CN106874923A - 一种商品的风格分类确定方法及装置 - Google Patents
一种商品的风格分类确定方法及装置 Download PDFInfo
- Publication number
- CN106874923A CN106874923A CN201510922584.2A CN201510922584A CN106874923A CN 106874923 A CN106874923 A CN 106874923A CN 201510922584 A CN201510922584 A CN 201510922584A CN 106874923 A CN106874923 A CN 106874923A
- Authority
- CN
- China
- Prior art keywords
- cluster
- characteristic vector
- commodity
- density
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本申请提供了一种商品的风格分类确定方法及装置。所述方法包括:获取商品图片,利用训练后卷积神经网络提取所述商品图片的特征向量;计算特征向量的聚类密度,根据聚类密度计算所述特征向量与比所述特征向量聚类密度值大的第一特征向量之间的密度距离;根据特征向量的聚类密度和密度距离确定所述特征向量聚类的初始数量和初始中心;根据所述聚类的初始数量和初始中心对所述商品图片进行特征向量聚类,获取满足设置的聚类稳定条件的聚类结果;根据所述聚类结果确定商品的风格分类。利用本申请实施例提供的技术方案,可以实现为商品的风格类型提供自动、快速、准确、可靠的分类依据,提高商品风格分类的准确性和效率,降低作业人员的工作强度。
Description
技术领域
本申请属于图像信息数据处理技术领域,尤其涉及一种商品的风格分类确定方法及装置。
背景技术
随着互联网消费时代的发展,消费者可以线上挑选自己喜爱的商品,极大的方便了用户购物。例如消费者可以通过线上商家展示的商品图片选取自己喜欢的商品种类。
一般的,消费者在线上购买商品时往往会受到多种概念因素的影响,例如比如品牌、价格、颜色、风格类型等,这些概念因素一般可以由商家在服务操作平台进行人工设置。在众多概念因素中,一些例如服装的品牌、价格、色彩等因素通常是容易定义,且一般有着相对明确、规范的界限进行区分。而对于其他一些商品的概念如风格、款式等,由于概念的语义性较强,受个人主观因素影响严重,导致不同的商家或消费者对具体的某一件商品的款式、风格定义上出现较大偏差。目前现有技术中对于商品风格款式信息的通常是根据各自的运营经验进行定义和设置的。而在实际商品运营展示中,由于商品风格分类的准则往往与行业运营的背景知识紧密相连,不同的运营平台、不同的商家甚至不同的作业人员对商品的风格分类参差不齐,往往不符合实际的分类情况。例如有的风格词对消费者而言范围太大,对应的商品太多,起不到挑选商品的作用,而有的风格词范围太小,对应的商品太少,用户没有挑选的空间。并且,由于人为主观的进行风格分类,还往往导致分类结果的对应关系不清晰,多种风格之间具有很大的重叠空间,导致消费者难以进行区分和判断,降低运营效果。同时,由于线上商品种类繁多,商品信息的增长量较快,采样人工方式进行商品风格分类也会消耗大量的人工和时间成本,降低分类效率。
现有技术中采用人工主观判断的方式确定商品的风格分类会导致商品风格分类不够准确、可靠,分类效率低下。
发明内容
本申请目的在于提供一种商品的风格分类确定方法及装置,可以实现对商品的风格类型进行自动、快速、准确、可靠的分类,可以提高商品风格分类的准确性和效率,降低作业人员的工作强度。
本申请提供一种商品的风格分类确定方法及装置是这样实现的:
一种商品的风格分类确定方法,所述方法包括:
获取商品图片,利用训练后卷积神经网络提取所述商品图片的特征向量;
计算所述特征向量的聚类密度,以及根据所述聚类密度计算所述特征向量与比所述特征向量聚类密度值大的第一特征向量之间的密度距离;
根据所述特征向量的聚类密度和密度距离确定所述特征向量聚类的初始数量和初始中心;
根据所述聚类的初始数量和初始中心对所述商品图片进行特征向量聚类,获取满足设置的聚类稳定条件的聚类结果;
根据所述聚类结果确定商品的风格分类。
一种商品的风格分类确定装置,所述装置包括:
特征提取模块,用于存储训练后卷积神经网络,还用于获取商品图片,并利用所述训练后卷积神经网络提取所述商品图片的特征向量;
密度和距离计算模块,用于计算所述特征向量的聚类密度,以及计算与比所述特征向量聚类密度高的周围特征向量之间的密度距离;
初始聚类计算模块,用于根据所述特征向量的聚类密度和密度距离确定所述特征向量聚类的初始数量和初始中心,;
聚类处理模块,用于根据所述聚类的初始数量和初始中心对所述商品图片进行特征向量聚类;还用于存储设置的聚类稳定条件,以及判断所述初始聚类计算模块聚类的结果是否满足所述聚类稳定条件,获取满足所述聚类稳定条件的聚类结果;
风格分类模块,用于根据所述聚类结果确定商品的风格分类。
本申请提供的商品的风格分类确定方法及装置,利用特定网络结构的训练后卷积神经网络提取出特征向量,将商品图片颜色、文字描述转换成预定维数的特征向量值。基于对商品图片特征数据的分布情况,利用聚类方法计算得到的特征向量点对商品图片进行分类,并对聚类的结果进行稳定性评估,获取稳定可靠的聚类分类结果。这样,可以基于商品图片特征向量的聚类信息实现对商品图片的准确、可靠的分类,不同风格分类的输出结果有着较为明显的类别差距,有效解决风格分类概念重叠、对应关系不清晰的问题,大大提高风格分类的准确性和可靠性。利用本申请实施方案,不仅可以提高商品风格分类准确率和可靠性,为商户提供风格分类依据,还可以降低作业人员的工作强度,自动、快速进行商品风格分类,提高分类处理效率。并且,利用本申请实施方案确定的风格分类结果更加符合实际商品图片的风格特点,能在页面或设备终端界面为用提供更为准确的款式、风格导购,提高用户体验,增加商品成交转化率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的商品的风格分类确定方法一种实施例的方法流程图;
图2是申请提供的获取训练后卷积神经网络一种实施例的方法流程示意图;
图3是本申请提供的预先设置的卷积神经网络一种实施例的模型结构示意图;
图4是本申请所述商品的风格分类确定方法另一种实施例的方法流程图;
图5是本申请所述商品的风格分类确定装置一种实施例的模块结构示意图;
图6是本申请提供的所述密度和距离计算模块一种实施例的模块结构示意图;
图7是本申请提供的所述初始聚类计算模块一种实施例的模块结构示意图;
图8是本申请提供的所述聚类处理模块一种实施例的模块结构示意图;
图9是本申请所述商品的风格分类确定装置另一种实施例的模块结构示意图;
图10是是本申请提供的所述特征提取模块一种实施例的模块结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
下面结合附图对本申请所述的商品的风格分类确定方法及装置进行详细的说明。图1是本申请提出的商品的风格分类确定方法一种实施例的方法流程图。虽然本申请提供了如下述实施例或附图所示的方法操作步骤或装置结构,但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者更少的操作步骤或模块结构。在逻辑性上不存在必要因果关系的步骤或结构中,这些步骤的执行顺序或装置的模块结构不限于本申请实施例提供的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置或终端产品应用时,可以按照实施例或者附图所示的方法或模块结构连接进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
本申请所述的商品风格分类摒弃了常规的人工观察判断的方式,采用利用对商品的图片信息进行提取的特征向量进行聚类分类,在判断各个聚类之间的差距较为清晰、明显,满足设置的聚类稳定条件后,将相应的聚类作为商品图片的风格分类。本申请提供的商品的风格分类计算方式可以适用于包括但不限于基于服装、鞋、帽、箱、包、装修风格等商品图片的风格分类。本申请以服装商品的风格分类为应用场景进行说明,具体的如图1所示,本申请提供的商品的风格分类确定方法的一种实施例可以包括:
S1:获取商品图片,利用训练后卷积神经网络提取所述商品图片的特征向量。
本实施例中可以获取服装类的商品图片,具体的获取方式可以包括预先通过网络搜索或拍摄或存储的数据库中获取等。例如本实施例应用场景中可以获取15000张服装类的商品图片。一般的,所述获取的商品图片通常具有一定的图片规范,例如可以要求所述商品图片中包括一定的商品主体,所述商品主体的信息齐全,不能只有部分或者遮挡或者严重缺损的商品图片。本实施例中可以对获取的商品图片设置仅包含一个主体信息完整、摆放于图片中间显著位置且商品图片中的背景或附属物对商品图片中主体识别的干扰在设置的可以接受范围内等的要求。
本申请可以利用特定的卷积神经网络来抽取出商品图片的特征信息。对于款式、风格这样的分类纬度而言,依靠传统的文字描述或用户搜索行为等特征进行定义、划分是非常低效且不精确的。因此,本申请中利用商品的图片描述进行分类计算处理,可以合理、有效的进行风格分类。具体的,本申请中可以预先设置预定结构的卷积神经网络模型,用商品风格分类的样本图片对设置的卷积神经网络进行训练,直至符合商品图片的处理需求。所述的卷积神经网络的模型结构可以根据数据处理需求进行自定义的设置,不同的深度网络适合不同的应用场景需求。一般的,较深的卷积神经网络结构具有更好的语义性描述能,但会消耗更多的资源,处理速度也较慢,而较浅的卷积神经网络结构描述能力较差,但消耗资源较少。基于此,本申请提供了一种卷积神经网络的模型结构及训练方法,可以保障所述商品图片特征提取效果的同时尽量减少消耗的资源。图2是本申请提供的获取训练后卷积神经网络一种实施例的方法流程示意图。具体的如图2所示,本申请的一种实施例中,所述训练后卷积神经网络包括采用下述方式训练得到的卷积神经网络:
S101:将采集的训练样本图片的颜色信息转换为RGB三通道颜色信息;
S102:将所述训练样本图片的短边缩放至第一预设值,相应的,所述训练样本图片的长边按照所述短边的缩放比例进行同比例缩放,形成第一样本图片;
S103:以所述第一样本图片的长边和短边的垂直中分线交点为中心点将所述第一样本图片裁剪为边长为所述第一预设值的正方形样本图片;
S104:确定出边长为第二预设值的正方形裁剪图片,将所述正方形裁剪图片在所述正方形样本图片内按照指定单位像素进行移动,获取第一扩展样本图片;
S105:以所述第一扩展样本图片的一条垂边为轴做镜像翻转生成第二扩展样本图片,将所述第一扩展样本图片和所述第二扩展样本图片作为训练的第二样本图片;
S106:将所述第二样本图片在预先设置的卷积神经网络中进行训练,确定出训练后卷积神经网络,所述预先设置的卷积神经网络被设置成,可以包括:
三层卷积层、两层全连通层、三层RELU层、三层Maxpooling层、一层Softmax层。
本申请在获取符合要求的训练后卷积神经网络的处理过程中,可以获取训练样本图片。具体的在上述服装风格分类的实施例中,可以对不同服装类目的图片进行采样,获取服装样本图片。一般的,所述获取的服装样本图片通常为矩形形状,当然,本申请中所述的样本图片并不排除其他多边形的形状。在具体实施时可以将非矩形的样本图片预先处理为矩形的样本图片。具体可以以女装连衣裙为一种应用场景实施例进行说明,在本应用场景中可以定义11种不同风格的连衣裙风格类型,包括:文艺、田园、复古、欧美、街头、民族、学院、名媛、甜美、职场、百搭。然后可以对每个连衣裙风格类型采集1500张服装样本图片。本实施例中每个样本图片可以包括设置的图片款式标签的标注数据。
进一步的,本实施例中可以对采集获取的服装样本图片进行统一规则的归一化处理,形成预定图片格式的归一化服装样本图片。本实施例中进行归一化处理后,可以提高模型训练效果。然后,本申请可以对所述归一化处理后的服装样本图片进行数据扩展处理,提高卷积神经网络训练结果的准确性和可靠性。
实际的实施过程中,随机采集获取的样本图片的尺寸大小通常为不一致的。在本实施例中可以对采集获取的服装样本图片进行归一化处理,所述的对服装样本图片归一化可以将不同服装样本图片的大小归一化到同等大小,减少不同尺寸的图片对确定服装图片风格的影响。具体的主要可以包括:将所述服装样本图片的颜色信息转换为RGB三通道颜色信息;将所述服装样本图片的尺寸统一缩放为短边为第一预设值,另一长边则同比例缩放的第一样本图片。例如,本实施例中所述第一预设值可以设置为256像素,假设服装样本图片的尺寸大小为[W,H],W为服装样本图片宽度,H为服装样本图片高度。若W>H,那么可以将所述服装样本图片的高度H缩放为256像素,所述比例为H/256,相应的,W进行同比例缩放后为W=W/(H/256)。若W<H,则相应的将W缩放为256像素,然后H进行同比例缩放。举例说明,某服装样本图片P1的尺寸为800*1200像素,那么经过上述处理后形成的第一样本图片P1’的尺寸为256*384像素。
得到所述第一样本图片后,可以进一步对所述第一样本图片中的非正方形图片进行裁剪操作,将其处理为边长第一预设值的正方形样本图片。本实施例中考虑到在服装样本图片中的服装主体一般出现在图片的中心区域,因此,可以在裁剪时保留所述样本图片的中心区域,这样可以最大化的保留服装样本图片中的服装主体信息,提高服装风格识别的准确性。本实施中所述的中心区域可以以所述第一样本图片的长边垂直中分线和短边垂直中分线的交点进行定位处理。具体的应用场景中,例如:
假如所述服装样本图片的尺寸缩放后为[256,H],即H>256像素,那么此时可以对所述服装样本图片的顶部和底部进行对称裁剪,从而保证可以保留所述服装样本图片的中心区域并且服装样本图片的垂边H为256像素。具体的所述服装样本图片的上边和下边可以分别裁剪(H-256)/2个像素;
假如所述服装样本图片的尺寸缩放后为[W,256],即W>256像素,那么此时可以对所述服装样本图片的左边和右边进行对称裁剪,从而保证可以保留所述服装样本图片的中心区域并且服装样本图片的横边W为256像素。具体的所述服装样本图片的左边和右边可以分别裁剪(W-256)/2个像素。
然后可以对上述归一化后的样本图片进行数据扩展,可以将原有采集获取的样本图片数据量采用一定方式的扩展到预定要求的数据量,这样可以在后续卷积神经网络处理时防止过拟合,可以提高卷积神经网络数据处理的可靠性。本实施例提供的数据扩展的处理方法在服装风格识别的应用场景中可以将原有的服装样本图片数据扩展到原有数据量的16倍。具体的对归一化后边长为256像素的正方形服装样本图片P进行数据扩展时,可以先确定出一个边长为第二预设值227像素的正方形裁剪图片,然后窗口式的移动所述正方形裁剪图片的水平边,可以4个像素为单位进行移动。在这样的处理后可以将数据量扩展到原来的8=int((256-227)/4+1)倍,裁剪出8张边长为227像素的正方形第一扩展样本图片P01、P02、P03、P04、P05、P06、P07、P08。然后可以对每一张裁剪抽离出227*227像素的第一扩展样本图片做一次以垂边为轴的镜像翻转,形成新的8张边长为227像素的正方形第二扩展样本图片P11、P12、P13、P14、P15、P16、P17、P18。这样,服装样本图片P经过上述数据扩展处理后得到16张边长为227像素的第二样本图片P01、P02、P03、P04、P05、P06、P07、P08、P11、P12、P13、P14、P15、P16、P17、P18。
每一张样本图片都可以经过上所述归一化和数据扩展处理后,生成用于模型训练的第二样本图片。
需要说明的是,本实施例中所述的第二预设值227像素具体的可以根据实际的数据处理需求进行设置。一般的,所述第二预设值设置可以略小于归一化后的服装样本图片的短边边长。如上述实施例中对边长为256像素的正方形样本图片可以设置第二预设值为227像素。另外,本实施例中所述的镜像翻转具体的可以以所述第一扩展样本图片的左边或者右边的垂边为轴进行处理。例如本实施例应用场景中可以以抽离出的所述边长为227像素的正方形样本图片的右边垂边为轴进行镜像翻转。
本实施例中所述预先设置的卷积神经网络的模型结构通常可以根据样本训练要求和实际应用场景进行设计、设置。本申请的一种实施例中,所述预先设置的卷积神经网络被设置成,可以包括:
三层卷积层、两层全连通层、三层RELU层、三层Maxpooling层、一层Softmax层。
在本实施例的卷积神经网络中具体的实施过程中可以根据卷积神经网络处理需求和服装风格识别的设计需求设置相应的神经网络层结构。例如一种实施例中可以在每个RELU层后接入归一化层,这样可以避免模型训练过程中的过拟合问题(over-fitting)。其他的实施例中还可以在全连通层接入Dropout层,可以用于提升模型收敛的效率。当然,实际的卷积神经网络可以根据应用场景需求添加其他网络结构,例如还可以添加Norm层等。
图3是本申请提供的所述预先设置的卷积神经网络一种实施例的模型结构示意图。具体的如图3所示,所述预先设置的卷积神经网络被设置成,可以包括:
包括64个卷积核的第一高斯卷积层;与所述第一高斯卷积层相连的第一Maxpooling层、RELU层、归一化层;与所述第一Maxpooling层相连的包括32个卷积核的第二高斯卷积层;与所述第二斯卷积层相连的第二Maxpooling层、RELU层、归一化层;与所述第二Maxpooling层相连的包括16个卷积核的第三高斯卷积层;与所述第三斯卷积层相连的第三Maxpooling层、RELU层、归一化层;所述第三Maxpooling层相连的第一全连通层;与所述第一全连通层相连的第二全连通层和Dropout层;与所述第二全连通层相连的Softmax层。
上述实施例中所述全联通层可以作为上下两层的节点之间的连接层,将上下两层所得到的各节点数据建立连接关系,从而对上一层的输入进行抽象化表达。例如本实施例中所述全联通层的输出可以是128维的特征向量。利用本实施例中设置的卷积神经网络可以对商品图片进行特征提取,可以在全连通层输出得到商品图片的M维的特征向量P={P1,P2,…,PM}。
所述的卷积处理通常为一种特征提取方式,可以将图像中符合条件的部分筛选出来。本申请的一种实施例中,所述预先设置的卷积神经网络中的卷积层可以采用高斯卷积层,所述的高斯卷积层主要用于包括对前一层的输出结果与多个高斯卷积核进行卷积操作。本实施例中所述高斯卷积核的参数可以通过学习得到。一种实施方式中,可以设置三层高斯卷积层,且每层使用的高斯卷积核的尺寸可以设置为5*5像素,同时每一个高斯卷积层中卷积核可以对服装样本图片中的所有像素计算处理一遍。一般的,从深度学习的原理上来说,底层卷积层的数据可以代表细粒度的特征,高层卷积层的数据可以代表抽象特征。因此,本申请的一种实施例所述的卷积神经网络中的卷积层中,高层的卷积层的卷积核数量可以大于底层卷积层的卷积核。在一个具体的应用中,例如所述三个卷积层可以包括有64个卷积核的第一层卷积层(即高层卷积层)、有32个卷积核的第二层卷积层以及有16个卷积核的第三层卷积层(即底层卷积层),所述三个卷积层的卷积核的尺寸可以均为5*5像素。
本实施例中的卷积神经网络可以在最后一个全连通层接入Softmax层,这里所述的Softmax层可以包括相应的判决函数。Softmax函数在二维情况下就是经典的logisticregression函数,这里可以看成是logistic regression函数的高维版本。具体的,本实施例中使用的Softmax层可以为一个非线性分类器,可以对全连通层输出的特征向量进行分类器训练。一般的,所述Softmax层处理的过程通常可以包括三步:第一步可以对全连通层输出的固定特征向量X所有维的值求最大值,记为Max_i;第二步可以使用exp表达式将所述特征向量X中的每一维都转化到0~1之间的数,即特征向量X中的每一维x[i]=exp(x[i]–Max_i);第三步可以对第二步转化后的特征向量X所有的值求和,然后相应的做归一化,即x[i]=x[i]/sum(x[i])。
本实施例中所述的Maxpooling层可以用于对上一层卷积层的输出进行降采样操作,即在预先设置的固定大小的采样窗口中选取最大值作为降采样后的点的值。例如在一个具体的实施例中,所述的Maxpooling层使用的采样窗口可以均设置为3*3像素,采样间隔可以为2个像素。
一般的,神经网络中的神经元有着不饱和的非线性特性。传统的神经元的输出与输入x之间有着饱和的非线性特性,即f(x)=tanh(x),而不饱和的非线性特性则使神经元有着新的函数关系f(x)=(0,x)。本实施例中所述RELU(rectified linear unit,校正线性单元,一种激活函数)层主要可以用于对上一层数据结果进行修正,包括将上一层小于0的输入全部变成0后输出,大于0的输出不变。本实施例中使用RELU层可以提高所述卷积神经网络模型整体的训练效率和准确性。
本申请实施例中可以在所述卷积神经网络中的RELU层接入归一化层,可以用于增强所述卷积神经网络整体的泛化性能。在具体的处理过程中,所述归一化可以是基于每个像素的局部窗口,即可以进行局部归一化操作。所述局部窗口的大小可以与所述卷积层卷积核的尺寸大小相同,如5*5像素。
本实施例中所述的Dropout(休眠层)层可以用于提升模型收敛的效率,例如可以随机让上一层50%的输出节点的数据为0,避免过拟合。
具体的,在训练过程中可以采用随机梯度下降方法对上述的卷积神经网络进行迭代学习。通常每一轮的迭代会更新所述卷积神经网络中每一层的参数,例如包括网络层内节点的权重值以及偏执值等,直到这些参数值收敛,以取得最优解。具体的收敛条件可以根据数据处理需求进行设置,一般来说,本实施例提供的卷积神经网络在经过约100000次迭代后,可以训练得到符合设计要求的训练后卷积神经网络模型。利用训练后卷积神经网络提取得到所述商品图片的128维特征向量。
S2:计算所述特征向量的聚类密度,以及根据所述聚类密度计算所述特征向量与比所述特征向量聚类密度值大的第一特征向量之间的密度距离。
获取商品图片的特征向量后,可以基于对所述图片量化的特征向量进行聚类分组。本实施例中可以先定义并计算出每个商品图片的特征向量相应数据点的聚类密度,获取每个特征向量的聚类密度后,可以进一步每个特征向量的密度距离。具体的如本实施例服装风格分类的应用场景中,获取的商品图片的特征向量可以为128维的数据,每一个商品的特征向量可以视为一个128维的数据点(P1~P128)。在此可以先计算出所有所述商品图片特征向量的聚类密度ρ1~ρ128。对于某个特征向量如P1的聚类密度如ρ1,可以从P2~P128中筛选出比特征向量P1的聚类密度的值ρ1大的第一特征向量。然后可以计算所述特征向量P1与所述第一特征向量之间的密度距离。按照上述方式可以分别计算出所有特征向量P1~P128的密度距离。这样,基于商品图片特征向量的整体分布密度来确定聚类的初始信息,可以提高本申请商品风格分类的准确性。
本申请提供一种计算所述聚类密度和密度距离的实施方式,具体的,本申请的一种实施例中,所述计算特征向量的聚类密度可以包括:
S201:计算所述特征向量中待处理特征向量与其余特征向量之间的两点距离,获取所述距离中的最大距离值;
S202:计算所述待处理特征向量与所述其余特征向量的两点距离与所述最大距离值的比值的平方值,将所述平方值的符号位取反位后的值作为常数e的幂,计算出所述待处理特征向量与所述其余特征向量的两点密度值;
S203:求取所述特征向量中所述其余特征向量的两点密度值的和值,将所述和值作为所述待处理特征向量的聚类密度。
上述中所述的待处理特征向量可以为所述商品图片的特征向量中当前待计算处理的特征向量,所述其余特征向量可以为所述特征向量中不包括所述待处理特征向量的特征向量。具体的,例如上述获取P1~P128的共128个特征向量的应用场景中,在计算特征向量P1的聚类密度时可以先计算P1分别与其他P2~P128共127个其余特征向量的距离,从中获取距离值最大值作为最大距离值。然后可以分别计算所述待处理特征向量与所述其余特征向量的两点密度值。首先,在计算P1与P2的两点密度值时,可以计算P1与P2的两点距离与所述最大距离值的平方值,然后符号位取反后作为常数e的幂得到P1与P2的两点密度值。最后,将P1分别与P2、P3,…,P128共127个其余特征向量的两点密度值相加求和,即可得到P1的聚类密度。采用同样的方式可以依次得到P2~P128的聚类密度。
按照上述方式可以计算得出所有特征向量的聚类密度。本实施例中可以采用欧式距离来衡量两个特征向量数据点之间的差距,然后取当前待处理特征向量数据点与所有其余特征向量数据点的两点距离的和值,将所述和值作为当前特征向量的聚类密度。具体的,可以采用下式计算得到特征向量的聚类密度:
上式中,ρi可以表示为待处理特征向量数据点i的聚类密度,Dis可以表示所述待处理特征向量数据点i与待计算的其余特征向量数据点j两点之间的距离函数,本实施例中可以采用欧式距离来衡量两点之间的距离,当然,也可以采取其他的算法计算所述距离。Disi,j可以表示所述待处理特征向量数据点i与所述其余特征向量数据点j之间的距离,Dism可以表示所述距离的最大值,Is可以表示所有的特征向量数据点,j∈Is\{i}可以表示为j属于所有特征向量数据点中除i以外的特征向量数据点。
计算得到每个特征向量的聚类密度后,可以计算特征向量与周围特征向量之间的密度距离。在所述周围特征向量中,可能存在有的聚类密度比待处理特征向量的聚类密度值大,有的比待处理特征的聚类密度值小。在本申请方案中,结合商品风格分类中商品图片数据的处理特点,采用选取比当前特征向量与的聚类密度高的特征向量之间的距离作为所述当前特征向量的密度距离。具体的,本申请的一种实施例中,所述根据所述聚类密度计算所述特征向量与比所述特征向量聚类密度值大的第一特征向量之间的密度距离可以包括:
在判断存在待处理特征向量的第一特征向量时,从所述第一特征向量中选取与所述待处理特征向量距离最小的第二特征向量所对应的距离作为所述待处理特征向量的密度距离;否则,选取与所述待处理特征向量距离最小的特征向量所对应的距离作为所述待处理特征向量的密度距离。
具体的,可以采用下述公式计算得到所述特征向量的密度距离:
上式中,δi可以表示待处理前特征向量数据点i的密度距离,Is可以表示所有的特征向量数据点,可以表示所有聚类密度比待处理特征向量数据点i高的点的集合,Disi,j可以表示所述待处理特征向量数据点i与所述其余特征向量数据点j之间的距离。
本实施例中提取所述商品图片的特征向量后,可以基于欧式距离的实施方式计算得到所述特征向量的聚类密度和相应的密度距离。
S3:根据所述特征向量的聚类密度和密度距离确定所述特征向量聚类的初始数量和初始中心。
有了商量商品图片特征向量的聚类密度和密度距离两个衡量指标后,可以结合所述特征向量的聚类密度和密度距离来确定商品风格分类时所述特征向量聚类的初始数量和初始中心。本实施例可以根据ρi×δi的值对所有特征向量数据点排序,这里越大的值表示越有可能是聚类的中心,因此,基于本实施例确定的聚类的初始信息更加准确、可靠,提高商品风格分类的准确性。本申请提供一种所述聚类的初始数量和初始中心的确定方法,具体的,本申请的一种实施例中,所述根据所述特征向量的聚类密度和密度距离确定所述特征向量聚类的初始数量和初始中心可以包括:
计算所述特征向量的聚类密度和密度距离的乘积值,选取所述乘积值中最大的前K个乘积值所对应的特征向量作为聚类的初始中心,K为设置的聚类的初始数量,K≥2。
本实施例中可以选取特征向量中聚类密度和密度距离的乘积值最大的前K个点作为聚类的初始中心,这里的K可以表示聚类的初始数量。一般的,在商品风格分类时,可以至少将商品划分为两种风格类型,因此本实施例中所述的K的取值范围可以为K≥2。在具体的实施本申请方案时,可以根据实际应用场景设置K的取值,例如本实施例服装商品风格分类K可以设置为3。一般的,可以从较小的K值开始尝试,在后续对聚类结果的评估没有通过时可以在增加K的取值。结合本实施例服装商品风格分类的应用场景以及实际的处理效果,所述K的取值范围包括:3≤K≤15。
本实施例可以从所述特征向量的聚类密度和密度距离乘积值中选取最大的前K个特征向量数据点来确定所述特征向量聚类的初始数量和初始中心。
S4:根据所述聚类的初始数量和初始中心对所述商品图片进行特征向量聚类,获取满足设置的聚类稳定条件的聚类结果。
本实施例中可以利用经典的k-means聚类算法对商品图片的特征向量进行聚类。上述过程中得到了聚类的初始数量和初始中心,可以采用下述方式完成特征向量的聚类。具体的,本申请的一种实施例中,所述根据所述聚类的初始数量和初始中心对所述商品图片进行特征向量聚类,获取满足设置的聚类稳定条件的聚类结果可以包括:
S401:将所述特征向量归类到距离所述特征向量最近的初始中心的聚类中。
这一步处理中可以利用欧式距离计算特征向量和每个所述初始中心的聚类之间聚类,然后将所述特征向量归类到距离最近的初始中心的聚类中。
S402:执行重新计算所述聚类的聚类中心、将所述特征向量归类到距离最近的聚类中心,直至满足聚类的收敛条件,获取收敛后聚类数据。
本实施例中,在同一个聚类下,可以计算属于同一维度的特征向量的算术平均值,以所述特征向量的算术平均值作为新的聚类中心。然后以新的聚类中心继续进行聚类,直到所有的聚类稳定下来,不再有数据点的变动或者变动的范围在设定范围内。具体的例如S401中归类形成三个聚类K1、K2、K3,其中聚类K1中包括M个特征向量P1、P2,…,PM,每个特征向量均为128维的矩阵数据。如P1(P1_1,P1_2,P1_3,…,P1_128)、P2(P2_1,P2_2,P2_3,…,P2_128)、…、PM(PM_1,PM_2,PM_3,…,PM_128)。然后在同一个聚类K1下,可以计算属于同一维度的特征向量的算术平均值,如特征向量中第1纬度的算术平均值可以为Pnew_1=(P1_1+P2_1+…+PM_1)/M,第2纬度的算术平均值可以为Pnew_2=(P1_2+P2_2+…+PM_2)/M,相应的,第128纬度的算术平均值可以为Pnew_128=(P1_128+P2_128+…+PM_128)/M。进一步的,可以将计算得到的特征向量的算术平均值作为聚类K1的新的聚类中心(Pnew_1,Pnew_2,…,Pnew_128)。对应聚类K1,可以以Pnew_128为新的聚类中心继续对特征向量P1、P2,…,PM继续聚类,直到满足聚类收敛条件。
S403:判断收敛后聚类数据是否满足设置的聚类稳定条件,若不满足,则调整所述聚类的初始数量,重新计算获取收敛后聚类数据;将满足所述聚类稳定条件的收敛后聚类数据作为聚类结果。
上述得到收敛后聚类数据的结果后,本实施例可以设置用于判断不同商品风格分类之间的差距是否清晰、分类中的数据点是否较为相似(聚类内部的聚合度较好)的聚类稳定条件。本申请所述的聚类稳定条件可以采取不同的计算方式进行评价、设置。本实施例结合风格分类的商品图片以及上述聚类中数据处理特点,提供一种有效、可靠的聚类稳定条件的设置方式。具体的,本申请的一种实施例中,所述聚类稳定条件可以包括:
所述收敛后聚类数据的中心点至相应聚类的所述初始中心的偏移量小于第一预设阀值:
获取所述收敛后聚类数据中特征向量的聚类密度与密度距离的乘积中的第一最大值和第二最大值,确定所述第一最大值至所述收敛后聚类数据中心点的第一距离以及所述第一最大值和第二最大值的第二距离,计算出的所述第一距离与所述第二距离的比值小于第二预设阀值。
具体的,本实施例中可以采用聚类的中心偏移量和聚类内部的稳定性对每个收敛后聚类进行评估,判断是否满足聚类稳定条件。例如可以采用下式计算聚类的中心偏移量:
上式中,c可以表示收敛后聚类实际的中心点,cori表示聚类最开始的初始中心。如果收敛后聚类的中心点和初始聚类时的初始中心的偏移量超过设置的第一预设阀值,则可以判定不满足聚类稳定条件。
同样,可以采用下式计算聚类内部的稳定性:
上式中,c1可以表示收敛后聚类内ρi×δi值第一最大值的数据点,c2可以表示收敛后聚类内第二最大值的数据点,Disc2,c可以表示所述第二最大值与相应聚类的初始中心的第一距离,Disc2,c1可以表示所述第一最大值与所述第二最大值的第二距离。如果α值较大,大于设置的第二预设阀值,则意味着该收敛后聚类是不稳定的,即不符合聚类稳定条件。
若不满足设置的聚类稳定条件,则可以调整所述聚类的初始数量,如上述服装商品风格分类中将设置的初始数量K为3重新设置为4,即从排序后的ρi×δi乘积值选取最大的前4个乘积值所对应的特征向量作为聚类的新的初始中心,然后重新进行聚类。
一般的,基于不同商品图片的属性数据,经过若干聚类和调整评估后,可以获取满足设置的聚类稳定条件的聚类结果。
S5:根据所述聚类结果确定商品的风格分类。
基于商品图片的特征向量完成商品图片的聚类后,可以根据聚类结果确定商品的风格分类。上述获取的每个聚类结果可以对应一个相应的风格分类,包括这该风格分类的一系列元素。所述风格分类具体的参数描述可以由相应的特征向量体现。例如对15000张服装商品图片经过上述处理后自动得到K=10个满足聚类稳定条件的聚类结果,则这15000张服装商品图片可以归类到所述10个聚类结果相应的风格分类中。例如K1聚类中可以包括与K1聚类中心最近的100张服装样本图片,根据K1聚类中心的特征向量描述,可以设定K1对应的风格分类为校园风,则相应的可以确定所述100张服装样本图片的风格分类为校园风。依次类推,可以根据K10聚类中心的特征向量描述将K10聚类中包括的与K10聚类中心最近的150张服装样本图片的风格分类确定风格分类为嘻哈风。当然,具体的风格分类的命名可以根据数据分析结果或经验等自定义的设置。
具体的,可以采用不同的方式根据每一聚类结果确定商品风格分类。例如,可以预先设置某一风格分类的特征向量中指定维度的数值范围,当聚类结果中的特征向量符合某一风格指定维度的数值范围时,可以将该聚类结果设置为该风格分类。当然,其他的实施方式中,也可以结合行业知识,根据经验和观察机对聚类结果相对应的风格分类进行命名。由于本申请技术方案输出的聚类结果为多维度的特征向量,作业人员或者计算设备可以清醒、准确取得不同风格分类之间的差异,对商品风格分类提供可靠的数据支持。本申请可以提取商品图片特征数据,根据特征数据采用预定方式自动进行输出聚类结果,确定商品风格分类,可以大大提高商品风格分类的准确性和处理效率。
可选的实施例中,根据商品图片的聚类结果确定商品的风格分类后,可以从每一种风格分类中选取具有象征性或代表性的商品图片展示给作业人员。这样,作业人员可以根据每个类别的代表性商品图片对确定出的相应的风格分类进行更为准确的命名,从而使商品风格分类的命名更加符合实际商品图片的风格特点,能在页面或设备终端界面为用提供更为准确的款式、风格导购,提高用户体验,增加商品成交转化率。图4是本申请所述商品的风格分类确定方法另一种实施例的方法流程图,如图4所示,本申请的另一种实施例中,所述方法还可以包括:
S601:从所述风格分类中选取出距离聚类中心最近的前T1个商品图片作为所述风格分类的分类代表图片,T1≥1。
当然,选取出所述分类代表图片后,可以将所述分类代表图片进行展示或者输出到指定的展示界面或存储位置。商品运营者或作业人员可以基于每一风格分类的分类代表图片进行准确的分类命名,为商品分类提供可靠的依据。
其他的实施例中,也可以选取不同风格分类中商品图片特征信息较近的商品图片,可以用于比较当前风格分类与其他风格分类的区别,为作业人员区分不同风格分类之间的差异提供分析依据。如图4所示,本申请的另一种实施例中,所述方法还可以包括:
S602:从当前风格分类中选取距离目标风格分类的聚类中心最近的前T2个商品图片作为当前风格分类的区别代表图片,T2≥1。
所述的目标风格分类可以表示为所有的风格分类中除当前风格分类之外的其他风格分类。具体的应用场景中,例如最终确定商品的风格分类为a、b、c,每个风格分类包括150张商品图片。然后可以从风格分类a中选取距离风格分类b的聚类中心最近的前T2个商品图片、选取距离风格分类c的聚类中心最近的前T2个商品图片作为区别代表图片。一般的,对于其他风格分类选取的区别代表图片数目可以不必相同,例如选取5张距离风格分类b聚类中心最近的商品图片,选取3张距离风格分类c距离中心最近的商品图片。当然,上述实施例中所述的T1、T2具体的取值可以根据需求进行自定义设置,如可以设置T1取值为10,T2取值为5。
本申请提供的商品的风格分类确定方法,可以利用特定网络结构和样本图片训练的卷积神经网络提取出特征向量,将商品图片颜色、文字描述转换成预定维数的特征向量值。基于对商品图片特征数据的分布情况,利用聚类方法计算得到的特征向量点对商品图片进行分类,并对聚类的结果进行稳定性评估,获取稳定可靠的聚类分类结果。这样,可以基于商品图片特征向量的聚类信息实现对商品图片的准确、可靠的分类,不同风格分类的输出结果有着较为明显的类别差距,有效解决风格分类概念重叠、对应关系不清晰的问题,大大提高风格分类的准确性和可靠性。利用本申请实施方案,不仅可以提高商品风格分类准确率和可靠性,为商户提供风格分类依据,还可以降低作业人员的工作强度,自动、快速进行商品风格分类,提高分类处理效率。
基于本申请提供的商品的风格分类确定方法,本申请提供一种商品的风格分类确定装置。图5是本申请所述商品的风格分类确定装置一种实施例的模块结构示意图,如图5所示,所述装置可以包括:
特征提取模块101,可以用于存储训练后卷积神经网络,还可以用于获取商品图片,并利用所述训练后卷积神经网络提取所述商品图片的特征向量;
密度和距离计算模块102,可以用于计算所述特征向量的聚类密度,以及根据所述聚类密度计算与比所述特征向量聚类密度值大的第一特征向量之间的密度距离;
初始聚类计算模块103,可以用于根据所述特征向量的聚类密度和密度距离确定所述特征向量聚类的初始数量和初始中心,;
聚类处理模块104,可以用于根据所述聚类的初始数量和初始中心对所述商品图片进行特征向量聚类;还可以用于存储设置的聚类稳定条件,以及判断所述初始聚类计算模块103聚类的结果是否满足所述聚类稳定条件,获取满足所述聚类稳定条件的聚类结果;
风格分类模块105,可以用于根据所述聚类结果确定商品的风格分类。
本申请提供的商品的风格分类确定装置可以利用聚类方法计算得到的特征向量点对商品图片进行分类,并对聚类的结果进行稳定性评估,获取稳定可靠的聚类分类结果。利用本申请实施方案,不仅可以提高商品风格分类准确率和可靠性,为商户提供风格分类依据,还可以降低作业人员的工作强度,自动、快速进行商品风格分类,提高风格分类处理效率。
图6是本申请提供的所述密度和距离计算模块102一种实施例的模块结构示意图,如图6所示,所述密度和距离计算模块102可以包括下述中的至少一种:
密度计算模块1021,可以用于计算所述特征向量中待处理特征向量与其余特征向量之间的两点距离,获取所述距离中的最大距离值;以及,计算所述待处理特征向量与所述其余特征向量的两点距离与所述最大距离值的比值的平方值,将所述平方值的符号位取反位后的值作为常数e的幂,计算出所述待处理特征向量与所述其余特征向量的两点密度值;求取所述特征向量中所述其余特征向量的两点密度值的和值,将所述和值作为所述待处理特征向量的聚类密度;
距离计算模块1022,可以用于判断是否存在比待处理特征向量的聚类密度高的第一特征向量;当判断结果为是时,从所述第一特征向量中选取与所述待处理特征向量距离最小的第二特征向量所对应的距离作为所述待处理特征向量的密度距离;否则,选取与所述待处理特征向量距离最小的特征向量所对应的距离作为所述待处理特征向量的密度距离。
在本申请方案中,可以计算抽离出商品图片特征向量的密度特征,结合商品风格分类中商品图片数据的处理特点,采用选取比当前待处理特征向量与的聚类密度高的特征向量之间的距离作为所述待处理特征向量的密度距离。这样,基于商品图片特征向量的整体分布密度来确定聚类的初始信息,可以提高本申请商品风格分类的准确性。
图7是本申请提供的所述初始聚类计算模块103一种实施例的模块结构示意图,如图7所示,所述初始聚类计算模块103可以包括:
计算排序模块1031,可以用于计算所述特征向量的聚类密度和密度距离的乘积值;
选取模块1032,可以用于选取所述乘积值最大的前K个乘积值所对应的特征向量作为聚类的初始中心,K为设置的聚类的初始数量,K≥2。
有了商量商品图片特征向量的聚类密度和密度距离两个衡量指标后,可以结合所述特征向量的聚类密度和密度距离来确定商品风格分类时所述特征向量聚类的初始数量和初始中心。本实施例可以根据ρi×δi的对给所有特征向量数据点排序,这里越大的值表示越有可能是聚类的中心,因此,基于本实施例确定的聚类的初始信息更加准确、可靠,提高商品风格分类的准确性。
图8是本申请提供的所述聚类处理模块104一种实施例的模块结构示意图,如图8所示,所述聚类处理模块104可以包括:
第一聚类模块1041,可以用于将所述特征向量归类到距离所述特征向量最近的初始中心的聚类中;
第二聚类模块1042,可以用于执行重新计算所述聚类的聚类中心、将所述特征向量归类到距离最近的聚类中心,直至满足聚类的收敛条件,获取收敛后聚类数据;
调整处理模块1043,可以用于判断收敛后聚类数据是否满足设置的聚类稳定条件,若不满足,则调整所述聚类的初始数量,重新计算获取收敛后聚类数据;将满足所述聚类稳定条件的收敛后聚类数据作为聚类结果。
所述的聚类稳定条件可以根据商品图片数据的处理需求采用不同的判定、评估方法。本申请的一种实施例中,结合商品图片风格分类的应用场景及本申请提取商品图片的特征向量的处理方案,提供一种有效、可靠的评估方案。具体的,上述所述聚类稳定条件可以包括:
计算出的所述收敛后聚类数据的中心点至相应聚类的所述初始中心的偏移量小于第一预设阀值:
获取所述收敛后聚类数据中特征向量的聚类密度与密度距离的乘积中的第一最大值和第二最大值,确定所述第一最大值至所述收敛后聚类数据中心点的第一距离以及所述第一最大值和第二最大值的第二距离,计算出的所述第一距离与所述第二距离的比值小于第二预设阀值。
图9是本申请所述商品的风格分类确定装置另一种实施例的模块结构示意图,如图9所示,所述装置还可以包括下述中的至少一项:
代表图片选取模块1061,可以用于从所述风格分类中选取出距离聚类中心最近的前T1个商品图片作为所述风格分类的分类代表图片,T1≥1;
区别图片选取模块1062,可以用于从当前风格分类中选取距离目标风格分类的聚类中心最近的前T2个商品图片作为当前风格分类的区别代表图片,T2≥1。
本实施例中所述装置可以选取出每种风格的分类代表图片,或者相近风格分类之间的区别代表图片,商品运营者或作业人员可以基于每一风格分类的分类代表图片进行准确的分类命名,为商品分类提供可靠的依据。同时,根据商品图片的聚类结果确定商品的风格分类后,可以从每一种风格分类中选取具有象征性或代表性的商品图片展示给作业人员。这样,作业人员可以根据每个类别的代表性商品图片对确定出的相应的风格分类进行更为准确的命名,从而使商品风格分类的命名更加符合实际商品图片的风格特点,能在页面或设备终端界面为用提供更为准确的款式、风格导购,提高用户体验,增加商品成交转化率。
上述实施例中特征提取模块101中存储的训练后卷积神经网络可以根据上商品图片数据处理的需求进行选取设置。本申请所述装置的一种实施例中,所述特征提取模块101可以采用预选的卷积神经网络和训练方式获取训练后卷积神经网络。图10是本申请提供的所述特征提取模块101一种实施例的模块结构示意图,如图10所示,本申请的另一种实施例中,所述特征提取模块101可以包括:
颜色信息转换模块1011,可以用于将采集的训练样本图片的颜色信息转换为RGB三通道颜色信息;
缩放模块1012,可以用于将所述训练样本图片的短边缩放至第一预设值,相应的,所述训练样本图片的长边按照所述短边的缩放比例进行同比例缩放,形成第一样本图片;
中心区域裁剪模块1013,可以用于以所述第一样本图片的长边和短边的垂直中分线交点为中心点将所述第一样本图片裁剪为边长为所述第一预设值的正方形样本图片;
第一扩展模块1014,可以用于确定出边长为第二预设值的正方形裁剪图片,将所述正方形裁剪图片在所述正方形样本图片内按照指定单位像素进行移动,获取第一扩展样本图片;
第二扩展模块1015,可以用于以所述第一扩展样本图片的一条垂边为轴做镜像翻转生成第二扩展样本图片,将所述第一扩展样本图片和所述第二扩展样本图片作为训练的第二样本图片;
训练模块1016,可以用于将所述第二样本图片在预先设置的卷积神经网络中进行训练,确定出训练后卷积神经网络,所述预先设置的卷积神经网络被设置成,包括:
三层卷积层、两层全连通层、三层RELU层、三层Maxpooling层、一层Softmax层。
图3是本申请提供的所述预先设置的卷积神经网络一种实施例的模型结构示意图。如图3所示,所述训练模块1016中所述预先设置的卷积神经网络具体的一种实施例中可以被设置成,包括:
包括64个卷积核的第一高斯卷积层;与所述第一高斯卷积层相连的第一Maxpooling层、RELU层、归一化层;与所述第一Maxpooling层相连的包括32个卷积核的第二高斯卷积层;与所述第二斯卷积层相连的第二Maxpooling层、RELU层、归一化层;与所述第二Maxpooling层相连的包括16个卷积核的第三高斯卷积层;与所述第三斯卷积层相连的第三Maxpooling层、RELU层、归一化层;所述第三Maxpooling层相连的第一全连通层;与所述第一全连通层相连的第二全连通层和Dropout层;与所述第二全连通层相连的Softmax层。
采用上述实施方式获取的训练后卷积神经网络,结合了商品图片风格分类的应用场景,采用特定的网络结构及训练方式,如对对样本图片归一化以及数据扩展处理、三层不同卷积核的卷积层、两层全连通层等,这样得到的训练卷积神经网络可以针对商品图片风格分类的特点提取能够准确、可靠的商品图片的特征向量,为后续基于特征向量的数据处理奠定基础,提高本申请整体商品风格分类确定方法及装置的实施效果。
本申请提供的商品的风格分类确定方法或装置,可以利用特定卷积网络结构的训练后卷积神经网络提取出特征向量,将商品图片颜色、文字描述转换成预定维数的特征向量值。基于对商品图片特征数据的分布情况,利用聚类方法计算得到的特征向量点对商品图片进行分类,并对聚类的结果进行稳定性评估,获取稳定可靠的聚类分类结果。这样,可以基于商品图片特征向量的聚类信息实现对商品图片的准确、可靠的分类,不同风格分类的输出结果有着较为明显的类别差距,有效解决风格分类概念重叠、对应关系不清晰的问题,大大提高风格分类的准确性和可靠性。利用本申请实施方案,不仅可以提高商品风格分类准确率和可靠性,为商户提供风格分类依据,还可以降低作业人员的工作强度,自动、快速进行商品风格分类,提高分类处理效率。并且,利用本申请实施方案得到的风格分类结果更加符合实际商品图片的风格特点,能在页面或设备终端界面为用提供更为准确的款式、风格导购,提高用户体验,增加商品成交转化率。
尽管本申请内容中提到卷积神经网络模型层结构、特征向量密度及距离计算、聚类、迭代等的图片信息及数据的处理、模型结构的描述,但是,本申请并不局限于必须是完全标准或者所提及的方式的信息及数据处理、模型结构的情况。本申请中各个实施例所涉及的上述描述仅是本申请中的一些实施例中的应用,在某些标准、模型、方法的基础上略加修改后的实施方式也可以实行上述本申请各实施例的方案。当然,在符合本申请上述各实施例的中所述的处理方法步骤的其他无创造性的变形,仍然可以实现相同的申请,在此不再赘述。
虽然本申请提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
上述实施例阐明的装置或模块,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现。当然,也可以将实现某功能的模块由多个子模块或子单元组合实现。
本申请中所述的方法、装置或模块可以以计算机可读程序代码方式的控制器实现。所述控制具体的可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、AtmelAT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本申请所述装置中的部分模块可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的硬件的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,也可以通过数据迁移的实施过程中体现出来。该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本申请的全部或者部分可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、移动通信终端、多处理器系统、基于微处理器的系统、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
虽然通过实施例描绘了本申请,本领域普通技术人员知道,本申请有许多变形和变化而不脱离本申请的精神,希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。
Claims (15)
1.一种商品的风格分类确定方法,其特征在于,所述方法包括:
获取商品图片,利用训练后卷积神经网络提取所述商品图片的特征向量;
计算所述特征向量的聚类密度,以及根据所述聚类密度计算所述特征向量与比所述特征向量聚类密度值大的第一特征向量之间的密度距离;
根据所述特征向量的聚类密度和密度距离确定所述特征向量聚类的初始数量和初始中心;
根据所述聚类的初始数量和初始中心对所述商品图片进行特征向量聚类,获取满足设置的聚类稳定条件的聚类结果;
根据所述聚类结果确定商品的风格分类。
2.如权利要求1所述的一种商品的风格分类确定方法,其特征在于,所述计算特征向量的聚类密度包括:
计算所述特征向量中待处理特征向量与其余特征向量之间的两点距离,获取所述距离中的最大距离值;
计算所述待处理特征向量与所述其余特征向量的两点距离与所述最大距离值的比值的平方值,将所述平方值的符号位取反位后的值作为常数e的幂,计算出所述待处理特征向量与所述其余特征向量的两点密度值;
求取所述特征向量中所述其余特征向量的两点密度值的和值,将所述和值作为所述待处理特征向量的聚类密度。
3.如权利要求1所述的一种商品的风格分类确定方法,其特征在于,所述计算与比所述特征向量聚类密度高的周围特征向量之间的密度距离包括:
在判断存在待处理特征向量的第一特征向量时,从所述第一特征向量中选取与所述待处理特征向量距离最小的第二特征向量所对应的距离作为所述待处理特征向量的密度距离;否则,选取与所述待处理特征向量距离最小的特征向量所对应的距离作为所述待处理特征向量的密度距离。
4.如权利要求1所述的一种商品的风格分类确定方法,其特征在于,所述根据所述特征向量的聚类密度和密度距离确定所述特征向量聚类的初始数量和初始中心包括:
计算所述特征向量的聚类密度和密度距离的乘积值,选取所述乘积值中最大的前K个乘积值所对应的特征向量作为聚类的初始中心,K为设置的聚类的初始数量,K≥2。
5.如权利要求1所述的一种商品的风格分类确定方法,其特征在于,所述根据所述聚类的初始数量和初始中心对所述商品图片进行特征向量聚类,获取满足设置的聚类稳定条件的聚类结果包括:
将所述特征向量归类到距离所述特征向量最近的初始中心的聚类中;
执行重新计算所述聚类的聚类中心、将所述特征向量归类到距离最近的聚类中心,直至满足聚类的收敛条件,获取收敛后聚类数据;
判断收敛后聚类数据是否满足设置的聚类稳定条件,若不满足,则调整所述聚类的初始数量,重新计算获取收敛后聚类数据;将满足所述聚类稳定条件的收敛后聚类数据作为聚类结果。
6.如权利要求5所述的一种商品的风格分类确定方法,其特征在于,所述聚类稳定条件包括:
所述收敛后聚类数据的中心点至相应聚类的所述初始中心的偏移量小于第一预设阀值:
获取所述收敛后聚类数据中特征向量的聚类密度与密度距离的乘积中的第一最大值和第二最大值,确定所述第一最大值至所述收敛后聚类数据中心点的第一距离以及所述第一最大值和第二最大值的第二距离,计算出的所述第一距离与所述第二距离的比值小于第二预设阀值。
7.如权利要求1所述的一种商品的风格分类确定方法,其特征在于,所述方法还包括下述中的至少一个实施步骤:
从所述风格分类中选取出距离聚类中心最近的前T1个商品图片作为所述风格分类的分类代表图片,T1≥1;
从当前风格分类中选取距离目标风格分类的聚类中心最近的前T2个商品图片作为当前风格分类的区别代表图片,T2≥1。
8.如权利要求1至7中任意一项所述的一种商品的风格分类确定方法,其特征在于,所述训练后卷积神经网络包括采用下述方式训练得到的卷积神经网络:
将采集的训练样本图片的颜色信息转换为RGB三通道颜色信息;
将所述训练样本图片的短边缩放至第一预设值,相应的,所述训练样本图片的长边按照所述短边的缩放比例进行同比例缩放,形成第一样本图片;
以所述第一样本图片的长边和短边的垂直中分线交点为中心点将所述第一样本图片裁剪为边长为所述第一预设值的正方形样本图片;
确定出边长为第二预设值的正方形裁剪图片,将所述正方形裁剪图片在所述正方形样本图片内按照指定单位像素进行移动,获取第一扩展样本图片;
以所述第一扩展样本图片的一条垂边为轴做镜像翻转生成第二扩展样本图片,将所述第一扩展样本图片和所述第二扩展样本图片作为训练的第二样本图片;
将所述第二样本图片在预先设置的卷积神经网络中进行训练,确定出训练后卷积神经网络,所述预先设置的卷积神经网络被设置成,包括:
三层卷积层、两层全连通层、三层RELU层、三层Maxpooling层、一层Softmax层。
9.一种商品的风格分类确定装置,其特征在于,所述装置包括:
特征提取模块,用于存储训练后卷积神经网络,还用于获取商品图片,并利用所述训练后卷积神经网络提取所述商品图片的特征向量;
密度和距离计算模块,用于计算所述特征向量的聚类密度,以及根据所述聚类密度计算与比所述特征向量聚类密度值大的第一特征向量之间的密度距离;
初始聚类计算模块,用于根据所述特征向量的聚类密度和密度距离确定所述特征向量聚类的初始数量和初始中心;
聚类处理模块,用于根据所述聚类的初始数量和初始中心对所述商品图片进行特征向量聚类;还用于存储设置的聚类稳定条件,以及判断所述初始聚类计算模块聚类的结果是否满足所述聚类稳定条件,获取满足所述聚类稳定条件的聚类结果;
风格分类模块,用于根据所述聚类结果确定商品的风格分类。
10.如权利要求9所述的一种商品的风格分类确定装置,其特征在于,所述密度和距离计算模块包括下述中的至少一种:
密度计算模块,用于计算所述特征向量中待处理特征向量与其余特征向量之间的两点距离,获取所述距离中的最大距离值;以及,计算所述待处理特征向量与所述其余特征向量的两点距离与所述最大距离值的比值的平方值,将所述平方值的符号位取反位后的值作为常数e的幂,计算出所述待处理特征向量与所述其余特征向量的两点密度值;求取所述特征向量中所述其余特征向量的两点密度值的和值,将所述和值作为所述待处理特征向量的聚类密度;
距离计算模块,用于判断是否存在比待处理特征向量的聚类密度高的第一特征向量;当判断结果为是时,从所述第一特征向量中选取与所述待处理特征向量距离最小的第二特征向量所对应的距离作为所述待处理特征向量的密度距离;否则,选取与所述待处理特征向量距离最小的特征向量所对应的距离作为所述待处理特征向量的密度距离。
11.如权利要求9所述的一种商品的风格分类确定装置,其特征在于,所述初始聚类计算模块包括:
计算排序模块,用于计算所述特征向量的聚类密度和密度距离的乘积值;
选取模块,用于选取所述乘积值最大的前K个乘积值所对应的特征向量作为聚类的初始中心,K为设置的聚类的初始数量,K≥2。
12.如权利要求9所述的一种商品的风格分类确定装置,其特征在于,所述聚类处理模块包括:
第一聚类模块,用于将所述特征向量归类到距离所述特征向量最近的初始中心的聚类中;
第二聚类模块,用于执行重新计算所述聚类的聚类中心、将所述特征向量归类到距离最近的聚类中心,直至满足聚类的收敛条件,获取收敛后聚类数据;
调整处理模块,用于判断收敛后聚类数据是否满足设置的聚类稳定条件,若不满足,则调整所述聚类的初始数量,重新计算获取收敛后聚类数据;将满足所述聚类稳定条件的收敛后聚类数据作为聚类结果。
13.如权利要求12所述的一种商品的风格分类确定装置,其特征在于,所述聚类稳定条件包括:
计算出的所述收敛后聚类数据的中心点至相应聚类的所述初始中心的偏移量小于第一预设阀值:
获取所述收敛后聚类数据中特征向量的聚类密度与密度距离的乘积中的第一最大值和第二最大值,确定所述第一最大值至所述收敛后聚类数据中心点的第一距离以及所述第一最大值和第二最大值的第二距离,计算出的所述第一距离与所述第二距离的比值小于第二预设阀值。
14.如权利要求9所述的一种商品的风格分类确定装置,其特征在于,所述装置还包括下述中的至少一项:
代表图片选取模块,用于从所述风格分类中选取出距离聚类中心最近的前T1个商品图片作为所述风格分类的分类代表图片,T1≥1;
区别图片选取模块,用于从当前风格分类中选取距离目标风格分类的聚类中心最近的前T2个商品图片作为当前风格分类的区别代表图片,T2≥1。
15.如权利要求9至14中任意一项所述的一种商品的风格分类确定装置,其特征在于,所述特征提取模块包括:
颜色信息转换模块,用于将采集的训练样本图片的颜色信息转换为RGB三通道颜色信息;
缩放模块,用于将所述训练样本图片的短边缩放至第一预设值,相应的,所述训练样本图片的长边按照所述短边的缩放比例进行同比例缩放,形成第一样本图片;
中心区域裁剪模块,用于以所述第一样本图片的长边和短边的垂直中分线交点为中心点将所述第一样本图片裁剪为边长为所述第一预设值的正方形样本图片;
第一扩展模块,用于确定出边长为第二预设值的正方形裁剪图片,将所述正方形裁剪图片在所述正方形样本图片内按照指定单位像素进行移动,获取第一扩展样本图片;
第二扩展模块,用于以所述第一扩展样本图片的一条垂边为轴做镜像翻转生成第二扩展样本图片,将所述第一扩展样本图片和所述第二扩展样本图片作为训练的第二样本图片;
训练模块,用于将所述第二样本图片在预先设置的卷积神经网络中进行训练,确定出训练后卷积神经网络,所述预先设置的卷积神经网络被设置成,包括:
三层卷积层、两层全连通层、三层RELU层、三层Maxpooling层、一层Softmax层。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510922584.2A CN106874923A (zh) | 2015-12-14 | 2015-12-14 | 一种商品的风格分类确定方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510922584.2A CN106874923A (zh) | 2015-12-14 | 2015-12-14 | 一种商品的风格分类确定方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106874923A true CN106874923A (zh) | 2017-06-20 |
Family
ID=59178116
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510922584.2A Pending CN106874923A (zh) | 2015-12-14 | 2015-12-14 | 一种商品的风格分类确定方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106874923A (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107562793A (zh) * | 2017-08-01 | 2018-01-09 | 佛山市深研信息技术有限公司 | 一种大数据挖掘方法 |
CN107704455A (zh) * | 2017-10-30 | 2018-02-16 | 成都市映潮科技股份有限公司 | 一种信息处理方法及电子设备 |
CN107818341A (zh) * | 2017-10-25 | 2018-03-20 | 天津大学 | 一种基于改进K‑means算法的颜色提取方法 |
CN107861972A (zh) * | 2017-09-15 | 2018-03-30 | 广州唯品会研究院有限公司 | 一种用户录入商品信息后显示商品全结果的方法及设备 |
CN107944481A (zh) * | 2017-11-16 | 2018-04-20 | 百度在线网络技术(北京)有限公司 | 用于生成信息的方法和装置 |
CN108197574A (zh) * | 2018-01-04 | 2018-06-22 | 张永刚 | 人物风格识别方法、终端及计算机可读存储介质 |
CN108491864A (zh) * | 2018-02-27 | 2018-09-04 | 西北工业大学 | 基于自动确定卷积核大小卷积神经网络的高光谱图像分类 |
CN108595585A (zh) * | 2018-04-18 | 2018-09-28 | 平安科技(深圳)有限公司 | 样本数据分类方法、模型训练方法、电子设备及存储介质 |
CN109255368A (zh) * | 2018-08-07 | 2019-01-22 | 平安科技(深圳)有限公司 | 随机选取特征的方法、装置、电子设备及存储介质 |
CN109271460A (zh) * | 2018-09-29 | 2019-01-25 | 阿里巴巴集团控股有限公司 | 对电子平台中的商户进行分类的方法和装置 |
CN109271544A (zh) * | 2018-07-11 | 2019-01-25 | 中国科学院自动化研究所 | 自动挑选画家代表作的方法及装置 |
CN109299259A (zh) * | 2018-09-26 | 2019-02-01 | 深圳壹账通智能科技有限公司 | 企业发票数据监测方法、装置、计算机设备和存储介质 |
CN109389175A (zh) * | 2018-10-24 | 2019-02-26 | 广东工业大学 | 一种图片分类方法及装置 |
CN109684950A (zh) * | 2018-12-12 | 2019-04-26 | 联想(北京)有限公司 | 一种处理方法及电子设备 |
CN110362709A (zh) * | 2019-06-11 | 2019-10-22 | 北京百度网讯科技有限公司 | 人物配图选取方法、装置、计算机设备及存储介质 |
CN110458236A (zh) * | 2019-08-14 | 2019-11-15 | 有米科技股份有限公司 | 一种广告文案风格识别方法和系统 |
CN110647826A (zh) * | 2019-09-05 | 2020-01-03 | 北京百度网讯科技有限公司 | 商品训练图片的获取方法、装置、计算机设备和存储介质 |
CN110659175A (zh) * | 2018-06-30 | 2020-01-07 | 中兴通讯股份有限公司 | 日志的主干提取方法、分类方法、设备及存储介质 |
CN111161814A (zh) * | 2019-12-18 | 2020-05-15 | 浙江大学 | 一种基于卷积神经网络的DRGs自动分组方法 |
CN111199223A (zh) * | 2018-11-19 | 2020-05-26 | 北京京东尚科信息技术有限公司 | 识别方法和设备、存储介质及处理器 |
CN112818146A (zh) * | 2021-01-26 | 2021-05-18 | 山西三友和智慧信息技术股份有限公司 | 一种基于产品图像风格的推荐方法 |
TWI738349B (zh) * | 2020-02-18 | 2021-09-01 | 大陸商深圳市商湯科技有限公司 | 圖像處理方法及圖像處理裝置、電子設備和電腦可讀儲存媒體 |
CN116340991A (zh) * | 2023-02-02 | 2023-06-27 | 魔萌动漫文化传播(深圳)有限公司 | Ip图库素材资源的大数据管理方法、装置以及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102509111A (zh) * | 2011-11-02 | 2012-06-20 | 大连理工大学 | 基于局部特征多级聚类及图像-类距离计算的商品图像自动分类算法 |
CN104731916A (zh) * | 2015-03-24 | 2015-06-24 | 无锡中科泛在信息技术研发中心有限公司 | 数据挖掘中基于密度优化初始中心的k均值聚类方法 |
CN104765879A (zh) * | 2015-04-28 | 2015-07-08 | 无锡中科泛在信息技术研发中心有限公司 | 数据挖掘中基于密度的k中心点划分聚类方法 |
CN104866524A (zh) * | 2015-04-10 | 2015-08-26 | 大连交通大学 | 一种商品图像精细分类方法 |
CN105069472A (zh) * | 2015-08-03 | 2015-11-18 | 电子科技大学 | 一种基于卷积神经网络自适应的车辆检测方法 |
-
2015
- 2015-12-14 CN CN201510922584.2A patent/CN106874923A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102509111A (zh) * | 2011-11-02 | 2012-06-20 | 大连理工大学 | 基于局部特征多级聚类及图像-类距离计算的商品图像自动分类算法 |
CN104731916A (zh) * | 2015-03-24 | 2015-06-24 | 无锡中科泛在信息技术研发中心有限公司 | 数据挖掘中基于密度优化初始中心的k均值聚类方法 |
CN104866524A (zh) * | 2015-04-10 | 2015-08-26 | 大连交通大学 | 一种商品图像精细分类方法 |
CN104765879A (zh) * | 2015-04-28 | 2015-07-08 | 无锡中科泛在信息技术研发中心有限公司 | 数据挖掘中基于密度的k中心点划分聚类方法 |
CN105069472A (zh) * | 2015-08-03 | 2015-11-18 | 电子科技大学 | 一种基于卷积神经网络自适应的车辆检测方法 |
Non-Patent Citations (1)
Title |
---|
ALEX RODRIGUEZ等: "Clustering by fast search and find of density peaks", 《SCIENCE》 * |
Cited By (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107562793A (zh) * | 2017-08-01 | 2018-01-09 | 佛山市深研信息技术有限公司 | 一种大数据挖掘方法 |
CN107861972A (zh) * | 2017-09-15 | 2018-03-30 | 广州唯品会研究院有限公司 | 一种用户录入商品信息后显示商品全结果的方法及设备 |
CN107861972B (zh) * | 2017-09-15 | 2022-02-22 | 广州唯品会研究院有限公司 | 一种用户录入商品信息后显示商品全结果的方法及设备 |
CN107818341A (zh) * | 2017-10-25 | 2018-03-20 | 天津大学 | 一种基于改进K‑means算法的颜色提取方法 |
CN107704455A (zh) * | 2017-10-30 | 2018-02-16 | 成都市映潮科技股份有限公司 | 一种信息处理方法及电子设备 |
CN107944481B (zh) * | 2017-11-16 | 2022-02-18 | 百度在线网络技术(北京)有限公司 | 用于生成信息的方法和装置 |
CN107944481A (zh) * | 2017-11-16 | 2018-04-20 | 百度在线网络技术(北京)有限公司 | 用于生成信息的方法和装置 |
CN108197574B (zh) * | 2018-01-04 | 2020-09-08 | 张永刚 | 人物风格识别方法、终端及计算机可读存储介质 |
CN108197574A (zh) * | 2018-01-04 | 2018-06-22 | 张永刚 | 人物风格识别方法、终端及计算机可读存储介质 |
CN108491864A (zh) * | 2018-02-27 | 2018-09-04 | 西北工业大学 | 基于自动确定卷积核大小卷积神经网络的高光谱图像分类 |
CN108491864B (zh) * | 2018-02-27 | 2020-05-01 | 西北工业大学 | 基于自动确定卷积核大小卷积神经网络的高光谱图像分类 |
CN108595585A (zh) * | 2018-04-18 | 2018-09-28 | 平安科技(深圳)有限公司 | 样本数据分类方法、模型训练方法、电子设备及存储介质 |
WO2019200782A1 (zh) * | 2018-04-18 | 2019-10-24 | 平安科技(深圳)有限公司 | 样本数据分类方法、模型训练方法、电子设备及存储介质 |
CN110659175A (zh) * | 2018-06-30 | 2020-01-07 | 中兴通讯股份有限公司 | 日志的主干提取方法、分类方法、设备及存储介质 |
CN109271544A (zh) * | 2018-07-11 | 2019-01-25 | 中国科学院自动化研究所 | 自动挑选画家代表作的方法及装置 |
CN109271544B (zh) * | 2018-07-11 | 2020-11-13 | 中国科学院自动化研究所 | 自动挑选画家代表作的方法及装置 |
CN109255368B (zh) * | 2018-08-07 | 2023-12-22 | 平安科技(深圳)有限公司 | 随机选取特征的方法、装置、电子设备及存储介质 |
CN109255368A (zh) * | 2018-08-07 | 2019-01-22 | 平安科技(深圳)有限公司 | 随机选取特征的方法、装置、电子设备及存储介质 |
CN109299259A (zh) * | 2018-09-26 | 2019-02-01 | 深圳壹账通智能科技有限公司 | 企业发票数据监测方法、装置、计算机设备和存储介质 |
CN109271460B (zh) * | 2018-09-29 | 2021-09-03 | 创新先进技术有限公司 | 对电子平台中的商户进行分类的方法和装置 |
CN109271460A (zh) * | 2018-09-29 | 2019-01-25 | 阿里巴巴集团控股有限公司 | 对电子平台中的商户进行分类的方法和装置 |
CN109389175A (zh) * | 2018-10-24 | 2019-02-26 | 广东工业大学 | 一种图片分类方法及装置 |
CN111199223A (zh) * | 2018-11-19 | 2020-05-26 | 北京京东尚科信息技术有限公司 | 识别方法和设备、存储介质及处理器 |
CN109684950A (zh) * | 2018-12-12 | 2019-04-26 | 联想(北京)有限公司 | 一种处理方法及电子设备 |
CN110362709A (zh) * | 2019-06-11 | 2019-10-22 | 北京百度网讯科技有限公司 | 人物配图选取方法、装置、计算机设备及存储介质 |
CN110458236A (zh) * | 2019-08-14 | 2019-11-15 | 有米科技股份有限公司 | 一种广告文案风格识别方法和系统 |
CN110647826B (zh) * | 2019-09-05 | 2022-04-29 | 北京百度网讯科技有限公司 | 商品训练图片的获取方法、装置、计算机设备和存储介质 |
US11599743B2 (en) | 2019-09-05 | 2023-03-07 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method and apparatus for obtaining product training images, and non-transitory computer-readable storage medium |
CN110647826A (zh) * | 2019-09-05 | 2020-01-03 | 北京百度网讯科技有限公司 | 商品训练图片的获取方法、装置、计算机设备和存储介质 |
CN111161814A (zh) * | 2019-12-18 | 2020-05-15 | 浙江大学 | 一种基于卷积神经网络的DRGs自动分组方法 |
TWI738349B (zh) * | 2020-02-18 | 2021-09-01 | 大陸商深圳市商湯科技有限公司 | 圖像處理方法及圖像處理裝置、電子設備和電腦可讀儲存媒體 |
CN112818146A (zh) * | 2021-01-26 | 2021-05-18 | 山西三友和智慧信息技术股份有限公司 | 一种基于产品图像风格的推荐方法 |
CN116340991A (zh) * | 2023-02-02 | 2023-06-27 | 魔萌动漫文化传播(深圳)有限公司 | Ip图库素材资源的大数据管理方法、装置以及电子设备 |
CN116340991B (zh) * | 2023-02-02 | 2023-11-07 | 魔萌动漫文化传播(深圳)有限公司 | Ip图库素材资源的大数据管理方法、装置以及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106874923A (zh) | 一种商品的风格分类确定方法及装置 | |
CN106874296A (zh) | 一种商品的风格识别方法及装置 | |
CN106446930B (zh) | 基于深层卷积神经网络的机器人工作场景识别方法 | |
CN106201535B (zh) | 工具栏背景颜色随着图片的主颜色而变换的方法和装置 | |
US9396560B2 (en) | Image-based color palette generation | |
CN106898026B (zh) | 一种图片的主色调提取方法和装置 | |
CN106874924A (zh) | 一种图片风格识别方法及装置 | |
CN109447169A (zh) | 图像处理方法及其模型的训练方法、装置和电子系统 | |
EP2779094A2 (en) | Segmentation of an image based on color and color differences | |
CN108052765A (zh) | 基于人格印象的配色方案自动生成方法及装置 | |
CN102129693B (zh) | 基于色彩直方图和全局对比度的图像视觉显著性计算方法 | |
CN108898579A (zh) | 一种图像清晰度识别方法、装置和存储介质 | |
CN109978918A (zh) | 一种轨迹追踪方法、装置和存储介质 | |
CN107392968B (zh) | 融合颜色对比图和颜色空间分布图的图像显著性检测方法 | |
CN108090508A (zh) | 一种分类训练方法、装置及存储介质 | |
CN102651128B (zh) | 一种基于采样的图像集分割方法 | |
CN106846344A (zh) | 一种基于边缘完备度的图像分割最优识别方法 | |
CN103164687B (zh) | 一种色情图像侦测的方法和系统 | |
CN107330750A (zh) | 一种推荐产品配图方法及装置,电子设备 | |
CN107133651A (zh) | 基于超网络判别子图的功能磁共振影像数据分类方法 | |
CN104636759A (zh) | 一种获取图片推荐滤镜信息的方法及图片滤镜信息推荐系统 | |
CN107977624A (zh) | 一种语义分割方法、装置以及系统 | |
CN111079807B (zh) | 一种地物分类方法及装置 | |
CN106327537A (zh) | 一种图像预处理方法及装置 | |
CN103514254A (zh) | 一种挖掘用户隐性操作行为的图像集合排序方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170620 |