CN110363251A - 一种sku图像分类方法、装置、电子设备及存储介质 - Google Patents

一种sku图像分类方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN110363251A
CN110363251A CN201910666546.3A CN201910666546A CN110363251A CN 110363251 A CN110363251 A CN 110363251A CN 201910666546 A CN201910666546 A CN 201910666546A CN 110363251 A CN110363251 A CN 110363251A
Authority
CN
China
Prior art keywords
sku
image
spu
foreground area
mask
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910666546.3A
Other languages
English (en)
Other versions
CN110363251B (zh
Inventor
宋佩红
余拓
陈永志
向阳
何梓轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Jiayun Data Technology Co Ltd
Original Assignee
Hangzhou Jiayun Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Jiayun Data Technology Co Ltd filed Critical Hangzhou Jiayun Data Technology Co Ltd
Priority to CN201910666546.3A priority Critical patent/CN110363251B/zh
Publication of CN110363251A publication Critical patent/CN110363251A/zh
Application granted granted Critical
Publication of CN110363251B publication Critical patent/CN110363251B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请所提供的一种SKU图像分类方法,包括:利用SPU匹配方法聚合同款SPU的SPU图像;其中,任一款SPU包括至少两种SKU;将各个SKU图像中SKU所在区域作为mask;其中,各个SKU图像均包含于同一款SPU对应的SPU图像;根据各个mask确定对应的颜色信息,并计算各个SKU图像之间的颜色距离;若颜色距离小于预设阈值,则确定对应的两个SKU图像为同种SKU图像。该方法解决了相关技术中无法分类背景不相同的SKU的问题,能够在保证精确度的前提下提高了召回率。此外,该方法利用SPU匹配方法,降低SKU图像分类范围,降低了分类的总体时间开销。本申请还提供一种SKU图像分类装置、电子设备及计算机可读存储介质,均具有上述有益效果。

Description

一种SKU图像分类方法、装置、电子设备及存储介质
技术领域
本申请涉及深度学习/计算机视觉技术领域,特别涉及一种SKU图像分类方法、装置、电子设备及计算机可读存储介质。
背景技术
SKU分类的任务是将多个商家提供的相同SKU聚合到一起,常用的技术是图像匹配技术。具体而言是指,根据某个SKU的图像,将其与其他网络商家提供的SKU图像进行匹配,若图像相同,则认为这些商家提供相同的SKU,并将这些SKU聚合在一起;否则,则认为该商家并不提供与其他商家相同的SKU。SKU:全称为Standard Keeping Unit,用于描述一个商品的规格、颜色、款式。比如银色iphone xs就是一个SKU。
目前,SKU分类项目一般采用传统的图像处理技术,例如感知哈希方法或者深度学习方法,判断两个SKU图片是否相同。若相同,则认为是同种SKU;反之亦然。
在现有的SKU分类应用场景下,精确度和召回率需要同时被保证。现有方法例如感知哈希方法或者深度学习方法,直接使用SKU图像做图像级别的匹配,会使大量背景不相同的SKU无法分类到一起。
因此,如何在保证精确度的前提下,召回更多的同种SKU是本领域技术人员亟需解决的技术问题。
发明内容
本申请的目的是提供一种SKU图像分类方法、装置、电子设备及计算机可读存储介质,能够在保证精确度的前提下,召回更多的同种SKU。
为解决上述技术问题,本申请提供一种SKU图像分类方法,包括:
利用SPU匹配方法聚合同款SPU的SPU图像;其中,任一款所述SPU包括至少两种SKU;
将各个SKU图像中SKU所在区域作为mask;其中,各个所述SKU图像均包含于同一款所述SPU对应的SPU图像;
根据各个所述mask确定对应的颜色信息,并计算各个所述SKU图像之间的颜色距离;
若所述颜色距离小于预设阈值,则确定对应的两个SKU图像为同种SKU图像。
优选地,所述利用SPU匹配方法聚合同款SPU的SPU图像,包括:
利用感知哈希方法或深度学习方法聚合同款SPU的SPU图像。
优选地,所述将各个SKU图像中SKU所在区域作为mask,包括:
利用图像分割算法提取各个所述SKU图像中SKU相关的第一前景区域;
采用分割效果分算法判断所述第一前景区域是否满足第一预设条件;
若所述第一前景区域满足所述第一预设条件,则将所述第一前景区域作为所述mask;
若所述第一前景区域不满足所述第一预设条件,则判断各个所述SKU图像是否为纯色图;
若任一所述SKU图像为所述纯色图,则根据所述SKU图像的背景色进行二值化处理,并将二值化处理后的第一前景区域的最大连通域作为所述mask;
若任一所述SKU图像不为所述纯色图,则利用关键点检测算法获取各个所述SKU图像中SKU相关的第二前景区域;
采用关键点检测效果分算法判断所述第二前景区域是否满足第二预设条件;
若所述第二前景区域满足所述第二预设条件,则将所述第二前景区域作为所述mask;
若所述第二前景区域不满足所述第二预设条件,则分别利用显著性检测算法和物体检测算法获取各个所述SKU图像中SKU相关的第三前景区域和第四前景区域;
将所述第三前景区域和所述第四前景区域的交集区域作为所述mask。
优选地,所述根据各个所述mask确定对应的颜色信息,并计算各个所述SKU图像之间的颜色距离,包括:
利用颜色聚类方法聚类出所述mask中出现频率最高的三种颜色,并保存对应的颜色出现频率;
将三种所述颜色及对应的颜色出现频率作为所述mask的所述颜色信息;
根据所述颜色信息,计算任意两个所述SKU图像之间的颜色距离。
本申请还提供一种SKU图像分类装置,包括:
SPU图像聚合模块,用于利用SPU匹配方法聚合同款SPU的SPU图像;其中,任一款所述SPU包括至少两种SKU;
mask确定模块,用于将各个SKU图像中SKU所在区域作为mask;其中,各个所述SKU图像均包含于同一款所述SPU对应的SPU图像;
颜色距离计算模块,用于根据各个所述mask确定对应的颜色信息,并计算各个所述SKU图像之间的颜色距离;
SKU图像分类模块,用于若所述颜色距离小于预设阈值,则确定对应的两个SKU图像为同种SKU图像。
优选地,所述SPU图像聚合模块,包括:
SPU图像聚合单元,用于利用感知哈希方法或深度学习方法聚合同款SPU的SPU图像。
优选地,所述mask确定模块,包括:
第一前景区域提取单元,用于利用图像分割算法提取各个所述SKU图像中SKU相关的第一前景区域;
第一预设条件满足判断单元,用于采用分割效果分算法判断所述第一前景区域是否满足第一预设条件;
第一mask确定单元,用于若所述第一前景区域满足所述第一预设条件,则将所述第一前景区域作为所述mask;
纯色图判断单元,用于若所述第一前景区域不满足所述第一预设条件,则判断各个所述SKU图像是否为纯色图;
第二mask确定单元,用于若任一所述SKU图像为所述纯色图,则根据所述SKU图像的背景色进行二值化处理,并将二值化处理后的第一前景区域的最大连通域作为所述mask;
第二前景区域提取单元,用于若任一所述SKU图像不为所述纯色图,则利用关键点检测算法获取各个所述SKU图像中SKU相关的第二前景区域;
第二预设条件满足判断单元,用于采用关键点检测效果分算法判断所述第二前景区域是否满足第二预设条件;
第三mask确定单元,用于若所述第二前景区域满足所述第二预设条件,则将所述第二前景区域作为所述mask;
第三和第四前景区域提取单元,用于若所述第二前景区域不满足所述第二预设条件,则分别利用显著性检测算法和物体检测算法获取各个所述SKU图像中SKU相关的第三前景区域和第四前景区域;
第四mask确定单元,用于将所述第三前景区域和所述第四前景区域的交集区域作为所述mask。
优选地,所述颜色距离计算模块,包括:
颜色聚类单元,用于利用颜色聚类方法聚类出所述mask中出现频率最高的三种颜色,并保存对应的颜色出现频率;
颜色信息确定单元,用于将三种所述颜色及对应的颜色出现频率作为所述mask的所述颜色信息;
颜色距离计算单元,用于根据所述颜色信息,计算任意两个所述SKU图像之间的颜色距离。
本申请还提供一种电子设备,包括:
存储器和处理器;其中,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现上述所述的SKU图像分类方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述所述的SKU图像分类方法的步骤。
本申请所提供的一种SKU图像分类方法,包括:利用SPU匹配方法聚合同款SPU的SPU图像;其中,任一款所述SPU包括至少两种SKU;将各个SKU图像中SKU所在区域作为mask;其中,各个所述SKU图像均包含于同一款所述SPU对应的SPU图像;根据各个所述mask确定对应的颜色信息,并计算各个所述SKU图像之间的颜色距离;若所述颜色距离小于预设阈值,则确定对应的两个SKU图像为同种SKU图像。
该方法先是利用SPU匹配方法聚合同款SPU的SPU图像,再将各个SKU图像中SKU所在区域作为mask,根据各个所述mask确定对应的颜色信息,并计算各个所述SKU图像之间的颜色距离,若所述颜色距离小于预设阈值,则确定对应的两个SKU图像为同种SKU图像。可见,该方法解决了相关技术中无法分类背景不相同的SKU的问题,能够在保证精确度的前提下提高了召回率。此外,该方法利用SPU匹配方法,降低SKU分类范围,降低了分类的总体时间开销。本申请还提供一种SKU图像分类装置、电子设备及计算机可读存储介质,均具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例所提供的一种SKU图像分类方法的流程图;
图2为本申请实施例所提供的一种SkuMerge系统结构示意图;
图3为本申请实施例所提供的一种SKU图像分类装置的结构框图。
具体实施方式
本申请的核心是提供一种SKU图像分类方法,能够在保证精确度的前提下,召回更多的同种SKU。本申请的另一核心是提供一种SKU图像分类装置、电子设备及计算机可读存储介质。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前,SKU分类项目一般采用传统的图像处理技术,例如感知哈希方法或者深度学习方法,判断两个SKU图片是否相同。若相同,则认为是同种SKU;反之亦然。在现有的SKU分类应用场景下,精确度和召回率需要同时被保证。现有方法例如感知哈希方法或者深度学习方法,直接使用SKU图像做图像级别的匹配,会使大量背景不相同的SKU无法分类到一起。本申请提供的一种SKU图像分类方法,能够在保证精确度的前提下,召回更多的同种SKU。具体请参考图1,图1为本申请实施例所提供的一种SKU图像分类方法的流程图,该SKU图像分类方法包括:
S101、利用SPU匹配方法聚合同款SPU的SPU图像;其中,任一款SPU包括至少两种SKU;
在一种实施例中,上述利用SPU匹配方法聚合同款SPU的SPU图像,包括:利用感知哈希方法或深度学习方法聚合同款SPU的SPU图像。其中,SPU:全称为Standard ProductUnit,用于描述一个商品。比如iphone xs就是一个SPU,与商家,与颜色、款式、套餐都无关。SKU:全称为Standard Keeping Unit,用于描述一个商品的规格、颜色、款式。比如银色iphone xs就是一个SKU。
S102、将各个SKU图像中SKU所在区域作为mask;其中,各个SKU图像均包含于同一款SPU对应的SPU图像;
在一种实施例中,上述将各个SKU图像中SKU所在区域作为mask,包括:
利用图像分割算法提取各个SKU图像中SKU相关的第一前景区域;
采用分割效果分算法判断第一前景区域是否满足第一预设条件;
若第一前景区域满足第一预设条件,则将第一前景区域作为mask;
若第一前景区域不满足第一预设条件,则判断各个SKU图像是否为纯色图;
若任一SKU图像为纯色图,则根据SKU图像的背景色进行二值化处理,并将二值化处理后的第一前景区域的最大连通域作为mask;
若任一SKU图像不为纯色图,则利用关键点检测算法获取各个SKU图像中SKU相关的第二前景区域;
采用关键点检测效果分算法判断第二前景区域是否满足第二预设条件;
若第二前景区域满足第二预设条件,则将第二前景区域作为mask;
若第二前景区域不满足第二预设条件,则分别利用显著性检测算法和物体检测算法获取各个SKU图像中SKU相关的第三前景区域和第四前景区域;
将第三前景区域和第四前景区域的交集区域作为mask。
其中,mask:掩码,用于描述一张图像中的有用区域。显著性检测:图像处理技术,用于获取图像中的前景区域。图像分割:图像处理技术,用于获取图像中的目标区域。关键点检测:图像处理技术,用于获取图像中目标物的关键点信息。
S103、根据各个mask确定对应的颜色信息,并计算各个SKU图像之间的颜色距离;
在一种实施例中,上述根据各个mask确定对应的颜色信息,并计算各个SKU图像之间的颜色距离,包括:
利用颜色聚类方法聚类出mask中出现频率最高的三种颜色,并保存对应的颜色出现频率;
将三种颜色及对应的颜色出现频率作为mask的颜色信息;
根据颜色信息,计算任意两个SKU图像之间的颜色距离。
S104、若颜色距离小于预设阈值,则确定对应的两个SKU图像为同种SKU图像。
该方法先是利用SPU匹配方法聚合同款SPU的SPU图像,再将各个SKU图像中SKU所在区域作为mask,根据各个所述mask确定对应的颜色信息,并计算各个所述SKU图像之间的颜色距离,若所述颜色距离小于预设阈值,则确定对应的两个SKU图像为同种SKU图像。可见,该方法解决了相关技术中无法聚合背景不相同的SKU的问题,能够在保证精确度的前提下提高了召回率。此外,该方法利用SPU匹配方法,降低SKU分类范围,降低了分类的总体时间开销。
下面就一种优选实施例对上述内容进行说明:
本发明提出了一种新的系统SkuMerge,将多种技术方法结合在一起,旨在提高SKU分类方法的召回率。具体而言,首先利用SPU匹配方法将同款SPU聚合在一起。需要说明的是:同款SPU会有多个商家提供,并且每个商家提供的SPU包含多个SKU;接着,针对每个SKU图像,利用mask pipline方法提取图像中SKU相关商品所在区域作为mask,过滤背景信息;接着,根据该mask,得到其对应的颜色信息;然后计算同款SPU中,多个SKU之间的颜色距离,若距离小于某个阈值,则认为是同款SKU;最后,利用SKU合并方法将同款SKU进行合并,得到最终的结果。其中,pipline为描述完成某项任务的步骤。
具体地,本发明主要包括5个模块,(1)SPU匹配模块,用于过滤非同款SPU之间的SKU分类;(2)hack模块,用于获取图像级别的SKU匹配;(3)mask pipline模块,用于提取图像中的SKU相关商品所在区域,过滤图像背景信息;(4)颜色信息提取模块:推断该SKU的主要颜色,以及其出现频率;(5)SKU合并模块:计算同款SPU中任意两个SKU之间的距离,判定它们是否属于相同SKU,并将该部分结果与hack模块的匹配结果进行合并。可参见图2,图2为本申请实施例所提供的一种SkuMerge系统结构示意图。其中,hack表示利用简单的图像处理技术完成图像匹配任务。
(1)SPU匹配模块
SPU匹配模块主要利用图像匹配算法,例如感知哈希方法或者深度学习方法,判定任意两个SPU的首图是否相同。若相同,则认为这两个SPU属于同个SPU。该模块的好处有:[1]减少了后面几个模块所需的时间开销,若某个SPU不存在同款SPU,则不需要做SKU分类。这里假设同个商家不会提供多个相同的SKU。[2]提高SKU匹配的精确度和召回率。通过SPU匹配,过滤不同SPU之间可能的SKU匹配,比如二维码图,多款SPU拥有相同的SKU图——二维码图,能够提高精确度。[3]多个商家提供的SKU差异很大,这种方法能够使得多个差异很大的SKU聚合在一起,提高召回率。
(2)hack模块
hack模块主要内容为:针对同款SPU的任意SKU图像,利用感知哈希算法对SKU图像进行匹配,认为拥有相同哈希值的SKU图像属于相同SKU,进而得到SKU匹配对。
(3)mask pipline模块
mask pipline模块是本发明的核心模块,它包含了以下几个步骤:
[1]基于图像分割算法的前景提取:对输入图片,利用图像分割算法提取SKU相关的前景区域,并使用分割效果分算法来判断提取的前景区域是否合理。若合理,则将该部分前景区域作为mask;否则进入步骤[2]。
[2]基于纯色图判定的前景提取:对输入图像,判定该图片是否是纯色图。若是,则获取背景色,并根据背景色对图像进行二值化处理,过滤背景,这里取前景的最大连通域作为mask;否则进入步骤[3];
[3]基于图像关键点检测算法的前景提取:对于输入图像,利用关键点检测算法获取SKU相关的前景区域,并用关键点检测效果分算法判定该前景区域是否合理;若合理,则该部分前景区域作为mask,否则进入步骤[4];
[4]基于显著性检测和物体检测的前景提取:对于输入图像,分别利用显著性检测算法和物体检测算法获取SKU相关的前景区域,考虑到显著性检测和物体检测算法的局限性,可能存在错误检测的问题,这里对这两个算法的结果进行合并:取两个算法提取的前景区域的交集,作为mask。
Mask pipline模块其实是多种图像处理方法的结合,旨在尽可能准确地获取SKU的前景信息,过滤掉SKU背景信息,使得后续的匹配工作更加地准确合理。
(4)颜色信息提取模块
颜色信息提取模块的具体过程如下:针对输入的mask,利用颜色聚类方法,聚类出mask区域中出现频率最高的三种颜色,并保留颜色出现频率,这里将这三种颜色及其对应的颜色频率作为该mask的颜色信息。
(5)SKU合并模块
SKU合并模块包含了以下步骤:[1]对于同款SPU,这里根据颜色信息,计算任意两个SKU之间的距离,若距离值小于阈值,则认为这两个SKU相同;反之亦然。进而得到maskpipline的SKU匹配对。[2]根据mask pipline的SKU匹配对以及hack模块的SKU匹配对,利用SKU合并算法对SKU匹配对进行合并,得到最终的结果。
SKU合并算法的逻辑:假设同个商家不会提供相同的SKU;假设距离越相近的SKU之间更可能属于同个SKU;假设hack模块的结果比mask pipline的结果更置信。
SKU合并算法,过滤了SKU合并冲突,将SKU匹配对合理地聚合在一起,使得结果地输出更符合实际业务场景的需求。
下面对本申请实施例提供的一种SKU图像分类装置、电子设备及计算机可读存储介质进行介绍,下文描述的SKU图像分类装置、电子设备及计算机可读存储介质与上文描述的SKU图像分类方法可相互对应参照。
请参考图3,图3为本申请实施例所提供的一种SKU图像分类装置的结构框图;该SKU图像分类装置包括:
SPU图像聚合模块301,用于利用SPU匹配方法聚合同款SPU的SPU图像;其中,任一款SPU包括至少两种SKU;
mask确定模块302,用于将各个SKU图像中SKU所在区域作为mask;其中,各个SKU图像均包含于同一款SPU对应的SPU图像;
颜色距离计算模块303,用于根据各个mask确定对应的颜色信息,并计算各个SKU图像之间的颜色距离;
SKU图像分类模块304,用于若颜色距离小于预设阈值,则确定对应的两个SKU图像为同种SKU图像。
基于上述实施例,本实施例中SPU图像聚合模块301,包括:
SPU图像聚合单元,用于利用感知哈希方法或深度学习方法聚合同款SPU的SPU图像。
基于上述实施例,本实施例中mask确定模块302,包括:
第一前景区域提取单元,用于利用图像分割算法提取各个SKU图像中SKU相关的第一前景区域;
第一预设条件满足判断单元,用于采用分割效果分算法判断第一前景区域是否满足第一预设条件;
第一mask确定单元,用于若第一前景区域满足第一预设条件,则将第一前景区域作为mask;
纯色图判断单元,用于若第一前景区域不满足第一预设条件,则判断各个SKU图像是否为纯色图;
第二mask确定单元,用于若任一SKU图像为纯色图,则根据SKU图像的背景色进行二值化处理,并将二值化处理后的第一前景区域的最大连通域作为mask;
第二前景区域提取单元,用于若任一SKU图像不为纯色图,则利用关键点检测算法获取各个SKU图像中SKU相关的第二前景区域;
第二预设条件满足判断单元,用于采用关键点检测效果分算法判断第二前景区域是否满足第二预设条件;
第三mask确定单元,用于若第二前景区域满足第二预设条件,则将第二前景区域作为mask;
第三和第四前景区域提取单元,用于若第二前景区域不满足第二预设条件,则分别利用显著性检测算法和物体检测算法获取各个SKU图像中SKU相关的第三前景区域和第四前景区域;
第四mask确定单元,用于将第三前景区域和第四前景区域的交集区域作为mask。
基于上述实施例,本实施例中颜色距离计算模块303,包括:
颜色聚类单元,用于利用颜色聚类方法聚类出mask中出现频率最高的三种颜色,并保存对应的颜色出现频率;
颜色信息确定单元,用于将三种颜色及对应的颜色出现频率作为mask的颜色信息;
颜色距离计算单元,用于根据颜色信息,计算任意两个SKU图像之间的颜色距离。
本申请还提供一种电子设备,包括:
存储器和处理器;其中,存储器用于存储计算机程序,处理器用于执行计算机程序时实现上述任意实施例的SKU图像分类方法的步骤。
本申请还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述任意实施例的SKU图像分类方法的步骤。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例提供的系统而言,由于其与实施例提供的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的一种SKU图像分类方法、装置、电子设备及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

Claims (10)

1.一种SKU图像分类方法,其特征在于,包括:
利用SPU匹配方法聚合同款SPU的SPU图像;其中,任一款所述SPU包括至少两种SKU;
将各个SKU图像中SKU所在区域作为mask;其中,各个所述SKU图像均包含于同一款所述SPU对应的SPU图像;
根据各个所述mask确定对应的颜色信息,并计算各个所述SKU图像之间的颜色距离;
若所述颜色距离小于预设阈值,则确定对应的两个SKU图像为同种SKU图像。
2.根据权利要求1所述的SKU图像分类方法,其特征在于,所述利用SPU匹配方法聚合同款SPU的SPU图像,包括:
利用感知哈希方法或深度学习方法聚合同款SPU的SPU图像。
3.根据权利要求2所述的SKU图像分类方法,其特征在于,所述将各个SKU图像中SKU所在区域作为mask,包括:
利用图像分割算法提取各个所述SKU图像中SKU相关的第一前景区域;
采用分割效果分算法判断所述第一前景区域是否满足第一预设条件;
若所述第一前景区域满足所述第一预设条件,则将所述第一前景区域作为所述mask;
若所述第一前景区域不满足所述第一预设条件,则判断各个所述SKU图像是否为纯色图;
若任一所述SKU图像为所述纯色图,则根据所述SKU图像的背景色进行二值化处理,并将二值化处理后的第一前景区域的最大连通域作为所述mask;
若任一所述SKU图像不为所述纯色图,则利用关键点检测算法获取各个所述SKU图像中SKU相关的第二前景区域;
采用关键点检测效果分算法判断所述第二前景区域是否满足第二预设条件;
若所述第二前景区域满足所述第二预设条件,则将所述第二前景区域作为所述mask;
若所述第二前景区域不满足所述第二预设条件,则分别利用显著性检测算法和物体检测算法获取各个所述SKU图像中SKU相关的第三前景区域和第四前景区域;
将所述第三前景区域和所述第四前景区域的交集区域作为所述mask。
4.根据权利要求3所述的SKU图像分类方法,其特征在于,所述根据各个所述mask确定对应的颜色信息,并计算各个所述SKU图像之间的颜色距离,包括:
利用颜色聚类方法聚类出所述mask中出现频率最高的三种颜色,并保存对应的颜色出现频率;
将三种所述颜色及对应的颜色出现频率作为所述mask的所述颜色信息;
根据所述颜色信息,计算任意两个所述SKU图像之间的颜色距离。
5.一种SKU图像分类装置,其特征在于,包括:
SPU图像聚合模块,用于利用SPU匹配方法聚合同款SPU的SPU图像;其中,任一款所述SPU包括至少两种SKU;
mask确定模块,用于将各个SKU图像中SKU所在区域作为mask;其中,各个所述SKU图像均包含于同一款所述SPU对应的SPU图像;
颜色距离计算模块,用于根据各个所述mask确定对应的颜色信息,并计算各个所述SKU图像之间的颜色距离;
SKU图像分类模块,用于若所述颜色距离小于预设阈值,则确定对应的两个SKU图像为同种SKU图像。
6.根据权利要求5所述的SKU图像分类装置,其特征在于,所述SPU图像聚合模块,包括:
SPU图像聚合单元,用于利用感知哈希方法或深度学习方法聚合同款SPU的SPU图像。
7.根据权利要求6所述的SKU图像分类装置,其特征在于,所述mask确定模块,包括:
第一前景区域提取单元,用于利用图像分割算法提取各个所述SKU图像中SKU相关的第一前景区域;
第一预设条件满足判断单元,用于采用分割效果分算法判断所述第一前景区域是否满足第一预设条件;
第一mask确定单元,用于若所述第一前景区域满足所述第一预设条件,则将所述第一前景区域作为所述mask;
纯色图判断单元,用于若所述第一前景区域不满足所述第一预设条件,则判断各个所述SKU图像是否为纯色图;
第二mask确定单元,用于若任一所述SKU图像为所述纯色图,则根据所述SKU图像的背景色进行二值化处理,并将二值化处理后的第一前景区域的最大连通域作为所述mask;
第二前景区域提取单元,用于若任一所述SKU图像不为所述纯色图,则利用关键点检测算法获取各个所述SKU图像中SKU相关的第二前景区域;
第二预设条件满足判断单元,用于采用关键点检测效果分算法判断所述第二前景区域是否满足第二预设条件;
第三mask确定单元,用于若所述第二前景区域满足所述第二预设条件,则将所述第二前景区域作为所述mask;
第三和第四前景区域提取单元,用于若所述第二前景区域不满足所述第二预设条件,则分别利用显著性检测算法和物体检测算法获取各个所述SKU图像中SKU相关的第三前景区域和第四前景区域;
第四mask确定单元,用于将所述第三前景区域和所述第四前景区域的交集区域作为所述mask。
8.根据权利要求7所述的SKU图像分类装置,其特征在于,所述颜色距离计算模块,包括:
颜色聚类单元,用于利用颜色聚类方法聚类出所述mask中出现频率最高的三种颜色,并保存对应的颜色出现频率;
颜色信息确定单元,用于将三种所述颜色及对应的颜色出现频率作为所述mask的所述颜色信息;
颜色距离计算单元,用于根据所述颜色信息,计算任意两个所述SKU图像之间的颜色距离。
9.一种电子设备,其特征在于,包括:
存储器和处理器;其中,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现如权利要求1至4任一项所述的SKU图像分类方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的SKU图像分类方法的步骤。
CN201910666546.3A 2019-07-23 2019-07-23 一种sku图像分类方法、装置、电子设备及存储介质 Active CN110363251B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910666546.3A CN110363251B (zh) 2019-07-23 2019-07-23 一种sku图像分类方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910666546.3A CN110363251B (zh) 2019-07-23 2019-07-23 一种sku图像分类方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN110363251A true CN110363251A (zh) 2019-10-22
CN110363251B CN110363251B (zh) 2021-09-21

Family

ID=68219702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910666546.3A Active CN110363251B (zh) 2019-07-23 2019-07-23 一种sku图像分类方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN110363251B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113902938A (zh) * 2021-10-26 2022-01-07 稿定(厦门)科技有限公司 一种图像的聚类方法和装置以及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890686A (zh) * 2011-07-21 2013-01-23 腾讯科技(深圳)有限公司 展示商品搜索结果的方法及系统
CN103186538A (zh) * 2011-12-27 2013-07-03 阿里巴巴集团控股有限公司 一种图像分类方法和装置、图像检索方法和装置
CN105095396A (zh) * 2015-07-03 2015-11-25 北京京东尚科信息技术有限公司 模型创建方法、质量评估方法及装置
US20160062867A1 (en) * 2014-08-29 2016-03-03 Jeremy Rodriguez Optimization of power and computational density of a data center
CN108491799A (zh) * 2018-03-23 2018-09-04 海深科技(宁波)有限公司 一种基于图像识别的智能售货柜商品管理方法及系统
CN109684496A (zh) * 2018-12-12 2019-04-26 杭州嘉云数据科技有限公司 一种同款商品的图像匹配方法、装置、设备以及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890686A (zh) * 2011-07-21 2013-01-23 腾讯科技(深圳)有限公司 展示商品搜索结果的方法及系统
CN103186538A (zh) * 2011-12-27 2013-07-03 阿里巴巴集团控股有限公司 一种图像分类方法和装置、图像检索方法和装置
US20160062867A1 (en) * 2014-08-29 2016-03-03 Jeremy Rodriguez Optimization of power and computational density of a data center
CN105095396A (zh) * 2015-07-03 2015-11-25 北京京东尚科信息技术有限公司 模型创建方法、质量评估方法及装置
CN108491799A (zh) * 2018-03-23 2018-09-04 海深科技(宁波)有限公司 一种基于图像识别的智能售货柜商品管理方法及系统
CN109684496A (zh) * 2018-12-12 2019-04-26 杭州嘉云数据科技有限公司 一种同款商品的图像匹配方法、装置、设备以及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113902938A (zh) * 2021-10-26 2022-01-07 稿定(厦门)科技有限公司 一种图像的聚类方法和装置以及设备
CN113902938B (zh) * 2021-10-26 2022-08-30 稿定(厦门)科技有限公司 一种图像的聚类方法和装置以及设备

Also Published As

Publication number Publication date
CN110363251B (zh) 2021-09-21

Similar Documents

Publication Publication Date Title
CN109035246B (zh) 一种人脸的图像选择方法及装置
CN104899586B (zh) 对图像中包含的文字内容进行识别方法及装置
CN104243820B (zh) 一种确定图像边界的方法及装置
CN102332034B (zh) 一种人像图片检索方法和装置
CN101493887B (zh) 基于半监督学习和哈希索引的眉毛图像分割方法
CN108197644A (zh) 一种图像识别方法和装置
CN106375771B (zh) 图像特征匹配方法和装置
CN106325756B (zh) 一种数据存储、数据计算方法和设备
CN105809651A (zh) 基于边缘非相似性对比的图像显著性检测方法
CN110166851B (zh) 一种视频摘要生成方法、装置和存储介质
CN106650660A (zh) 一种车型识别方法及终端
CN111144215A (zh) 图像处理方法、装置、电子设备及存储介质
CN104216925A (zh) 一种视频内容去重的处理方法
EP4209959A1 (en) Target identification method and apparatus, and electronic device
CN111898538A (zh) 证件鉴伪方法、装置、电子设备及存储介质
CN111696080A (zh) 一种基于静态纹理的人脸欺诈检测方法、系统及存储介质
KR101089847B1 (ko) 얼굴 인식을 위한 sift 알고리즘을 이용한 키포인트 매칭 시스템 및 방법
CN106355139A (zh) 人脸防伪方法和装置
CN111753642B (zh) 一种确定关键帧的方法及装置
CN110363251A (zh) 一种sku图像分类方法、装置、电子设备及存储介质
CN112906571B (zh) 活体识别方法、装置及电子设备
CN105229700B (zh) 用于从多个连续拍摄图像提取峰图像的设备和方法
CN111210452B (zh) 一种基于图割和均值偏移的证件照人像分割方法
CN115545122B (zh) 对象匹配方法、装置、设备、系统、介质及程序产品
CN111125391B (zh) 数据库更新方法和装置、电子设备、计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PP01 Preservation of patent right

Effective date of registration: 20220906

Granted publication date: 20210921

PP01 Preservation of patent right