CN105608459A - 商品图片的分割方法及其装置 - Google Patents

商品图片的分割方法及其装置 Download PDF

Info

Publication number
CN105608459A
CN105608459A CN201410597626.5A CN201410597626A CN105608459A CN 105608459 A CN105608459 A CN 105608459A CN 201410597626 A CN201410597626 A CN 201410597626A CN 105608459 A CN105608459 A CN 105608459A
Authority
CN
China
Prior art keywords
picture
commodity
body position
classification
commodity picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410597626.5A
Other languages
English (en)
Other versions
CN105608459B (zh
Inventor
林海略
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201410597626.5A priority Critical patent/CN105608459B/zh
Priority to JP2017522490A priority patent/JP6669741B2/ja
Priority to PCT/CN2015/092509 priority patent/WO2016066042A1/zh
Publication of CN105608459A publication Critical patent/CN105608459A/zh
Priority to US15/582,186 priority patent/US10297029B2/en
Application granted granted Critical
Publication of CN105608459B publication Critical patent/CN105608459B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/162Segmentation; Edge detection involving graph-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20076Probabilistic image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了商品图片的分割方法及其装置,分割方法包括:根据商品图片中的主体位置对输入的商品图片进行图片分类;根据图片分类的结果,对不同类别的商品图片选择对应的主体位置模板,其中,每个主体位置模板中预先定义的位置参数各不相同,每个主体位置模板根据预先定义的位置参数设置了权重分布场,该权重分布场体现了商品图片中每个像素属于前景或背景的概率;以及根据被选择的主体位置模板中的权重分布场进行图片分割,从商品图片中分割出商品主体。本发明在进行图片分割之前会先对图片按照主体位置分类,与现有的那些直接对图片进行分割的技术相比,图片分类之后优化了分割结果。

Description

商品图片的分割方法及其装置
技术领域
本发明涉及图像处理领域,特别涉及一种商品图片的分割技术。
背景技术
随着技术的快速发展,为了用于商品搜索和商品选品等业务领域,经常需要从商品图片中分割出商品主体。目前已经提出了一些图片分割技术,例如基于显著区域检测的分割技术、基于人脸检测的分割技术、基于图像连通度的分割技术等等。但是这些分割技术却全都不适用于服装图片的分割。基于显著区域检测的分割技术只在图像背景清晰、布局简单的情况下分割效果好,但是商品图片中大部分都背景复杂或者布局复杂。基于人脸检测的分割技术适用于有服装模特且服装模特脸部清晰、姿势简单的情况,但是商品图片很多根本就没有模特或者模特的姿势复杂。基于图像连通度的分割技术适用于图像背景清晰、布局简单、服装本身纹理少的情况,但是商品图片中大部分都背景复杂或布局复杂。由此可见,这些分割方法都难以在服装图片分割上取得满意的效果。
发明内容
本发明的目的在于提供一种商品图片的分割方法及其装置,可以从商品图片中准确地分割出商品主体。
为解决上述技术问题,本发明的实施方式公开了一种商品图片的分割方法,先训练图片分类器进行图片分类,再根据图片分类的结果分割出商品主体;该方法包括以下步骤:
根据商品图片中的主体位置对输入的商品图片进行图片分类;
根据图片分类的结果,对不同类别的商品图片选择对应的主体位置模板,其中,每个主体位置模板中预先定义的位置参数各不相同,每个主体位置模板根据预先定义的位置参数设置了权重分布场,该权重分布场体现了商品图片中每个像素属于前景或背景的概率;以及
根据被选择的主体位置模板中的权重分布场进行图片分割,从商品图片中分割出商品主体。
本发明的实施方式还公开了一种商品图片的分割装置,包括:
分类单元,根据商品图片中的主体位置对输入的商品图片进行图片分类;
权重设置单元,根据来自分类单元的图片分类的结果,对不同类别的商品图片选择对应的主体位置模板,其中,每个主体位置模板中预先定义的位置参数各不相同,每个主体位置模板根据预先定义的位置参数设置了权重分布场,该权重分布场体现了商品图片中每个像素属于前景或背景的概率;以及
分割单元,根据被选择的主体位置模板中的权重分布场进行图片分割,从商品图片中分割出商品主体。
本发明实施方式与现有技术相比,主要区别及其效果在于:
首先本发明在进行图片分割之前会先对图片按照主体位置分类,与现有的那些直接对图片进行分割的技术相比,图片分类之后优化了分割结果。
进一步地,使用深度学习法,也就是训练一个卷积神经网络来作为图片分类器,分类合理分类效果也好。
进一步地,基于训练集合来训练所述卷积神经网络,在构建训练集合的过程中,先聚类再分类,在处理大数据的情况下能大大提高分类的准确度,也减少了工作量,降低了成本。
进一步地,用于图片分割的模板所设置的权重分布场使得:越靠近商品图片的中心,成为商品主体的权重越大,越远离商品图片的中心,成为商品主体的权重越小,能获得更准确的分割结果。
附图说明
图1是本发明第一实施方式中一种商品图片的分割方法的流程示意图。
图2是本发明第一实施方式中一种商品图片的分割方法采用的CNN网络的结构示意图。
图3是本发明第一实施方式中一种商品图片的分割方法采用的训练集合的构建的流程示意图。
图4是本发明第一实施方式中一种商品图片的分割方法采用的训练集合的构建中HOG特征提取的设置示意图。
图5~图9是本发明第一实施方式中一种商品图片的分割方法采用的训练集合的构建中聚类的结果的例子。
图10~图14是本发明第一实施方式中一种商品图片的分割方法采用的训练集合的构建中分类的结果的例子。
图15是本发明第二实施方式中一种商品图片的分割装置的结构示意图。
具体实施方式
在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请各权利要求所要求保护的技术方案。
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的实施方式作进一步地详细描述。
本发明第一实施方式涉及一种商品图片的分割方法。图1是该商品图片的分割方法的流程示意图。
具体地说,该分割方法根据图片分类的结果分割出商品主体。如图1所示,该商品图片的分割方法包括以下步骤:
在步骤S101中,根据商品图片中的主体位置对输入的商品图片进行图片分类。
此后进入步骤S102,根据图片分类的结果,对不同类别的商品图片选择对应的主体位置模板,其中,每个主体位置模板中预先定义的位置参数各不相同,每个主体位置模板根据预先定义的位置参数设置了权重分布场,该权重分布场体现了商品图片中每个像素属于前景或背景的概率。
此后进入步骤S103,根据被选择的主体位置模板中的权重分布场进行图片分割,从商品图片中分割出商品主体。
此后结束本流程。
根据上述步骤可知,本发明在进行图片分割之前会先对图片按照主体位置进行分类,与现有的那些直接对图片进行分割的技术相比,图片分类之后优化了分割结果。
在步骤S101中进行图片分类,是以深度学习法来进行所述图片分类,分类合理分类效果也好。当然,在此也可以应用其他的图片分类方法,并不限于此。
在此所用的深度学习法涉及人工神经网络,具体是指训练一个卷积神经网络(CNN网络)作为图片分类器。
可以理解,除了卷积神经网络之外,其他所有的深度学习法也都是适用的,例如自动编码器(AutoEncoder)、稀疏编码(SparseCoding)、限制波尔兹曼机(RBM)、深信度网络(DBN)等等。
在使用CNN网络作为图片分类器的情况下,该CNN网络是一个深度网络,一个示例性的结构是一个8层的结构,如图2所示,其中包括5个卷积层、2个全连接层、1个柔性最大值(Softmax)层。可以理解,除此之外,该CNN网络还可以是其他的结构,例如包括下采用层,或者其他数量的卷积层等等。
为了训练出这个CNN网络,首先构建一个训练集合。图3示出了一个构建训练集合的示例性的流程。可以理解,该流程的每个步骤都可以根据实际需要做出调整,整个流程并不限于图3示出的这种方式。
如图3所示,该训练集合的构建包括以下步骤:
在步骤S201中,获取商品图片。
此后进入步骤S202,对获取的商品图片进行多个特征的提取。
此后进入步骤S203,按照所提取的多个特征对获取的商品图片进行聚类,聚类数量为A个。
此后进入步骤S204,查看该A个聚类的商品图片,根据商品图片的主体位置,一部分聚类中的所有图片都分到同一个主体位置类别中,另一部分聚类中的图片分到各个不同的主题位置类别中,主体位置类别的数量为B个。A和B都是整数且A>B≥2。
此后结束本流程。
为了便于理解,现给出一个按照上述步骤构建训练集合的实例。在这个实例中,作为处理对象的是服装商品图片。可以理解,该实例仅仅是一个例子,本发明并不限于此,也可用于其他商品图片。
首先,使用爬虫下载商品图片,本例中,对淘宝平台的女装类目下的数据下载,该数据为100万数量级,即大数据。图片下载后进行标准化处理以方便后续处理,将所有图片都缩放到同样大小,例如分辨率为256乘以256的大小。
接着,对于数据提取两个特征,方向梯度直方图特征(HOG特征)和图片大小特征。如图4所示,提取HOG特征时例如将块(block)的大小设为96,块会在整体图片上面滑动遍历,块的滑动距离设为40,每个块分割成4个单元格(cell),因此单元格的大小设为48,每个单元格的方向数设为9。通俗地讲,HOG特征的提取就是将一个图片先灰度化(将图片看做一个x,y,z(灰度)的三维图片),再划分成4个小的单元格,计算每个单元格中每个像素的梯度(即方向),最后统计每个单元格的梯度直方图(不同梯度的个数),即可形成每个单元格的HOG描述子。按照图片的HOG特征和大小特征对图片进行聚类,得到A个聚类,A例如是512。图5~图9是一些聚类结果的图片的例子。
最后,按照聚类的结果将图片分类。查看该A个聚类的商品图片,根据商品图片的主体位置,一部分聚类中的所有图片都分到同一个主体位置类别中,这种情况占了大部分。另一部分聚类中的图片分到各个不同的主题位置类别中,这种情况只占小部分。主体位置类别的数量为B个,B例如是5。这5个类别例如分别是复杂多列图片、双列图片、单列标准图片、比单列标准图片窄的图片、比单列标准图片宽的图片。这些类别的例子在图10~图14中被示出。其中,图10是复杂多列图片,图11是双列图片,图12是单列标准图片,图13是比单列标准图片窄的图片,图14是比单列标准图片宽的图片。
A和B只要满足都是整数且A>B≥2即可,并不限于上述数量。由于在构建训练集合的过程中,先聚类再分类,在处理大数据的情况下能大大提高分类的准确度,也减少了工作量,降低了成本。
现对上述步骤S102作具体说明。在步骤S102中,根据图片分类的结果,对不同类别的商品图片选择对应的主体位置模板,其中,每个主体位置模板中预先定义的位置参数各不相同,每个主体位置模板根据预先定义的位置参数设置了权重分布场,该权重分布场体现了商品图片中每个像素属于前景或背景的概率。
例如在有5个类别,且这5个类别例如分别是复杂多列图片、双列图片、单列标准图片、比单列标准图片窄的图片、比单列标准图片宽的图片。按照以下方法操作。
对于复杂多列图片,不做图片分割。
对于双列图片、单列标准图片、比单列标准图片窄的图片、比单列标准图片宽的图片,分别定义一个主体位置模版,主体位置模板的位置参数各不相同。
主体位置模版所设置的权重的分布场的设计原则是指:越靠近中心,是服装主体的可能性越大(即权重越大),越远离中心,是服装主体的可能性越小(即权重越小)。由于以往的权重分布设置中,都是依照像素点的颜色来决定其分布,分割效果并不好,本发明采用主体位置来决定其分布,大大提高了分割效果。
对每个像素点p,例如按照如下定义式定义该像素属于前景或背景的概率,即该像素是商品主体的概率:
forgroundLikelihood ( p ) = e - 0.5 d ( p ) 2 ,
其中d(p)表示p到图片中心点距离度量。
为了处理不同的图片类型,对于不同的主体位置模板引入位置参数a,b。具体来说:
d ( p ) = ( p . x - center . x center . x ) 2 / a 2 + ( p . y - center . y center . y ) 2 / b 2
其中center表示图像的中心点,center.x和center.y表示中心点的横坐标和纵坐标。p.x和p.y分别标识p点的横坐标和纵坐标。
对于位置参数的设置,例如可以按照如下设置:
对于单列标准图片,设置a=0.3,b=0.8,
对于比单列标准图片窄的图片,设置a=0.2,b=0.79,
对于比单列标准图片宽的图片,设置a=0.4,b=0.81,
对于双列图片,先取图片的左半边,再按照单列标准图片处理。
现对上述步骤S103作具体说明。在步骤S103中,根据被选择的主体位置模板中的权重分布场进行图片分割,从商品图片中分割出商品主体。例如采用图割法(GraphCuts)进行图片分割。
可以理解,除了图割法以外的其他图片分割方法也适用于本发明,例如抓割法(GrabCut)等等。
以下对用图割法进行图片分割进行具体说明。
对于每个图片,例如在分辨率为256乘256的情况下构建一个256乘256个格子的图,其中每个像素点是一个普通节点,每个普通节点分别和其上下左右四个普通节点有边相连。每个边有权重,这种边的权重即普通权重按照像素点之间的相似度设置。
在图中增加两个虚拟节点,一个是前景节点,一个是背景节点。每个普通节点都和前景节点相连,也和背景节点相连。普通节点和前景节点相连的前连线的边的权重以及普通节点和后景节点相连的后连线的边的权重按照上述步骤S102中的权重分布场的计算得到。也就是说,该权重分布场体现了商品图片中每个像素属于前景(商品主体)或背景的概率。
设置好图和权重之后,使用合理的方法将图分成两部分,和前景节点相连的部分即为商品主体。
本发明的各方法实施方式均可以以软件、硬件、固件等方式实现。不管本发明是以软件、硬件、还是固件方式实现,指令代码都可以存储在任何类型的计算机可访问的存储器中(例如永久的或者可修改的,易失性的或者非易失性的,固态的或者非固态的,固定的或者可更换的介质等等)。同样,存储器可以例如是可编程阵列逻辑(ProgrammableArrayLogic,简称“PAL”)、随机存取存储器(RandomAccessMemory,简称“RAM”)、可编程只读存储器(ProgrammableReadOnlyMemory,简称“PROM”)、只读存储器(Read-OnlyMemory,简称“ROM”)、电可擦除可编程只读存储器(ElectricallyErasableProgrammableROM,简称“EEPROM”)、磁盘、光盘、数字通用光盘(DigitalVersatileDisc,简称“DVD”)等等。
本发明第二实施方式涉及一种商品图片的分割装置。图15是该商品图片的分割装置的结构示意图。本发明的实际结构可以根据实际需要做出必要的调整,并不局限于图15中的结构。
具体地说,该商品图片的分割装置根据图片分类的结果分割出商品主体。如图15所示,该分割装置100包括:
分类单元101,用于根据商品图片中的主体位置对输入的商品图片进行图片分类;
权重设置单元102,用于根据来自分类单元的图片分类的结果,对不同类别的商品图片选择对应的主体位置模板,其中,每个主体位置模板中预先定义的位置参数各不相同,每个主体位置模板根据预先定义的位置参数设置了权重分布场,该权重分布场体现了商品图片中每个像素属于前景或背景的概率;以及
分割单元103,用于根据被选择的主体位置模板中的权重分布场进行图片分割,从商品图片中分割出商品主体。
第一实施方式是与本实施方式相对应的方法实施方式,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
可选地但并非必须地,分割装置100还包括对训练集合进行构建的训练集合构建单元104(图15中未示出),根据该训练集合构建单元所构建的训练集合用于训练所述分类单元。
可选地但并非必须地,分割装置100还包括权重分布场设置单元105(图15中未示出),设置所述权重分布场使得:越靠近商品图片的中心,成为商品主体的权重越大,越远离商品图片的中心,成为商品主体的权重越小。
需要说明的是,本发明各设备实施方式中提到的各单元都是逻辑单元,在物理上,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现,这些逻辑单元本身的物理实现方式并不是最重要的,这些逻辑单元所实现的功能的组合才是解决本发明所提出的技术问题的关键。此外,为了突出本发明的创新部分,本发明上述各设备实施方式并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,这并不表明上述设备实施方式并不存在其它的单元。
需要说明的是,在本专利的权利要求和说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
虽然通过参照本发明的某些优选实施方式,已经对本发明进行了图示和描述,但本领域的普通技术人员应该明白,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (12)

1.一种商品图片的分割方法,其特征在于,包括以下步骤:
根据商品图片中的主体位置对输入的商品图片进行图片分类;
根据图片分类的结果,对不同类别的商品图片选择对应的主体位置模板,其中,每个主体位置模板中预先定义的位置参数各不相同,每个主体位置模板根据预先定义的位置参数设置了权重分布场,该权重分布场体现了商品图片中每个像素属于前景或背景的概率;以及
根据被选择的主体位置模板中的权重分布场进行图片分割,从商品图片中分割出商品主体。
2.如权利要求1所述的商品图片的分割方法,其特征在于,
所述商品图片是服装商品图片。
3.如权利要求2所述的商品图片的分割方法,其特征在于,
以深度学习法来进行所述图片分类,所述深度学习法包括训练一个卷积神经网络作为图片分类器的步骤。
4.如权利要求3所述的商品图片的分割方法,其特征在于,
所述卷积神经网络至少包括5个卷积层、2个全连接层、及1个柔性最大值层。
5.如权利要求3所述的商品图片的分割方法,其特征在于,
基于训练集合来训练所述卷积神经网络。
6.如权利要求5所述的商品图片的分割方法,其特征在于,
按照以下步骤构建所述训练集合:
获取商品图片;
对获取的商品图片进行多个特征的提取;
按照所提取的多个特征对获取的商品图片进行聚类,聚类数量为A个;以及
查看该A个聚类的商品图片,根据商品图片的主体位置,一部分聚类中的所有图片都分到同一个主体位置类别中,另一部分聚类中的图片分到各个不同的主题位置类别中,主体位置类别的数量为B个,
其中A和B都是整数且A>B≥2。
7.如权利要求6所述的商品图片的分割方法,其特征在于,
所述多个特征至少包括方向梯度直方图特征和大小特征。
8.如权利要求6所述的商品图片的分割方法,其特征在于,
所述主体位置类别至少包括以下类别之一或其组合:复杂多列图片、双列图片、单列标准图片、比单列标准图片窄的图片、比单列标准图片宽的图片。
9.如权利要求1所述的商品图片的分割方法,其特征在于,还包括以下步骤:
设置所述权重分布场使得:越靠近商品图片的中心,成为商品主体的权重越大,越远离商品图片的中心,成为商品主体的权重越小。
10.一种商品图片的分割装置,其特征在于,包括:
分类单元,根据商品图片中的主体位置对输入的商品图片进行图片分类;
权重设置单元,根据来自分类单元的图片分类的结果,对不同类别的商品图片选择对应的主体位置模板,其中,每个主体位置模板中预先定义的位置参数各不相同,每个主体位置模板根据预先定义的位置参数设置了权重分布场,该权重分布场体现了商品图片中每个像素属于前景或背景的概率;以及
分割单元,根据被选择的主体位置模板中的权重分布场进行图片分割,从商品图片中分割出商品主体。
11.如权利要求10所述的商品图片的分割装置,其特征在于,
还包括对训练集合进行构建的训练集合构建单元,
根据该训练集合构建单元所构建的训练集合用于训练所述分类单元。
12.如权利要求10所述的商品图片的分割装置,其特征在于,
还包括权重分布场设置单元,设置所述权重分布场使得:越靠近商品图片的中心,成为商品主体的权重越大,越远离商品图片的中心,成为商品主体的权重越小。
CN201410597626.5A 2014-10-29 2014-10-29 商品图片的分割方法及其装置 Active CN105608459B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201410597626.5A CN105608459B (zh) 2014-10-29 2014-10-29 商品图片的分割方法及其装置
JP2017522490A JP6669741B2 (ja) 2014-10-29 2015-10-22 商品画像のセグメンテーション方法および装置
PCT/CN2015/092509 WO2016066042A1 (zh) 2014-10-29 2015-10-22 商品图片的分割方法及其装置
US15/582,186 US10297029B2 (en) 2014-10-29 2017-04-28 Method and device for image segmentation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410597626.5A CN105608459B (zh) 2014-10-29 2014-10-29 商品图片的分割方法及其装置

Publications (2)

Publication Number Publication Date
CN105608459A true CN105608459A (zh) 2016-05-25
CN105608459B CN105608459B (zh) 2018-09-14

Family

ID=55856594

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410597626.5A Active CN105608459B (zh) 2014-10-29 2014-10-29 商品图片的分割方法及其装置

Country Status (4)

Country Link
US (1) US10297029B2 (zh)
JP (1) JP6669741B2 (zh)
CN (1) CN105608459B (zh)
WO (1) WO2016066042A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107463945A (zh) * 2017-07-12 2017-12-12 浙江大学 一种基于深度匹配网络的商品种类识别方法
CN107545271A (zh) * 2016-06-29 2018-01-05 阿里巴巴集团控股有限公司 图像识别方法、装置和系统
CN108447064A (zh) * 2018-02-28 2018-08-24 苏宁易购集团股份有限公司 一种图片处理方法及装置
CN109146885A (zh) * 2018-08-17 2019-01-04 深圳蓝胖子机器人有限公司 图像分割方法、设备和计算机可读存储介质
CN109977983A (zh) * 2018-05-07 2019-07-05 广州逗号智能零售有限公司 获得训练图像的方法及装置
CN112166438A (zh) * 2018-03-13 2021-01-01 雷哥尼公司 确定性标记数据生成和人工智能训练途径
US11830235B2 (en) 2019-01-09 2023-11-28 Samsung Electronics Co., Ltd Image optimization method and system based on artificial intelligence

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608459B (zh) 2014-10-29 2018-09-14 阿里巴巴集团控股有限公司 商品图片的分割方法及其装置
US10453200B2 (en) 2016-11-02 2019-10-22 General Electric Company Automated segmentation using deep learned priors
US10878570B2 (en) * 2018-07-17 2020-12-29 International Business Machines Corporation Knockout autoencoder for detecting anomalies in biomedical images
RU2698157C1 (ru) * 2019-02-12 2019-08-22 Акционерное общество Научно-производственный центр "Электронные вычислительно-информационные системы" (АО НПЦ "ЭЛВИС") Система поиска нарушений в порядке расположения объектов
CN112466035B (zh) * 2019-09-06 2022-08-12 图灵通诺(北京)科技有限公司 基于视觉和重力感应的商品识别方法、装置和系统
KR102429534B1 (ko) * 2020-11-02 2022-08-04 주식회사 루닛 대상 이미지에 대한 추론 작업을 수행하는 방법 및 시스템

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102779270A (zh) * 2012-06-21 2012-11-14 西南交通大学 一种针对购物图像搜索的目标衣物图像提取方法
CN102842135A (zh) * 2012-07-17 2012-12-26 杭州淘淘搜科技有限公司 一种商品图像主体区域检测方法
CN103578098A (zh) * 2012-08-07 2014-02-12 阿里巴巴集团控股有限公司 在商品图片中提取商品主体的方法和装置
US20140086483A1 (en) * 2012-09-21 2014-03-27 Alibaba Group Holding Limited Detecting a label from an image

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0532052B1 (en) * 1991-09-12 2008-02-13 FUJIFILM Corporation Method for extracting object images and method for detecting movements thereof
US6728404B1 (en) * 1991-09-12 2004-04-27 Fuji Photo Film Co., Ltd. Method for recognizing object images and learning method for neural networks
AU5603300A (en) 1999-06-11 2001-01-02 Pulsent Corporation Method and apparatus for digital image segmentation
IL146978A0 (en) 1999-06-11 2002-08-14 Pulsent Corp Method and apparatus for digital image segmentation
US6973213B2 (en) 2001-10-12 2005-12-06 Xerox Corporation Background-based image segmentation
US6922485B2 (en) 2001-12-06 2005-07-26 Nec Corporation Method of image segmentation for object-based image retrieval
KR20050067438A (ko) 2002-11-19 2005-07-01 코닌클리케 필립스 일렉트로닉스 엔.브이. 템플릿 예측을 사용한 이미지 세그먼테이션
US7606417B2 (en) 2004-08-16 2009-10-20 Fotonation Vision Limited Foreground/background segmentation in digital images with differential exposure calculations
US7376272B2 (en) * 2004-06-14 2008-05-20 Xerox Corporation Method for image segmentation to identify regions with constant foreground color
KR20060007901A (ko) * 2004-07-22 2006-01-26 삼성전자주식회사 영상으로부터의 중요 객체 추출 장치 및 방법
US8913830B2 (en) 2005-01-18 2014-12-16 Siemens Aktiengesellschaft Multilevel image segmentation
WO2006104468A1 (en) 2005-03-31 2006-10-05 Agency For Science, Technology And Research Method and apparatus for image segmentation
US7660468B2 (en) * 2005-05-09 2010-02-09 Like.Com System and method for enabling image searching using manual enrichment, classification, and/or segmentation
US7676081B2 (en) 2005-06-17 2010-03-09 Microsoft Corporation Image segmentation of foreground from background layers
US7379593B2 (en) 2005-12-21 2008-05-27 Xerox Corporation Method for image segmentation from proved detection of background and text image portions
US8417033B2 (en) 2007-04-27 2013-04-09 Hewlett-Packard Development Company, L.P. Gradient based background segmentation and enhancement of images
WO2010019925A1 (en) * 2008-08-15 2010-02-18 Brown Technology Partnerships Method and apparatus for estimating body shape
US8515171B2 (en) 2009-01-09 2013-08-20 Rochester Institute Of Technology Methods for adaptive and progressive gradient-based multi-resolution color image segmentation and systems thereof
EP2435983A4 (en) * 2009-05-28 2017-08-23 Hewlett-Packard Development Company, L.P. Image processing
GB2473503B (en) * 2009-09-15 2015-02-11 Metail Ltd System and method for image processing
CN101847264B (zh) * 2010-05-28 2012-07-25 北京大学 基于互补显著度图的图像兴趣物体自动提取方法及系统
US8861873B2 (en) * 2010-06-01 2014-10-14 Hewlett-Packard Development Company, L.P. Image clustering a personal clothing model
WO2011152821A1 (en) * 2010-06-01 2011-12-08 Hewlett-Packard Development Company, L.P. Clustering images
CN101950400B (zh) * 2010-10-09 2014-04-16 姚建 网络购物导航方法领域的图片检索方法
US20130259374A1 (en) * 2012-03-29 2013-10-03 Lulu He Image segmentation
CN103577475B (zh) * 2012-08-03 2018-01-30 阿里巴巴集团控股有限公司 一种图片自动化分类方法、图片处理方法及其装置
CN105608459B (zh) 2014-10-29 2018-09-14 阿里巴巴集团控股有限公司 商品图片的分割方法及其装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102779270A (zh) * 2012-06-21 2012-11-14 西南交通大学 一种针对购物图像搜索的目标衣物图像提取方法
CN102842135A (zh) * 2012-07-17 2012-12-26 杭州淘淘搜科技有限公司 一种商品图像主体区域检测方法
CN103578098A (zh) * 2012-08-07 2014-02-12 阿里巴巴集团控股有限公司 在商品图片中提取商品主体的方法和装置
US20140086483A1 (en) * 2012-09-21 2014-03-27 Alibaba Group Holding Limited Detecting a label from an image

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HUI ZHANG ET AL: "Incorporating Mean Template Into Finite Mixture Model for Image Segmentation", 《IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS》 *
徐清华 等: "基于模板库的自动图像对象分割方法研究", 《舰船电子工程》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107545271A (zh) * 2016-06-29 2018-01-05 阿里巴巴集团控股有限公司 图像识别方法、装置和系统
CN107545271B (zh) * 2016-06-29 2021-04-09 阿里巴巴集团控股有限公司 图像识别方法、装置和系统
CN107463945A (zh) * 2017-07-12 2017-12-12 浙江大学 一种基于深度匹配网络的商品种类识别方法
CN108447064A (zh) * 2018-02-28 2018-08-24 苏宁易购集团股份有限公司 一种图片处理方法及装置
CN112166438A (zh) * 2018-03-13 2021-01-01 雷哥尼公司 确定性标记数据生成和人工智能训练途径
CN109977983A (zh) * 2018-05-07 2019-07-05 广州逗号智能零售有限公司 获得训练图像的方法及装置
CN109977983B (zh) * 2018-05-07 2021-06-08 广州逗号智能零售有限公司 获得训练图像的方法及装置
CN109146885A (zh) * 2018-08-17 2019-01-04 深圳蓝胖子机器人有限公司 图像分割方法、设备和计算机可读存储介质
CN109146885B (zh) * 2018-08-17 2021-08-17 深圳蓝胖子机器智能有限公司 图像分割方法、设备和计算机可读存储介质
US11830235B2 (en) 2019-01-09 2023-11-28 Samsung Electronics Co., Ltd Image optimization method and system based on artificial intelligence

Also Published As

Publication number Publication date
JP6669741B2 (ja) 2020-03-18
WO2016066042A1 (zh) 2016-05-06
CN105608459B (zh) 2018-09-14
US10297029B2 (en) 2019-05-21
JP2017538196A (ja) 2017-12-21
US20170236292A1 (en) 2017-08-17

Similar Documents

Publication Publication Date Title
CN105608459A (zh) 商品图片的分割方法及其装置
Xie et al. Beyond classification: structured regression for robust cell detection using convolutional neural network
Rahaman et al. An efficient multilevel thresholding based satellite image segmentation approach using a new adaptive cuckoo search algorithm
CN107193876A (zh) 一种基于最近邻knn算法的缺失数据填补方法
CN107633522A (zh) 基于局部相似性活动轮廓模型的脑部图像分割方法和系统
CN108614997B (zh) 一种基于改进AlexNet的遥感图像识别方法
CN106295502A (zh) 一种人脸检测方法及装置
CN109858476B (zh) 标签的扩充方法和电子设备
CN104123417B (zh) 一种基于聚类融合的图像分割的方法
Cortina-Januchs et al. Detection of pore space in CT soil images using artificial neural networks
CN104573742A (zh) 医学图像分类方法和系统
CN106408037A (zh) 图像识别方法及装置
CN106340016A (zh) 一种基于细胞显微镜图像的dna定量分析方法
CN107358177A (zh) 一种基于图像分析的中远距离行人检测方法及终端设备
CN107203775A (zh) 一种图像分类的方法、装置和设备
CN110349159A (zh) 基于权重能量自适应分布的三维形状分割方法及系统
CN107545271A (zh) 图像识别方法、装置和系统
CN104715481A (zh) 基于随机森林的多尺度印刷品缺陷检测方法
CN108764361A (zh) 基于集成学习的游梁式抽油机示功图的工况识别方法
CN104217213A (zh) 一种基于对称性理论的医学图像多阶段分类方法
CN106780479A (zh) 一种基于深度学习的高精度图像模糊检测方法
CN106980878B (zh) 三维模型几何风格的确定方法及装置
CN101600115A (zh) 一种剔除图像稳像系统周期性特征块的方法
CN104050665B (zh) 一种视频图像中前景停留时间的估计方法及装置
Jiuqing et al. Cell tracking via structured prediction and learning

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1224404

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant