CN107729908B - 一种机器学习分类模型的建立方法、装置及系统 - Google Patents

一种机器学习分类模型的建立方法、装置及系统 Download PDF

Info

Publication number
CN107729908B
CN107729908B CN201610653563.XA CN201610653563A CN107729908B CN 107729908 B CN107729908 B CN 107729908B CN 201610653563 A CN201610653563 A CN 201610653563A CN 107729908 B CN107729908 B CN 107729908B
Authority
CN
China
Prior art keywords
classification model
segmentation
product
segmentation result
machine learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610653563.XA
Other languages
English (en)
Other versions
CN107729908A (zh
Inventor
赵小伟
高洋
华先胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201610653563.XA priority Critical patent/CN107729908B/zh
Publication of CN107729908A publication Critical patent/CN107729908A/zh
Application granted granted Critical
Publication of CN107729908B publication Critical patent/CN107729908B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling

Abstract

本申请提供了一种机器学习分类模型的建立方法、装置及系统,其中,方法包括:检测产品图像中的包含产品主体的标注框;采用基于标注框的分割方法,对所述标注框内的产品主体进行分割,得到第一分割结果;将所述第一分割结果和预先标注的第二分割结果作为样本,采用所述样本进行深度学习训练得到分类模型。采用本申请提供的这些技术方案,能够减少人工标注样本的工作量,增强分类模型的可实用性。

Description

一种机器学习分类模型的建立方法、装置及系统
技术领域
本申请涉及机器学习领域,特别涉及一种机器学习分类模型的建立方法、装置及系统。
背景技术
近年来,图像分割方法在互联网的发展中发挥着非常重要的作用。由于互联网展现图像需要综合考虑美观度和点击率,尤其是在电子商务网站上。因此,网站设计师需要对图像中的主体进行适应性设计,如添加文字素材,颜色调整等等。而图像中的主体就是通过图像分割方法从原始的图像中分割出来的表征产品本身的部分。
目前,常用的图像分割方法有两大类,一类是传统分割方法,另一类是基于深度学习的分割方法。
其中,传统分割方法通常是以人为设计的特征(如颜色、纹理特征)为基础,通过机器学习一个分类模型,利用该分类模型进行图像分割。这类分类器仅以简单的、人为设计的颜色、纹理特征来进行分割,由于拍摄环境、拍摄角度、产品种类的多种多样化,导致该分类模型对互联网中的产品图像的分割效果并不理想。
其中,基于深度学习的分割方法,利用像素级的图像样本,通过机器学习一个分类模型,但深度学习过程需要大量的人工标注的像素级的图像样本,另外,分类模型后期优化也依赖于人工标注的像素级的图像样本,大量的人工成本限制了基于深度学习的分割方法的实用性。
发明内容
本申请所要解决的技术问题是提供一种机器学习分类模型的建立方法,减少人工标注样本的工作量,增强分类模型的可实用性。
另外,本申请还提供一种机器学习分类模型的建立装置和系统,以保证上述方法在实际中的实现以及应用。
在本申请第一方面提供了一种机器学习分类模型的建立方法,该方法包括:
检测产品图像中的包含产品主体的标注框;
采用基于标注框的分割方法,对所述标注框内的产品主体进行分割,得到第一分割结果;
统计产品图像对应的第一分割结果,将统计到的第一分割结果和预先标注的第二分割结果作为样本,采用所述样本进行深度学习得到一个分类模型。
在本申请第一方面提供了一种机器学习分类模型的建立装置,该装置包括:
检测单元,用于检测产品图像中的包含产品主体的标注框;
粗分割单元,用于采用基于标注框的分割方法,对所述标注框内的产品主体进行分割,得到第一分割结果;
训练单元,用于将所述第一分割结果和预先标注的第二分割结果作为样本,采用所述样本进行深度学习训练得到分类模型。
在本申请第一方面提供了一种机器学习分类模型的建立系统,该系统包括:
检测器、基于标注框的分类器和分类模型训练器;
其中,检测器,用于检测产品图像中的包含产品主体的标注框;
其中,基于标注框的分类器,用于采用基于标注框的分割方法,对所述标注框内的产品主体进行分割,得到第一分割结果;
其中,分类模型训练器,用于将所述第一分割结果和预先标注的第二分割结果作为样本,采用所述样本进行深度学习训练得到分类模型。
与现有技术相比,本申请提供的技术方案具有以下优点:
本申请提供的技术方案,提出了半监督方法的方式进行模型学习,在学习时,不再直接采用大量的人工标注的像素级的产品图像作为样本,而是提出了以“少量人工标注的像素级的产品图像+大量产品主体的标注框”为样本进行模型学习的方式。其中,大量产品主体标注框是不需要通过人工方式,而是通过检测器机器检测就可以得到的样本。这种方式大大减少了学习模型需要的人工标注量,另外,采用基于标注框的分割方法对标注框内的产品主体进行分割得到的第一分割结果,能够保证第一分割结果作为样本数据的可靠性。
本申请提供的技术方案提供的这种半监督学习方式,大大减少样本标注的工作量,为了学习到强大的分类模型,提出了采用像素级标注和标注框相结合的方式进行样本标注,因此,在本申请中,只需要提供少量的像素级的图像和大量只有标注框的数据,就可以学习到强大的分类模型,大大提高了深度学习分类模型的可实用性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的一种机器学习分类模型的建立方法实施例1的流程图;
图2是本申请提供的服装类产品图像的检测结果示意图;
图3是本申请提供的服装类产品图像的第一分割结果示意图;
图4是本申请提供的一种机器学习分类模型的建立方法实施例2的流程图;
图5是本申请提供的一种机器学习分类模型的建立方法实施例3的流程图;
图6是本申请提供的一种机器学习分类模型的建立方法实施例4的流程图;
图7是本申请提供的一种机器学习分类模型的建立方法实现过程的示意图;
图8是本申请提供的一种机器学习分类模型的建立装置的结构图;
图9是本申请提供的一种机器学习分类模型的建立系统的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
参见图1,图1是本申请提供的一种机器学习分类模型的建立方法的流程图,如图1所示,该方法包括步骤101至步骤103;
步骤101:检测产品图像中的包含产品主体的标注框。
本申请实施例提供的方法可以适用于互联网领域中,在互联网领域产品图像的种类众多,为了适应于某一类产品图像的检测处理,预先针对产品类型创建对应的检测器。则步骤101在实现时,可以根据产品图像中产品归属的类型选择对应的检测器,进而利用该检测器对这一类型产品的产品图像进行检测处理,以检测得到包含产品主体的标注框。在本申请中,标注框是指能够标注出产品图像中产品主体区域的图框。
为了方便本领域技术人员清楚地理解的本申请实施例提供的方法,接下来以电子商务网站上的服装类的产品图像为例对步骤101的实现进行解释说明。
服装类的产品图像需要由服装检测器进行检测,而服装检测器可以通过任意一种方式生成:
(1)采用R-CNN,R-CNN(Region-based Convolutional Neural Networks,基于区域的卷积神经网络)是一种通用物体检测器,R-CNN先对图像中可能是物体的区域进行过滤得到候选区域,再采用深度卷积神经网络对候选区域进行分类,最后综合各个区域的置信度得出物体的位置,将该位置以标记框的形式呈现。为了适应于服装类产品图像的检测场景,可以预先收集一些服装类的产品图像作为样本数据,利用这些样本数据重新训练R-CNN得到服装检测器。
(2)采用DPM,DPM(Deformable Part Model,可变形部件模型)是一款非常实用的物体检测器,为了使DPM适应于服装类产品图像的检测场景,可以预先收集一些服装类的产品图像作为样本数据,利用这些样本数据重新训练DPM得到服装检测器。
除了上述(1)和(2)两种检测器之外,本申请实施例的实现,也可以采用其他类型的检测器来实现步骤101,对此,本申请实施例不作具体限定。
另外,上述(1)和(2)两种检测器仅以检测服装类产品图像为例来进行说明的,而本申请实施例的实现,并不限定产品图像中产品的具体类型,不论是哪种类型产品的产品图像都可以预先建立对应的检测器,以针对性的实现检测功能。而其他类型产品对应的检测器的建立方式与上述(1)和(2)的方式原理相同,此处不再赘述。
下面以图2为例对服装类产品图像的检测结果进行示例性说明。
参见图2示出的三张产品图像分别是产品1、产品2、产品3各自的产品图像,这三张产品图像经过检测器的检测处理后,对应的得到产品1的标注框、产品2的标注框、产品3的标注框。从图2可以看出,经过检测器的检测处理,能够确定一张产品图像中仅包含产品本身的区域,将该区域以标注框的形式记录下来。
经过步骤101可以对收集到的大量的产品图像进行检测处理,进而得到每个产品图像对应的标注框,这些产品图像对应的标注框作为后续机器学习所需的一部分样本数据。
但标注框区域内既有产品主体还有一些背景区域,其直接作为样本数据的效果并不好。因此,在本申请实施例中,还通过以下步骤102对这些标注框作进一步处理,以得到可以作为样本数据的分割结果。
步骤102:采用基于标注框的分割方法,对所述标注框内的产品主体进行分割,得到第一分割结果。
基于标注框的分割方法有多种,如OneCut、GrabCut等。在本申请实施例中可以采用已有的任意一种基于标注框的分割方法。接下来以GrabCut为例对步骤102的实现进行解释说明。
GrabCut提供了基于标注框的迭代式分割方式,GrabCut能够自动分割出标注框内包含的产品部分。参见图3,图3是本申请提供的基于GrabCut的分割示意图;在本申请实施例中,为了使得基于标注框的分割方法实现良好的分割效果,本申请实施例提出了前景种子和背景种子的标注方式,具体设置方式如下:
标注距离产品物体中心的方形区域内像素作为前景种子;
标注产品图像中标注框以外的像素作为背景种子。
则,GrabCut利用已标注的这些种子像素学习高斯混合模型(GMM),在学习高斯混合模型时可以仅采用简单的颜色特征,学习好GMM之后,将其应用到图像中剩余的像素中,从而实现产品图像的自动分割。
图3呈现的示意图具体是采用GrabCut对图2示出的标注框进行分割的场景图;在图3中,GrabCut基于本申请提供的自动标注前景种子和背景种子学习GMM,进而利用GMM对标注框内的产品进行分割,从而得到第一分割结果。
当然,在实现步骤102时,若采用其他基于标注框的分割方法,其处理方式也与上述GrabCut处理流程相似,此处不再一一列举。
经过步骤101和步骤102的处理,可以自动得到大量的产品图像的第一分割结果。这些第一分割结果就作为后续机器学习所需要的一部分样本数据。
接下来通过步骤103实现机器学习得到分类模型。
步骤103:将所述第一分割结果和预先标注的第二分割结果作为样本,采用所述样本进行深度学习得到一个分类模型。
经过步骤102对大量的产品图像的标注框进行分割得到产品图像对应的第一分割结果,则先收集大量的第一分割结果,然后,将第一分割结果,和预先标注的第二分割结果作为机器学习的样本数据;这里的第二分割结果是由人工预先针对少量的产品图像进行分割得到的分割结果,也可以看作是精细分割结果。
在实现步骤103时,进一步地可以基于这些样本数据深度学习训练一个端到端(end-to-end)的FCN(Fully Convolutional Neural Networks,全卷积神经网络)模型,利用卷积神经网络所具有的很强大的学习能力,从而得到较准确的结果。
通过上述方法,我们可以看出,在本申请中,不再单纯依赖于人工标注大量的样本,而是以大量的产品图像的产品主体的标注框为基础,自动分割得到大量的第一分割结果和少量预先标注好的第二分割结果,这样,能够保证深度学习所需的样本量,又能够大大减小人工标注的工作量,从而可以更快速训练得到分类模型,使深度学习分类模型更加实用。
在实际应用中,我们可以以某一类产品的产品图像为基础,通过上述方法分割得到第一分割结果和针对这一类产品图像预先标注的第二分割结果,以这些分割结果为样本数据学习得到针对这一类产品的分类模型,这些使得分类模型针对这一类产品的分割性能更准确。
例如:以上述图2和图3所示的场景为例,我们可以以服装类的产品图像为基础,按照上述方法学习得到专门适用于服装类产品图像分割的分类模型。
在利用图1所示方法学习得到分类模型之后,就可以利用该分类模型进行产品图像的分割处理。
则在上述图1所示方法的基础上,还可以增加如下步骤104;具体可以参见图4所示的流程图。图4中所示的步骤101至步骤103与上述图1中的步骤101和步骤103相同,可以参照上文相关描述,此处不再赘述。下面仅对步骤104进行解释说明。
步骤104:利用所述分类模型对待分割的产品图像进行分割,得到第三分割结果。
这里的待分割的产品图像,可以是未做任何分割处理的产品图像,如数据库中存储的、需要被分割的产品图像;这里的待分割的产品图像也可以是已经过其他分割方式处理后的产品图像;例如,待分割的产品图像可以是经过上述步骤101和步骤102处理后得到的第一分割结果(参见图3中示出的产品的第一分割结果)。
当待分割的产品图像是上述第一分割结果时,则步骤104的本质作用就是对经过步骤102处理后的第一分割结果进行修正。由于,深度学习得到的分类模型已经学习到了对这一类产品刻画能力更强大的特征,因此,其分割效果更优,能够修正第一分割结果。
另外,为了进一步提高分割结果的精准性,在上述图2所示方法的基础上,还可以增加如下步骤105;具体可以参见图5所示的流程图。图5中所示的步骤101至步骤103与上述图1中的步骤101和步骤103相同,步骤104与上述图2中的步骤104相同,可以参照上文相关描述,此处不再赘述。下面仅对步骤105进行解释说明。
步骤105:利用判别式模型对所述第三分割结果进行修正,得到第四分割结果。
在实现步骤105时,我们可以采用的判别式模型包括:基于条件随机场理论的模型,如:CRF,FlexCRF,CRF++等模型。由于,通过步骤101-103深度学习到的分类模型在图像分割时,没有考虑到图像像素之间的关联性,因此,可能会产生一些错误分割结果,基于此,本申请实施例提出了图5所示的方法,利用判别式模型,进一步考虑图像像素之间的关联性,对上述分类模型分割得到的第三分割结果作进一步精细化,进行修正。
在实现步骤105时,我们可以优选的采用全连接CRF进行修正,可以直接采用算法默认的参数,当然,也可以通过引入校验集来学习更优的参数。
另外,本申请发明人还考虑到不论哪一种模型的分割效果都无法达到100%的精准,因此,在实际应用中,一般都会通过后台人工维护系统随机对分割后的结果进行筛查,通过人工的方式再次对一些产品图像进行分割修正。基于这样的实际应用需求的考虑,本申请实施例还提供了对应的解决方案,具体参见图6示出的方法流程图,图6具体是在图4所示方法的基础上,增加步骤106和步骤107。图6中所示的步骤101至步骤103与上述图1中的步骤101和步骤103相同,步骤104与上述图2中的步骤104相同,可以参照上文相关描述,此处不再赘述。下面仅对步骤106和步骤107进行解释说明。
步骤106:计算所述待分割的产品图像对应的第三分割结果与所述待分割的产品图像中包含产品主体的标注框的交并比,并判断所述交并比是否小于预设交并比阈值;其中,两幅图像的交并比是指两幅图像的交集区域与并集区域的比值。通过交并比的大小就能够从一定程度上衡量出分割结果的可靠性;如果步骤106判断结果为是时,进入步骤107。
步骤107:将所述待分割的产品图像推送给后台人工维护系统。
这样,通过步骤106的判断处理就能够自动发现一些可疑的分割结果,再将这些可疑的分割结果对应的产品图像推送给后台人工维护系统,再通过人工方式进行分割/修正。这样使得后台人工维护系统能够有针对性地向人工推送图像,使得人工方式分割/修正更有目标,更有价值。
另外,本申请发明人还提供了关于如何优化分类模型的方案。该方案主要是利用分割得到的精细分割结果作为样本数据,修正分类模型的参数。具体的,可以在上述图5所示方法的基础上,增加如下步骤:
利用所述第四分割结果修正所述分类模型的参数,以实现对分类模型的参数的优化。
进一步地,在实现时,可以采用深度学习的微调机制(Finetune)对所述分类模型的参数进行修正。目前,深度学习的微调机制通常是,将模型的学习率调小,如1e4或者1e5,使其只在当前解的附近找一个更优的、在当前样本上表现更好的参数。
另外,在实际应用中我们可以通过多次迭代方式来优化分类模型,参见图7示出的示意图,在图7中为了便于本领域技术人员理解,采用了具体的模型类型,如GrabCut、FCN模型、CRF模型等,但其并不限定本申请技术方案的具体实现。
从图7示出的示意图可以看出,人工仅需要标记少量的像素级的图像,将这些图像作为第二分割结果,通过GrabCut模型可以自动分割得到大量的第一分割结果,而将第一分割结果和第二分割结果总体作为FCN模型学习的样本数据,通过深度学习训练得到FCN模型,然后,再通过FCN模型可以修正第一分割结果,再通过CRF模型修正FCN模型修正后的结果,最后利用FCN+CRF双重分割修正后的结果,对FCN模型进行迭代优化。这样,既能够利用少了人工标记的样本来实现FCN模型的深度学习训练,又能够通过FCN+CRF双重修正结果来进一步优化FCN模型,整个训练和优化过程都大大减少了人工参与的工作量。
基于此应用场景,本申请实施例还提供了以下方式以实现在合适的时机停止迭代优化。具体的,可以在迭代方式优化分类模型时,通过如下步骤来判断是否停止迭代优化:
统计所述待分割的产品图像经过两次相邻分割处理得到第四分割结果,判断两个第四分割结果之间的残差是否小于预设残差阈值;
如果是,则停止对所述分类模型的参数的优化操作。
这种控制方式,既能够有效控制迭代优化得到一个分割效果较好的分类模型,又能够尽可能节省优化时间。
与上述方法相对应的,本申请实施例还提供了对应的装置,用于实现上述方法。下面结合图8对该装置进行解释说明。
参见图8,图8是本申请提供一种机器学习分类模型的建立装置,如图8所示,该装置800包括:检测单元801、样本分割单元802、训练单元803;下面根据该装置的工作原理对其内部各个单元的功能和连接关系进行解释说明。
检测单元801,用于检测产品图像中的包含产品主体的标注框;
样本分割单元802,用于采用基于标注框的分割方法,对所述标注框内的产品主体进行分割,得到第一分割结果;
训练单元803,用于将所述第一分割结果和预先标注的第二分割结果作为样本,采用所述样本进行深度学习训练得到分类模型。
在实现时,所述装置还可以包括:
分割单元,用于利用所述分类模型对待分割的产品图像进行分割,得到第三分割结果。
在实现时,所述装置在包含上述分割单元的基础上,还可以包括:
修正单元,用于利用判别式模型对所述第三分割结果进行修正,得到第四分割结果。
其中,所述判别式模型包括:基于条件随机场理论的模型。
在实现时,所述装置在包含上述分割单元的基础上,还可以包括:
第一判断单元,用于计算所述待分割的产品图像对应的第三分割结果与所述待分割的产品图像中包含产品主体的标注框的交并比,并判断所述交并比是否小于预设交并比阈值;如果是,触发推送单元;
推送单元,用于将所述待分割的产品图像推送给后台人工维护系统。
在实现时,所述装置在包含上述修正单元的基础上,还可以包括:
优化单元,用于利用所述第四分割结果修正所述分类模型的参数,以实现对分类模型的参数的优化。
其中,所述优化单元,进一步地可以包括优化子单元,用于采用深度学习的微调机制对所述分类模型的参数进行修正。
在实现时,所述装置在包含上述优化单元的基础上,还可以包括:
第二判断单元,用于统计所述待分割的产品图像经过两次相邻分割处理得到第四分割结果,判断两个第四分割结果之间的残差是否小于预设残差阈值;如果是,则触发控制单元;
控制单元,用于停止对所述分类模型的参数的优化操作。
本申请提供的装置,利用半监督方法的方式进行模型学习,在学习时,不再直接采用大量的人工标注的像素级的产品图像作为样本,而是提出了以“少量人工标注的像素级的产品图像+大量产品主体的标注框”为样本进行模型学习的方式。其中,大量产品主体标注框是不需要通过人工方式,而是通过检测器机器检测就可以得到的样本。这种方式大大减少了学习模型需要的人工标注量,另外,采用基于标注框的分割方法对标注框内的产品主体进行分割得到的第一分割结果,能够保证第一分割结果作为样本数据的可靠性。
本申请提供的技术方案提供的这种半监督学习方式,大大减少样本标注的工作量,为了学习到强大的分类模型,提出了采用像素级标注和标注框相结合的方式进行样本标注,因此,在本申请中,只需要提供少量的像素级的图像和大量只有标注框的数据,就可以学习到强大的分类模型,大大提高了深度学习分类模型的可实用性。
另外,为了保证上述方法实施例提供的方法在实际中的实现和应用,本申请实施例还提供了对应的系统,下面结合图8对该系统进行解释说明。
参见图9,图9是本申请提供的一种机器学习分类模型的建立系统,如图9所示,该系统900包括:检测器901、基于标注框的分类器902和分类模型训练器903;
其中,检测器901,用于检测产品图像中的包含产品主体的标注框;
其中,基于标注框的分类器902,用于采用基于标注框的分割方法,对所述标注框内的产品主体进行分割,得到第一分割结果;
其中,分类模型训练器903,用于将所述第一分割结果和预先标注的第二分割结果作为样本,采用所述样本进行深度学习训练得到分类模型。
上述系统在工作时,检测器901输入端接收到大量的产品图像,检测器检测出这些产品图像中包含产品主体的标注框区域,然后,检测器901将检测结果输出至基于标注框的分类器902;基于标注框的分类器902接收到检测器输出的内容后,执行分割操作,将分割得到的第一分割结果输出至分类模型训练器903;对于分类模型训练器903而言,其输入端除了接收大量的第一分割结果之外,还接收少量的人工预先标注的像素级的第二分割结果,分类模型训练器利用接收端接收到的第一分割结果和第二分割结果作为样本数据,深度学习训练得到分类模型,进而输出该分类模型。
通过本申请提供的上述系统,利用检测器和基于标注框的分类器共同作用,为分类模型的训练提供大量的样本数据,这样,既满足深度学习过程对样本数据量大的高要求,又在一定程度上简化人工标注的工作量,从而使得增强了这种分类模型的可使用性。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一、第二、第三、第四等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的一种机器学习分类模型的建立方法、装置及系统进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种机器学习分类模型的建立方法,其特征在于,所述方法包括:
检测产品图像中的包含产品主体的标注框;所述标注框,用于标注产品图像中产品主体所在区域;
采用基于标注框的分割方法,对所述标注框内的产品主体进行分割,得到第一分割结果;
将所述第一分割结果和预先标注的第二分割结果作为样本,采用所述样本进行深度学习训练得到分类模型。
2.根据权利要求1所述的机器学习分类模型的建立方法,其特征在于,所述方法还包括:
利用所述分类模型对待分割的产品图像进行分割,得到第三分割结果。
3.根据权利要求2所述的机器学习分类模型的建立方法,其特征在于,所述方法还包括:
利用判别式模型对所述第三分割结果进行修正,得到第四分割结果。
4.根据权利要求3所述的机器学习分类模型的建立方法,其特征在于,所述判别式模型包括:基于条件随机场理论的模型。
5.根据权利要求2所述的机器学习分类模型的建立方法,其特征在于,所述方法还包括:
计算所述待分割的产品图像对应的第三分割结果与所述待分割的产品图像中包含产品主体的标注框的交并比,并判断所述交并比是否小于预设交并比阈值;
如果是,则将所述待分割的产品图像推送给后台人工维护系统。
6.根据权利要求3所述的机器学习分类模型的建立方法,其特征在于,所述方法还包括:
利用所述第四分割结果修正所述分类模型的参数,以实现对分类模型的参数的优化。
7.根据权利要求6所述的机器学习分类模型的建立方法,其特征在于,采用深度学习的微调机制对所述分类模型的参数进行修正。
8.根据权利要求6所述的机器学习分类模型的建立方法,其特征在于,所述方法还包括:
统计所述待分割的产品图像经过两次相邻分割处理得到第四分割结果,判断两个第四分割结果之间的残差是否小于预设残差阈值;
如果是,则停止对所述分类模型的参数的优化操作。
9.一种机器学习分类模型的建立装置,其特征在于,所述装置包括:
检测单元,用于检测产品图像中的包含产品主体的标注框;所述标注框,用于标注产品图像中产品主体所在区域;
粗分割单元,用于采用基于标注框的分割方法,对所述标注框内的产品主体进行分割,得到第一分割结果;
训练单元,用于将所述第一分割结果和预先标注的第二分割结果作为样本,采用所述样本进行深度学习训练得到分类模型。
10.一种机器学习分类模型的建立系统,其特征在于,所述系统包括:
检测器、基于标注框的分类器和分类模型训练器;
其中,检测器,用于检测产品图像中的包含产品主体的标注框;所述标注框,用于标注产品图像中产品主体所在区域;
其中,基于标注框的分类器,用于采用基于标注框的分割方法,对所述标注框内的产品主体进行分割,得到第一分割结果;
其中,分类模型训练器,用于将所述第一分割结果和预先标注的第二分割结果作为样本,采用所述样本进行深度学习训练得到分类模型。
CN201610653563.XA 2016-08-10 2016-08-10 一种机器学习分类模型的建立方法、装置及系统 Active CN107729908B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610653563.XA CN107729908B (zh) 2016-08-10 2016-08-10 一种机器学习分类模型的建立方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610653563.XA CN107729908B (zh) 2016-08-10 2016-08-10 一种机器学习分类模型的建立方法、装置及系统

Publications (2)

Publication Number Publication Date
CN107729908A CN107729908A (zh) 2018-02-23
CN107729908B true CN107729908B (zh) 2021-10-15

Family

ID=61200267

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610653563.XA Active CN107729908B (zh) 2016-08-10 2016-08-10 一种机器学习分类模型的建立方法、装置及系统

Country Status (1)

Country Link
CN (1) CN107729908B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977983B (zh) * 2018-05-07 2021-06-08 广州逗号智能零售有限公司 获得训练图像的方法及装置
CN109145947B (zh) * 2018-07-17 2022-04-12 昆明理工大学 一种基于部件检测和视觉特征的时尚女装图像细粒度分类方法
CN110880001A (zh) * 2018-09-06 2020-03-13 银河水滴科技(北京)有限公司 一种语义分割神经网络的训练方法、设备和存储介质
CN109740738B (zh) * 2018-12-29 2022-12-16 腾讯科技(深圳)有限公司 一种神经网络模型训练方法、装置、设备和介质
CN111027418B (zh) * 2019-11-21 2023-04-18 盛景智能科技(嘉兴)有限公司 工厂物料管理方法、装置和电子设备
CN111028249A (zh) * 2019-12-23 2020-04-17 杭州知衣科技有限公司 一种基于深度学习的服装图像分割方法
CN113313716B (zh) * 2020-02-27 2024-03-01 北京车和家信息技术有限公司 一种自动驾驶语义分割模型的训练方法及装置
CN111814885B (zh) * 2020-07-10 2021-06-22 云从科技集团股份有限公司 一种管理图像框的方法、系统、设备及介质
CN113095444B (zh) * 2021-06-07 2021-09-17 北京智芯微电子科技有限公司 图像标注方法、装置及存储介质
CN113781491A (zh) * 2021-11-11 2021-12-10 阿里巴巴达摩院(杭州)科技有限公司 图像分割模型的训练、图像分割方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090316988A1 (en) * 2008-06-18 2009-12-24 Samsung Electronics Co., Ltd. System and method for class-specific object segmentation of image data
CN101853400A (zh) * 2010-05-20 2010-10-06 武汉大学 基于主动学习和半监督学习的多类图像分类方法
CN103150578A (zh) * 2013-04-09 2013-06-12 山东师范大学 一种基于半监督学习的支持向量机分类器训练方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103390164B (zh) * 2012-05-10 2017-03-29 南京理工大学 基于深度图像的对象检测方法及其实现装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090316988A1 (en) * 2008-06-18 2009-12-24 Samsung Electronics Co., Ltd. System and method for class-specific object segmentation of image data
CN101853400A (zh) * 2010-05-20 2010-10-06 武汉大学 基于主动学习和半监督学习的多类图像分类方法
CN103150578A (zh) * 2013-04-09 2013-06-12 山东师范大学 一种基于半监督学习的支持向量机分类器训练方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"SEMANTIC IMAGE SEGMENTATION WITH DEEP CONVOLUTIONAL NETS AND FULLY CONNECTED CRFs";Liang-Chieh etc.;《arXiv:1412.7062v4[cs.CV]》;20160607;论文第3-5节 *

Also Published As

Publication number Publication date
CN107729908A (zh) 2018-02-23

Similar Documents

Publication Publication Date Title
CN107729908B (zh) 一种机器学习分类模型的建立方法、装置及系统
CN106920229B (zh) 图像模糊区域自动检测方法及系统
US9805264B2 (en) Incremental learning framework for object detection in videos
CN101470809B (zh) 一种基于扩展混合高斯模型的运动目标检测方法
CN107330027B (zh) 一种弱监督的深度台标检测方法
CN108197566B (zh) 一种基于多路神经网络的监控视频行为检测方法
WO2012175785A1 (en) Methods, apparatuses and computer program products for performing accurate pose estimation of objects
RU2014127535A (ru) Автоматизация анализа изображения
US20180260974A1 (en) Color recognition through learned color clusters
Cuevas et al. Improved background modeling for real-time spatio-temporal non-parametric moving object detection strategies
JP6835215B2 (ja) 画像処理方法及び装置
CN109376659A (zh) 用于人脸关键点网络检测模型的训练方法、人脸关键点检测方法、装置
Hassanpour et al. Video frame’s background modeling: Reviewing the techniques
CN105303581B (zh) 一种自适应参数的运动目标检测方法
CN109472193A (zh) 人脸检测方法及装置
CN109919209A (zh) 一种领域自适应深度学习方法及可读存储介质
CN114389966A (zh) 基于图神经网络和流时空关联的网络流量识别方法和系统
CN105447147A (zh) 一种数据处理方法及装置
CN103945089A (zh) 基于亮度闪烁修正及IP camera的动态目标检测方法
CN110705412A (zh) 一种基于运动历史图像的视频目标检测方法
Huo et al. Semisupervised learning based on a novel iterative optimization model for saliency detection
CN107633527B (zh) 基于全卷积神经网络的目标追踪方法及装置
Tang et al. Single image rain removal model using pure rain dictionary learning
CN110136164B (zh) 基于在线透射变换、低秩稀疏矩阵分解去除动态背景的方法
CN111091122A (zh) 一种多尺度特征卷积神经网络的训练和检测方法、装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant