CN110363201A - 基于协同学习的弱监督语义分割方法及系统 - Google Patents

基于协同学习的弱监督语义分割方法及系统 Download PDF

Info

Publication number
CN110363201A
CN110363201A CN201910619773.0A CN201910619773A CN110363201A CN 110363201 A CN110363201 A CN 110363201A CN 201910619773 A CN201910619773 A CN 201910619773A CN 110363201 A CN110363201 A CN 110363201A
Authority
CN
China
Prior art keywords
segmentation
label
pseudo label
positioning
pseudo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910619773.0A
Other languages
English (en)
Other versions
CN110363201B (zh
Inventor
张娅
李智康
王延峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201910619773.0A priority Critical patent/CN110363201B/zh
Publication of CN110363201A publication Critical patent/CN110363201A/zh
Application granted granted Critical
Publication of CN110363201B publication Critical patent/CN110363201B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种基于协同学习的弱监督语义分割方法及系统,所述方法包括:特征图提取步骤:对输入的原始图像,使用深度神经网络提取图像的高层特征图;定位图提取步骤:使用定位子网络,在特征图上基于图像标签提取物体的定位图;分割图提取步骤:使用分割子网络和条件随机场,在特征图上提取物体分割图;伪标签生成步骤:在物体定位图和分割图上,利用阈值选取得到物体定位伪标签和物体分割伪标签;伪标签结合步骤:物体定位伪标签和物体分割伪标签使用一种自适应的混合策略进行混合。所述系统包括与所述各步骤相对应的模块,本发明能够仅通过提供图像级别的标签,训练对图像的像素级别预测的模型,从而完成对图像的语义分割。

Description

基于协同学习的弱监督语义分割方法及系统
技术领域
本发明涉及计算机视觉和图像处理领域,具体地,涉及一种基于协同学习的弱监督语义分割方法及系统。
背景技术
语义分割是计算机视觉中的一个基础任务,它的目标是给图片中每个像素标注一个对应的语义类别,它对后续的图像理解,图像编辑等任务起到了重要的作用,例如交通场景行人分割、医疗场景病灶分割、军事场景航拍图分割。随着深度神经网络在图像处理领域逐渐发展,现在较为成熟的语义分割技术,基本上都是基于深度学习的方法。然而,不同于分类任务,要收集大量像素级别的标签十分耗时耗力,同时也很难保证标签的准确性和一致性。弱监督语义分割应运而生,在提供不完全标注的情况下,如标注框、笔画、点、甚至是图像类别标签,完成语义分割任务。其中,由于图像级别的标签易得且高效,基于图像标签的弱监督语义分割尤为受人关注。
在基于图像标签的弱监督语义分割领域,最初的研究工作是基于多实例学习,将每个像素看作一个实例,一张图片看作一个包,要确保一张图像至少有一个像素属于目标类,此类方法由于缺乏对每个像素的显式监督,很难区别两个边界上相邻但是属于不同类别的像素之间的语义不连续性,效果有效。之后的大部分研究工作致力于基于弱标签生成高质量的伪标签,通常基于物体注意力图,然而定位图比较平滑,生成的伪标签的边界相对粗糙,很难提供物体的形状信息。
经检索,公开号为CN108647684A的中国发明专利,公开一种基于引导注意力推理网络的弱监督语义方法。该方法通过利用分类流和注意力挖掘两个网络流,分类流有助于识别类的区域,注意力挖掘确保所有可能有助于分类决策的区域都将被纳入网络的注意力之中,使注意力图变得更加完整、准确,通过这两种损失函数可以联合生成和训练注意力图;同时引入引导注意力推理网络的扩展,在弱监督的学习框架中无缝集成额外的监督,从而控制注意力图学习过程。
但上述专利未对图像的边界和形状信息进行考虑,如根据条件随机随机场或者随机行走对物体边界进行建模等,未能充分利用分割任务的特点。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于协同学习的弱监督语义分割方法及系统。
本发明使用协同学习的框架,通过两个骨干共享的子网络,产生位置和边界敏感的伪标签,从而在只有图像级别标注的情况下,通过伪标签训练对图像的像素级别预测的模型,从而完成对图像的语义分割。
根据本发明的第一目的,提供一种基于协同学习的弱监督语义分割方法,包括:
特征图提取步骤:对输入的原始图像,使用深度神经网络提取图像的高层特征图;
定位图提取步骤:使用定位子网络,在特征图上基于图像标签提取物体的定位图;
分割图提取步骤:使用分割子网络和条件随机场,在特征图上提取物体分割图;
伪标签生成步骤:在物体定位图和分割图上,利用阈值选取得到物体定位伪标签和物体分割伪标签;
伪标签结合步骤:物体定位伪标签和物体分割伪标签使用一种自适应的混合策略进行混合。
本发明所述的基于协同学习的弱监督语义分割方法,是能够进行端到端训练的。
优选地,所述特征图提取步骤,定位子网络和分割子网络共享一个骨干网络。在骨干网络中,运用了空洞卷积模块,在保证一定大小特征图分辨率的情况下,增大特征图的感受野,该步骤能够对输入的任意图像提取出0到1之间浮点数组成的高层特征图,同时整个方法能够在进行端到端训练的过程中被继续学习优化。
优选地,所述定位图提取步骤,在骨干网络提取的特征图上使用定位子网络,根据提供的物体类别,通过类别激活映射CAM得到对应类别的定位图。
优选地,所述分割图提取步骤,在骨干网络提取的特征图上使用分割子网络得到粗糙的分割图,之后结合原始图像通过条件随机场CRF得到精细的分割图。
优选地,所述伪标签生成步骤,对于定位图,首先将定位图每个点最大可信度的类别作为初始伪标签,同时作为该点标签的可信度,同时根据显著性图作为背景的先验,结合每个点标签的可信度,对每个点的标签根据阈值进行筛选;对于分割图,首先将分割图每个点最大可信度的类别作为初始伪标签,同时作为该点标签的可信度,之后对每个点的标签根据阈值进行筛选,不满足可信度条件的伪标签设为未知。
优选地,所述伪标签结合步骤,物体定位伪标签和物体分割伪标签使用一种动态的混合策略进行像素级别混合,同时结合定位伪标签定位准确和分割伪标签边界清晰的优点,作为模型的监督,进行端到端的学习。
根据本发明的第二目的,提供一种基于协同学习的弱监督语义分割系统,包括:
特征图提取模块:对输入的原始图像,使用深度神经网络提取图像的高层特征图;
定位图提取模块:使用定位子网络,在特征图上基于图像标签提取物体的定位图;
分割图提取模块:使用分割子网络和条件随机场,在特征图上提取物体分割图;
伪标签生成模块:在物体定位图和分割图上,利用阈值选取得到物体定位伪标签和物体分割伪标签;
伪标签结合模块:物体定位伪标签和物体分割伪标签使用一种自适应的混合策略进行混合。
本发明所述的基于协同学习的弱监督语义分割方法,是能够进行端到端训练的。
优选地,所述特征图提取模块,定位子网络和分割子网络共享一个骨干网络。在骨干网络中,运用了空洞卷积模块,在保证一定大小特征图分辨率的情况下,增大特征图的感受野,该模块能够对输入的任意图像提取出0到1之间浮点数组成的高层特征图,同时整个方法能够在进行端到端训练的过程中被继续学习优化。
优选地,所述定位图提取模块,在骨干网络提取的特征图上使用定位子网络,根据提供的物体类别,通过类别激活映射CAM得到对应类别的定位图。
优选地,所述分割图提取模块,在骨干网络提取的特征图上使用分割子网络得到粗糙的分割图,之后结合原始图像通过条件随机场CRF得到精细的分割图。
优选地,所述伪标签生成模块,对于定位图,首先将定位图每个点最大可信度的类别作为初始伪标签,同时作为该点标签的可信度,同时根据显著性图作为背景的先验,结合每个点标签的可信度,对每个点的标签根据阈值进行筛选;对于分割图,首先将分割图每个点最大可信度的类别作为初始伪标签,同时作为该点标签的可信度,之后对每个点的标签根据阈值进行筛选,不满足可信度条件的伪标签设为未知。
优选地,所述伪标签结合模块,物体定位伪标签和物体分割伪标签使用一种动态的混合策略进行像素级别混合,同时结合定位伪标签定位准确和分割伪标签边界清晰的优点,作为模型的监督,进行端到端的学习。
与现有技术相比,本发明具有如下的有益效果:
本发明对输入图像分别通过定位子网络提取定位图和通过分割子网络提取分割图,之后通过混合后的定位伪标签和分割伪标签作为监督,从而进行弱监督的语义分割。
进一步的,本发明中定位图提取模块能够对输入图像提取物体的位置敏感信息,分割图提取模块能够对输入图像提取物体的边界敏感信息。与此同时,伪标签生成模块一定程度上过滤了伪标签中噪声,有利于网络的训练。最后通过伪标签混合模块,物体的位置信息和边界信息都能够得到保留和利用,从而提升弱监督语义分割的效果。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明一实施例中方法流程图;
图2为本发明一实施例中方法具体流程图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
根据本发明提供的一种基于协同学习的弱监督语义分割方法,包括:
特征图提取步骤:对输入的原始图像,使用深度神经网络提取图像的高层特征图;
定位图提取步骤:使用定位子网络,在高层特征图上基于图像标签提取物体定位图;
分割图提取步骤:使用分割子网络和条件随机场,在高层特征图上提取物体分割图;
伪标签生成步骤:在物体定位图和物体分割图上,利用阈值选取分别得到物体定位伪标签和物体分割伪标签;
伪标签结合步骤:将物体定位伪标签和物体分割伪标签进行自适应混合。
具体地,所述定位子网络和分割子网络共享一个骨干网络,在所述骨干网络中,运用空洞卷积,在保证设定大小特征图分辨率的情况下,增大高层特征图的感受野,对输入的任意图像提取出0到1之间浮点数组成的高层特征图。
具体地,所述定位图提取中,在骨干网络提取的高层特征图上使用定位子网络,根据提供的物体类别,通过类别激活映射CAM得到对应类别的物体定位图。
具体地,所述定位图提取中,给定一张图像I,fu,k代表最后一层卷积层之后的单元k在空间位置u的激活,所以对于单元k,执行了全局池化后的结果Fk在经过最后的全连接层后,对类别c的分数为是单元k对应于类别c的权重,对于类别c的物体定位图Au,c表示为:
Au,c直接说明了在空间位置u的激活对图像I分类到类别c的重要性。
具体地,所述分割图提取中,在骨干网络提取的高层特征图上使用分割子网络得到粗糙的分割图,之后结合原始图像通过条件随机场CRF得到精细的物体分割图。
具体地,所述分割图提取中,在骨干网络提取的物体特征图上,使用分割子网络得到粗糙的分割图Hu,c,分割网络使用了多个不同尺度的空洞卷积,捕捉不同尺度大小物体,之后将粗糙的分割图的对数项作为条件随机场的一元项,将原始图像中关于位置和颜色的信息的高斯核作为条件随机场的二元项,产生精细的物体分割图Gu,c
具体地,所述伪标签生成中,对于物体定位图,首先将物体定位图每个点最大可信度的类别作为初始伪标签,并作为该点标签的可信度,根据显著性图作为背景先验,结合每个点标签的可信度,对每个点标签根据阈值进行筛选,得到物体定位伪标签;对于物体分割图,首先将物体分割图每个点最大可信度的类别作为初始伪标签,并作为该点标签的可信度,之后对每个点标签根据阈值进行筛选,将不满足可信度条件的伪标签设为未知,得到物体分割伪标签。
具体地,所述伪标签生成中,对于物体定位图的初始伪标签对应的可信度基于显著性图Bu的背景初始伪标签通过一个三元区间确定物体定位图的伪标签,前景类别可信度高的第一区域和背景可信度高的第二区域分别选为对应的前景伪标签和背景伪标签,对于第一区域和第二区域以外的第三区域,只有当前景伪标签和背景伪标签不冲突时,选为对应的前景伪标签,否则,伪标签设为未知,在损失函数中不参与计算,物体定位伪标签Wu具体生成方法可写作:
其中,δh和δl分别是前景类别可信度的高可信度阈值和低可信阈值,δs是背景类别可信度的阈值,当Au≥δh,说明是前景类别可信度高的第一区域,当Au<δl and Bu≤δs,说明背景可信度高的第二区域,其它区域为第三区域;
对于物体分割图的初始伪标签对应的可信度根据可信度进行筛选,由于前景类别和背景类别的分布不同,对前景和背景选取不同的可信度阈值θf和θb,物体分割伪标签Su也即:
其中,C是数据集类别种类,是背景类别种类。
具体地,所述伪标签结合中,物体定位伪标签和物体分割伪标签使用动态的混合策略进行像素级别混合。
根据本发明提供的一种基于协同学习的弱监督语义分割系统,包括:
特征图提取模块:对输入的原始图像,使用深度神经网络提取图像的高层特征图;
定位图提取模块:使用定位子网络,在高层特征图上基于图像标签提取物体定位图;
分割图提取模块:使用分割子网络和条件随机场,在高层特征图上提取物体分割图;
伪标签生成模块:在物体定位图和物体分割图上,利用阈值选取分别得到物体定位伪标签和物体分割伪标签;
伪标签结合模块:将物体定位伪标签和物体分割伪标签进行自适应混合。
以下结合附图对本发明做进一步阐述。
如图1所示,为本发明一种基于协同学习的弱监督语义分割方法实施例的流程图,该方法将输入图像处理为特征图,分别使用定位图提取步骤和分割图提取步骤在特征图上提取定位图和分割图,并使用伪标签生成步骤产生定位伪标签和分割伪标签,最后使用自适应的混合策略将定位伪标签和分割伪标签进行混合,并用混合后的伪标签作为网络的监督,从而完成对图像的语义分割。
具体的,参照图1,所述方法包括如下步骤:
特征图提取步骤:对输入的原始图像,使用深度神经网络提取图像的高层特征图;
定位图提取步骤:使用定位子网络,在特征图上基于图像标签提取物体的定位图;
分割图提取步骤:使用分割子网络和条件随机场,在特征图上提取物体分割图;
伪标签生成步骤:在物体定位图和分割图上,利用阈值选取得到物体定位伪标签和物体分割伪标签;
伪标签结合步骤:物体定位伪标签和物体分割伪标签使用一种自适应的混合策略进行混合。
对应于上述方法,本发明还提供一种基于协同学习的弱监督语义分割系统的实施例,包括:
特征图提取模块:对输入的原始图像,使用深度神经网络提取图像的高层特征图;
定位图提取模块:使用定位子网络,在特征图上基于图像标签提取物体的定位图;
分割图提取模块:使用分割子网络和条件随机场,在特征图上提取物体分割图;
伪标签生成模块:在物体定位图和分割图上,利用阈值选取得到物体定位伪标签和物体分割伪标签;
伪标签结合模块:物体定位伪标签和物体分割伪标签使用一种自适应的混合策略进行混合。
上述基于协同学习的弱监督语义分割系统各个模块实现的技术特征可以与上述基于协同学习的弱监督语义分割方法中对应步骤实现的技术特征相同。
以下对各个步骤和模块的具体实现进行详细的描述,以便理解本发明技术方案。
在本发明部分实施例中,所述特征图提取步骤,定位子网络和分割子网络共享一个骨干网络。在骨干网络中,运用了空洞卷积模块,在保证一定大小特征图分辨率的情况下,增大特征图的感受野,该步骤能够对输入的任意图像提取出0到1之间浮点数组成的高层特征图,同时整个方法能够在进行端到端训练的过程中被继续学习优化。
在本发明部分实施例中,所述定位图提取步骤,在骨干网络提取的特征图上使用定位子网络,根据提供的物体类别,通过类别激活映射CAM得到对应类别的定位图。
在本发明部分实施例中,所述分割图提取步骤,在骨干网络提取的特征图上使用分割子网络得到粗糙的分割图,之后结合原始图像通过条件随机场CRF得到精细的分割图。
在本发明部分实施例中,所述伪标签生成步骤,对于定位图,首先将定位图每个点最大可信度的类别作为初始伪标签,同时作为该点标签的可信度,同时根据显著性图作为背景的先验,结合每个点标签的可信度,对每个点的标签根据阈值进行筛选;对于分割图,首先将分割图每个点最大可信度的类别作为初始伪标签,同时作为该点标签的可信度,之后对每个点的标签根据阈值进行筛选,不满足可信度条件的伪标签设为未知。
在本发明部分实施例中,所述伪标签结合步骤,物体定位伪标签和物体分割伪标签使用一种动态的混合策略进行像素级别混合,同时结合定位伪标签定位准确和分割伪标签边界清晰的优点,作为模型的监督,进行端到端的学习。
在本发明以优选实施例中,所述伪标签结合步骤,具体可以按照如下操作:
C是数据集类别种类,是背景类别种类,Su,c和Wu,c分别是定位伪标签和分割伪标签,是图像中出现的类别,u∈U是图像中的任意一个像素位置,最后混合后的伪标签Fu,c可以写做
Fu,c=αWu,c+(1-α)Su,c
超参数α控制着混合的比例,是一个单调递减的函数,n是当前的训练轮数,N是总的训练轮数,N0决定了衰减的速度。分割伪标签会随着训练的进行越来越精确,因此分割伪标签的比例会越来越大。α0确保了定位伪标签在混合中所占的最小比例,在训练中作为正则器,表示定位伪标签Wu,c在最终混合伪标签Fu,c中所占的比例。
伪标签Fu,c作为分割子网络的监督信息,提供像素级别的标注。考虑到伪标签中前景和背景标签的分布不平衡,对损失函数中为每个图像添加对应的权重,取为伪标签中前景和背景的标签的数量的倒数,最终的伪标签损失lmask为:
其中,pu,c表示分割网络预测像素u属于第c个类别的概率。
此外,对分割子网络同时添加边界损失lboundary,鼓励分割子网络输出的分割结果和经过条件随机场修正后的分割结果保持一致,具体为粗糙分割图Hu,c和精细分割图Gu,c之间的KL散度:
对于定位子网络,由于一张图像中有多个类别,因此将损失定义为图像类别标签y和定位子网络预测的图像类别之间的二值多标签交叉熵:
其中,lcls表示图像分类的损失函数。
最终,所述的基于协同学习的弱监督语义分割方法的训练目标是:
l=λlcls+lmask+lboundary
其中,l表示整个模型训练总的损失函数。
在训练阶段,仅仅提供图像类别标签的情况下,定位子网络和分割子网络由损失函数的随机梯度下降完成共同更新。两个子网络单独的网络层的梯度由对应的损失独立计算,共享的骨干网络的梯度由总损失产生。在测试阶段,单独由分割子网络产生图像的像素级别预测,从而完成对图像的语义分割。
具体的,由特征图提取模块、定位图提取模块、分割图提取模块、伪标签生成模块,伪标签结合模块组成的语义分割网络框架如图2所示,整个网络框架能够端到端地进行训练。
如图2所示的网络框架中,图中的特征图提取模块,对输入的原始图像,使用深度神经网络提取图像的高层特征图。骨干网络由一系列卷积层+pooling层+relu层组成的,在高层的网络中,部分卷积层为空洞卷积,在保证一定大小特征图分辨率的情况下,增大特征图的感受野,对输入的任意图像提取出0到1之间浮点数组成的高层特征图。
如图2所示的网络框架中,图中的定位图提取模块,使用定位子网络,在特征图上基于图像标签提取物体的定位图。通过在骨干网络提取的特征图上使用定位子网络,根据提供的物体类别,通过类别激活映射CAM得到对应类别的定位图。给定一张图像I,fu,k代表最后一层卷积层之后的单元k在空间位置u的激活,所以对于单元k,执行了全局池化后的结果Fk在经过最后的全连接层后,对类别c的分数为 是单元k对应于类别c的权重。网络对于类别c的定位图Au,c可以写做:
Au,c直接说明了在空间位置u的激活对图像I分类到类别c的重要性。
如图2所示的网络框架中,图中的分割图提取模块,使用分割子网络和条件随机场,在特征图上提取物体分割图。在骨干网络提取的特征图上,使用分割子网络得到粗糙的分割图Hu,c,分割网络使用了6、12、18、24四种尺度的空洞卷积ASPP模块,能够捕捉不同尺度大小物体。之后将粗糙的分割图的对数项看作条件随机场的一元项,将原始图像中关于位置和颜色的信息的高斯核作为条件随机场的二元项,产生精细的分割图Gu,c
综上,本发明能够对输入图像分别通过定位子网络提取定位图和通过分割子网络提取分割图,定位图包含物体的位置敏感信息,分割图包含物体的边界敏感信息。与此同时,伪标签生成模块一定程度上过滤了伪标签中噪声,有利于网络的训练。最后通过伪标签混合模块,物体的位置信息和边界信息都能够得到保留和利用,从而提升弱监督语义分割的效果。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (10)

1.一种基于协同学习的弱监督语义分割方法,其特征在于,包括:
特征图提取步骤:对输入的原始图像,使用深度神经网络提取图像的高层特征图;
定位图提取步骤:使用定位子网络,在高层特征图上基于图像标签提取物体定位图;
分割图提取步骤:使用分割子网络和条件随机场,在高层特征图上提取物体分割图;
伪标签生成步骤:在物体定位图和物体分割图上,利用阈值选取分别得到物体定位伪标签和物体分割伪标签;
伪标签结合步骤:将物体定位伪标签和物体分割伪标签进行自适应混合。
2.根据权利要求1所述的基于协同学习的弱监督语义分割方法,其特征在于,所述定位子网络和分割子网络共享一个骨干网络,在所述骨干网络中,运用空洞卷积,在保证设定大小特征图分辨率的情况下,增大高层特征图的感受野,对输入的任意图像提取出0到1之间浮点数组成的高层特征图。
3.根据权利要求2所述的基于协同学习的弱监督语义分割方法,其特征在于,所述定位图提取中,在骨干网络提取的高层特征图上使用定位子网络,根据提供的物体类别,通过类别激活映射CAM得到对应类别的物体定位图。
4.根据权利要求3所述的基于协同学习的弱监督语义分割方法,其特征在于,所述定位图提取中,给定一张图像I,fu,k代表最后一层卷积层之后的单元k在空间位置u的激活,所以对于单元k,执行了全局池化后的结果Fk在经过最后的全连接层后,对类别c的分数为 是单元k对应于类别c的权重,对于类别c的物体定位图Au,c表示为:
Au,c直接说明了在空间位置u的激活对图像I分类到类别c的重要性。
5.根据权利要求1所述的基于协同学习的弱监督语义分割方法,其特征在于,所述分割图提取中,在骨干网络提取的高层特征图上使用分割子网络得到粗糙的分割图,之后结合原始图像通过条件随机场CRF得到精细的物体分割图。
6.根据权利要求5所述的基于协同学习的弱监督语义分割方法,其特征在于,所述分割图提取中,在骨干网络提取的物体特征图上,使用分割子网络得到粗糙的分割图Hu,c,分割网络使用了多个不同尺度的空洞卷积,捕捉不同尺度大小物体,之后将粗糙的分割图的对数项作为条件随机场的一元项,将原始图像中关于位置和颜色的信息的高斯核作为条件随机场的二元项,产生精细的物体分割图Gu,c
7.根据权利要求1所述的基于协同学习的弱监督语义分割方法,其特征在于,所述伪标签生成中,对于物体定位图,首先将物体定位图每个点最大可信度的类别作为初始伪标签,并作为该点标签的可信度,根据显著性图作为背景先验,结合每个点标签的可信度,对每个点标签根据阈值进行筛选,得到物体定位伪标签;对于物体分割图,首先将物体分割图每个点最大可信度的类别作为初始伪标签,并作为该点标签的可信度,之后对每个点标签根据阈值进行筛选,将不满足可信度条件的伪标签设为未知,得到物体分割伪标签。
8.根据权利要求7所述的基于协同学习的弱监督语义分割方法,其特征在于,所述伪标签生成中,对于物体定位图的初始伪标签对应的可信度基于显著性图Bu的背景初始伪标签通过一个三元区间确定物体定位图的伪标签,前景类别可信度高的第一区域和背景可信度高的第二区域分别选为对应的前景伪标签和背景伪标签,对于第一区域和第二区域以外的第三区域,只有当前景伪标签和背景伪标签不冲突时,选为对应的前景伪标签,否则,伪标签设为未知,在损失函数中不参与计算,物体定位伪标签Wu具体生成方法可写作:
其中,δh和δl分别是前景类别可信度的高可信度阈值和低可信阈值,δs是背景类别可信度的阈值,当Au≥δh,说明是前景类别可信度高的第一区域,当Au<δl and Bu≤δs,说明背景可信度高的第二区域,其它区域为第三区域;
对于物体分割图的初始伪标签对应的可信度根据可信度进行筛选,由于前景类别和背景类别的分布不同,对前景和背景选取不同的可信度阈值θf和θb,物体分割伪标签Su即:
其中,C是数据集类别种类,是背景类别种类。
9.根据权利要求1所述的基于协同学习的弱监督语义分割方法,其特征在于,所述伪标签结合中,物体定位伪标签和物体分割伪标签使用动态的混合策略进行像素级别混合。
10.一种基于协同学习的弱监督语义分割系统,其特征在于,包括:
特征图提取模块:对输入的原始图像,使用深度神经网络提取图像的高层特征图;
定位图提取模块:使用定位子网络,在高层特征图上基于图像标签提取物体定位图;
分割图提取模块:使用分割子网络和条件随机场,在高层特征图上提取物体分割图;
伪标签生成模块:在物体定位图和物体分割图上,利用阈值选取分别得到物体定位伪标签和物体分割伪标签;
伪标签结合模块:将物体定位伪标签和物体分割伪标签进行自适应混合。
CN201910619773.0A 2019-07-10 2019-07-10 基于协同学习的弱监督语义分割方法及系统 Active CN110363201B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910619773.0A CN110363201B (zh) 2019-07-10 2019-07-10 基于协同学习的弱监督语义分割方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910619773.0A CN110363201B (zh) 2019-07-10 2019-07-10 基于协同学习的弱监督语义分割方法及系统

Publications (2)

Publication Number Publication Date
CN110363201A true CN110363201A (zh) 2019-10-22
CN110363201B CN110363201B (zh) 2021-06-01

Family

ID=68218657

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910619773.0A Active CN110363201B (zh) 2019-07-10 2019-07-10 基于协同学习的弱监督语义分割方法及系统

Country Status (1)

Country Link
CN (1) CN110363201B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110853072A (zh) * 2019-11-08 2020-02-28 安徽大学 基于自引导推理的弱监督图像语义分割方法
CN110852270A (zh) * 2019-11-11 2020-02-28 中科视语(北京)科技有限公司 基于深度学习的混合语法人体解析方法及装置
CN111145277A (zh) * 2019-12-31 2020-05-12 山东浪潮人工智能研究院有限公司 一种深度语义感知与bpg压缩工具的图像压缩方法
CN111462132A (zh) * 2020-03-20 2020-07-28 西北大学 一种基于深度学习的视频物体分割方法及系统
CN111783811A (zh) * 2019-10-30 2020-10-16 北京京东尚科信息技术有限公司 伪标签生成方法和装置
CN111898098A (zh) * 2020-08-18 2020-11-06 哈尔滨工业大学 面向多方协作的利益相关者服务价值冲突发现和消解方法
CN112381098A (zh) * 2020-11-19 2021-02-19 上海交通大学 基于目标分割领域自学习的半监督学习方法和系统
CN112884730A (zh) * 2021-02-05 2021-06-01 南开大学 一种基于协作学习的协同显著性物体检测方法及系统
WO2021109878A1 (en) * 2019-12-06 2021-06-10 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method and system for semi-supervised content localization
CN113239924A (zh) * 2021-05-21 2021-08-10 上海交通大学 一种基于迁移学习的弱监督目标检测方法及系统
CN114863104A (zh) * 2022-05-05 2022-08-05 哈尔滨工业大学 一种基于标签分布学习的图像分割方法
CN115249306A (zh) * 2022-09-13 2022-10-28 腾讯科技(深圳)有限公司 图像分割模型训练方法、图像处理方法、装置及存储介质
CN116309653A (zh) * 2023-05-18 2023-06-23 中国科学技术大学 弱监督图像语义分割方法、系统、设备及存储介质
CN116363362A (zh) * 2023-03-08 2023-06-30 阿里巴巴(中国)有限公司 图像语义分割方法、对象识别方法及计算设备
WO2023207535A1 (zh) * 2022-04-29 2023-11-02 华为技术有限公司 一种伪标签框生成方法、装置及电子设备
CN117975241A (zh) * 2024-03-29 2024-05-03 厦门大学 一种面向指向性目标分割的半监督学习方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106530305A (zh) * 2016-09-23 2017-03-22 北京市商汤科技开发有限公司 语义分割模型训练和图像分割方法及装置、计算设备
CN106709568A (zh) * 2016-12-16 2017-05-24 北京工业大学 基于深层卷积网络的rgb‑d图像的物体检测和语义分割方法
CN108062756A (zh) * 2018-01-29 2018-05-22 重庆理工大学 基于深度全卷积网络和条件随机场的图像语义分割方法
CN108256562A (zh) * 2018-01-09 2018-07-06 深圳大学 基于弱监督时空级联神经网络的显著目标检测方法及系统
CN108399406A (zh) * 2018-01-15 2018-08-14 中山大学 基于深度学习的弱监督显著性物体检测的方法及系统
CN108647684A (zh) * 2018-05-02 2018-10-12 深圳市唯特视科技有限公司 一种基于引导注意力推理网络的弱监督语义分割方法
CN108764281A (zh) * 2018-04-18 2018-11-06 华南理工大学 一种基于半监督自步学习跨任务深度网络的图像分类方法
CN109063723A (zh) * 2018-06-11 2018-12-21 清华大学 基于迭代挖掘物体共同特征的弱监督图像语义分割方法
CN109087303A (zh) * 2018-08-15 2018-12-25 中山大学 基于迁移学习提升语义分割模型效果的框架
CN109255790A (zh) * 2018-07-27 2019-01-22 北京工业大学 一种弱监督语义分割的自动图像标注方法
CN109345537A (zh) * 2018-08-17 2019-02-15 西安电子科技大学 基于高阶多尺度crf半监督的sar图像分割方法
WO2019089192A1 (en) * 2017-11-03 2019-05-09 Siemens Aktiengesellschaft Weakly-supervised semantic segmentation with self-guidance
CN109993173A (zh) * 2019-03-28 2019-07-09 华南理工大学 一种基于种子生长及边界约束的弱监督图像语义分割方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106530305A (zh) * 2016-09-23 2017-03-22 北京市商汤科技开发有限公司 语义分割模型训练和图像分割方法及装置、计算设备
CN106709568A (zh) * 2016-12-16 2017-05-24 北京工业大学 基于深层卷积网络的rgb‑d图像的物体检测和语义分割方法
WO2019089192A1 (en) * 2017-11-03 2019-05-09 Siemens Aktiengesellschaft Weakly-supervised semantic segmentation with self-guidance
CN108256562A (zh) * 2018-01-09 2018-07-06 深圳大学 基于弱监督时空级联神经网络的显著目标检测方法及系统
CN108399406A (zh) * 2018-01-15 2018-08-14 中山大学 基于深度学习的弱监督显著性物体检测的方法及系统
CN108062756A (zh) * 2018-01-29 2018-05-22 重庆理工大学 基于深度全卷积网络和条件随机场的图像语义分割方法
CN108764281A (zh) * 2018-04-18 2018-11-06 华南理工大学 一种基于半监督自步学习跨任务深度网络的图像分类方法
CN108647684A (zh) * 2018-05-02 2018-10-12 深圳市唯特视科技有限公司 一种基于引导注意力推理网络的弱监督语义分割方法
CN109063723A (zh) * 2018-06-11 2018-12-21 清华大学 基于迭代挖掘物体共同特征的弱监督图像语义分割方法
CN109255790A (zh) * 2018-07-27 2019-01-22 北京工业大学 一种弱监督语义分割的自动图像标注方法
CN109087303A (zh) * 2018-08-15 2018-12-25 中山大学 基于迁移学习提升语义分割模型效果的框架
CN109345537A (zh) * 2018-08-17 2019-02-15 西安电子科技大学 基于高阶多尺度crf半监督的sar图像分割方法
CN109993173A (zh) * 2019-03-28 2019-07-09 华南理工大学 一种基于种子生长及边界约束的弱监督图像语义分割方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ALEXANDER KOLESNIKOV ET AL.: "Seed, Expand and Constrain: Three Principles for Weakly-Supervised Image Segmentation", 《EUROPEAN CONFERENCE ON COMPUTER VISION》 *
BOLEI ZHOU ET AL.: "Learning Deep Features for Discriminative Localization", 《2016 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 *
XIANG WANG ET AL.: "Weakly-Supervised Semantic Segmentation by Iteratively Mining Common Object Features", 《2018 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *
YAUHEN BABAKHIN: "Semi-Supervised Segmentation of Salt Bodies in Seismic Images using an Ensemble of Convolutional Neural Networks", 《ARVIV:1904.04445V1》 *
方明超: "基于全卷积网络的脑部MRI肿瘤分割方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111783811A (zh) * 2019-10-30 2020-10-16 北京京东尚科信息技术有限公司 伪标签生成方法和装置
CN110853072B (zh) * 2019-11-08 2023-08-22 安徽大学 基于自引导推理的弱监督图像语义分割方法
CN110853072A (zh) * 2019-11-08 2020-02-28 安徽大学 基于自引导推理的弱监督图像语义分割方法
CN110852270A (zh) * 2019-11-11 2020-02-28 中科视语(北京)科技有限公司 基于深度学习的混合语法人体解析方法及装置
CN110852270B (zh) * 2019-11-11 2024-03-15 中科视语(北京)科技有限公司 基于深度学习的混合语法人体解析方法及装置
WO2021109878A1 (en) * 2019-12-06 2021-06-10 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method and system for semi-supervised content localization
CN111145277A (zh) * 2019-12-31 2020-05-12 山东浪潮人工智能研究院有限公司 一种深度语义感知与bpg压缩工具的图像压缩方法
CN111462132A (zh) * 2020-03-20 2020-07-28 西北大学 一种基于深度学习的视频物体分割方法及系统
CN111898098A (zh) * 2020-08-18 2020-11-06 哈尔滨工业大学 面向多方协作的利益相关者服务价值冲突发现和消解方法
CN112381098A (zh) * 2020-11-19 2021-02-19 上海交通大学 基于目标分割领域自学习的半监督学习方法和系统
CN112884730B (zh) * 2021-02-05 2022-06-07 南开大学 一种协同显著性物体检测方法及系统
CN112884730A (zh) * 2021-02-05 2021-06-01 南开大学 一种基于协作学习的协同显著性物体检测方法及系统
CN113239924B (zh) * 2021-05-21 2022-04-26 上海交通大学 一种基于迁移学习的弱监督目标检测方法及系统
CN113239924A (zh) * 2021-05-21 2021-08-10 上海交通大学 一种基于迁移学习的弱监督目标检测方法及系统
WO2023207535A1 (zh) * 2022-04-29 2023-11-02 华为技术有限公司 一种伪标签框生成方法、装置及电子设备
CN114863104A (zh) * 2022-05-05 2022-08-05 哈尔滨工业大学 一种基于标签分布学习的图像分割方法
CN114863104B (zh) * 2022-05-05 2023-08-08 哈尔滨工业大学 一种基于标签分布学习的图像分割方法
CN115249306A (zh) * 2022-09-13 2022-10-28 腾讯科技(深圳)有限公司 图像分割模型训练方法、图像处理方法、装置及存储介质
CN115249306B (zh) * 2022-09-13 2022-12-02 腾讯科技(深圳)有限公司 图像分割模型训练方法、图像处理方法、装置及存储介质
CN116363362A (zh) * 2023-03-08 2023-06-30 阿里巴巴(中国)有限公司 图像语义分割方法、对象识别方法及计算设备
CN116363362B (zh) * 2023-03-08 2024-01-09 阿里巴巴(中国)有限公司 图像语义分割方法、对象识别方法及计算设备
CN116309653B (zh) * 2023-05-18 2023-08-29 中国科学技术大学 弱监督图像语义分割方法、系统、设备及存储介质
CN116309653A (zh) * 2023-05-18 2023-06-23 中国科学技术大学 弱监督图像语义分割方法、系统、设备及存储介质
CN117975241A (zh) * 2024-03-29 2024-05-03 厦门大学 一种面向指向性目标分割的半监督学习方法

Also Published As

Publication number Publication date
CN110363201B (zh) 2021-06-01

Similar Documents

Publication Publication Date Title
CN110363201A (zh) 基于协同学习的弱监督语义分割方法及系统
CN109583425A (zh) 一种基于深度学习的遥感图像船只集成识别方法
CN106778821B (zh) 基于slic和改进的cnn的极化sar图像分类方法
Zhong et al. An adaptive subpixel mapping method based on MAP model and class determination strategy for hyperspectral remote sensing imagery
KR101640998B1 (ko) 화상 처리 장치 및 화상 처리 방법
CN112734775B (zh) 图像标注、图像语义分割、模型训练方法及装置
US11887362B2 (en) Sky filter method for panoramic images and portable terminal
CN110176027A (zh) 视频目标跟踪方法、装置、设备及存储介质
CN110136154A (zh) 基于全卷积网络与形态学处理的遥感图像语义分割方法
CN110738207A (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
CN107909015A (zh) 基于卷积神经网络及空谱信息融合的高光谱图像分类方法
CN111986099A (zh) 基于融合残差修正的卷积神经网络的耕地监测方法及系统
CN109934200A (zh) 一种基于改进M-Net的RGB彩色遥感图像云检测方法及系统
CN109613006A (zh) 一种基于端到端神经网络的织物疵点检测方法
CN111640125A (zh) 基于Mask R-CNN的航拍图建筑物检测和分割方法及装置
CN107730515A (zh) 基于区域增长和眼动模型的全景图像显著性检测方法
CN109948593A (zh) 基于结合全局密度特征的mcnn人群计数方法
CN108241854A (zh) 一种基于运动和记忆信息的深度视频显著性检测方法
CN109583455A (zh) 一种融合递进图排序的图像显著性检测方法
WO2020077940A1 (en) Method and device for automatic identification of labels of image
CN106570874A (zh) 一种结合图像局部约束与对象全局约束的图像标记方法
CN116645592B (zh) 一种基于图像处理的裂缝检测方法和存储介质
Zhuang et al. Normal endmember spectral unmixing method for hyperspectral imagery
CN106780546A (zh) 基于卷积神经网络的运动模糊编码点的身份识别方法
CN107705323A (zh) 一种基于卷积神经网络的水平集目标追踪方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant