CN108399406B - 基于深度学习的弱监督显著性物体检测的方法及系统 - Google Patents

基于深度学习的弱监督显著性物体检测的方法及系统 Download PDF

Info

Publication number
CN108399406B
CN108399406B CN201810036348.4A CN201810036348A CN108399406B CN 108399406 B CN108399406 B CN 108399406B CN 201810036348 A CN201810036348 A CN 201810036348A CN 108399406 B CN108399406 B CN 108399406B
Authority
CN
China
Prior art keywords
training
map
neural network
saliency
salient object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810036348.4A
Other languages
English (en)
Other versions
CN108399406A (zh
Inventor
李冠彬
林倞
谢圆
成慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN201810036348.4A priority Critical patent/CN108399406B/zh
Priority to PCT/CN2018/095057 priority patent/WO2019136946A1/zh
Publication of CN108399406A publication Critical patent/CN108399406A/zh
Application granted granted Critical
Publication of CN108399406B publication Critical patent/CN108399406B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习的弱监督显著性物体检测的方法及系统,该方法包括:利用非监督的显著性检测方法产生所有训练图像的显著图;将显著图与对应的图像级别的类别标签作为初次迭代的有噪声的监督信息,以训练多任务的全卷积神经网络,训练过程收敛后,生成新的类别激活图和显著性物体预测图;利用条件随机场模型调整类别激活图和显著性物体预测图;利用标签更新策略为下一次迭代更新显著性标注信息;多次迭代进行训练过程直到符合停止的条件;在含有未知类别图像的数据集上进行泛化式训练,得到最终模型,本发明在优化过程中自动清除噪声信息,只使用图像级别的标注信息就能达到良好的预测效果,避免了冗繁耗时的像素级别的人工标注过程。

Description

基于深度学习的弱监督显著性物体检测的方法及系统
技术领域
本发明涉及基于深度学习的计算机视觉领域,特别是涉及一种基于深度学习的弱监督显著性物体检测的方法及系统。
背景技术
显著性物体检测是指在图像中准确地定位出最吸引人类视觉注意力的区域。近年来由于这种技术能在众多不同的视觉技术中得到运用,激发了大量计算机视觉和认知科学的研究工作。
近几年,卷积神经网络的成功运用为显著性检测技术带来了重大突破,如G.Li等人在2015年的研究工作“Visual saliency based on multiscale deep features”(IEEEConference on Computer Vision and Pattern Recognition(CVPR),June 2015),和N.Liu等人在2016年的研究工作“Deep hierarchical saliency network for salientobject detection”(In Proceedings of the IEEE Conference on Computer Visionand Pattern Recognition,pages 678–686,2016)。然而,这些基于深度学习理论的利用卷积神经网络进行建模的方法,保证性能的前提都是需要有足量且质量高的像素级别的标注信息来作为训练样本。但是,对于显著性检测来说,进行像素级别的标注十分吃力,即使是对于经验丰富的标注人员,也需要几分钟时间才能标出一张图。此外,由于显著性的定义比较主观,为了保证训练质量,在完成人工标注阶段的工作之后,还需对标注信息进行进一步删选,去除有争议性的标注,整个标注工作需要耗费很多人工和时间,从而限制了像素级别训练数据的数据总量,这种限制也进一步成为全监督方法提高性能的瓶颈。
另一方面,这一领域也存在海量的非监督的方法,如较早期的Y.Wei,F.Wen,W.Zhu,and J.Sun的工作“Geodesic saliency using background priors”(In Europeanconference on computer vision,pages 29–42.Springer,2012),和近年M.-M.Cheng等人的研究Global contrast based salient region detection.(IEEE Transactions onPattern Analysis and Machine Intelligence,37(3):569–582,2015)。这些方法通常基于某种低级别的特征进行预测,如颜色,位置,背景先验信息等,导致了这类方法总是在特定类别的图像上比较适用,但是无法对所有图像进行很好的预测,这些基于低级别特征的方法有共同的缺点,即检测的错误大多源于缺乏空间相关性和图像语义的考虑。
发明内容
为克服上述现有技术存在的不足,本发明之目的在于提供一种基于深度学习的弱监督显著性物体检测方法及系统,有效地结合了有监督和无监督的显著性检测方法,在优化过程中可以自动清除噪声信息,只使用图像级别的标注信息就能达到良好的预测效果,从而避免了冗繁耗时的像素级别的人工标注过程。
为达上述及其它目的,本发明提出一种基于深度学习的弱监督显著性物体检测方法,包括如下步骤:
步骤S1,利用非监督的显著性检测方法通过多任务的全卷积神经网络产生所有训练图像的显著图Sanno
步骤S2,将所述显著图与对应的图像级别的类别标签同时作为初次迭代的有噪声的监督信息,以训练多任务的全卷积神经网络,于训练过程收敛后,生成新的类别激活图Scam和显著性物体预测图Spredict
步骤S3,利用条件随机场模型调整所述类别激活图和显著性物体预测图;
步骤S4,利用标签更新策略为下一次迭代更新显著性标注信息;
步骤S5,多次迭代式地进行步骤S2-S4的训练过程,直到符合停止的条件;
步骤S6,在含有未知类别图像的数据集上进行泛化式训练,得到最终模型。
优选地,于步骤S1中,选择含有图像类别信息的数据集训练数据,并选取一个非监督的显著性检测方法,通过所述多任务的全卷积神经网络为所有训练样本生成像素级别的显著图。
优选地,选取任一深度神经网络模型作为全卷积神经网络的预训练模型,将该深度神经网络模型最后的线性分类层替换为一个线性卷积层,去掉该网络中最后两个下采样层,并使用扩张卷积算法在最后两层的卷积层提高扩张率。
优选地,于所述多任务的全卷积神经网络中,将所述全卷积神经网络复制3次,每一个子网络对应一个尺度下的图像输入,3个网络共享权值,3个网络的输出用线性差值的方法缩放到图像的原始大小,进行像素层面的相加处理后输入softmax层产生最终的概率图。
优选地,步骤S2进一步包括:
以步骤S1产生的显著图和对应的人工标注的类别信息分别作为显著性图伪标签和类别标签,训练所述多任务的全卷积神经网络;
于训练过程收敛后,利用训练好的全卷积神经网络生成新的显著性物体预测图,并使用所述多任务的全卷积神经网络结合类别激活映射技术生成类别激活图。
优选地,将所述多任务的全卷积神经网络的3个尺度下的特征图连接起来后,经过一个全局平均池化层,得到进一步处理后的特征,再输入一个全连接层,从而获得类别分布输出。
优选地,于步骤S3中,利用条件随机场模型,处理步骤S1产生的显著图Sanno,以调整步骤S2产生的类别激活图Scam和显著图Spredict,生成更具有空间协同关系和更强保边性的预测图,记为Canno,Ccam,Cpredict
优选地,于步骤S4中,所述标签更新策略利用类别激活图进行指导和合适的阈值判定生成新的显著图伪标签。
优选地,所述标签更新策略具体如下:
如果MAE(Canno,Cpredict)≤α,则
Figure BDA0001548085600000041
否则如果MAE(Canno,Ccam)>β且MAE(Cpredict,Ccam)>β,则在下次迭代训练时去掉这个训练样本;
否则如果MAE(Canno,Ccam)≤MAE(Cpredict,Ccam),则
Figure BDA0001548085600000042
Figure BDA0001548085600000043
否则Supdate=Cpredict
其中MAE为平均错误率,CRF为条件随机场算法,α、β为预设阈值。
为达到上述目的,本发明还提供一种基于深度学习的弱监督显著性物体检测系统,其特征在于:
显著图产生单元,用于利用非监督的显著性检测方法通过多任务的全卷积神经网络产生所有训练图像的显著图Sanno
训练单元,用于将所述显著图与对应的图像级别的类别标签同时作为初次迭代的有噪声的监督信息,以训练多任务的全卷积神经网络,于训练过程收敛后,生成新的类别激活图Scam和显著性物体预测图Spredict
调整单元,用于利用条件随机场模型调整所述类别激活图和显著性物体预测图;
更新单元,用于利用标签更新策略为下一次迭代更新显著性标注信息;
迭代训练单元,用于多次迭代式地进行训练单元、调整单元以及更新单元的训练过程,直到符合停止的条件;
第二阶段训练单元,用于于第一阶段训练停止后,在含有未知类别图像的数据集上进行泛化式训练,得到最终模型。
与现有技术相比,本发明一种基于深度学习的弱监督的显著性物体检测方法及系统通过利用非监督的显著性检测方法产生所有训练图像的显著图,与对应的图像级别的类别标签同时作为初次迭代的有噪声的监督信息,用以训练多任务的全卷积神经网络,训练过程收敛后,通过多任务的神经网络生成新的类别激活图和显著性物体预测图,并使用条件随机场模型调整类别激活图和显著图,利用标签更新策略为下一次迭代更新标签信息,通过多次迭代进行上述训练过程,直到符合停止的条件,最后在含有未知类别图像的数据集上进行泛化式训练,得到最终模型,本发明提出的方法在缺乏像素级别标签的情况下,只利用图像级别标签的指导,有效地挖掘和纠正了传统非监督方法产生的显著性物体预测图的歧义,最终的效果超过了所有现有的显著性物体检测领域的非监督方法。
附图说明
图1为本发明一种基于深度学习的弱监督显著性物体检测的方法的步骤流程图;
图2为本发明具体实施例中多任务的全卷积神经网络的结构图;
图3为本发明具体实施例迭代式训练过程的示意图;
图4为本发明一种基于深度学习的弱监督显著性物体检测系统的系统架构图。
具体实施方式
以下通过特定的具体实例并结合附图说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
图1为本发明一种基于深度学习的弱监督显著性物体检测方法的步骤流程图。如图1所示,本发明一种基于深度学习的弱监督显著性物体检测方法,包括如下步骤:
步骤S1,利用非监督的显著性检测方法通过多任务的全卷积神经网络产生所有训练图像的显著图。具体地,于步骤S1中,选择含有图像类别信息的数据集作为第一阶段的训练数据,这种数据集通常用于图像检测,并选取一个非监督的显著性检测方法,通过多任务的全卷积神经网络为所有训练样本生成像素级别的显著图,记为Sanno
本发明可选取任一性能较好的深度神经网络模型,如ResNet(残差网络),GoogleNet等作为全卷积神经网络的预训练模型。图2为本发明具体实施例中多任务的全卷积神经网络的结构图。在本发明具体实施例中,采用了101层的ResNet(残差网络),并根据需要对网络结构进行修改,但不以此为限。具体地,
首先将该残差网络最后有1000路输出的线性分类层替换为一个线性卷积层,该层输出两个通道的特征图。另外,为了得到分辨率更高的特征图,参考L.-C.Chen,等人的研究工作“Semantic image segmentation with deep convolutional nets and fullyconnected crfs”(arXiv preprint arXiv:1412.7062,2014),去掉了网络中最后两个下采样层,并使用扩张卷积(dilation algorithm)算法在最后两层的卷积层提高扩张率(dilation rate)以增加感受野的范围,经过这样的处理,网络最终输出分辨率为原始分辨率的1/8的特征图。
由于显著性物体的尺度跨度较大,为了更精准检测出不同尺度下的物体,本发明将上述101层的残差网络复制了3次,每一个子网络对应一个尺度下的输入,3个网络共享权值,3个网络的输出用线性差值的方法缩放到图像的原始大小,进行像素层面的相加处理后输入softmax层产生最终的概率图,即训练图像的显著图。
步骤S2,将所述显著图与对应的图像级别的类别标签同时作为初次迭代的有噪声的监督信息,以训练多任务的全卷积神经网络,于训练过程收敛后,生成新的类别激活图和显著性物体预测图。
具体地,步骤S2进一步包括:
步骤S201,以步骤S1产生的显著图和对应的人工标注的类别信息分别作为显著性图伪标签和类别标签,训练多任务的全卷积神经网络;
步骤S202,于步骤S201的训练过程收敛后,利用该步骤训练好的全卷积神经网络生成新的显著性物体预测图,记为Spredict,并使用该神经网络结合类别激活映射技术生成类别激活图,记为Scam
如图2所示,对于图像的分类任务,参考B.Zhou等人的论文“Learning deepfeatures for discriminative localization”(In Proceedings of the IEEEConference on Computer Visionand Pattern Recognition,pages 2921–2929,2016),将3个尺度下的特征图连接起来后,经过一个全局平均池化层,得到进一步处理后的特征,再输入一个全连接层,从而获得类别分布输出。
用fk(x,y)代表连接后的特征在第k个通道的空间位置为(x,y)的激活值,用
Figure BDA0001548085600000073
表示单位k(经过全局池化操作,连接后的特征图的每个通道都变成一个单位的激活值)对应于类别c的权值。定义Mc为第c个类别的类别激活图,则它在每个位置的值由以下计算公式得到:
Figure BDA0001548085600000071
步骤S3,利用条件随机场模型调整该类别激活图和显著性物体预测图。具体地,于步骤S3中,利用条件随机场模型,处理步骤S1产生的显著图Sanno,以调整步骤S2产生的类别激活图Scam和显著图Spredict,生成更具有空间协同关系和更强保边性的预测图,对应地,记为Canno,Ccam,Cpredict
在本发明具体实施例中,本发明嵌入了一个图模型来对显著图进行微调,具体地,这个图模型基于条件随机场,可以提高预测图片的空间相关性和保边性。
特别地,本发明所提出的模型解决一个二值的像素级别的标注问题,采用了以下的能量公式:
Figure BDA0001548085600000072
其中L表示对所有像素标定的显著性标签,li=1表示第i个像素是显著的,而li=0表示第i个像素不是显著的。P(li)是像素xi对应标签li的概率,初始化时,设定P(1)=Si,P(0)=1-Si,S为需要处理的显著图,对应地,Si即为该处理的显著图在位置xi的显著性分数,θij(li,lj)是位置间成对的值,由以下公式计算得到:
Figure BDA0001548085600000081
其中,p为位置向量,I为颜色向量,w为线性组合的权重,σαβγ为控制近邻性和相似性的程度的超参数。
其中,当li≠lj时,μ(li,lj)=1,否则为0。θij由两个内核组成而成。第一个内核依赖于像素的位置和在该位置的颜色值,促使临近的具有相近颜色的像素得到相似的显著性分数。第二个内核依赖于像素间的关系,试着除去小型的孤立的区域。
整个图模型的输出是一个概率图,每个位置的值表示该位置的像素是显著像素的概率。优选地,可以通过一定阈值将该概率图转换为二值图,作为训练时的伪标签。
步骤S4,使用标签更新策略为下一次迭代更新显著性标注信息。具体地,使用标签更新策略根据以上步骤生成的Sanno,Scam,Spredict,Canno,Ccam,Cpredict生成下一次迭代的显著性标注信息,记为Supdate
在本发明具体实施例中,所述标签更新策略,用类别激活图进行指导和合适的阈值判定生成新的显著图伪标签,具体的标签更新策略如下:
如果MAE(Canno,Cpredict)≤α
那么
Figure BDA0001548085600000082
否则如果MAE(Canno,Ccam)>β且MAE(Cpredict,Ccam)>β
那么在下次迭代训练时去掉这个训练样本
否则如果MAE(Canno,Ccam)≤MAE(Cpredict,Ccam)
那么
Figure BDA0001548085600000083
否则
Supdate=Cpredict
其中MAE为平均错误率,CRF为条件随机场算法,α、β为预设阈值。
步骤S5,多次迭代式地进行步骤S2-S4的训练过程,直到符合停止的条件。具体地,交替进行步骤S2、S3、S4,直到满足设定的停止条件时停止第一阶段的训练。
优选地,于步骤S5之后,本发明之基于深度学习的弱监督的显著性物体检测方法还包括如下步骤:
步骤S6,在含有未知类别图像的数据集上进行泛化式训练,得到最终模型。具体地,选取一到两个显著性检测的数据集作为第二阶段的训练数据,与第一阶段不同的是,这一阶段的数据含有未知类别的物体,用这些数据对全卷积神经网络进行微调式的训练,当训练过程收敛后得到最终模型。
图3为本发明具体实施例迭代式训练过程的示意图。在本发明具体实施例中,对整个弱监督显著图的训练分为两个阶段,都基于一个迭代式的训练策略,每次迭代的过程如图3所示。
在第一个阶段,本发明选取了微软的COCO数据集进行训练,这是一个大型的广泛用于物体检测的数据集,该数据集中对于每张训练图像,都有一到多个类别标签。首先,选用一个效果良好的非监督显著性检测模型,为所有训练样本生成初始的显著图,作为第一次训练的显著图伪标签,然后将这些伪标签结合对应的图像级别的类别标签作为监督信息,训练多任务的全卷积神经网络,当训练过程收敛后,选取在验证集上表现最好的模型作为本次训练过程最终的模型,并用它为整个训练数据集生成新的显著图和类别激活图。在本发明具体实施例中,利用如下损失函数进行模型的优化:
(1)欧式距离损失函数:
Figure BDA0001548085600000101
其中,
Figure BDA0001548085600000102
表示第n个样本标签,yn表示第n个样本预测值
(2)sigmoid交叉熵损失函数
Figure BDA0001548085600000103
Figure BDA0001548085600000104
其中,N表示样本总数,pn表示第n个样本标签,
Figure BDA0001548085600000105
表示第n个样本预测值。
其次,利用显著性标签更新策略为下一次迭代生成新的训练元组(图像,显著图伪标签,图像类别标签)。迭代式地重复以上训练过程直到满足停止的条件。在每次训练过程后,计算验证集上,该过程的伪标签和全卷积神经网络生成的新的显著图之间的MAE(平均错误率),当该平均错误率低于一定阈值(可预设)时表示模型达到了想要的拟合效果,可以结束训练。
第二个训练阶段,为了提高模型的泛化能力,以使得模型对含有未知图像标签的图片也能通用地进行显著性检测,需要在显著性检测的数据集(MSRA-B,HKU-IS)上进一步微调,在此阶段,将响应值最高的5张类别激活图的平均值作为指导图。
图4为本发明一种基于深度学习的弱监督显著性物体检测系统的系统架构图。如图4所示,本发明一种基于深度学习的弱监督显著性物体检测系统,包括:
显著图产生单元401,用于利用非监督的显著性检测方法通过多任务的全卷积神经网络产生所有训练图像的显著图。具体地,显著图产生单元401选择含有图像类别信息的数据集作为第一阶段的训练数据,这种数据集通常用于图像检测,并选取一个非监督的显著性检测方法,利用多任务的全卷积神经网络为所有训练样本生成像素级别的显著图,记为Sanno
本发明可选取任一深度神经网络模型,如ResNet(残差网络),GoogleNet等,作为全卷积神经网络的预训练模型。在本发明具体实施例中,如图2所示,选取101层的残差网络作为全卷积神经网络的预训练模型,并根据需要对网络结构进行修改,具体地,
首先将该残差网络最后有1000路输出的线性分类层替换为一个线性卷积层,该层输出两个通道的特征图。另外,为了得到分辨率更高的特征图,参考L.-C.Chen,等人的研究工作“Semantic image segmentation with deep convolutional nets and fullyconnected crfs”(arXiv preprint arXiv:1412.7062,2014),去掉了网络中最后两个下采样层,并使用扩张卷积(dilation algorithm)算法在最后两层的卷积层提高扩张率(dilation rate)以增加感受野的范围,经过这样的处理,网络最终输出分辨率为原始分辨率的1/8的特征图。
由于显著性物体的尺度跨度较大,为了更精准检测出不同尺度下的物体,本发明将上述101层的残差网络复制了3次,每一个子网络对应一个尺度下的输入,3个网络共享权值,3个网络的输出用线性差值的方法缩放到图像的原始大小,进行像素层面的相加处理后输入softmax层产生最终的概率图。
训练单元402,用于将所述显著图与对应的图像级别的类别标签同时作为初次迭代的有噪声的监督信息,以训练多任务的全卷积神经网络,于训练过程收敛后,生成新的类别激活图和显著性物体预测图。
具体地,训练单元402具体用于:
以显著图产生单元401产生的显著图和对应的人工标注的类别信息分别作为显著性图伪标签和类别标签,训练多任务的全卷积神经网络;
于训练过程收敛后,利用训练好的全卷积神经网络生成新的显著性物体预测图,记为Spredict,同时使用该网络结合类别激活映射技术生成类别激活图,记为Scam
如图2所示,对于图像的分类任务,参考B.Zhou等人的论文“Learning deepfeatures for discriminative localization”(In Proceedings of the IEEEConference on Computer Visionand Pattern Recognition,pages 2921–2929,2016),将3个尺度下的特征图连接起来后,经过一个全局平均池化层,得到进一步处理后的特征,再输入一个全连接层,从而获得类别分布输出。
用fk(x,y)代表连接后的特征在第k个通道的空间位置为(x,y)的激活值,用
Figure BDA0001548085600000122
表示单位k(经过全局池化操作,连接后的特征图的每个通道都变成一个单位的激活值)对应于类别c的权值。定义Mc为第c个类别的类别激活图,则它在每个位置的值由以下计算公式得到:
Figure BDA0001548085600000121
调整单元403,用于利用条件随机场模型调整该类别激活图和显著性物体预测图。具体地,调整单元403利用条件随机场模型,处理显著图产生单元401产生的显著图Sanno,以调整训练单元402产生的类别激活图Scam和显著图Spredict,生成更具有空间协同关系和更强保边性的预测图,对应地,记为Canno,Ccam,Cpredict
更新单元404,用于使用标签更新策略为下一次迭代更新标签信息,具体地,更新单元404使用标签更新策略根据以上步骤生成的Sanno,Scam,Spredict,Canno,Ccam,Cpredict生成下一次迭代的显著图标签,记为Supdate
迭代训练单元405,用于多次迭代式地进行训练单元402、调整单元403以及更新单元404的训练过程,直到符合停止的条件。具体地,交替进行训练单元402、调整单元403以及更新单元404,直到满足设定的停止条件时停止第一阶段的训练。
第二阶段训练单元406,用于于第一阶段训练停止后,在含有未知类别图像的数据集上进行泛化式训练,得到最终模型。具体地,第二阶段训练单元406选取一到两个显著性检测的数据集作为第二阶段的训练数据,与第一阶段不同的是,这一阶段的数据含有未知类别的物体,用这些数据对全卷积神经网络进行微调式的训练,当训练过程收敛后得到最终模型。
综上所述,本发明一种基于深度学习的弱监督的显著性物体检测方法及系统通过利用非监督的显著性检测方法产生所有训练图像的显著图,与对应的图像级别的类别标签同时作为初次迭代的有噪声的监督信息,用以训练多任务的全卷积神经网络,训练过程收敛后,通过多任务的神经网络生成新的类别激活图和显著性物体预测图,并使用条件随机场模型调整类别激活图和显著图,利用标签更新策略为下一次迭代更新标签信息,通过多次迭代进行上述训练过程,直到符合停止的条件,最后在含有未知类别图像的数据集上进行泛化式训练,得到最终模型,本发明提出的方法在缺乏像素级别标签的情况下,只利用图像级别标签的指导,有效地挖掘和纠正了传统非监督方法产生的显著性物体预测图的歧义,最终的效果超过了所有现有的显著性物体检测领域的非监督方法。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何本领域技术人员均可在不违背本发明的精神及范畴下,对上述实施例进行修饰与改变。因此,本发明的权利保护范围,应如权利要求书所列。

Claims (6)

1.一种基于深度学习的弱监督显著性物体检测方法,包括如下步骤:
步骤S1,利用非监督的显著性检测方法通过多任务的全卷积神经网络产生所有训练图像的显著图Sanno
步骤S2,将所述显著图与对应的图像级别的类别标签同时作为初次迭代的有噪声的监督信息,以训练多任务的全卷积神经网络,于训练过程收敛后,生成新的类别激活图Scam和显著性物体预测图Spredict
步骤S3,利用条件随机场模型调整所述类别激活图和显著性物体预测图;
步骤S4,利用标签更新策略为下一次迭代更新显著性标注信息;
步骤S5,多次迭代式地进行步骤S2-S4的训练过程,直到符合停止的条件;
步骤S6,在含有未知类别图像的数据集上进行泛化式训练,得到最终模型;
于步骤S1中,选择含有图像类别信息的数据集训练数据,并选取一个非监督的显著性检测方法,通过所述多任务的全卷积神经网络为所有训练样本生成像素级别的显著图;
选取任一深度神经网络模型作为全卷积神经网络的预训练模型,将该深度神经网络模型最后的线性分类层替换为一个线性卷积层,去掉该网络中最后两个下采样层,并使用扩张卷积算法在最后两层的卷积层提高扩张率;
步骤S2进一步包括:
以步骤S1产生的显著图和对应的人工标注的类别信息分别作为显著性图伪标签和类别标签,训练所述多任务的全卷积神经网络;
于训练过程收敛后,利用训练好的全卷积神经网络生成新的显著性物体预测图,并使用所述多任务的全卷积神经网络结合类别激活映射技术生成类别激活图。
2.如权利要求1所述的一种基于深度学习的弱监督显著性物体检测方法,其特征在于:于所述多任务的全卷积神经网络中,将所述全卷积神经网络复制3次,每一个子网络对应一个尺度下的图像输入,3个网络共享权值,3个网络的输出用线性差值的方法缩放到图像的原始大小,进行像素层面的相加处理后输入softmax层产生最终的概率图。
3.如权利要求1所述的一种基于深度学习的弱监督显著性物体检测方法,其特征在于:将所述多任务的全卷积神经网络的3个尺度下的特征图连接起来后,经过一个全局平均池化层,得到进一步处理后的特征,再输入一个全连接层,从而获得类别分布输出。
4.如权利要求1所述的一种基于深度学习的弱监督显著性物体检测方法,其特征在于:于步骤S3中,利用条件随机场模型,处理步骤S1产生的显著图Sanno,以调整步骤S2产生的类别激活图Scam和显著图Spredict,生成更具有空间协同关系和更强保边性的预测图,记为Canno,Ccam,Cpredict
5.如权利要求4所述的一种基于深度学习的弱监督显著性物体检测方法,其特征在于:于步骤S4中,所述标签更新策略利用类别激活图进行指导和合适的阈值判定生成新的显著图伪标签。
6.如权利要求5所述的一种基于深度学习的弱监督显著性物体检测方法,其特征在于,所述标签更新策略具体如下:
如果MAE(Canno,Cpredict)≤α,则
Figure FDA0003367142980000021
否则如果MAE(Canno,Ccam)>β且MAE(Cpredict,Ccam)>β,则在下次迭代训练时去掉这个训练样本;
否则如果MAE(Canno,Ccam)≤MAE(Cpredict,Ccam),则
Figure FDA0003367142980000022
Figure FDA0003367142980000023
否则Supdate=Cpredict
其中MAE为平均错误率,CRF为条件随机场算法,α、β为预设阈值。
CN201810036348.4A 2018-01-15 2018-01-15 基于深度学习的弱监督显著性物体检测的方法及系统 Active CN108399406B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810036348.4A CN108399406B (zh) 2018-01-15 2018-01-15 基于深度学习的弱监督显著性物体检测的方法及系统
PCT/CN2018/095057 WO2019136946A1 (zh) 2018-01-15 2018-07-10 基于深度学习的弱监督显著性物体检测的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810036348.4A CN108399406B (zh) 2018-01-15 2018-01-15 基于深度学习的弱监督显著性物体检测的方法及系统

Publications (2)

Publication Number Publication Date
CN108399406A CN108399406A (zh) 2018-08-14
CN108399406B true CN108399406B (zh) 2022-02-01

Family

ID=63094831

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810036348.4A Active CN108399406B (zh) 2018-01-15 2018-01-15 基于深度学习的弱监督显著性物体检测的方法及系统

Country Status (2)

Country Link
CN (1) CN108399406B (zh)
WO (1) WO2019136946A1 (zh)

Families Citing this family (142)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165692B (zh) * 2018-09-06 2021-06-01 中国矿业大学 一种基于弱监督学习的用户性格预测装置及方法
CN111144574B (zh) * 2018-11-06 2023-03-24 北京嘀嘀无限科技发展有限公司 使用指导者模型训练学习者模型的人工智能系统和方法
CN109597906B (zh) * 2018-12-06 2020-11-13 苏州飞搜科技有限公司 图像检索方法及装置
CN109784203B (zh) * 2018-12-24 2020-05-15 中国科学院大学 基于分层传播和激活的弱监督x光图像违禁品检查方法
CN109948642B (zh) * 2019-01-18 2023-03-28 中山大学 基于图像输入的多智能体跨模态深度确定性策略梯度训练方法
CN111507981B (zh) * 2019-01-31 2021-07-13 数坤(北京)网络科技股份有限公司 图像处理方法和装置、电子设备、计算机可读存储介质
US10997475B2 (en) * 2019-02-14 2021-05-04 Siemens Healthcare Gmbh COPD classification with machine-trained abnormality detection
CN109961095B (zh) * 2019-03-15 2023-04-28 深圳大学 基于非监督深度学习的图像标注系统及标注方法
CN110083719A (zh) * 2019-03-29 2019-08-02 杭州电子科技大学 一种基于深度学习的工业制品病疵检测方法
CN110060247B (zh) * 2019-04-18 2022-11-25 深圳市深视创新科技有限公司 应对样本标注错误的鲁棒深度神经网络学习方法
CN110084804A (zh) * 2019-04-30 2019-08-02 河海大学常州校区 一种基于弱监督深度学习的水下构筑物缺陷检测方法
CN110070072A (zh) * 2019-05-05 2019-07-30 厦门美图之家科技有限公司 一种生成物体检测模型的方法
CN110222704B (zh) * 2019-06-12 2022-04-01 北京邮电大学 一种弱监督目标检测方法及装置
CN110322509B (zh) * 2019-06-26 2021-11-12 重庆邮电大学 基于层级类激活图的目标定位方法、系统及计算机设备
CN110363201B (zh) * 2019-07-10 2021-06-01 上海交通大学 基于协同学习的弱监督语义分割方法及系统
CN110516536B (zh) * 2019-07-12 2022-03-18 杭州电子科技大学 一种基于时序类别激活图互补的弱监督视频行为检测方法
CN110674807A (zh) * 2019-08-06 2020-01-10 中国科学院信息工程研究所 一种基于半监督与弱监督学习的曲形场景文字检测方法
CN110516718B (zh) * 2019-08-12 2023-03-24 西北工业大学 基于深度嵌入空间的零样本学习方法
CN110533086B (zh) * 2019-08-13 2021-01-26 天津大学 图像数据半自动标注方法
CN110472609A (zh) * 2019-08-21 2019-11-19 广东工业大学 一种鸟类图像识别方法、装置、设备和存储介质
CN110516596B (zh) * 2019-08-27 2023-03-24 西安电子科技大学 基于Octave卷积的空谱注意力高光谱图像分类方法
CN110569901B (zh) * 2019-09-05 2022-11-29 北京工业大学 一种基于通道选择的对抗消除弱监督目标检测方法
CN112529024A (zh) * 2019-09-17 2021-03-19 株式会社理光 一种样本数据的生成方法、装置及计算机可读存储介质
CN110648334A (zh) * 2019-09-18 2020-01-03 中国人民解放军火箭军工程大学 一种基于注意力机制的多特征循环卷积显著性目标检测方法
CN110765882B (zh) * 2019-09-25 2023-04-07 腾讯科技(深圳)有限公司 一种视频标签确定方法、装置、服务器及存储介质
CN110660480B (zh) * 2019-09-25 2023-05-26 上海交通大学 脊骨脱位辅助诊断方法及系统
CN110827238B (zh) * 2019-09-29 2023-07-21 哈尔滨工程大学 一种改进的全卷积神经网络的侧扫声纳图像特征提取方法
CN110689081B (zh) * 2019-09-30 2020-08-21 中国科学院大学 一种基于分歧学习的弱监督目标分类和定位方法
CN110852295B (zh) * 2019-10-15 2023-08-25 深圳龙岗智能视听研究院 一种基于多任务监督学习的视频行为识别方法
CN110796183A (zh) * 2019-10-17 2020-02-14 大连理工大学 基于相关性引导的判别学习的弱监督细粒度图像分类算法
CN110705516B (zh) * 2019-10-18 2022-10-25 大连海事大学 一种基于协同网络结构的鞋底花纹图像聚类方法
CN110827318A (zh) * 2019-10-18 2020-02-21 天津大学 一种基于多层语义特征与多响应图融合的目标跟踪方法
CN111008644B (zh) * 2019-10-30 2023-04-21 西安电子科技大学 基于局部动态能量函数fcn-crf模型的生态变化监测方法
CN111161848B (zh) * 2019-10-31 2023-08-29 杭州深睿博联科技有限公司 Ct图像的病灶标注方法及装置、存储介质
CN110827312B (zh) * 2019-11-12 2023-04-28 北京深境智能科技有限公司 一种基于协同视觉注意力神经网络的学习方法
CN111127336B (zh) * 2019-11-18 2023-05-02 复旦大学 一种基于自适应选择模块的图像信号处理方法
CN110956185B (zh) * 2019-11-21 2023-04-18 大连理工大学人工智能大连研究院 一种图像显著目标的检测方法
CN110991502B (zh) * 2019-11-21 2020-10-13 北京航空航天大学 一种基于类别激活映射技术的空域安全态势评估方法
CN110992334B (zh) * 2019-11-29 2023-04-07 四川虹微技术有限公司 用于dcgan网络生成图像的质量评估方法
CN111047571B (zh) * 2019-12-10 2023-04-25 安徽大学 一种具有自适应选择训练过程的图像显著目标检测方法
CN111026898A (zh) * 2019-12-10 2020-04-17 云南大学 一种基于交叉空间池化策略的弱监督图像情感分类与定位方法
CN111027634B (zh) * 2019-12-16 2023-04-18 中山大学 一种基于类激活映射图引导的正则化方法及系统
CN111178503A (zh) * 2019-12-16 2020-05-19 北京邮电大学 面向移动终端的去中心化目标检测模型训练方法及系统
CN111091011B (zh) * 2019-12-20 2023-07-28 科大讯飞股份有限公司 领域预测方法、领域预测装置及电子设备
CN111260594B (zh) * 2019-12-22 2023-10-31 天津大学 一种无监督的多模态图像融合方法
CN111179175B (zh) * 2019-12-27 2023-04-07 深圳力维智联技术有限公司 基于卷积神经网络的图像处理方法、装置及存储介质
CN111209919B (zh) * 2020-01-06 2023-06-09 上海海事大学 一种海上船舶显著性检测方法及系统
CN111259736B (zh) * 2020-01-08 2023-04-07 上海海事大学 一种基于深度学习的复杂环境下行人实时检测方法
CN111242839B (zh) * 2020-01-13 2023-04-21 华南理工大学 一种基于尺度等级的图像缩放裁剪方法
CN113139553A (zh) * 2020-01-16 2021-07-20 中国科学院国家空间科学中心 一种基于U-net的紫外极光图像极光卵形态提取方法及系统
CN111291651B (zh) * 2020-01-21 2023-05-05 中国科学院西安光学精密机械研究所 用于遥感场景分类的多任务神经网络框架及分类方法
CN111461974B (zh) * 2020-02-17 2023-04-25 天津大学 基于由粗到细的lstm模型的图像扫描路径控制方法
CN111340771B (zh) * 2020-02-23 2024-04-09 北京工业大学 一种融合视觉信息丰富度和宽深度联合学习的细颗粒物实时监测方法
CN111368702B (zh) * 2020-02-28 2023-03-14 西安工程大学 基于YOLOv3网络的复合绝缘子憎水性等级识别方法
CN111368895B (zh) * 2020-02-28 2023-04-07 上海海事大学 一种湿垃圾中垃圾袋目标检测方法及检测系统
CN111523390B (zh) * 2020-03-25 2023-11-03 杭州易现先进科技有限公司 一种图像识别的方法及增强现实ar图标识别的系统
CN111428655A (zh) * 2020-03-27 2020-07-17 厦门大学 一种基于深度学习的头皮检测方法
CN111553462A (zh) * 2020-04-08 2020-08-18 哈尔滨工程大学 一种类激活映射方法
CN111487679B (zh) * 2020-04-22 2023-04-07 中国石油天然气集团有限公司 横波速度预测方法、装置和设备
CN111563886B (zh) * 2020-04-29 2023-04-07 安徽国钜工程机械科技有限公司 基于非监督特征学习的隧道钢轨表面病害检测方法及装置
CN111513702A (zh) * 2020-04-30 2020-08-11 何中煜 心电数据的检测方法及存储介质
CN111523610B (zh) * 2020-05-06 2023-04-21 青岛联合创智科技有限公司 一种样本高效标注的物品识别方法
CN111680702B (zh) * 2020-05-28 2022-04-01 杭州电子科技大学 一种使用检测框实现弱监督图像显著性检测的方法
CN111860106B (zh) * 2020-05-28 2023-12-08 江苏东印智慧工程技术研究院有限公司 一种无监督的桥梁裂缝识别方法
CN111915618B (zh) * 2020-06-02 2024-05-14 华南理工大学 基于峰值响应增强的实例分割算法、计算设备
CN111753885B (zh) * 2020-06-09 2023-09-01 华侨大学 一种基于深度学习的隐私增强数据处理方法和系统
CN111860596B (zh) * 2020-06-17 2023-11-07 长安大学 基于深度学习的无监督路面裂缝分类方法及模型建立方法
CN111832436B (zh) * 2020-06-24 2023-06-16 五邑大学 基于多任务与弱监督的美丽预测方法、装置及存储介质
CN111768380A (zh) * 2020-06-29 2020-10-13 上海仪电(集团)有限公司中央研究院 一种工业零配件表面缺陷检测方法
CN111899203B (zh) * 2020-07-10 2023-06-20 贵州大学 基于标注图在无监督训练下的真实图像生成方法及存储介质
CN111814895A (zh) * 2020-07-17 2020-10-23 大连理工大学人工智能大连研究院 基于绝对和相对深度诱导网络的显著性目标检测方法
CN111882546B (zh) * 2020-07-30 2023-08-01 中原工学院 基于弱监督学习的三分支卷积网络织物疵点检测方法
CN111899251A (zh) * 2020-08-06 2020-11-06 中国科学院深圳先进技术研究院 一种区分伪造来源和目标区域的copy-move型伪造图像检测方法
CN113762455A (zh) * 2020-08-07 2021-12-07 北京沃东天骏信息技术有限公司 检测模型训练方法、单字检测方法、装置、设备及介质
CN111914778B (zh) * 2020-08-07 2023-12-26 重庆大学 一种基于弱监督学习的视频行为定位方法
CN111965183B (zh) * 2020-08-17 2023-04-18 沈阳飞机工业(集团)有限公司 基于深度学习的钛合金显微组织检测方法
CN114109456A (zh) * 2020-08-28 2022-03-01 神华神东煤炭集团有限责任公司 用于煤矿地下水库煤柱坝体结构的监测预警方法与系统
CN111951292B (zh) * 2020-09-01 2022-11-08 吉林大学 物体表面反射属性提取方法、装置、设备及存储介质
CN112115995B (zh) * 2020-09-11 2023-04-07 北京邮电大学 一种基于半监督学习的图像多标签分类方法
CN112183248A (zh) * 2020-09-14 2021-01-05 北京大学深圳研究生院 一种基于逐通道时空表征学习的视频显著性物体检测方法
CN114266716B (zh) * 2020-09-15 2024-04-02 复旦大学 基于深度学习的盾构隧道墙面渗漏水风险检测的方法
CN112132810B (zh) * 2020-09-24 2023-09-12 西安电子科技大学 基于感知逻辑和特征对比的图像显著性检测方法
CN112153461B (zh) * 2020-09-25 2022-11-18 北京百度网讯科技有限公司 用于定位发声物的方法、装置、电子设备及可读存储介质
CN112560571A (zh) * 2020-10-09 2021-03-26 天津大学 基于卷积神经网络的智能自主视觉导航方法
CN112329588B (zh) * 2020-10-30 2024-01-05 中海石油(中国)有限公司 一种基于Faster R-CNN的管道故障检测方法
CN112364980B (zh) * 2020-11-09 2024-04-30 北京计算机技术及应用研究所 一种弱监督场景下基于强化学习的深度神经网络训练方法
CN112184602B (zh) * 2020-11-09 2024-04-16 上海市精神卫生中心(上海市心理咨询培训中心) 一种基于弱监督和辅助任务的图像归一化方法
CN112329659B (zh) * 2020-11-10 2023-08-29 平安科技(深圳)有限公司 基于车辆图像的弱监督语义分割方法及其相关设备
CN112395997B (zh) * 2020-11-19 2023-11-24 中山大学 一种基于可微图学习的行人重识别模型的弱监督训练方法
CN112749621B (zh) * 2020-11-25 2023-06-13 厦门理工学院 一种基于深度卷积神经网络的遥感图像云层检测方法
CN112533137B (zh) * 2020-11-26 2023-10-17 北京爱笔科技有限公司 设备的定位方法、装置、电子设备及计算机存储介质
CN112529878B (zh) * 2020-12-15 2024-04-02 西安交通大学 一种基于多视图半监督的淋巴结的分类方法、系统及设备
CN112541904B (zh) * 2020-12-16 2023-03-24 西安电子科技大学 一种无监督遥感图像变化检测方法、存储介质及计算设备
CN112598043B (zh) * 2020-12-17 2023-08-18 杭州电子科技大学 一种基于弱监督学习的协同显著性检测方法
CN112668579A (zh) * 2020-12-24 2021-04-16 西安电子科技大学 基于自适应亲和力和类别分配的弱监督语义分割方法
CN112686256B (zh) * 2021-01-05 2023-10-20 中山大学 一种无需训练且无监督的目标协同定位方法、系统及装置
CN112733742B (zh) * 2021-01-14 2022-02-01 哈尔滨市科佳通用机电股份有限公司 一种基于深度学习的铁路货车下拉杆圆销故障检测方法
CN112733744B (zh) * 2021-01-14 2022-05-24 北京航空航天大学 一种基于边缘协同监督与多级约束的伪装物体检测模型
CN112766285B (zh) * 2021-01-26 2024-03-19 北京有竹居网络技术有限公司 图像样本生成方法、装置和电子设备
CN112784924B (zh) * 2021-02-08 2023-05-23 宁波大学 基于分组聚合深度学习模型的肋骨骨折ct图像分类方法
CN112560999B (zh) * 2021-02-18 2021-06-04 成都睿沿科技有限公司 一种目标检测模型训练方法、装置、电子设备及存储介质
CN113158760B (zh) * 2021-02-20 2023-08-15 温州大学 一种基于多层次标签的弱监督特定行为识别系统
CN112861880B (zh) * 2021-03-05 2021-12-07 江苏实达迪美数据处理有限公司 基于图像分类的弱监督rgbd图像显著性检测方法及系统
CN113034388B (zh) * 2021-03-12 2024-04-05 西北大学 一种古代绘画虚拟修复方法及修复模型的构建方法
CN112966684B (zh) * 2021-03-15 2022-11-04 北湾科技(武汉)有限公司 一种注意力机制下的协同学习文字识别方法
CN113221633B (zh) * 2021-03-24 2023-09-19 西安电子科技大学 一种基于层次类别模型的弱监督时序行为定位方法
CN112950631B (zh) * 2021-04-13 2023-06-30 西安交通大学口腔医院 基于显著图约束和x光头颅定位侧位图像的年龄估计方法
CN113077451B (zh) * 2021-04-13 2023-04-18 中山大学 基于无监督学习的单张图片本征图像分解方法、系统及介质
CN113222898B (zh) * 2021-04-14 2024-02-09 西安电子科技大学 基于多元统计量和深度学习的双航过sar图像痕迹检测方法
CN113139597B (zh) * 2021-04-19 2022-11-04 中国人民解放军91054部队 一种基于统计思想的图像分布外检测方法
CN113343772B (zh) * 2021-05-12 2022-06-14 武汉大学 一种基于隐式引导与显式教导策略的视频显著性目标检测方法
CN113221826B (zh) * 2021-05-31 2023-05-02 浙江工商大学 一种基于自监督学习显著性估计像素嵌入的道路检测方法
CN113435607B (zh) * 2021-06-09 2023-08-29 内蒙古大学 一种基于联邦学习的疾病筛查方法
CN113378937B (zh) * 2021-06-11 2023-08-11 西安电子科技大学 一种基于自监督增强的小样本图像分类方法及系统
CN113326886B (zh) * 2021-06-16 2023-09-15 中山大学 基于无监督学习的显著性物体检测方法及系统
CN113255581B (zh) * 2021-06-21 2021-09-28 湖南大学 弱监督深度学习水体提取方法、装置、计算机设备和介质
CN113327666B (zh) * 2021-06-21 2022-08-12 青岛科技大学 一种胸片疾病多分类网络的多标签局部至全局学习方法
CN113505670B (zh) * 2021-06-29 2023-06-23 西南交通大学 基于多尺度cam和超像素的遥感图像弱监督建筑提取方法
CN113420707B (zh) * 2021-07-05 2022-07-15 神思电子技术股份有限公司 一种基于弱监督学习的视频目标检测方法
CN113610120B (zh) * 2021-07-21 2023-09-29 燕山大学 基于弱监督学习的App图像内容安全检测方法
CN113723492B (zh) * 2021-08-25 2024-05-24 哈尔滨理工大学 一种改进主动深度学习的高光谱图像半监督分类方法及装置
CN113435431B (zh) * 2021-08-27 2021-12-07 北京市商汤科技开发有限公司 姿态检测方法、神经网络模型的训练方法、装置及设备
CN113807206B (zh) * 2021-08-30 2023-04-07 电子科技大学 一种基于去噪任务辅助的sar图像目标识别方法
CN113838130B (zh) * 2021-08-30 2023-07-18 厦门大学 一种基于特征扩展性学习的弱监督目标定位方法
CN113869512B (zh) * 2021-10-09 2024-05-21 北京中科智眼科技有限公司 基于自监督与自蒸馏的补充标签学习方法
CN114049662B (zh) * 2021-10-18 2024-05-28 天津大学 一种基于面部特征迁移学习的表情识别网络装置及方法
CN113989558B (zh) * 2021-10-28 2024-04-30 哈尔滨工业大学 基于迁移学习与边界框调节的弱监督目标检测方法
CN114332490A (zh) * 2021-11-25 2022-04-12 河南大学 一种基于涂鸦监督的高分辨显著性目标检测方法
CN114187446A (zh) * 2021-12-09 2022-03-15 厦门大学 一种跨场景对比学习的弱监督点云语义分割方法
CN114358144B (zh) * 2021-12-16 2023-09-26 西南交通大学 一种图像分割质量评估方法
CN114302157B (zh) * 2021-12-23 2023-11-17 广州津虹网络传媒有限公司 属性标签识别、代播事件检测方法及其装置、设备、介质
CN114359603B (zh) * 2022-02-18 2024-03-15 西北工业大学 一种多模态遥感图像领域自适应无监督匹配方法
CN114627348B (zh) * 2022-03-22 2024-05-31 厦门大学 多主体任务中基于意图的图片识别方法
CN114841312B (zh) * 2022-03-30 2024-02-27 西北工业大学 一种基于自适应图卷积网络的弱监督视频异常检测方法
CN114549863B (zh) * 2022-04-27 2022-07-22 西安电子科技大学 一种基于像素级噪声标签监督的光场显著性目标检测方法
CN115439688B (zh) * 2022-09-01 2023-06-16 哈尔滨工业大学 一种基于周围区域感知与关联的弱监督物体检测方法
CN115187783B (zh) * 2022-09-09 2022-12-27 之江实验室 基于联邦学习的多任务混合监督医疗图像分割方法及系统
CN115512169B (zh) * 2022-11-09 2023-07-25 之江实验室 基于梯度和区域亲和力优化的弱监督语义分割方法及装置
CN116343050B (zh) * 2023-05-26 2023-08-01 成都理工大学 基于自适应权重的遥感图像噪声标注的目标检测方法
CN116612537B (zh) * 2023-07-21 2023-10-03 武汉理工大学 一种基于背景弱化及一致性计算的半监督动作检测方法
CN117079103B (zh) * 2023-10-16 2024-01-02 暨南大学 一种用于神经网络训练的伪标签生成方法及系统
CN117811846B (zh) * 2024-02-29 2024-05-28 浪潮电子信息产业股份有限公司 基于分布式系统的网络安全检测方法、系统、设备及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341505A (zh) * 2017-06-07 2017-11-10 同济大学 一种基于图像显著性与Object Bank的场景分类方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103310195B (zh) * 2013-06-09 2016-12-28 西北工业大学 车辆高分遥感图像的基于llc特征的弱监督识别方法
KR102094507B1 (ko) * 2013-11-01 2020-03-27 삼성전자주식회사 선택적 정제를 이용한 계층적 중요점 영상 생성 방법, 상기 방법을 기록한 컴퓨터 판독 가능 저장매체 및 중요점 영상 생성 장치.
CN105825502B (zh) * 2016-03-12 2018-06-15 浙江大学 一种基于显著性指导的词典学习的弱监督图像解析方法
CN107203781B (zh) * 2017-05-22 2020-07-28 浙江大学 一种基于显著性指导的端到端的弱监督目标检测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341505A (zh) * 2017-06-07 2017-11-10 同济大学 一种基于图像显著性与Object Bank的场景分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Salient Object Detection via Bootstrap Learning;Na Tong et al;《2015 IEEE Conference on Computer Vision and Pattern Recognition》;20151015;第1884-1892页 *
SEMANTIC IMAGE SEGMENTATION WITH DEEP CONVOLUTIONAL NETS AND FULLY CONNECTED CRFS;Liang-Chieh Chen et al;《arXiv:1412.7062v4》;20160607;第1-14页 *

Also Published As

Publication number Publication date
WO2019136946A1 (zh) 2019-07-18
CN108399406A (zh) 2018-08-14

Similar Documents

Publication Publication Date Title
CN108399406B (zh) 基于深度学习的弱监督显著性物体检测的方法及系统
Li et al. A deep learning method for change detection in synthetic aperture radar images
CN109977918B (zh) 一种基于无监督域适应的目标检测定位优化方法
CN109886121B (zh) 一种遮挡鲁棒的人脸关键点定位方法
CN108171209B (zh) 一种基于卷积神经网络进行度量学习的人脸年龄估计方法
CN111583263B (zh) 一种基于联合动态图卷积的点云分割方法
CN106547880B (zh) 一种融合地理区域知识的多维度地理场景识别方法
CN109359608B (zh) 一种基于深度学习模型的人脸识别方法
CN111369572A (zh) 一种基于图像修复技术的弱监督语义分割方法和装置
Chen et al. Learning linear regression via single-convolutional layer for visual object tracking
CN112036447B (zh) 零样本目标检测系统及可学习语义和固定语义融合方法
CN110969086B (zh) 一种基于多尺度cnn特征及量子菌群优化kelm的手写图像识别方法
CN110889865B (zh) 一种基于局部加权稀疏特征选择的视频目标跟踪方法
CN110188827B (zh) 一种基于卷积神经网络和递归自动编码器模型的场景识别方法
CN111079847A (zh) 一种基于深度学习的遥感影像自动标注方法
CN113920170B (zh) 结合场景上下文和行人社会关系的行人轨迹预测方法、系统及存储介质
CN112232395B (zh) 一种基于联合训练生成对抗网络的半监督图像分类方法
Xu et al. Task-aware meta-learning paradigm for universal structural damage segmentation using limited images
CN115410059B (zh) 基于对比损失的遥感图像部分监督变化检测方法及设备
CN112488128A (zh) 一种基于贝塞尔曲线的任意畸变图像线段检测方法
CN109657693B (zh) 一种基于相关熵和迁移学习的分类方法
CN111259938B (zh) 基于流形学习和梯度提升模型的图片偏多标签分类方法
Kelenyi et al. SAM-Net: self-attention based feature matching with spatial transformers and knowledge distillation
CN111144469B (zh) 基于多维关联时序分类神经网络的端到端多序列文本识别方法
CN112927266A (zh) 基于不确定性引导训练的弱监督时域动作定位方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant