CN112115995A - 一种基于半监督学习的图像多标签分类方法 - Google Patents
一种基于半监督学习的图像多标签分类方法 Download PDFInfo
- Publication number
- CN112115995A CN112115995A CN202010954339.0A CN202010954339A CN112115995A CN 112115995 A CN112115995 A CN 112115995A CN 202010954339 A CN202010954339 A CN 202010954339A CN 112115995 A CN112115995 A CN 112115995A
- Authority
- CN
- China
- Prior art keywords
- label
- training
- data set
- pictures
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000012549 training Methods 0.000 claims abstract description 151
- 239000013598 vector Substances 0.000 claims abstract description 55
- 238000002372 labelling Methods 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 125000004432 carbon atom Chemical group C* 0.000 claims description 2
- 239000012855 volatile organic compound Substances 0.000 claims description 2
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000013145 classification model Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2155—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
一种基于半监督学习的图像多标签分类方法,包括:从训练数据集中分别提取有标签数据和无标签数据的训练图片,并构成有标签数据集、无标签数据集,然后为每张训练图片标注标签向量;构建图像多标签分类网络,将有标签数据集和无标签数据集中的所有训练图片作为训练样本输入进行半监督训练,其输入是有标签数据集和无标签数据集的训练图片及标签向量,输出是训练图片对应各标签的预测概率;为待分类图片标注标签向量,然后将待分类图片及标签向量输入图像多标签分类网络,并根据输出确定待分类图片的多个标签。本发明属于信息技术领域,能基于无标签和有标签数据组成的混合数据集实现图像多标签分类,充分利用标签有效信息,有效提高网络分类性能。
Description
技术领域
本发明涉及一种基于半监督学习的图像多标签分类方法,属于网络通信技术领域。
背景技术
多标签图像分类是计算机视觉领域的一项基础性和实践性工作,其目标是预测图像中出现的一系列物体标签。它有许多现实世界的应用,包括人体属性识别,医学诊断识别,视频多标签分类以及图像标注等。近些年来,大多数卷积神经网络都是为了处理单标签分类问题而设计,每个图像只使用一个标签来描述该图像中最重要、最显著的内容,比如描述一个对象或场景。然而,仅用一个标签来标记图像与现实应用并不相符,因为现实世界中的大多数图像都含有多个对象或概念。因此,为了自然而全面的地描述图像,需要建立多标签的图像分类模型。
随着深度卷积神经网络的发展,研究者们越来越多的关注网络的深度和宽度。网络越大、越深,其性能越好,同时网络的参数数量也明显增加,此时便需要更多的标记训练样本来防止过拟合。然而在现实场景下的深度学习问题中,准确标记海量的训练图像,需要大量的人工劳动和精力,成本非常高,获得完整标记的多标签数据集往往是困难的。要解决大量未标记数据的训练问题,一个简单的解决方案是丢弃所有无标签的样本,然而这可能会付出丢失大量的数据样本的特征信息的代价。同时,在神经网络的训练过程中我们发现,知道尽可能多的正确标记的训练数据有助于提高模型性能。另外一种解决方案是在模型训练前,通过聚类或标签特征相关性生成无标签数据的标签,进而进行监督训练。然而,这种对无标签样本的预处理忽略了神经网络对数据的特征表达且标签的噪声也显著增加,因此会降低网络的分类性能。
专利申请号CN 201910883908.4(申请名称:一种基于ACGAN图像半监督分类算法,申请日:2019.09.18,申请人:长沙理工大学)公开了基于ACGAN图像半监督分类算法,解决在半监督学习中标签过少导致分类过拟合的问题,通过ACGAN网络中的生成器生成假数据及其对应的标签,并把假数据放入分类器中进行分类,增加带有标签的数据量,从而提高分类模型的泛化能力。但这种技术方案由于分类器的分类性能原因会使生成的标签不具备可靠性,从而使得标签数据集引入较大的噪声,降低模型的泛化性能。
因此,如何基于无标签和有标签数据组成的混合数据集实现图像的多标签分类,从而充分利用标签数据的有效信息,有效提高网络的分类性能,已成为技术人员急需解决的技术问题。
发明内容
有鉴于此,本发明的目的是提供一种基于半监督学习的图像多标签分类方法,能基于无标签和有标签数据组成的混合数据集实现图像的多标签分类,从而充分利用标签数据的有效信息,有效提高网络的分类性能。
为了达到上述目的,本发明提供了一种基于半监督学习的图像多标签分类方法,包括有:
步骤一、从训练数据集中分别提取有标签数据的训练图片和无标签数据的训练图片,并由有标签数据的训练图片构成有标签数据集、由无标签数据的训练图片构成无标签数据集,然后使用one-hot编码格式,为有标签数据集、无标签数据集中的每张训练图片标注对应的标签向量:[b1,b2,…,bC],其中,C是所有标签总数,有标签数据集中每张训练图片的标签向量中的第c个标签值bc为0或者1,当bc=1时,表示该训练图片包含有第c个标签,当bc=0时,表示该训练图片不包含有第c个标签,c∈[1,C],无标签数据中每张训练图片的标签向量中的所有标签值均为-1,表示该训练图片的标签未知;
步骤二、构建图像多标签分类网络,并将有标签数据集和无标签数据集中的所有训练图片作为训练样本输入至图像多标签分类网络中,进行半监督训练,所述图像多标签分类网络的输入是有标签数据集和无标签数据集中的训练图片及其对应的标签向量,输出是训练图片对应各标签的预测概率;
步骤三、为待分类图片标注对应的标签向量,所述待分类图片的标签向量中的所有标签值均为-1,然后将待分类图片及其标签向量输入至步骤二训练后的图像多标签分类网络,并根据输出的待分类图片对应各标签的预测概率确定待分类图片的多个标签。
与现有技术相比,本发明的有益效果是:多标签分类中最常用的损失函数是二元交叉熵,本发明在训练过程中针对生成的伪标签,提出部分标签损失替换传统的二元交叉熵损失,可以加快模型的收敛速度,提高模型的分类性能;本发明基于GCN网络,利用图的特点表征多标签之间的相关性,具有灵活性和扩展性,通过对数据标签的整体性建模分析,提高了模型的分类性能,引入标签相关性对多标签分类模型具有促进效果;如果基于阈值或基于置信度 top-k的伪标签生成策略,都会引入较多的标签噪声,对网络的监督训练造成不利的影响,本发明基于标签一致性来生成和优化无标签数据的伪标签,可以降低网络生成伪标签错误的可能性,减少标签噪声,提高模型的分类性能。
附图说明
图1是本发明一种基于半监督学习的图像多标签分类方法的流程图。
图2是图1步骤二将有标签数据集和无标签数据集中的所有训练图片作为训练样本输入至图像多标签分类网络时,图像多标签分类网络的具体处理流程图。
图3是以训练中的第t次迭代为例,为无标签数据集中的第j张训练图片生成伪标签向量中的每个伪标签值的具体步骤流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
如图1所示,本发明一种基于半监督学习的图像多标签分类方法,包括有:
步骤一、从训练数据集中分别提取有标签数据的训练图片和无标签数据的训练图片,并由有标签数据的训练图片构成有标签数据集、由无标签数据的训练图片构成无标签数据集,然后使用one-hot编码格式,为有标签数据集、无标签数据集中的每张训练图片标注对应的标签向量:[b1,b2,…,bC],其中,C是所有标签总数,有标签数据集中每张训练图片的标签向量中的第c个标签值bc可以为0或者1,当bc=1时,表示该训练图片包含有第c个标签,当bc=0时,表示该训练图片不包含有第c个标签,c∈[1,C],无标签数据中每张训练图片的标签向量中的所有标签值均为-1,表示该训练图片的标签未知;
步骤二、构建图像多标签分类网络,并将有标签数据集和无标签数据集中的所有训练图片作为训练样本输入至图像多标签分类网络中,进行半监督训练,所述图像多标签分类网络的输入是有标签数据集和无标签数据集中的训练图片及其对应的标签向量,输出是训练图片对应各标签的预测概率;
步骤三、为待分类图片标注对应的标签向量,所述待分类图片的标签向量中的所有标签值均为-1,然后将待分类图片及其标签向量输入至步骤二训练后的图像多标签分类网络,并根据输出的待分类图片对应各标签的预测概率确定待分类图片的多个标签。
如图2所示,步骤二将有标签数据集和无标签数据集中的所有训练图片作为训练样本输入至图像多标签分类网络时,图像多标签分类网络的具体处理流程如下:
步骤21、构建ResNet网络,从输入的有标签数据集和无标签数据集中的每张训练图片中提取图片特征,然后输出每张训练图片的图片特征向量;
步骤22、根据有标签数据集中所有训练图片的标签向量,计算用于表征所有标签之间相互关系的相关系数矩阵:统计有标签数据集中所有训练图片的标签对的出现次数,构建所有标签的标签共现矩阵,然后使用有标签数据集中的各标签文本对G loVe模型进行训练以生成每个标签的词嵌入向量,并由有标签数据集中所有训练图片的标签向量计算得到所有标签的条件概率矩阵,再使用每个标签的词嵌入向量和所有标签的条件概率矩阵计算得到有标签数据集中每张训练图片的标签邻接矩阵,最后构建GCN网络,并将有标签数据集中所有训练图片的标签邻接矩阵输入GCN网络,从而输出得到所有标签的相关系数矩阵;
G loVe模型是基于全局词频统计的词表征工具,它可以把一个单词表达成一个由实数组成的向量,这些向量捕捉到了单词之间一些语义特性,比如相似性、类比性等。通过对向量的运算,比如欧几里得距离或者cos ine相似度,可以计算出两个单词之间的语义相似性,步骤22中通过G loVe模型可以充分分析标签之间的关系。图卷积神经网络(GCN)是一种能对图数据进行深度学习的方法,图数据每个节点都有自己的特征信息、结构信息,通过GCN网络可以自动化地学习到这些数据信息,本发明通过GCN网络可以很好的学习多标签之间的相关性,GCN网络在训练时可以以标签数据集中所有训练图片的标签邻接矩阵为训练样本,输出的所有标签的相关系数矩阵可以使用所有标签的标签共现矩阵进行初始化;
步骤23、将步骤21输出的每张训练图片的图片特征向量与步骤22获得的所有标签的相关系数矩阵作点乘(dot product),并将点乘后的结果再通过分类器,从而获得每张训练图片对应各标签的预测概率。
为加快收敛速度,图像多标签分类网络可以使用ResNet-50在大型数据集ImageNet中的预处理模型进行初始化,并使用SGD作为优化器、动量设定为0.9、重量衰减为10-4。初始学习率为0.01,每40个epoch衰减10倍,网络总共训练100个epoch,batch-s ize为64。
在步骤二的训练过程中,可以将有标签数据集、无标签数据集中的训练图片以1:1的比例输入到ResNet网络中,先使用有标签数据集进行迭代训练,然后利用所学习的模型逐步预测、生成无标签数据的伪标签向量,最后利用这些伪标签和真实标签继续对模型进行训练。
在训练最初的阶段,由于模型的分类性能较弱,无标签数据生成的伪标签会引入较大的噪声,因而步骤二中的图像多标签分类网络在训练过程中的损失函数可以定义为:其中,losslabel(x,y)是当训练图片属于有标签数据集时的损失函数,是当训练图片属于无标签数据集时的损失函数,α(t) 表示高斯增长函数。losslabel(x,y)采用传统的二元交叉熵,x是ResNet网络从训练图片中提取的图片特征向量,y是使用one-hot格式为训练图片所标注的真实的标签向量,C是所有标签总数,σ(·)表示sigmoid函数,yc表示训练图片的第c 个标签值,其值为1或0。x是ResNet网络从训练图片中提取的图片特征向量,是训练过程中得到的训练图片的伪标签向量,和分别表示中第c个伪标签值为1和0的数量,表示指示函数,若为1,则为1,为0,若为0,则为0,为1。α(t)表示高斯增长函数,α(t)的设置对于网络性能是非常重要的,如果α(t)过高,则起初模型的伪标签噪声很大,将使得网络性能降低,如果α(t)太小,则不能充分利用无标签数据的有效信息,因此α(t) 是缓慢增加的高斯增长函数,公式如下所示:其中,t 表示当前模型的训练的迭代次数,T=80,表示在起初训练迭代80个周期内,缓慢增加无标签损失的权重。
同时,在步骤二对无标签数据集中的训练图片进行训练时,本发明还可以进一步基于标签一致性来为无标签数据集中的训练图片生成相应的伪标签值。训练过程中,不断生成、优化无标签数据的伪标签,并加入训练集中,从而提高模型的分类性能。这样,如图3所示,以训练中的第t次迭代为例,为无标签数据集中的第j张训练图片生成伪标签向量中的每个伪标签值的具体过程如下:
步骤A1、将第j张训练图片输入至第t次迭代训练后的图像多标签分类网络,预测并记录第j张训练图片在第t次迭代对应的每个类别标签置信度分数;
步骤A2、逐一提取第j张训练图片的每个类别标签置信度分数在前p次迭代中的对应值,然后判断第j张训练图片的每个类别标签置信度分数在前p次迭代中是否排序都在所有类别标签置信度分数的前k名之内、且其值都大于绝对置信度阈值θ1,如果是,则将第j张训练图片对应标签的伪标签值设为1,并继续判断第j张训练图片的下一个类别标签置信度分数;如果否,则直接继续判断第j张训练图片的下一个类别标签置信度分数,当判断完所有类别标签置信度分数后,继续下一步;
步骤A3、逐一判断第j张训练图片的每个类别标签置信度分数在前p次迭代中是否都小于绝对置信度阈值θ2、且其对应的伪标签值不为1,如果是,则将第j张训练图片对应标签的伪标签值设为0,然后继续判断下一个类别标签置信度分数;如果否,则表示标签未知,将第j张训练图片对应标签的伪标签值设为-1,然后继续判断下一个类别标签置信度分数。
上述k、p、θ1、θ2可根据实际业务需要而设置,通过实验证明,当p=4,k=3,θ1=1.0,θ2=-5.0时,网络模型可预测出更多、更准确的伪标签,网络模型具有更好的分类效果。
当步骤二完成对图像多标签分类网络的训练后,步骤三将待分类图片及其标签向量输入至图像多标签分类网络时,也是先通过ResNet网络计算得到待分类图片的图片特征向量,然后将待分类图片的图片特征向量和步骤22计算得到的所有标签的相关系数矩阵作点乘(dot product),再将点乘后的结果通过分类器,从而获得待分类图片对应各标签的预测概率,最后根据预测概率为待分类图片确定对应的多个标签。
上述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (8)
1.一种基于半监督学习的图像多标签分类方法,其特征在于,包括有:
步骤一、从训练数据集中分别提取有标签数据的训练图片和无标签数据的训练图片,并由有标签数据的训练图片构成有标签数据集、由无标签数据的训练图片构成无标签数据集,然后使用one-hot编码格式,为有标签数据集、无标签数据集中的每张训练图片标注对应的标签向量:[b1,b2,…,bC],其中,C是所有标签总数,有标签数据集中每张训练图片的标签向量中的第c个标签值bc为0或者1,当bc=1时,表示该训练图片包含有第c个标签,当bc=0时,表示该训练图片不包含有第c个标签,c∈[1,C],无标签数据中每张训练图片的标签向量中的所有标签值均为-1,表示该训练图片的标签未知;
步骤二、构建图像多标签分类网络,并将有标签数据集和无标签数据集中的所有训练图片作为训练样本输入至图像多标签分类网络中,进行半监督训练,所述图像多标签分类网络的输入是标签数据集和无标签数据集中的训练图片及其对应的标签向量,输出是训练图片对应各标签的预测概率;
步骤三、为待分类图片标注对应的标签向量,所述待分类图片的标签向量中的所有标签值均为-1,然后将待分类图片及其标签向量输入至步骤二训练后的图像多标签分类网络,并根据输出的待分类图片对应各标签的预测概率确定待分类图片的多个标签。
2.根据权利要求1所述的方法,其特征在于,步骤二将有标签数据集和无标签数据集中的所有训练图片作为训练样本输入至图像多标签分类网络时,图像多标签分类网络的具体处理流程如下:
步骤21、构建ResNet网络,从输入的有标签数据集和无标签数据集中的每张训练图片中提取图片特征,然后输出每张训练图片的图片特征向量;
步骤22、根据有标签数据集中所有训练图片的标签向量,计算用于表征所有标签之间相互关系的相关系数矩阵:统计有标签数据集中所有训练图片的标签对的出现次数,构建所有标签的标签共现矩阵,然后使用有标签数据集中的各标签文本对GloVe模型进行训练以生成每个标签的词嵌入向量,并由有标签数据集中所有训练图片的标签向量计算得到所有标签的条件概率矩阵,再使用每个标签的词嵌入向量和所有标签的条件概率矩阵计算得到有标签数据集中每张训练图片的标签邻接矩阵,最后构建GCN网络,并将有标签数据集中所有训练图片的标签邻接矩阵输入GCN网络,从而输出得到所有标签的相关系数矩阵;
步骤23、将步骤21输出的每张训练图片的图片特征向量与步骤22获得的所有标签的相关系数矩阵作点乘,并将点乘后的结果再通过分类器,从而获得每张训练图片对应各标签的预测概率。
3.根据权利要求2所述的方法,其特征在于,图像多标签分类网络使用ResNet-50在大型数据集ImageNet中的预处理模型进行初始化,并使用SGD作为优化器、动量设定为0.9、重量衰减为10-4,初始学习率为0.01,每40个epoch衰减10倍,网络总共训练100个epoch,batch-size为64。
7.根据权利要求1所述的方法,其特征在于,以训练中的第t次迭代为例,为无标签数据集中的第j张训练图片生成伪标签向量中的每个伪标签值的具体过程如下:
步骤A1、将第j张训练图片输入至第t次迭代训练后的图像多标签分类网络,预测并记录第j张训练图片在第t次迭代对应的每个类别标签置信度分数;
步骤A2、逐一提取第j张训练图片的每个类别标签置信度分数在前p次迭代中的对应值,然后判断第j张训练图片的每个类别标签置信度分数在前p次迭代中是否排序都在所有类别标签置信度分数的前k名之内、且其值都大于绝对置信度阈值θ1,如果是,则将第j张训练图片对应标签的伪标签值设为1,并继续判断第j张训练图片的下一个类别标签置信度分数;如果否,则直接继续判断第j张训练图片的下一个类别标签置信度分数,当判断完所有类别标签置信度分数后,继续下一步;
步骤A3、逐一判断第j张训练图片的每个类别标签置信度分数在前p次迭代中是否都小于绝对置信度阈值θ2、且其对应的伪标签值不为1,如果是,则将第j张训练图片对应标签的伪标签值设为0,然后继续判断下一个类别标签置信度分数;如果否,则将第j张训练图片对应标签的伪标签值设为-1,然后继续判断下一个类别标签置信度分数。
8.根据权利要求7所述的方法,其特征在于,p=4,k=3,θ1=1.0,θ2=-5.0。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010954339.0A CN112115995B (zh) | 2020-09-11 | 2020-09-11 | 一种基于半监督学习的图像多标签分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010954339.0A CN112115995B (zh) | 2020-09-11 | 2020-09-11 | 一种基于半监督学习的图像多标签分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112115995A true CN112115995A (zh) | 2020-12-22 |
CN112115995B CN112115995B (zh) | 2023-04-07 |
Family
ID=73802598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010954339.0A Expired - Fee Related CN112115995B (zh) | 2020-09-11 | 2020-09-11 | 一种基于半监督学习的图像多标签分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112115995B (zh) |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112560982A (zh) * | 2020-12-24 | 2021-03-26 | 昆明理工大学 | 基于cnn-lda的半监督图像标签生成方法 |
CN112581528A (zh) * | 2020-12-24 | 2021-03-30 | 广东工业大学 | 一种基于主动学习的衣物关键点辅助标注及预测优化方法 |
CN112686316A (zh) * | 2020-12-30 | 2021-04-20 | 上海掌门科技有限公司 | 一种用于确定标签的方法与设备 |
CN112734035A (zh) * | 2020-12-31 | 2021-04-30 | 成都佳华物链云科技有限公司 | 一种数据处理方法及装置、可读存储介质 |
CN112786160A (zh) * | 2021-02-03 | 2021-05-11 | 紫东信息科技(苏州)有限公司 | 基于图神经网络的多图片输入的多标签胃镜图片分类方法 |
CN112801116A (zh) * | 2021-01-27 | 2021-05-14 | 商汤集团有限公司 | 图像的特征提取方法及装置、电子设备和存储介质 |
CN112801153A (zh) * | 2021-01-19 | 2021-05-14 | 南京邮电大学 | 一种嵌入lbp特征的图的半监督图像分类方法及系统 |
CN112819803A (zh) * | 2021-02-22 | 2021-05-18 | 珠海博明视觉科技有限公司 | 一种用于机器视觉缺陷检测的神经网络分类器的使用方法 |
CN112819099A (zh) * | 2021-02-26 | 2021-05-18 | 网易(杭州)网络有限公司 | 网络模型的训练方法、数据处理方法、装置、介质及设备 |
CN112967252A (zh) * | 2021-03-05 | 2021-06-15 | 哈尔滨市科佳通用机电股份有限公司 | 一种轨道车辆机感吊架组装螺栓丢失检测方法 |
CN112990374A (zh) * | 2021-04-28 | 2021-06-18 | 平安科技(深圳)有限公司 | 图像分类方法、装置、电子设备及介质 |
CN113221991A (zh) * | 2021-04-30 | 2021-08-06 | 佛山市南海区广工大数控装备协同创新研究院 | 一种利用深度学习重新标注数据集的方法 |
CN113344097A (zh) * | 2021-06-21 | 2021-09-03 | 特赞(上海)信息科技有限公司 | 基于多模型的图像处理方法和装置 |
CN113598774A (zh) * | 2021-07-16 | 2021-11-05 | 中国科学院软件研究所 | 基于多通道脑电数据的积极情绪多标签分类方法及装置 |
CN113657425A (zh) * | 2021-06-28 | 2021-11-16 | 华南师范大学 | 基于多尺度与跨模态注意力机制的多标签图像分类方法 |
CN113807412A (zh) * | 2021-08-30 | 2021-12-17 | 广州大学 | 一种多标签图像分类方法、装置、设备及存储介质 |
CN113822342A (zh) * | 2021-09-02 | 2021-12-21 | 湖北工业大学 | 一种安全图卷积网络的文献分类方法及系统 |
CN113901991A (zh) * | 2021-09-15 | 2022-01-07 | 天津大学 | 一种基于伪标签的3d点云数据半自动标注方法及装置 |
CN114610967A (zh) * | 2022-03-09 | 2022-06-10 | 东北大学 | 一种应用于用户画像领域的数据增广方法 |
CN115062709A (zh) * | 2022-06-21 | 2022-09-16 | 腾讯科技(深圳)有限公司 | 模型优化方法、装置、设备、存储介质及程序产品 |
CN115294402A (zh) * | 2022-08-24 | 2022-11-04 | 合肥市正茂科技有限公司 | 一种基于去冗余多阶混合训练的半监督车辆分类方法 |
CN117058489A (zh) * | 2023-10-09 | 2023-11-14 | 腾讯科技(深圳)有限公司 | 多标签识别模型的训练方法、装置、设备及存储介质 |
WO2023245523A1 (zh) * | 2022-06-22 | 2023-12-28 | 极纳人工智能有限公司 | 用于生成训练数据的方法以及装置 |
CN118072269A (zh) * | 2024-02-22 | 2024-05-24 | 北京鉴智科技有限公司 | 路面类型检测方法、装置、车辆、电子设备及存储介质 |
CN114610967B (zh) * | 2022-03-09 | 2024-10-22 | 东北大学 | 一种应用于用户画像领域的数据增广方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109783818A (zh) * | 2019-01-17 | 2019-05-21 | 上海三零卫士信息安全有限公司 | 一种企业行业多标签分类方法 |
CN109816009A (zh) * | 2019-01-18 | 2019-05-28 | 南京旷云科技有限公司 | 基于图卷积的多标签图像分类方法、装置及设备 |
WO2019136946A1 (zh) * | 2018-01-15 | 2019-07-18 | 中山大学 | 基于深度学习的弱监督显著性物体检测的方法及系统 |
CN110807495A (zh) * | 2019-11-08 | 2020-02-18 | 腾讯科技(深圳)有限公司 | 多标签分类方法、装置、电子设备及存储介质 |
-
2020
- 2020-09-11 CN CN202010954339.0A patent/CN112115995B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019136946A1 (zh) * | 2018-01-15 | 2019-07-18 | 中山大学 | 基于深度学习的弱监督显著性物体检测的方法及系统 |
CN109783818A (zh) * | 2019-01-17 | 2019-05-21 | 上海三零卫士信息安全有限公司 | 一种企业行业多标签分类方法 |
CN109816009A (zh) * | 2019-01-18 | 2019-05-28 | 南京旷云科技有限公司 | 基于图卷积的多标签图像分类方法、装置及设备 |
CN110807495A (zh) * | 2019-11-08 | 2020-02-18 | 腾讯科技(深圳)有限公司 | 多标签分类方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
王晶晶: "针对弱标记数据的半监督多标签分类算法", 《中国优秀硕士学位论文全文数据库 信息科技辑(月刊)》 * |
Cited By (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112581528B (zh) * | 2020-12-24 | 2023-09-22 | 广东工业大学 | 一种基于主动学习的衣物关键点辅助标注及预测优化方法 |
CN112581528A (zh) * | 2020-12-24 | 2021-03-30 | 广东工业大学 | 一种基于主动学习的衣物关键点辅助标注及预测优化方法 |
CN112560982A (zh) * | 2020-12-24 | 2021-03-26 | 昆明理工大学 | 基于cnn-lda的半监督图像标签生成方法 |
CN112686316A (zh) * | 2020-12-30 | 2021-04-20 | 上海掌门科技有限公司 | 一种用于确定标签的方法与设备 |
CN112734035A (zh) * | 2020-12-31 | 2021-04-30 | 成都佳华物链云科技有限公司 | 一种数据处理方法及装置、可读存储介质 |
CN112734035B (zh) * | 2020-12-31 | 2023-10-27 | 成都佳华物链云科技有限公司 | 一种数据处理方法及装置、可读存储介质 |
CN112801153A (zh) * | 2021-01-19 | 2021-05-14 | 南京邮电大学 | 一种嵌入lbp特征的图的半监督图像分类方法及系统 |
CN112801153B (zh) * | 2021-01-19 | 2022-08-26 | 南京邮电大学 | 一种嵌入lbp特征的图的半监督图像分类方法及系统 |
CN112801116B (zh) * | 2021-01-27 | 2024-05-21 | 商汤集团有限公司 | 图像的特征提取方法及装置、电子设备和存储介质 |
CN112801116A (zh) * | 2021-01-27 | 2021-05-14 | 商汤集团有限公司 | 图像的特征提取方法及装置、电子设备和存储介质 |
CN112786160A (zh) * | 2021-02-03 | 2021-05-11 | 紫东信息科技(苏州)有限公司 | 基于图神经网络的多图片输入的多标签胃镜图片分类方法 |
CN112819803A (zh) * | 2021-02-22 | 2021-05-18 | 珠海博明视觉科技有限公司 | 一种用于机器视觉缺陷检测的神经网络分类器的使用方法 |
CN112819803B (zh) * | 2021-02-22 | 2024-03-22 | 珠海博明视觉科技有限公司 | 一种用于机器视觉缺陷检测的神经网络分类器的使用方法 |
CN112819099B (zh) * | 2021-02-26 | 2023-12-22 | 杭州网易智企科技有限公司 | 网络模型的训练方法、数据处理方法、装置、介质及设备 |
CN112819099A (zh) * | 2021-02-26 | 2021-05-18 | 网易(杭州)网络有限公司 | 网络模型的训练方法、数据处理方法、装置、介质及设备 |
CN112967252B (zh) * | 2021-03-05 | 2021-10-22 | 哈尔滨市科佳通用机电股份有限公司 | 一种轨道车辆机感吊架组装螺栓丢失检测方法 |
CN112967252A (zh) * | 2021-03-05 | 2021-06-15 | 哈尔滨市科佳通用机电股份有限公司 | 一种轨道车辆机感吊架组装螺栓丢失检测方法 |
CN112990374A (zh) * | 2021-04-28 | 2021-06-18 | 平安科技(深圳)有限公司 | 图像分类方法、装置、电子设备及介质 |
WO2022227192A1 (zh) * | 2021-04-28 | 2022-11-03 | 平安科技(深圳)有限公司 | 图像分类方法、装置、电子设备及介质 |
CN112990374B (zh) * | 2021-04-28 | 2023-09-15 | 平安科技(深圳)有限公司 | 图像分类方法、装置、电子设备及介质 |
CN113221991A (zh) * | 2021-04-30 | 2021-08-06 | 佛山市南海区广工大数控装备协同创新研究院 | 一种利用深度学习重新标注数据集的方法 |
CN113344097A (zh) * | 2021-06-21 | 2021-09-03 | 特赞(上海)信息科技有限公司 | 基于多模型的图像处理方法和装置 |
CN113344097B (zh) * | 2021-06-21 | 2024-03-19 | 特赞(上海)信息科技有限公司 | 基于多模型的图像处理方法和装置 |
CN113657425A (zh) * | 2021-06-28 | 2021-11-16 | 华南师范大学 | 基于多尺度与跨模态注意力机制的多标签图像分类方法 |
CN113657425B (zh) * | 2021-06-28 | 2023-07-04 | 华南师范大学 | 基于多尺度与跨模态注意力机制的多标签图像分类方法 |
CN113598774B (zh) * | 2021-07-16 | 2022-07-15 | 中国科学院软件研究所 | 基于多通道脑电数据的积极情绪多标签分类方法及装置 |
CN113598774A (zh) * | 2021-07-16 | 2021-11-05 | 中国科学院软件研究所 | 基于多通道脑电数据的积极情绪多标签分类方法及装置 |
CN113807412B (zh) * | 2021-08-30 | 2023-09-26 | 广州大学 | 一种多标签图像分类方法、装置、设备及存储介质 |
CN113807412A (zh) * | 2021-08-30 | 2021-12-17 | 广州大学 | 一种多标签图像分类方法、装置、设备及存储介质 |
CN113822342B (zh) * | 2021-09-02 | 2023-05-30 | 湖北工业大学 | 一种安全图卷积网络的文献分类方法及系统 |
CN113822342A (zh) * | 2021-09-02 | 2021-12-21 | 湖北工业大学 | 一种安全图卷积网络的文献分类方法及系统 |
CN113901991A (zh) * | 2021-09-15 | 2022-01-07 | 天津大学 | 一种基于伪标签的3d点云数据半自动标注方法及装置 |
CN114610967A (zh) * | 2022-03-09 | 2022-06-10 | 东北大学 | 一种应用于用户画像领域的数据增广方法 |
CN114610967B (zh) * | 2022-03-09 | 2024-10-22 | 东北大学 | 一种应用于用户画像领域的数据增广方法 |
CN115062709A (zh) * | 2022-06-21 | 2022-09-16 | 腾讯科技(深圳)有限公司 | 模型优化方法、装置、设备、存储介质及程序产品 |
WO2023245523A1 (zh) * | 2022-06-22 | 2023-12-28 | 极纳人工智能有限公司 | 用于生成训练数据的方法以及装置 |
CN115294402B (zh) * | 2022-08-24 | 2023-08-11 | 合肥市正茂科技有限公司 | 一种基于去冗余多阶混合训练的半监督车辆分类方法 |
CN115294402A (zh) * | 2022-08-24 | 2022-11-04 | 合肥市正茂科技有限公司 | 一种基于去冗余多阶混合训练的半监督车辆分类方法 |
CN117058489A (zh) * | 2023-10-09 | 2023-11-14 | 腾讯科技(深圳)有限公司 | 多标签识别模型的训练方法、装置、设备及存储介质 |
CN117058489B (zh) * | 2023-10-09 | 2023-12-29 | 腾讯科技(深圳)有限公司 | 多标签识别模型的训练方法、装置、设备及存储介质 |
CN118072269A (zh) * | 2024-02-22 | 2024-05-24 | 北京鉴智科技有限公司 | 路面类型检测方法、装置、车辆、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112115995B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112115995B (zh) | 一种基于半监督学习的图像多标签分类方法 | |
Li et al. | Siamese contrastive embedding network for compositional zero-shot learning | |
CN112163426B (zh) | 一种基于注意力机制与图长短时记忆神经网络结合的关系抽取方法 | |
CN113190699B (zh) | 一种基于类别级语义哈希的遥感图像检索方法及装置 | |
CN111552807B (zh) | 一种短文本多标签分类方法 | |
CN110196980A (zh) | 一种基于卷积网络在中文分词任务上的领域迁移 | |
Huang et al. | They are not completely useless: Towards recycling transferable unlabeled data for class-mismatched semi-supervised learning | |
CN114821271B (zh) | 模型训练方法、图像描述生成方法、装置及存储介质 | |
CN112926661A (zh) | 一种增强图像分类鲁棒性的方法 | |
Cholakkal et al. | Backtracking spatial pyramid pooling-based image classifier for weakly supervised top–down salient object detection | |
Huang et al. | TPCKT: two-level progressive cross-media knowledge transfer | |
CN117557886A (zh) | 融合偏标签和消极学习的含噪声标签图像识别方法及系统 | |
CN114781375A (zh) | 一种基于bert与注意力机制的军事装备关系抽取方法 | |
CN116663539A (zh) | 基于RoBERTa和指针网络的中文实体与关系联合抽取方法及系统 | |
Wang et al. | Recognizing handwritten mathematical expressions as LaTex sequences using a multiscale robust neural network | |
Wang et al. | Out-of-distributed semantic pruning for robust semi-supervised learning | |
Ma et al. | Delving deeper into pixel prior for box-supervised semantic segmentation | |
Dao et al. | Class enhancement losses with pseudo labels for open-vocabulary semantic segmentation | |
Xu et al. | Semi-supervised self-growing generative adversarial networks for image recognition | |
CN117787283A (zh) | 基于原型对比学习的小样本细粒度文本命名实体分类方法 | |
Li et al. | DeTAL: Open-Vocabulary Temporal Action Localization with Decoupled Networks | |
CN117851591A (zh) | 一种基于bigbird和图注意力网络的多标签长文本分类方法 | |
Wu et al. | Conditional consistency regularization for semi-supervised multi-label image classification | |
CN116363460A (zh) | 基于主题模型的高分辨率遥感样本标注方法 | |
Xie et al. | Class knowledge overlay to visual feature learning for zero-shot image classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20230407 |
|
CF01 | Termination of patent right due to non-payment of annual fee |