CN112990385A - 一种基于半监督变分自编码器的主动众包图像学习方法 - Google Patents
一种基于半监督变分自编码器的主动众包图像学习方法 Download PDFInfo
- Publication number
- CN112990385A CN112990385A CN202110531443.3A CN202110531443A CN112990385A CN 112990385 A CN112990385 A CN 112990385A CN 202110531443 A CN202110531443 A CN 202110531443A CN 112990385 A CN112990385 A CN 112990385A
- Authority
- CN
- China
- Prior art keywords
- image
- crowdsourcing
- semi
- supervised
- mark
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000006870 function Effects 0.000 claims abstract description 34
- 238000013507 mapping Methods 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 17
- 238000002372 labelling Methods 0.000 claims abstract description 9
- 238000009826 distribution Methods 0.000 claims description 42
- 239000000126 substance Substances 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 8
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 claims description 3
- 101100533306 Mus musculus Setx gene Proteins 0.000 claims description 2
- 238000011478 gradient descent method Methods 0.000 claims description 2
- 239000013307 optical fiber Substances 0.000 claims description 2
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241000287196 Asthenes Species 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012358 sourcing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2155—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于半监督变分自编码器的主动众包图像学习方法,具体为:获取图片集,随机抽选一定比例的图像,将其分发给网络上的标注者进行标注,获得众包标记;搭建基于半监督变分自编码器的众包学习网络模型;将数据集输入模型,构造损失函数;基于随机梯度下降,端到端地对模型进行训练;选择预测真实标记的熵最大的图像,查询真实标记;与上一轮迭代所使用的训练集组合,生成新的数据集,返回第三步,直到当前迭代次数到达阈值为止;删去模型重构部分和众包映射层部分,将网络的剩余部分作为分类器。本发明同时利用众包数据和无标记数据,降低数据的标注成本。并通过引入少量真实标记,来缓解模型对于噪声的过拟合,提高模型的泛化性能。
Description
技术领域
本发明涉及一种基于半监督变分自编码器的主动众包图像学习方法,属于图像标注技术领域。
背景技术
传统的监督学习需要大量的专家图像,需要比较高的标注成本。为了降低成本,人们提出了多种方法,比如众包学习、半监督学习和主动学习。
众包学习的流程是首先发布标注任务在网络平台上,任何人都可以进行这个标注任务,所收集到的数据比专家标注噪声比例更多。为了解决众包中非专家标注者的不确定性,通常会让每张图像由多个标注者进行标注,即重复标注。如何利用这种具有噪声和重复标记的众包数据成为了众包学习的关键点。代表性的方式有从每张图像的多个标签集估计其真实标记的真实标记推断,其中最为简单的是Majority-voting,对每个标注者的可靠度进行建模的DS模型及其变种,使用EM式算法联合学习分类器模型和标注者噪声模型, 使用预测模型来提高数据质量,与主动学习结合等。其中,尽管众包学习中的标签聚合方法可以与任何类型的机器学习算法结合使用,但与同样联合学习分类器本身的方法相比,它们是次优的。
半监督学习通过引入大量的无标记数据,这些无标记数据和有标记数据是同分布的,通过无标记数据来对模型进行约束,缓解模型的过拟合,提高它的性能同时降低对专家标记数量的需求。不过,将众包学习和半监督学习结合起来的工作都没有考虑过引入少量的额外监督信息来缓解模型对于众包数据中噪声的拟合。
主动学习则是通过某种指标或策略选择出无标记数据中最具有信息量的图像,之后询问专家这些图像的标记。将众包学习和主动学习结合起来的工作均聚焦于询问图像的众包标注而非专家标注。但是在实际情况中,少量图像的真实标记不会增加太多的标记成本,但却很有可能较大地提高模型的泛化性能。
发明内容
本发明所要解决的技术问题是:提供一种基于半监督变分自编码器的主动众包图像学习方法,同时利用众包数据和无标记数据,降低数据的标注成本。并通过引入少量真实标记,来缓解模型对于噪声的拟合,提高模型的泛化性能。
本发明为解决上述技术问题采用以下技术方案:
一种基于半监督变分自编码器的主动众包图像学习方法,包括如下步骤:
步骤2,搭建半监督众包学习网络模型,所述半监督众包学习网络模型包括半监督变分自编码器、众包映射层和主动学习框架;
步骤4,基于随机梯度下降方法,端到端地对半监督众包学习网络模型进行训练,得到训练好的半监督众包学习网络模型;
步骤7,对最终的半监督众包学习网络模型,删掉重构部分和众包映射层部分,将剩余部分作为众包图像分类器;
步骤8,利用众包图像分类器对待标注图像进行标注,得到众包学习标记。
作为本发明的一种优选方案,步骤2所述众包映射层,具体形式如下:
作为本发明的一种优选方案,步骤3所述变分下界损失函数的构造方法为:
其中,表示第一图像集中的图像,表示的真实标记,表示隐变
量,表示与的似然函数,表示期望,表示的先验分布,表示的先验分布,表示的后验分布,表示对的近似分布,表示和的损失函数,表示分布参数,为变分参
数;
最终的变分下界损失函数为:
当第一次迭代时,损失函数的第四项为0;
其中,表示变分下界损失函数,均表示超参数,表示第一图
像集的分布,表示第二图像集的分布,表示第三图像集的分布,分别
表示第三图像集的单张图像和其真实标记,表示第r个众包映射层,y表示真实标记,表示由经过众包映射层反向映射得到的目标标记,表示代入了的。
作为本发明的一种优选方案,步骤4所述端到端地对半监督众包学习网络模型进行训练所采用的优化器为SGD或Adam。
作为本发明的一种优选方案,所述步骤5的具体过程如下:
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
本发明结合半监督学习、众包学习以及主动学习的优势,使用半监督变分自编码器完成众包数据集共享表示学习,使用众包映射层完成真实标记层到众包标记层的映射,使用主动挑选不断迭代的方式引入少量真实标记,实现了端到端训练,提高了图像估计的效果和效率。
附图说明
图1是本发明一种基于半监督变分自编码器的主动众包图像学习方法的流程图。
图2是本发明模型的结构图。
图3是本发明迭代挑选的具体流程图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
如图1所示,展示了基于半监督变分自编码器与主动学习的众包图像学习方法的具体流程,包括以下步骤:
步骤1:构造图像众包数据集。
获取图像后,随机抽选t比例的图像,将它们记为,之后通过众包平台,如
Amazon Mechanical Turk和 Crowdflower 等,分发给网络上的标注者进行预标注,得到标
注。剩余的没有被标注的部分我们记作。
步骤2:搭建半监督众包学习网络模型,图2是模型的结构图。
在步骤2中,我们所搭建的半监督主动众包学习网络由一个半监督变分自编码器、一个映射层与一套迭代的主动学习框架组成。
首先,我们将表示整个数据集表示为,其
中,为单张图片,为的真实标记,为对应的隐变量,n是样本数量。在半监
督的设定下,只有一部分有着对应的,其中,,而。其中是有标记图像集,我们设之为第一图像集;
是无标记图像集,我们设之为第二图像集。我们其分布分别表示为和。整个数据集可以被解释为以下的生成过程:
其中,服从一个多项式分布。对于图片来说,由于他们没有真实
标记,所以对于它们来说是一个隐变量,也是一个隐变量。这些隐变量相互之间边缘
独立。而则是一个似然函数,通过对隐变量的非线性变换进行参数化,我们
使用了深度神经网络作为这种非线性变换的近似。由于大多数的标签是未知的,在推理
过程中,对于无标记数据,我们将其所有类别的情况进行求和,从而以推理的方式进行分
类。而对于无标记数据类别的预测则是从推断的后验分布中得到。因此,这个模
型也可以看作是一个连续分布于离散分布的混合模型,组件之间共享参数。
其中,形式上是一个高斯分布,其分布参数由一个深度神经网络产生,我们可以称之为编码器-z(),而服从于一个类别分布(Categorical Distribution)。其分
布参数由深度神经网络产生,我们称之为编码器-y (),称为解码器(Decoder)。
其中,表示第一图像集中的图像,表示的真实标记,表示隐变
量。表示与的似然函数,表示期望,表示的先验分布,表示的先验分布,表示的后验分布,表示对的近似分布。表示和的损失函数,表示分布参数,为变分参
数。
其中,表示第二图像集的图像,这些图像是没有真实标记的。表示关于的似然函数,表示的先验分布,表示的先验分
布,表示的后验分布,表示近似的,是对的近似分布,而是关于的先验联合分布,表示其真实标记,由于数据集没有给出的真实标记,所以对于而言是隐变量。
这里对于来自于不同的两个数据集的图像和,都使用表示真实标记是为了表示
这两类数据标记分布的一致。表示的后验分布。表示关于和的损失函数,表示的熵,注意这里的仅表示真
实类别的一种可能情况,表示枚
举真实标记为各个类别的所有情况,并对它们进行求和。表示关于的损失
函数。
然而,我们发现只对与无标记数据相关的有贡献。理想情
况下,所有的模型和变量参数都应该能够利用到所有的数据。为了弥补这一点,我们增加了
一个交叉熵分损失项,使得分布也能从有标记数据中学习。因此,最后构造出
的变分下界损失函数为:
将其代入变分下界损失函数中,得到
当第一次迭代时,损失函数的第四项为0;
其中,表示变分下界损失函数,均表示超参数,表示第一图
像集的分布,表示第二图像集的分布,表示第三图像集的分布,分别
表示第三图像集的单张图像和其真实标记。表示第r个众包映射层,y表示真实标记,表示由经过众包映射层反向映射得到的目标标记,表示代入了的。
步骤4:基于随机梯度下降,端到端地对模型进行训练
我们使用优化器,如SGD、Adam等,对整个网络进行端到端的训练。
步骤5的具体步骤如图3所示:
将挑选出来的真实标记数据加入原来的训练集中,形成新的数据集。将其投入到下一次的训练当中去。
步骤7:删去模型重构部分和众包映射层部分,将网络的剩余部分作为分类器。
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。
Claims (5)
1.一种基于半监督变分自编码器的主动众包图像学习方法,其特征在于,包括如下步骤:
步骤2,搭建半监督众包学习网络模型,所述半监督众包学习网络模型包括半监督变分自编码器、众包映射层和主动学习框架;
步骤4,基于随机梯度下降方法,端到端地对半监督众包学习网络模型进行训练,得到训练好的半监督众包学习网络模型;
步骤7,对最终的半监督众包学习网络模型,删掉重构部分和众包映射层部分,将剩余部分作为众包图像分类器;
步骤8,利用众包图像分类器对待标注图像进行标注,得到众包学习标记。
3.根据权利要求1所述基于半监督变分自编码器的主动众包图像学习方法,其特征在于,步骤3所述变分下界损失函数的构造方法为:
其中,表示第一图像集中的图像,表示的真实标记,表示隐变量,表示与的似然函数,表示期望,表示的先验分布,
表示的先验分布,表示的后验分布,表示对
的近似分布,表示和的损失函数,表示分布参数,为变分参数;
最终的变分下界损失函数为:
当第一次迭代时,损失函数的第四项为0;
4.根据权利要求1所述基于半监督变分自编码器的主动众包图像学习方法,其特征在于,步骤4所述端到端地对半监督众包学习网络模型进行训练所采用的优化器为SGD或Adam。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110531443.3A CN112990385B (zh) | 2021-05-17 | 2021-05-17 | 一种基于半监督变分自编码器的主动众包图像学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110531443.3A CN112990385B (zh) | 2021-05-17 | 2021-05-17 | 一种基于半监督变分自编码器的主动众包图像学习方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112990385A true CN112990385A (zh) | 2021-06-18 |
CN112990385B CN112990385B (zh) | 2021-09-21 |
Family
ID=76336630
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110531443.3A Active CN112990385B (zh) | 2021-05-17 | 2021-05-17 | 一种基于半监督变分自编码器的主动众包图像学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112990385B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113255849A (zh) * | 2021-07-14 | 2021-08-13 | 南京航空航天大学 | 一种基于双重主动查询的标签带噪图像学习方法 |
CN114036947A (zh) * | 2021-12-09 | 2022-02-11 | 广东工业大学 | 一种半监督学习的小样本文本分类方法和系统 |
CN114494890A (zh) * | 2022-04-14 | 2022-05-13 | 广州市玄武无线科技股份有限公司 | 一种模型训练方法、商品图像管理方法及装置 |
CN115331065A (zh) * | 2022-10-13 | 2022-11-11 | 南京航空航天大学 | 基于解码器迭代筛选的鲁棒噪声多标签图像学习方法 |
CN116110504A (zh) * | 2023-04-12 | 2023-05-12 | 烟台国工智能科技有限公司 | 基于半监督变分自编码器的分子性质预测方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111027712A (zh) * | 2019-12-06 | 2020-04-17 | 中国科学技术大学 | 混合使用多种标记方式的主动众包学习方法及应用方法 |
CN111581468A (zh) * | 2020-05-15 | 2020-08-25 | 北京交通大学 | 基于噪声容忍的偏多标记学习方法 |
-
2021
- 2021-05-17 CN CN202110531443.3A patent/CN112990385B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111027712A (zh) * | 2019-12-06 | 2020-04-17 | 中国科学技术大学 | 混合使用多种标记方式的主动众包学习方法及应用方法 |
CN111581468A (zh) * | 2020-05-15 | 2020-08-25 | 北京交通大学 | 基于噪声容忍的偏多标记学习方法 |
Non-Patent Citations (1)
Title |
---|
WANLI SHI等: "Semi-Supervised Multi-Label Learning from Crowds via Deep Sequential Generative Model", 《KDD "20》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113255849A (zh) * | 2021-07-14 | 2021-08-13 | 南京航空航天大学 | 一种基于双重主动查询的标签带噪图像学习方法 |
CN113255849B (zh) * | 2021-07-14 | 2021-10-01 | 南京航空航天大学 | 一种基于双重主动查询的标签带噪图像学习方法 |
CN114036947A (zh) * | 2021-12-09 | 2022-02-11 | 广东工业大学 | 一种半监督学习的小样本文本分类方法和系统 |
CN114036947B (zh) * | 2021-12-09 | 2023-11-14 | 广东工业大学 | 一种半监督学习的小样本文本分类方法和系统 |
CN114494890A (zh) * | 2022-04-14 | 2022-05-13 | 广州市玄武无线科技股份有限公司 | 一种模型训练方法、商品图像管理方法及装置 |
CN115331065A (zh) * | 2022-10-13 | 2022-11-11 | 南京航空航天大学 | 基于解码器迭代筛选的鲁棒噪声多标签图像学习方法 |
CN116110504A (zh) * | 2023-04-12 | 2023-05-12 | 烟台国工智能科技有限公司 | 基于半监督变分自编码器的分子性质预测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112990385B (zh) | 2021-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112990385B (zh) | 一种基于半监督变分自编码器的主动众包图像学习方法 | |
US10866987B2 (en) | Evaluating performance of recommender system | |
CN109345302A (zh) | 机器学习模型训练方法、装置、存储介质和计算机设备 | |
Ionescu et al. | Overview of the ImageCLEF 2022: Multimedia retrieval in medical, social media and nature applications | |
Wang et al. | A hybrid GA-PSO method for evolving architecture and short connections of deep convolutional neural networks | |
Myronenko et al. | Accounting for dependencies in deep learning based multiple instance learning for whole slide imaging | |
CN108052862A (zh) | 年龄预估方法和装置 | |
CN110263236B (zh) | 基于动态多视图学习模型的社交网络用户多标签分类方法 | |
CN109767312A (zh) | 一种信用评估模型训练、评估方法与装置 | |
CN114299349B (zh) | 一种基于多专家系统和知识蒸馏的众包图像学习方法 | |
CN108182597A (zh) | 一种基于决策树和逻辑回归的点击率预估方法 | |
WO2016165058A1 (en) | Social prediction | |
CN111178399A (zh) | 数据处理方法及装置、电子设备和计算机可读存储介质 | |
CN109447110A (zh) | 综合邻居标签相关性特征和样本特征的多标签分类的方法 | |
Liu et al. | Teacher-student compression with generative adversarial networks | |
CN116227624A (zh) | 面向异构模型的联邦知识蒸馏方法和系统 | |
CN114218457B (zh) | 一种基于转发社交媒体用户表征的假新闻检测方法 | |
WO2023024408A1 (zh) | 用户特征向量确定方法、相关设备及介质 | |
Huang et al. | An Ad CTR prediction method based on feature learning of deep and shallow layers | |
CN114330514A (zh) | 一种基于深度特征与梯度信息的数据重建方法及系统 | |
CN110008348A (zh) | 结合节点和边进行网络图嵌入的方法和装置 | |
CN110717537B (zh) | 训练用户分类模型、执行用户分类预测的方法及装置 | |
CN116306969A (zh) | 基于自监督学习的联邦学习方法和系统 | |
CN111292062A (zh) | 基于网络嵌入的众包垃圾工人检测方法、系统及存储介质 | |
CN116563602A (zh) | 基于类别级软目标监督的细粒度图像分类模型训练方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20211213 Address after: 10 / F, building B3, Huizhi science and Technology Park, 8 Hengtai Road, Nanjing Economic and Technological Development Zone, Nanjing, Jiangsu Province 210000 Patentee after: Jiangsu Fenghuang Intelligent Education Research Institute Co.,Ltd. Address before: No. 29, Qinhuai District, Qinhuai District, Nanjing, Jiangsu Patentee before: Nanjing University of Aeronautics and Astronautics |