CN112906763A - 一种利用跨任务信息的数字图像自动标注方法 - Google Patents
一种利用跨任务信息的数字图像自动标注方法 Download PDFInfo
- Publication number
- CN112906763A CN112906763A CN202110133675.3A CN202110133675A CN112906763A CN 112906763 A CN112906763 A CN 112906763A CN 202110133675 A CN202110133675 A CN 202110133675A CN 112906763 A CN112906763 A CN 112906763A
- Authority
- CN
- China
- Prior art keywords
- model
- target
- models
- task
- domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000002372 labelling Methods 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 24
- 239000011159 matrix material Substances 0.000 claims abstract description 7
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 11
- 238000013145 classification model Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000011478 gradient descent method Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 2
- 230000005012 migration Effects 0.000 abstract description 13
- 238000013508 migration Methods 0.000 abstract description 13
- 230000000694 effects Effects 0.000 abstract description 7
- 238000013526 transfer learning Methods 0.000 abstract 2
- 239000000284 extract Substances 0.000 abstract 1
- 230000000087 stabilizing effect Effects 0.000 abstract 1
- 238000000605 extraction Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种利用跨任务信息的数字图像自动标注方法。迁移学习已成功应用于图像标注任务中标注样本不足的场景。通过利用相关领域的知识,迁移学习可提高目标任务模型的效果。然而在许多图像标注场景中,难以保证辅助领域与目标任务有较强的相关性,因此迁移算法往往难以稳定地取得效果提升。本发明通过矩阵分解技术从辅助领域模型中提取领域间共有知识,并利用此共有知识对目标模型的有偏正则化实现了知识迁移。在领域间相关性不确定的情况下实现目标任务模型稳定的效果提升,在标注样本数量不足的情况下学得高效模型。
Description
技术领域
本发明属于数字图像标注技术领域,具体涉及一种利用跨任务信息的数字图像自动标注方法。
背景技术
数字图像标注是人工智能应用中的常见任务。现有图像标注模型的训练往往需要大量标注样本,代价高昂。然而,由于现实世界中物体对象的出现概率分布为长尾分布,存在大量对象类别仅能收集到少量标注样本。同时,有些任务领域本身就带有难以获取目标任务对应标注数据的属性。例如在医疗健康和生物信息领域,数据的标注需要专家给出,标注代价极高。除此之外,也有些任务存在训练数据和预测分布存在差异而无法进行泛化的情况。例如在计算机视觉领域中的手机照片分类任务,由于不可控的任务场景中的光照、朝向、清晰度等问题,从公共数据集上学得的模型通常无法在目标任务上获取良好泛化效果,无法满足用户需求。一个解决方案是使用模型迁移算法,利用相关任务的模型辅助目标任务上的模型训练,通过跨领域的知识迁移实现目标模型的效果提升。通常利用在超大数据集上训练得到的深度模型(VGG,ResNet等)抽取图像的一般特征。在此特征基础上进行目标任务线性分类模型的训练。现有模型迁移算法往往直接将相关任务的分类模型作用到目标任务样本或模型上,利用辅助模型的加权组合表示或约束目标模型。然而,在辅助领域与目标任务相关性较低时,通常方法包含大量无用的知识迁移,无法稳定有效地提升目标模型效果。
发明内容
发明目的:为了克服在领域相关性较低时,难以利用辅助领域模型提升目标模型性能的问题,本发明提供了一种利用跨任务信息的数字图像自动标注方法,
技术方案:为实现上述目的,本发明采用的技术方案为:
一种利用跨任务信息的数字图像自动标注方法,包括以下步骤:
步骤1:收集相关图像标注任务上的预训练模型,并由用户判断模型的丰富程度,若足够丰富则转到步骤2,否则转到步骤4;
步骤2:利用丰富的辅助模型进行领域共享知识的抽取,即获取共享基模型集合D;
步骤3:利用共享基模型集合D对目标模型wt进行有偏正则化约束,同时最小化模型wt的经验损失,输出目标模型wt;
步骤4:利用步骤1收集到的辅助模型以及当前任务少量标注样本上学得的较差模型,同时进行领域共享知识D抽取,模型wt的经验误差最小化与有偏正则化,输出目标模型wt;
步骤5:利用步骤3或4学得的标注模型,对经过与辅助模型相同预处理方式得到的数字图像样本进行标注预测,选择预测概率最大的类别作为图像标记。
进一步的:步骤2中抽取领域共享基模型集合D的具体方法为:
我们假设在来自多个相关的图像领域的模型间,存在一组通用基础模型D可用于表示每个领域上的模型中的共有知识部分,比如多领域任务共有的形状或纹理知识。假设共搜集到m个辅助模型其中d为图像抽取到的特征维度;设D∈Rd×k,Vs∈Rk×m。假设收集到较多的辅助模型来自与目标任务具有相似的形状、纹理、颜色或场景等特征的标注任务,则认为收集到了丰富的辅助模型,这种情况下我们认为从辅助模型中可以直接获得对目标任务较为有效的共有知识。因此我们基于上述想法采用矩阵分解的方式抽取共享基模型集合D,得到了下列优化目标:
其中λ为控制权重矩阵Vs每列光滑程度的超参数,需根据问题搜索最优值;k为基模型的数量,在(3,min(d,2m/3))中搜索最优值。由于我们希望抽取到对每个领域都有用的基模型,我们对模型权重Vs采用2,1范数作为约束,使每一个辅助模型对应的基模型权重分布尽量光滑。
进一步的:可通过梯度下降求解式(1)。不同于直接对所有变量求导的常用梯度下降法,我们为本发明提出的式(1)专门设计了一种分块最速梯度下降法,在固定某些变量的情况下找到其它变量的最优值,依次更新变量迭代收敛到局部最优。具体如下:首先将变量D,Vs以标准正态分布初始化,D在Vs固定的情况下,对优化目标求导并使梯度为零,得到D的更新式:接着固定D使目标函数关于Vs的梯度为零,由于我们设计的目标函数式(1)的特殊性,我们仅能获得Vs的隐式更新式:(DTD)Vs+VsM=DTWs。其中M=diag(1/||vi||,i=1,...),vi为Vs中的第i列;Vs的隐式更新式为Sylvester方程,形如AX+XB=Q,通过python包scipy中的scipy.linalg._solvers.solve_sylvester(A,B,Q)求解;由于M为关于Vs的变量,需重复求解此式直到收敛获取固定D情况下Vs的最优值。依次重复D与Vs的更新直到收敛,由目标函数的块凸性可保证收敛到局部最优,得到共享基模型集合D。接着即可利用D对通过有偏最小化目标模型的经验损失学习目标模型。
进一步的:所述步骤3对目标模型wt经验损失的有偏最小化的具体方法为:
在抽取到对目标任务较为有效的基模型集合D之后。假设目标任务图像有c个类别,将线性模型推广到多分类设Vt∈Rk×c。为了使学得的模型能良好的应用于目标图像标注任务,我们结合目标任务的少两样本标注与领域共用知识设计了模型学习方法,通过优化下式可学得目标模型Wt:
其中分别为目标任务的样本与标记,L(·)为任意可求梯度的损失函数,λ,μ为需要搜索的超参数。通过同时最小化模型分类的损失函数以及基模型对目标模型的表达损失,我们利用领域间共有的模型先验知识表达目标模型的共有知识部分,同时也利用目标任务的标注信息尽可能地学习目标任务的特有知识。式(2)可通过分块最速梯度下降求解,类似地分别固定Vt与Wt,依次更新直到目标函数收敛可得目标分类模型Wt。
进一步的:所述步骤4同时抽取领域共享基模型集合D与训练有偏目标模型的具体方法为:
假设目标任务图像有c个类别,将线性模型推广到多分类设 假设收集到的辅助模型来自与目标任务具有较少相似特征的标注任务,则认为没有收集到丰富的辅助模型,这种情况下我们认为仅从低质量辅助模型中抽取的多领域间共有知识难以保证能学得高效的目标模型。为了提高领域间抽取知识对目标任务的有效性以及更准确地刻画领域共有知识,我们设计了以下优化目标以学习目标模型Wt:
其中分别为目标任务的图像与其标记, D∈Rd×k,Vs∈Rk×m,Vt∈Rk×c,L(·)为任意可求梯度的损失函数,λ,μ,η为需要搜索的超参数。通过同时利用辅助模型与更新过程中初步学得的目标模型进行知识抽取,更好地刻画了领域共有知识。通过同时进行知识抽取与目标标注任务的学习,进一步提高了抽取所得知识对目标任务的有效性。式(3)可通过分块最速梯度下降求解,通过结合权利要求3、4中的分块最速梯度下降法,依次更新所有变量直至目标函数收敛到局部最优可得目标分类模型Wt。
有益效果:本发明通过利用容易获得的相关任务领域充分训练的线性模型,抽取领域间共享的基模型集合,对目标任务模型权重进行有偏正则化提高目标模型性能,在辅助领域与目标任务相关性较弱的情况下实现了领域模型间有效的知识迁移,在目标任务标注数据不足的情况下学得了高效的预测模型。具体的,本发明根据搜集到的相关任务领域模型的丰富程度选择不同的方式抽取领域共享基模型集合。在辅助模型较多时,先通过矩阵分解获取领域共享的基模型,抽取领域间的共享知识,然后利用其对目标预测模型权重进行有偏正则化实现知识迁移;在辅助模型较少或相关性普遍较低时,同时利用辅助模型与目标域少量标注数据联合进行领域共享知识抽取与目标任务模型预测误差最小化,利用目标域的信息帮助选择共享知识的抽取。常见模型迁移方法通常直接将辅助模型作用到目标任务数据上进行模型加权组合或是利用其进行目标模型的有偏正则化,而当辅助模型与目标任务相关性较差时,辅助模型对目标数据的预测效果较差且模型中含有大量对目标任务无用的知识,直接将其作用到目标数据模型无法获取理想的结果。在各种辅助模型相关性大小、数量多少的情况下,本发明设计了有效的领域模型知识迁移方法,稳定提升了模型预测性能,而无需用户对相关领域模型进行手动挑选,避免了人为判断领域模型相关程度与设置相关性阈值挑选模型的困难性,解决了在标注数据不足的情况下有效利用相关领域模型提升目标模型性能的问题。
附图说明
图1是本发明机制的流程图;
图2是基模型权重学习的流程图;
图3是知识抽取与迁移的流程图;
图4是联合知识抽取与模型迁移的流程图。
具体实施方式
下面结合附图对本发明作更进一步的说明。
实施例
如图1所示为本发明机制的流程图。首先搜集相关任务辅助模型并判断其丰富程度(辅助模型的数量及与目标任务的相关性)。在辅助模型较丰富的情况下,首先利用辅助模型的分解进行领域共享基模型集合D的抽取,然后将D对目标模型的加权表出作为模型训练目标的有偏正则化项,通过优化目标函数得到模型wt。而在辅助模型不丰富的情况下,同时进行领域共享基模型集合D的抽取与目标模型wt的有偏正则化学习,优化目标函数直到收敛可获得高效目标模型wt。
图2所示为基模型权重学习的流程图。本发明采用交替更新的方式抽取共享基模型集合,需多次在固定模型与基模型集合的情况下,求解模型基于基模型集合的规则化权重即V。首先根据是否为第一轮更新选择是否随机初始化基模型权重V,我们采用标准正态分布。然后计算V每列2范数倒数的对角阵M=diag(1/||vi||,i=1,...)。接着根据现有的D,W,M解Sylvester方程(DTD)V+VM=DTW,并根据对应目标函数(1)的收敛与否决定是否结束更新,或进行下一次迭代。收敛结束条件可设置为V的变化幅度或速度。
图3所示为知识抽取与迁移的流程图,代表了在丰富辅助模型情况下目标模型的训练过程。首先按标准正态分布初始化目标模型Wt与基模型集合D。根据输入的相关任务模型Ws按更新基模型集合D。然后利用图2流程更新基模型权重Vs。重复更新D,Vs直到式(1)收敛,获得良好抽取的基模型集合D。然后根据D与目标任务样本X,Y更新目标模型权重。利用图2流程更新基模型权重Vt。重复更新Wt,Vt直到式(2)收敛,输出目标模型通常收敛结束条件可根据函数值的变化幅度或速度设置。
图4所示为联合知识抽取与模型迁移的流程图,代表了在辅助模型较少或较差情况下目标模型的训练过程。首先按标准正态分布初始化目标模型Wt与基模型集合D。假设我们这里采用均方误差作为损失函数。根据输入的相关任务模型Ws与目标任务样本X,Y,按更新目标模型Wt。然后按更新基模型集合D。接着分别利用图2流程更新基模型权重Vs,Vt。重复上述更新过程直到式(3)收敛,输出目标模型通常收敛结束条件可根据函数值的变化幅度或速度设置。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (5)
1.一种利用跨任务信息的数字图像自动标注方法,其特征在于:包括以下步骤:
步骤1:收集相关图像标注任务上的预训练模型,并由用户判断模型的丰富程度,若足够丰富则转到步骤2,否则转到步骤4;
步骤2:利用丰富的辅助模型进行领域共享知识的抽取,即获取共享基模型集合D;
步骤3:利用共享基模型集合D对目标模型wt进行有偏正则化约束,同时最小化模型wt的经验损失,输出目标模型wt;
步骤4:利用步骤1收集到的辅助模型以及当前任务少量标注样本上学得的较差模型,同时进行领域共享知识D抽取,模型wt的经验误差最小化与有偏正则化,输出目标模型wt;
步骤5:利用步骤3或4学得的标注模型,对经过与辅助模型相同预处理方式得到的数字图像样本进行标注预测,选择预测概率最大的类别作为图像标记。
3.根据权利要求2所述的一种利用跨任务信息的数字图像自动标注方法,其特征在于:通过分块最速梯度下降法求解式(1),具体如下:首先将变量D,Vs以标准正态分布初始化,D在Vs固定的情况下,对优化目标求导并使梯度为零,得到D的更新式:接着固定D使目标函数关于Vs的梯度为零,获得Vs的隐式更新式:其中M=diag(1/‖vi‖,i=1,…),vi为Vs中的第i列;Vs的隐式更新式为Sylvester方程,形如AX+XB=Q,通过python包scipy中的scipy.linalg._solvers.solve_sylvester(A,B,Q)求解;M为关于Vs的变量,需重复求解Vs的隐式更新式直到收敛获取固定D情况下Vs的最优值;依次重复D与Vs的更新直到收敛,由目标函数的块凸性可保证收敛到局部最优,得到共享基模型集合D。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110133675.3A CN112906763B (zh) | 2021-02-01 | 2021-02-01 | 一种利用跨任务信息的数字图像自动标注方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110133675.3A CN112906763B (zh) | 2021-02-01 | 2021-02-01 | 一种利用跨任务信息的数字图像自动标注方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112906763A true CN112906763A (zh) | 2021-06-04 |
CN112906763B CN112906763B (zh) | 2024-06-14 |
Family
ID=76122307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110133675.3A Active CN112906763B (zh) | 2021-02-01 | 2021-02-01 | 一种利用跨任务信息的数字图像自动标注方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112906763B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113642708A (zh) * | 2021-08-13 | 2021-11-12 | 北京赛目科技有限公司 | 一种车辆环境等级识别模型的训练方法、识别方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105701509A (zh) * | 2016-01-13 | 2016-06-22 | 清华大学 | 一种基于跨类别迁移主动学习的图像分类方法 |
US20190258671A1 (en) * | 2016-10-28 | 2019-08-22 | Vilynx, Inc. | Video Tagging System and Method |
CN110363122A (zh) * | 2019-07-03 | 2019-10-22 | 昆明理工大学 | 一种基于多层特征对齐的跨域目标检测方法 |
-
2021
- 2021-02-01 CN CN202110133675.3A patent/CN112906763B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105701509A (zh) * | 2016-01-13 | 2016-06-22 | 清华大学 | 一种基于跨类别迁移主动学习的图像分类方法 |
US20190258671A1 (en) * | 2016-10-28 | 2019-08-22 | Vilynx, Inc. | Video Tagging System and Method |
CN110363122A (zh) * | 2019-07-03 | 2019-10-22 | 昆明理工大学 | 一种基于多层特征对齐的跨域目标检测方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113642708A (zh) * | 2021-08-13 | 2021-11-12 | 北京赛目科技有限公司 | 一种车辆环境等级识别模型的训练方法、识别方法及装置 |
CN113642708B (zh) * | 2021-08-13 | 2024-05-14 | 北京赛目科技有限公司 | 一种车辆环境等级识别模型的训练方法、识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112906763B (zh) | 2024-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110956185B (zh) | 一种图像显著目标的检测方法 | |
Hao et al. | An end-to-end architecture for class-incremental object detection with knowledge distillation | |
CN109741332B (zh) | 一种人机协同的图像分割与标注方法 | |
CN108256561B (zh) | 一种基于对抗学习的多源域适应迁移方法及系统 | |
CN109754015B (zh) | 用于画作多标签识别的神经网络及相关方法、介质和设备 | |
CN108399428B (zh) | 一种基于迹比准则的三元组损失函数设计方法 | |
CN114492574A (zh) | 基于高斯均匀混合模型的伪标签损失无监督对抗域适应图片分类方法 | |
CN110569886A (zh) | 一种双向通道注意力元学习的图像分类方法 | |
CN111079847B (zh) | 一种基于深度学习的遥感影像自动标注方法 | |
CN110598018B (zh) | 一种基于协同注意力的草图图像检索方法 | |
CN110705591A (zh) | 一种基于最优子空间学习的异构迁移学习方法 | |
WO2021227091A1 (zh) | 一种基于图卷积神经网络的多模态分类方法 | |
CN113326731A (zh) | 一种基于动量网络指导的跨域行人重识别算法 | |
CN112819065B (zh) | 基于多重聚类信息的无监督行人难样本挖掘方法和系统 | |
CN110443257B (zh) | 一种基于主动学习的显著性检测方法 | |
CN114548279A (zh) | 一种基于蒸馏网络的半监督图像分类方法 | |
CN114357221B (zh) | 一种基于图像分类的自监督主动学习方法 | |
CN115563327A (zh) | 基于Transformer网络选择性蒸馏的零样本跨模态检索方法 | |
CN112905762A (zh) | 一种基于同等注意力图网络的视觉问答方法 | |
CN114444605B (zh) | 一种基于双重不平衡场景下的无监督域适应方法 | |
CN115439715A (zh) | 基于反标签学习的半监督少样本图像分类学习方法及系统 | |
CN116258990A (zh) | 一种基于跨模态亲和力的小样本参考视频目标分割方法 | |
CN115035341A (zh) | 一种自动选择学生模型结构的图像识别知识蒸馏方法 | |
CN115080734A (zh) | 一种基于注意力机制与强化学习的跨域情感分类方法 | |
CN114860973A (zh) | 一种面向小样本场景的深度图像检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |