CN112784927B

CN112784927B - 一种基于在线学习的半自动图像标注方法

Info

Publication number: CN112784927B
Application number: CN202110177362.8A
Authority: CN
Inventors: 傅瑞罡; 高颖慧; 董小虎; 李飚; 朱永锋
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2021-02-09
Filing date: 2021-02-09
Publication date: 2022-03-04
Anticipated expiration: 2041-02-09
Also published as: CN112784927A

Abstract

本发明属于数据工程领域，具体公开了一种基于在线学习的半自动图像标注方法，用于为基于学习的图像目标检测方法制备训练数据。本方法针对目标检测领域中的手工制备训练数据耗时问题，通过边标注边学习的方式，提取并利用手动标注过程中存在的监督信息，提高了图像标注的自动化程度，提升了数据集制备的效率。

Description

一种基于在线学习的半自动图像标注方法

技术领域

本发明涉及一种基于在线学习的半自动图像标注方法，属于数据工程领域，用于为基于学习的图像目标检测方法制备训练数据。

背景技术

近年来，以卷积神经网络为代表的深度学习技术凭借其强大的特征学习能力，在图像目标检测领域的应用越来越广泛。训练数据的制备是特征学习的必要条件。检测领域的数据标注包括框选和注释两个步骤。框选指选定目标，并标出目标的外界矩形框；注释指提供目标的类别信息。

目前，训练数据的制备通常依靠人力标注，配合一些交互式的辅助标注工具可以在一定程度上减轻了标注者的负担。这些标注工具，如labelme、labelimg等，提供了在图片上画多边形边界、注释物体类别等基本功能。但尽管如此，整体的标注效率仍然非常低下，每个目标实例的标注需要花费数十秒。

为了节省标注的人力成本，一些研究探索了更简单的标注方法，例如基于眼动的标注方法、基于点的标注方法以及基于框验证的标注方法。基于眼动的标注方法需要配备眼动仪，价格昂贵，适普性不强。基于点的标注方法和基于框验证的标注方法在鲁棒性上稍差，即当目标所处环境较复杂时，方法性能不可靠。因此，研究一种鲁棒性强、自动化程度高的标注方法很有必要。

发明内容

本发明要解决的技术问题是：针对目标检测领域中的手工制备训练数据耗时问题，通过边标注边学习的方式，提取并利用手动标注过程中存在的监督信息，提高图像标注的自动化程度，提升数据集制备的效率。

为解决上述技术问题，本发明提出一种基于在线学习的半自动图像标注方法，所述方法包括四个步骤：

(1)确定待标注图像集中存在的目标类别数，初始化一个多分类的逻辑回归分类器；

(2)输入待标注图像，执行手动标注模式：通过手动框选目标位置、手动注释目标类别，完成对图像中所有目标的标注，并通过这些已标注数据在线训练分类器；

(3)测试分类器性能，并基于分类器性能决定是否由手动标注模式切换至半自动标注模式；

(4)输入待标注图像，执行半自动标注模式：手动框选目标位置，通过分类器自动完成对目标类别的注释。

所述步骤(1)通过以下步骤实现：

1)利用人机交互界面，确定数据集中的目标类别数n；

2)初始化逻辑回归分类器：逻辑回归分类器的初始化即建立一个全零的m×n大小的参数矩阵w，其中，m为预设参数，与目标HOG特征的维度相匹配，n为目标类别数。

所述步骤(2)通过以下步骤实现：

1)利用人机交互界面，手动框选目标位置，手动注释目标类别；

2)提取t时刻目标样本(记t时刻为标注第t个目标样本的时刻)的HOG特征x，x为一个m维的矢量，即x∈R^m×1；

3)获取t时刻目标样本的真实标签y，并计算分类器的交叉熵损失：

其中，w_t,i、w_t,y分别为t时刻分类器参数矩阵w中的第i列和第y列矢量；

4)使用Ftrl方法在线训练分类器模型，以使得分类器的损失变小；记w_t,i,j为t时刻分类器参数矩阵w第i列第j行元素的值，g_t,i,j为分类器交叉熵损失L关于参数w_t,i,j的梯度值，Ftrl 方法的参数更新公式为：

其中，待优化函数中的第一项

w与分类器损失关于参数的梯度有关；第二项

为参数的约束项，用于避免t时刻的迭代结果与从前结果产生过于严重的偏差，稳定损失的收敛；第三项λ₁||w||₁、第四项

分别为参数的L₁、L₂正则项，用于保证参数的稀疏性；σ_s,i,j、λ₁、λ₂为损失权重；

若已知w_t,i,j，则t+1时刻的w_t+1,i,j求解过程如下：

1.计算损失L关于参数w_t,i,j的梯度g_t,i,j；

2.计算中间变量σ_t,i,j：

其中，α为人为设定的超参数；

3.计算中间变量z_t,i,j：

4.计算中间变量η_t,i,j：

其中，β为人为设定的超参数；

5.更新t+1时刻的参数值w_t+1,i,j：

其中，sgn()表示符号函数，λ₁、λ₂为人为设定的超参数。

所述步骤(3)通过以下步骤实现：

从所有已标注的目标样本中随机采样d个样本组成验证集，记为{x₁,x₂,...,x_d}，对应真实标签为{y₁,y₂,...,y_d}；使用分类器对验证集中的所有目标做类别预测，对于任意样本x_k， k∈{1,2,...,d}，其类别预测结果为：

其中，w_t,i为t时刻w中的第i列矢量；

对比预测类别以及真实标签，分类器在验证集上的分类正确个数为：

其中，y_k是样本x_k对应的真实标签；分类器的分类准确率最终确定为

/d，准确率越高，说明分类器的性能越好；当分类器在验证集上达到设定的分类准确率后，执行半自动标注模式以提升标注的速度。

所述步骤(4)通过以下步骤实现：

1)利用人机交互界面，手动框选目标位置；

2)提取目标的HOG特征x；

3)使用分类器对目标的类别做预测：将目标特征x输入分类器，目标的类别置信度分布如下：

其中，n为目标类别数，p是n维矢量，它的第i个元素p_i对应目标属于第i个类别的置信度，满足0<p_i<1，且

特征x的类别最终判决为：

即为目标的注释结果，这是由分类器自动生成的。

本发明的有益效果：

与现有技术相比，本发明的优点在于通过将注释过程抽象为学习分类问题，实现了标注过程的部分自动化，提升了数据标注的效率。目标类别数越多，效率提升越明显。

附图说明

图1为本发明两种标注模式的示意图；

图2为基于本发明方法的图像标注示意图；

图3为在线学习下的模型准确率收敛曲线。

具体实施方式

为将本发明的目的、内容、优点阐述地更加清晰，以下将结合说明书附图对本发明作进一步详细说明。本发明涉及一种基于在线学习的半自动图像标注方法，包括如下步骤：

所述步骤(1)通过以下步骤实现：

1)利用人机交互界面，确定数据集中的目标类别数n；

所述步骤(2)执行手动标注模式，其流程如图1第一行所示。具体地，它通过以下步骤实现：

1)利用人机交互界面，手动框选目标位置，手动注释目标类别，如图2所示；

其中，w_t,i、w_t,y分别为t时刻分类器参数矩阵w中的第i列和第y列矢量。