CN116342973A

CN116342973A - 一种基于半监督学习的数据标注方法和系统

Info

Publication number: CN116342973A
Application number: CN202310223294.3A
Authority: CN
Inventors: 郑德欣; 杨吉利; 王庆峰
Original assignee: Shanghai Xiding Intelligent Technology Co ltd
Current assignee: Shanghai Xiding Intelligent Technology Co ltd
Priority date: 2023-03-09
Filing date: 2023-03-09
Publication date: 2023-06-27

Abstract

本发明公开了一种基于半监督学习的数据标注方法，包括：从待标注数据中选取第一数量的样本数据，并从样本数据中选取第二数量的数据进行标注，得到第二数量的标注数据；基于样本数据中的未标注数据训练第一半监督模型得到训练后的第一模型，基于标注数据训练第二半监督模型得到训练后的第二模型；将待标注数据分别输入第一模型和第二模型中进行目标检测，得到第一检测结果和第二检测结果；基于第一检测结果和第二检测结果之间的交并比以及置信度对检测框进行筛选，得到检测框真值和待复检检测框。本方案能够大大减少人工标注成本，并提高数据标注的效率和准确度。

Description

一种基于半监督学习的数据标注方法和系统

技术领域

本发明涉及深度学习技术领域，具体涉及一种基于半监督学习的数据标注方法、系统、计算设备及存储介质。

背景技术

对于基于计算机视觉的目标检测及相关任务，为了训练深度学习网络提高其检测精度，需要大量的数据标注。

对于检测框的数据标注，目前常见的数据标注方法，一种是人工标注，这种方法在进行标注和标注结束后复检中，都需要消耗大量时间和人力。同时由于大量数据需要多个标注人员标注，不同人的主观理解不同也会对标注的精度产生影响。另一种是使用预训练模型进行自动标注，即根据已有的模型进行推理，将推理后的标签进行少量人工复检后作为标注的结果。这种方法需要预训练模型具有较好的检测精度，而实际应用中，目标检测模型一般都是针对特定场景，在场景和数据集更换后，难以直接给出较好的推理结果。因此这种方法只适用于已有较好的模型，又需要扩充数据量的已知场景，对于全新的应用场景则难以适用。

因此，需要提供一种数据标注方法，能够节省人力标注成本，提高标注效率和精度，适用于复杂多样化的检测任务，以解决现有技术中存在的问题。

发明内容

本发明提出一种克服上述问题或者至少部分地解决上述问题的一种基于半监督学习的数据标注方法、系统、计算设备及存储介质，通过使用两个半监督学习模型在少量数据行进行训练，再使用训练好的两个模型在大批量数据上进行推理，最后对两个模型输出的检测框基于交并比和置信度进行筛选和修正后得到最终的标注结果。因此，本方案具有节省人力成本，标注效率和精度高的优点，能够更好地将标注数据用于多种场景的深度学习任务。

根据本发明的第一方面，提供一种基于半监督学习的数据标注方法，首先，从待标注数据中选取第一数量的样本数据，并从样本数据中选取第二数量的数据进行标注，得到第二数量的标注数据；然后，基于样本数据训练第一半监督模型得到训练后的第一模型，基于标注数据训练第二半监督模型得到训练后的第二模型。

随后，用于将待标注数据分别输入第一模型和第二模型中进行目标检测，得到第一检测结果和第二检测结果；最后，基于第一检测结果和第二检测结果之间的交并比以及置信度对检测框进行筛选，得到检测框真值和待复检检测框。

可选地，在上述方法中，样本数据的数据分布与待标注数据的数据分布相同，标注数据包括检测框坐标值和物体类别，第一数量大于第二数量。

可选地，在上述方法中，第一半监督模型为基于一致性正则化的半监督模型，第二半监督模型为基于伪标签的半监督模型。

可选地，在上述方法中，基于样本数据中的未标注数据训练第一半监督模型得到训练后的第一模型的步骤包括：对样本数据中的未标注数据分别添加第一扰动和第二扰动，得到第一扰动数据和第二扰动数据；将第一扰动数据和第二扰动数据分别输入第一半监督模型进行目标检测，得到第一标注结果和第二标注结果；计算第一标注结果和第二标注结果之间的一致性损失值和交叉熵损失值；基于一致性损失值和交叉熵损失值调整第一半监督模型的参数，得到训练后的第一模型。

可选地，在上述方法中，第一扰动和第二扰动包括翻转、平移、旋转、剪切、颜色抖动、亮度抖动中任意几种，第一扰动和第二扰动不同。

可选地，在上述方法中，可以基于标注数据训练第二半监督模型，得到训练后的第一优化模型；将样本数据中的未标注数据输入第一优化模型中进行预测，得到伪标签数据；对伪标签数据进行非极大值抑制和置信度过滤，得到过滤后的伪标签数据；基于标注数据和过滤后的伪标签数据训练第一优化模型，得到训练后的第二模型。

可选地，在上述方法中，对第一检测结果和第二检测结果进行非极大值抑制，得到置信度大于第一置信度阈值的检测框；计算同一个待标注数据对应的第一检测框和第二检测框之间的交并比值，将交并比值大于第一交并比阈值的第一检测框和第二检测框确定为匹配。

对于匹配的检测框，如果第一检测框和第二检测框之间的交并比值大于第二交并比阈值，则将置信度较高的检测框确定为检测框真值，否则将置信度较高的检测框作为待复检检测框；

对于未匹配的检测框，将置信度大于第二置信度阈值的检测框作为检测框真值，将置信度小于第二置信度阈值且大于第三置信度阈值的检测框作为待复检检测框。

可选地，在上述方法中，第二置信度阈值大于第三置信度阈值，第三置信度阈值大于第一置信度阈值，第一交并比阈值小于第二交并比阈值，该方法还包括对待复检检测框进行人工修正后的检测框作为检测结果。

根据本发明的第二方面，提供了一种基于半监督学习的数据标注系统，包括：标注模块、训练模块、检测模块和筛选模块。

其中，标注模块，用于从待标注数据中选取第一数量的样本数据，并从样本数据中选取第二数量的数据进行标注，得到第二数量的标注数据。

训练模块，用于基于样本数据中的未标注数据训练第一半监督模型得到训练后的第一模型，基于标注数据训练第二半监督模型得到训练后的第二模型。

推理模块，用于将待标注数据分别输入第一模型和第二模型中进行目标检测，得到第一检测结果和第二检测结果。

筛选模块，用于基于第一检测结果和第二检测结果之间的交并比以及置信度对检测框进行筛选，得到检测框真值和待复检检测框。

根据本发明的第三方面，提供一种计算设备，包括：至少一个处理器；和存储有程序指令的存储器，其中，程序指令被配置为适于由至少一个处理器执行，程序指令包括用于执行上述基于半监督学习的数据标注方法的指令。

根据本发明的第四方面，提供一种存储有程序指令的可读存储介质，当程序指令被计算设备读取并执行时，使得计算设备执行上述的基于半监督学习的数据标注方法。

根据本发明的方案，只需极少量的人工标注得到用于训练两个半监督学习模型的标注数据，使用两个不同的半监督学习模型在少量数据上进行训练，再用训练好的两个模型在大批量数据上进行推理，最后对两个模型的推理结果基于交并比和置信度进行筛选和人工修正，得到最终的标注结果。因此，本方案能够大大节省人力标注成本，并提高数据标注的精度和效率，以便更好地将标注数据用于多种场景的深度学习任务。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了根据本发明一个实施例的计算设备100的结构框图；

图2示出了根据本发明一个实施例的基于半监督学习的数据标注方法200的流程示意图；

图3示出了根据本发明一个实施例的基于半监督学习的数据标注系统300的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

深度学习模型的训练依赖于大量的标注数据，如果标注数据数量不足会导致模型的泛化能力不高，采用人工标注需要耗费大量的人工成本。并且标注人员专业水平不一，对同一目标的理解不同，影响标注的正确性和效率。

现有的自动标注模型依然依赖于标注数据的数量，在具体任务中，标注数据的获取比较困难，如何充分利用无标注、多样化的数据来提升自动标注模型的泛化能力是关键。半监督学习可以充分利用未标记数据训练出泛化能力较强的标注模型。

目前半监督目标检测方法主要有两个方向：一致性正则化和伪标签。一致性正则化是通过比较同一输入添加不同扰动之后输出结果的一致性，更新损失函数的梯度。伪标签方法是利用在少量已标注数据上学习的预训练模型对未标注数据进行推理，经过非极大值抑制后减少大量冗余框，再利用一个置信度阈值去挑选伪标签，最后利用伪标签训练模型。

为了提高数据标注的精度和效率，本方案提供了一种基于半监督学习的数据标注方法，首先人工进行少量检测框的标注，再使用半监督学习模型在少量数据上进行训练，用训练好的模型在大批量未标注数据上进行推理，并对推理的检测框进行筛选，最后对筛选后的检测框进行人工复检修正后，得到最终的数据标注结果。本方案能够减少人工标注成本，充分利用少量已标注数据对半监督学习模型进行训练，能够提高数据标注模型的泛化能力和数据标注的准确度。

图1示出了根据本发明一个实施例的计算设备100的结构图。如图1所示，在基本的配置102中，计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。

取决于期望的配置，处理器104可以是任何类型的处理器，包括但不限于：微处理器（µP）、微控制器（µC）、数字信息处理器（DSP）或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元（ALU）、浮点数单元（FPU）、数字信号处理核心（DSP核心）或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用，或者在一些实现中，存储器控制器118可以是处理器104的一个内部部分。

取决于期望的配置，系统存储器106可以是任意类型的存储器，包括但不限于：易失性存储器（诸如RAM）、非易失性存储器（诸如ROM、闪存等）或者它们的任何组合。计算设备中的物理内存通常指的是易失性存储器RAM，磁盘中的数据需要加载至物理内存中才能够被处理器104读取。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。

在一些实施方式中，应用122可以布置为在操作系统上由一个或多个处理器104利用程序数据124执行指令。操作系统120例如可以是Linux、Windows等，其包括用于处理基本系统服务以及执行依赖于硬件的任务的程序指令。应用122包括用于实现各种用户期望的功能的程序指令，应用122例如可以是浏览器、即时通讯软件、软件开发工具（例如集成开发环境IDE、编译器等）等，但不限于此。当应用122被安装到计算设备100中时，可以向操作系统120添加驱动模块。

在计算设备100启动运行时，处理器104会从存储器106中读取操作系统120的程序指令并执行。应用122运行在操作系统120之上，利用操作系统120以及底层硬件提供的接口来实现各种用户期望的功能。当用户启动应用122时，应用122会加载至存储器106中，处理器104从存储器106中读取并执行应用122的程序指令。

计算设备100还包括储存设备132，储存设备132包括可移除储存器136和不可移除储存器138，可移除储存器136和不可移除储存器138均与储存接口总线134连接。

计算设备100还可以包括有助于从各种接口设备（例如，输出设备142、外设接口144和通信设备146）到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156，它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备（例如，键盘、鼠标、笔、语音输入设备、触摸输入设备）或者其他外设（例如打印机、扫描仪等）之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160，其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。

网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块，并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号，它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例，通信介质可以包括诸如有线网络或者专线网络之类的有线介质，以及诸如声音、射频（RF）、微波、红外（IR）或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。在根据本发明的计算设备100中，应用122包括用于执行本发明的基于半监督学习的数据标注方法200的指令。

图2示出了根据本发明一个实施例的基于半监督学习的数据标注方法200的流程示意图。如图2所示，该方法200始于步骤S210，从待标注数据中选取第一数量的样本数据，并从样本数据中选取第二数量的数据进行标注，得到第二数量的标注数据。

其中，待标注数据是大批量、多样化的未标注数据，可以包括文本、语音、图像、视频等多种类型的数据。

根据本发明的一个实施例，可以从大批量的待标注数据中随机抽取第一数量的样本数据，其中，样本数据的数据分布与待标注数据的数据分布相同。也就是说，先从大批量的待标注数据中抽取小部分样本数据作为后续半监督学习模型的训练集。从原始数据中随机抽取样本数据可以使样本数据中包含原始数据中的目标和场景。

然后，从样本数据中再随机抽取第二数量的数据进行标注，得到物体检测框的标注数据，其中第一数量大于第二数量，标注数据包括物体类别和检测框坐标值。例如，可以取检测框的左上角坐标（x1,y1）、右下角坐标（x2,y2）作为检测框的坐标值，物体类别为class_index，则标签内容为（x1,y1,x2,y2,class_index）

随后执行步骤S220，基于样本数据中的未标注数据训练第一半监督模型得到训练后的第一模型，基于标注数据训练第二半监督模型得到训练后的第二模型。

根据本发明的一个实施例，第一半监督模型为基于一致性正则化的半监督模型，可以对标注数据分别添加第一扰动和第二扰动，得到第一扰动数据和第二扰动数据。其中，第一扰动和第二扰动包括翻转、平移、旋转、剪切、颜色抖动、亮度抖动中任意几种（强数据增强），第一扰动和第二扰动不同。对同一输入数据添加不同的扰动进行一致性预测能够有效利用标注数据。

然后将第一扰动数据和第二扰动数据分别输入第一半监督模型进行目标检测，得到第一标注结果和第二标注结果；并计算第一标注结果和第二标注结果之间的一致性损失值和交叉熵损失值。最后，基于一致性损失值和交叉熵损失值调整第一半监督模型的参数，得到训练后的第一模型。

第二半监督模型为基于伪标签的半监督模型，可以先基于标注数据训练第二半监督模型，得到训练后的第一优化模型。然后，将样本数据中的未标注数据输入第一优化模型中进行预测，得到伪标签数据；对伪标签数据进行非极大值抑制和置信度过滤，得到过滤后的伪标签数据。最后，基于标注数据和过滤后的伪标签数据训练第一优化模型，得到训练后的第二模型。

在使用标注数据完成两个半监督模型的训练之后，接着可以执行步骤S230，将待标注数据分别输入第一模型和第二模型中进行目标检测，得到第一检测结果和第二检测结果。

在大批量未标注数据上完成推理之后，得到推理的检测框，最后就可以执行步骤S240，基于第一检测结果和第二检测结果之间的交并比以及置信度对检测框进行筛选，得到检测框真值和待复检检测框。

具体地，可以首先对第一检测结果和第二检测结果进行非极大值抑制处理和置信度过滤，得到置信度大于第一置信度阈值的检测框。

由于在目标检测过程中，在同一目标位置上会产生大量的候选框，这些候选框之间会存在重叠现象，需要利用非极大值抑制来找到最佳的检测框，并消除冗余的检测框。

其中，NMS算法流程包括：1）设定IOU（交并比）阈值，根据置信度得分进行排序；2）将置信度最高的检测框添加到最终输出列表中，将其从检测框列表中删除；3）计算所有检测框的面积；4）计算置信度最高的检测框与其他候选框的IOU值，删除IOU值大于IOU阈值的检测框；5）如果还剩余的检测框，则重复上诉步骤3，直至检测框列表为空。通过非极大值抑制（NMS）可以选取邻域内置信度最高的检测框并抑制置信度低的检测框，过滤后得到置信度大于第一置信度阈值的检测框。

然后，计算同一个待标注数据对应的第一检测框和第二检测框之间的交并比值，将交并比值大于第一交并比阈值的第一检测框和第二检测框确定为匹配。

需要说明的是，对于第一模型输出的第一检测框，如果有多个检测框与其匹配，则选取交并比最大的检测框与其配对。

对于匹配的检测框，如果第一检测框和第二检测框之间的交并比值大于第二交并比阈值，则将第一检测框和第二检测框中置信度较高的检测框确定为检测框真值，否则将置信度较高的检测框作为待复检检测框。

对于未匹配的检测框，将置信度大于第二置信度阈值的检测框作为检测框真值，将置信度小于第二置信度阈值且大于第三置信度阈值的检测框作为待复检检测框。也就是说，如果两个模型输出的同一输入的两个检测框未匹配成功，则说明仅有一个模型检测出该检测框，所以第二置信度阈值需要设置得较高，该模型检测出的检测框的置信度非常高才能直接将其确定为真值。

在上述步骤中，第二置信度阈值大于第三置信度阈值，第三置信度阈值大于第一置信度阈值，第一交并比阈值小于第二交并比阈值。

最后对全部待标注数据的检测框筛选完成后，对待复检检测框进行人工修正，将修正后的检测框作为最终的目标检测结果。

根据本发明提供的技术方案，使用极少量的人工标注数据训练两个半监督学习模型，再用训练好的两个模型在大批量数据上进行推理，最后在基于检测框之间的交并比和检测框的置信度对两个模型的推理结果进行筛选，得到筛选后的检测框真值和待复检检测框，对待复检检测框修正后即得到最终的推理结果。本方案能够大大降低人工标注成本，具有标注速度快，标注精度高的优点。

通过本发明提供的数据标注方法可以更好的支持多种应用场景的深度学习任务，具有较好的通用性。

图3示出了根据本发明一个实施例的基于半监督学习的数据标注系统300的结构框图。如图3所示，该系统300可以包括标注模块310、训练模块320、推理模块330和筛选模块340。

其中，标注模块310可以从待标注数据中选取第一数量的数据进行标注，得到第一数量的标注数据，然后从样本数据中随机抽取第二数量的数据进行人工标注，得到标注数据。

具体地，标注模块310可以从大批量待标注数据中随机选取少量数据作为样本数据，用于训练半监督学习模型。样本数据中的未标注数据和标注数据可以分别用于训练第一半监督模型和第二半监督模型。

训练模块320可以基于标注模块310得到的未标注数据训练第一半监督模型得到训练后的第一模型，基于标注数据训练第二半监督模型得到训练后的第二模型。

具体地，训练模块320可以用样本数据（包含少量标注数据）分别训练基于一致性正则化的第一半监督模型和基于伪标签的第二半监督模型，得到训练后的第一模型和第二模型。

推理模块330可以将待标注数据分别输入第一模型和第二模型中进行目标检测，得到第一检测结果和第二检测结果。

也就是说，对于同一个输入图像会分别得到两个模型推理处的第一检测结果和第二检测结果。

筛选模块340可以基于第一检测结果和第二检测结果之间的交并比以及置信度对检测框进行筛选，得到检测框真值和待复检检测框。

筛选模块340可以先基于第一置信度阈值对所有的检测结果进行非极大值抑制。然后对同一输入图像的两个检测结果进行匹配，如果匹配成功则根据两者之间的交并比判断是检测框真值还是待复检检测框。如果未匹配成功则根据检测框的置信度判断检测框是真值还是待复检检测框。对于待复检检测框经过人工复检修正后，得到最终的检测结果。

通过本发明提供的基于半监督学习的数据标注方法和系统，只需极少量的人工标注得到用于训练两个半监督学习模型的标注数据，使用两个不同的半监督学习模型在少量数据上进行训练，再用训练好的两个模型在大批量数据上进行推理，最后对两个模型的推理结果基于交并比和置信度进行筛选和人工修正，得到最终的标注结果。因此，本方案能够大大节省人力标注成本，并提高数据标注的精度和效率。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中，或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书（包括伴随的权利要求、摘要和附图）中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书（包括伴随的权利要求、摘要和附图）中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

此外，所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此，具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外，装置实施例的在此所述的元素是如下装置的例子：该装置用于实施由为了实施该发明的目的的元素所执行的功能。

如在此所使用的那样，除非另行规定，使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例，并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。

尽管根据有限数量的实施例描述了本发明，但是受益于上面的描述，本技术领域内的技术人员明白，在由此描述的本发明的范围内，可以设想其它实施例。此外，应当注意，本说明书中使用的语言主要是为了可读性和教导的目的而选择的，而不是为了解释或者限定本发明的主题而选择的。因此，在不偏离所附权利要求书的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围，对本发明所做的公开是说明性的而非限制性的，本发明的范围由所附权利要求书限定。

Claims

1.一种基于半监督学习的数据标注方法，其特征在于，包括：

从待标注数据中选取第一数量的样本数据，并从所述样本数据中选取第二数量的数据进行标注，得到第二数量的标注数据；

基于所述样本数据中的未标注数据训练第一半监督模型得到训练后的第一模型，基于所述标注数据训练第二半监督模型得到训练后的第二模型；

将所述待标注数据分别输入所述第一模型和第二模型中进行目标检测，得到第一检测结果和第二检测结果；

基于所述第一检测结果和第二检测结果之间的交并比以及置信度对检测框进行筛选，得到检测框真值和待复检检测框。

2.根据权利要求1所述的数据标注方法，其特征在于，所述样本数据的数据分布与所述待标注数据的数据分布相同，所述标注数据包括检测框坐标值和物体类别，所述第一数量大于第二数量。

3.根据权利要求2所述的数据标注方法，其特征在于，所述第一半监督模型为基于一致性正则化的半监督模型，所述第二半监督模型为基于伪标签的半监督模型，所述基于所述样本数据中的未标注数据训练第一半监督模型得到训练后的第一模型的步骤包括：

对样本数据中的未标注数据分别添加第一扰动和第二扰动，得到第一扰动数据和第二扰动数据；

将所述第一扰动数据和第二扰动数据分别输入第一半监督模型进行目标检测，得到第一标注结果和第二标注结果；

计算第一标注结果和第二标注结果之间的一致性损失值和交叉熵损失值；

基于所述一致性损失值和交叉熵损失值调整所述第一半监督模型的参数，得到训练后的第一模型。

4.根据权利要求3所述的数据标注方法，其特征在于，所述第一扰动和第二扰动包括翻转、平移、旋转、剪切、颜色抖动、亮度抖动中任意几种，所述第一扰动和第二扰动不同。

5.根据权利要求3所述的数据标注方法，其特征在于，所述基于所述标注数据训练第二半监督模型得到训练后的第二模型的步骤包括：

基于所述标注数据训练所述第二半监督模型，得到训练后的第一优化模型；

将样本数据中的未标注数据输入所述第一优化模型中进行预测，得到伪标签数据；

对所述伪标签数据进行非极大值抑制和置信度过滤，得到过滤后的伪标签数据；

基于所述标注数据和过滤后的伪标签数据训练所述第一优化模型，得到训练后的第二模型。

6.根据权利要求1所述的数据标注方法，其特征在于，所述基于第一检测结果和第二检测结果之间的交并比以及置信度对检测框进行筛选，得到检测框真值和待复检检测框的步骤包括：

对所述第一检测结果和第二检测结果进行非极大值抑制，得到置信度大于第一置信度阈值的检测框；

计算同一个待标注数据对应的第一检测框和第二检测框之间的交并比值，将交并比值大于第一交并比阈值的第一检测框和第二检测框确定为匹配；

7.根据权利要求6所述的数据标注方法，其特征在于，所述第二置信度阈值大于第三置信度阈值，第三置信度阈值大于第一置信度阈值，所述第一交并比阈值小于第二交并比阈值，所述方法还包括：

对所述待复检检测框进行人工修正后的检测框作为检测结果。

8.一种基于半监督学习的数据标注系统，其特征在于，包括：

标注模块，用于从待标注数据中选取第一数量的样本数据，并从所述样本数据中选取第二数量的数据进行标注，得到第二数量的标注数据；

训练模块，用于基于所述样本数据中的未标注数据训练第一半监督模型得到训练后的第一模型，基于所述标注数据训练第二半监督模型得到训练后的第二模型；

推理模块，用于将所述待标注数据分别输入所述第一模型和第二模型中进行目标检测，得到第一检测结果和第二检测结果；以及

9.一种计算设备，包括：

至少一个处理器；和存储有程序指令的存储器，其中，所述程序指令被配置为适于由所述至少一个处理器执行，所述程序指令包括用于执行如权利要求1-7中任一项所述的基于半监督学习的数据标注方法的指令。

10.一种存储有程序指令的可读存储介质，当所述程序指令被计算设备读取并执行时，使得所述计算设备执行如权利要求1-7任意一项中所述的基于半监督学习的数据标注方法。