CN112200274B

CN112200274B - 一种目标检测方法、装置、电子设备和存储介质

Info

Publication number: CN112200274B
Application number: CN202011424797.XA
Authority: CN
Inventors: 吴子平; 曹杨; 曾真
Original assignee: Hunan Labsci Medical Robot Co ltd; Hunan Solai Intelligent Technology Co ltd
Current assignee: Zhuhai Laibosai Medical Robot Co ltd
Priority date: 2020-12-09
Filing date: 2020-12-09
Publication date: 2021-03-30
Anticipated expiration: 2040-12-09
Also published as: CN112200274A

Abstract

本申请公开了一种目标检测方法，包括：根据获取到的未标注数据集合确定随机伪目标，并确定随机伪目标的标注数据；使用未标注数据集合和标注数据训练得到伪目标检测模型；使用人工已标注数据集合继续训练伪目标检测模型得到目标检测模型；获取待检测目标数据，并将待检测目标数据输入目标检测模型，得到待检测目标的检测结果。该方法充分利用了未标注数据集合，并根据未标注数据集合得到伪目标检测模型，再将人工已标注数据集合输入到该伪目标检测模型得到目标检测模型，最终得到检测结果，能够提高目标检测模型效果。本申请同时还提供了一种目标检测装置、一种电子设备和存储介质，具有上述有益效果。

Description

一种目标检测方法、装置、电子设备和存储介质

技术领域

本申请涉及目标检测技术领域，特别涉及一种目标检测方法、装置、电子设备和存储介质。

背景技术

目前，计算机视觉技术及相关深度学习应用广泛，例如，应用于医疗诊断相关显微镜下微观视野方面。其中，监督学习是指用来训练的数据中含有人工标注的信息，自监督学习是指从数据本身提取相关事实作为标注，不需人工标注。

相关技术中，目标检测应用大部分基于有标注数据进行监督训练，即在图像中标注好待检测目标的位置，大小和目标类别，在训练时采取较传统的翻转，变形等基于标注数据不被严重破坏的方法进行数据增强，但是存在数据利用率较低的问题，即仅利用了人工标注数据进行训练，目标检测模型性能相对较低，且在具体的应用中往往需要大量的人工标注数据，标注成本也十分高昂。

发明内容

本申请的目的是提供一种目标检测方法，能够提高了数据利用率和目标检测的效果。其具体方案如下：

第一方面，本申请公开了一种目标检测方法，包括：

根据获取到的未标注数据集合确定随机伪目标，并确定所述随机伪目标的标注数据；

使用所述未标注数据集合和所述标注数据训练得到伪目标检测模型；

使用人工已标注数据集合继续训练所述伪目标检测模型得到目标检测模型；

获取待检测目标数据，并将所述待检测目标数据输入所述目标检测模型，得到所述待检测目标的检测结果。

可选的，根据获取到的未标注数据集合确定随机伪目标，包括：

当所述未标注数据集合为未标注图像集合时，对所述未标注图像集合中的各个图像选取随机框，并将所述随机框作为所述随机伪目标。

可选的，对所述未标注图像集合中的各个图像选取随机框，包括：

对所述未标注图像集合中各个图像选取预设数量的区域，并将所述区域作为初始随机框；所述初始随机框的交并比小于预设阈值；

对所述初始随机框进行特征处理，得到所述随机框。

可选的，对所述初始随机框进行特征处理，得到所述随机框，包括：

使用随机色像素点对所述初始随机框进行透明填充，得到所述随机框。

可选的，对所述未标注图像集合中各个图像选取预设数量的区域，并将所述区域作为初始随机框，包括：

根据所述待检测目标的宽高比，从所述未标注图像集合各个图像中选取预设数量的区域，并将所述区域作为所述初始随机框。

可选的，确定所述随机伪目标的标注数据，包括：

获取所述随机伪目标的位置、大小和类别，并将所述位置、大小和类别作为所述标注数据。

第二方面，本申请公开了一种目标检测装置，包括：

确定模块，用于根据获取到的未标注数据集合确定随机伪目标，并确定所述随机伪目标的标注数据；

第一训练模块，用于使用所述未标注数据集合和所述标注数据训练得到伪目标检测模型；

第二训练模块，用于使用人工已标注数据集合就行训练所述伪目标检测模型得到目标检测模型；

输入模块，用于将待检测目标数据输入所述目标检测模型，得到所述待检测目标的检测结果。

可选的，所述确定模块，包括：

选取子模块，用于当所述未标注数据集合为未标注图像集合时，对所述未标注图像集合中的各个图像选取随机框，并将所述随机框作为所述随机伪目标。

第三方面，本申请公开了一种电子设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上述目标检测方法的步骤。

第四方面，本申请公开了一种存储介质，所述存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上述目标检测方法的步骤。

本申请提供一种目标检测方法，包括：根据获取到的未标注数据集合确定随机伪目标，并确定所述随机伪目标的标注数据；使用所述未标注数据集合和所述标注数据训练得到伪目标检测模型；使用人工已标注数据集合继续训练所述伪目标检测模型得到目标检测模型；获取待检测目标数据，并将所述待检测目标数据输入所述目标检测模型，得到所述待检测目标的检测结果。

可见，本申请根据未标注数据集合得到随机伪目标，并将该未标注数据集合和随机伪目标的标注数据经过深度学习训练得到伪目标检测模型，再使用人工已标注数据集合继续训练该模型，得到目标检测模型，最终得到待检测目标的检测结果，即充分利用了未标注数据集合，并根据未标注数据集合得到伪目标检测模型，再使用人工已标注数据集合继续训练该伪目标检测模型得到目标检测模型，最终得到检测结果，也就是经过特征预学习后，再进行目标检测，能够提高目标检测模型效果，避免了相关技术中仅利用人工已标注数据进行目标检测，数据利用率低且目标检测模型效果相对较低的缺点，提高了数据利用率和目标检测的效果，改善用户体验。本申请同时还提供了一种目标检测装置、一种电子设备和存储介质，具有上述有益效果，在此不再赘述。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例所提供的一种目标检测方法的流程图；

图2为本申请实施例提供的一种目标检测装置的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在常见的目标检测方法中，都是采用人工已标注数据进行模型训练，再应用该模型得到目标检测结果，人工标注数据成本高，且仅利用人工已标注数据得到的模型效果相对较低。基于上述技术问题，本实施例提供一种目标检测方法，充分利用了未标注数据集合，并根据未标注数据集合得到伪目标检测模型，再使用人工已标注数据集合继续训练该伪目标检测模型得到目标检测模型，得到最终检测结果。需要说明的是，本实施中的未标注数据或人工已标注数据通常指的是图像数据，具体请参考图1，图1为本申请实施例所提供的一种目标检测方法的流程图，具体包括：

S101、根据获取到的未标注数据集合确定随机伪目标，并确定随机伪目标的标注数据。

可以理解的是，未标注数据集合，即未经过人工标记的数据集合，相应的，人工已标注数据集合即为经过人工标记的数据集合。本实施例并不限定未标注数据集合的种类，可以是图像数据集合，可以是视频数据集合，也可以是语音数据集合。需要注意的是，在本实施例中未标注数据集合和人工已标注数据集合通常指的是图像数据集合。本实施例中的随机伪目标是根据未标注数据集合确定的。本实施例并不限定确定随机伪目标的具体方式，可以根据具体实际情况而设定。

在一种具体的实施例中，根据获取到的未标注数据集合确定随机伪目标，可以包括：当未标注数据集合为未标注图像集合时，对未标注图像集合中的各个图像选取随机框，并将随机框作为随机伪目标。本实施例并不限定未标注图像集合中的图像个数，可以是20张，可以是5000张，可以根据实际情况而定。当未标注数据集合为未标注图像集合时，从未标注图像集合的各个图像中随机框取多个区域，将该区域作为选取的随机框，同时将该随机框作为随机伪目标。本实施例并不限定选取随机框的个数，可以根据实际情况进行选取。

进一步的，本实施例并不限定选取随机框的具体方式，在一种具体的实施例中，对未标注图像集合中的各个图像选取随机框，可以包括：对未标注图像集合中各个图像选取预设数量的区域，并将区域作为初始随机框；初始随机框的交并比小于预设阈值；对初始随机框进行特征处理，得到随机框。本实施例并不限定预设数量的具体个数，可以是5个，可以是18个，可以根据具体情况进行设定。可以理解的是，本实施例中对未标注图像集合中的各个图像进行选取的初始随机框，各个初始随机框之间的交并比小于预设阈值，能够避免各随机框之间过分重叠。本实施例并不限定预设阈值的大小，可以是0.2，可以是0.5，可根据具体情况进行设定。选取初始随机框后，对各个初始随机框进行特征处理，得到随机框。需注意的是，可以按照设定的交并比去选取初始随机框，也可以随意选取框取，再按照交并比从所有框取的框中选取初始随机框，可以根据实际情况进行选择。

本实施例并不限定特征处理的具体方式，可以将框内的图像内容进行水平或垂直或同时翻转操作；可以采用加入高斯噪点的方式；可以使用随机单像素点进行透明填充，像素点可在本图像或初始随机框内随机选取，本实施例并不限定填充后的透明度，例如，透明度可在100~200；也可以使用随机色像素点进行透明填充，相同的，本实施例并不限定填充后的透明度，例如，透明度可在100~200；也可以在另一张图像中扣取对应大小的区域进行透明填充，扣取的位置可对应或独立随机，透明度在一定范围内随机确定，如100~200。

本实施例并不限定标注数据的具体内容，可以是随机伪目标的位置，可以是随机伪目标的大小，也可以是其他特征。在一种具体的实施例中，确定随机伪目标的标注数据，可以包括：获取随机伪目标的位置、大小和类别，并将位置、大小和类别作为标注数据。可以理解的是，随机伪目标的位置即为所处图像的位置，随机伪目标的大小即为框取的随机框的大小或尺寸，需要注意的是，随机伪目标的类别是根据特征提取的方式而确定的，即对初始随机框不同的特征提取方式对应不同的随机伪目标类别。

在一种具体的实施例中，对初始随机框进行特征处理，得到随机框，可以包括：使用随机色像素点对初始随机框进行透明填充，得到随机框。即采用随机色像素点对初始随机框进行透明填充的方式。得到随机框。

在一种具体的实施例中，为了提高目标检测效果，对未标注图像集合中各个图像选取预设数量的区域，并将区域作为初始随机框，可以包括：根据待检测目标的宽高比，从未标注图像集合各个图像中选取预设数量的区域，并将区域作为初始随机框。即，需要按照待检测目标的宽高比，从未标注图像集合各个图像中来选取预设数量的区域，也就是选取的预设数量的区域对应的宽高比和待检测目标的宽高比是相同的，再将该区域作为初始随机框。即根据待检测目标的宽高比来选取初始随机框，可以相对更精确的对待检测目标进行检测，提高目标检测效果。

S102、使用未标注数据集合和标注数据训练得到伪目标检测模型。

本实施例并不限定深度学习模型的具体算法，可以根据实际数据集进行选取。即，本实施例中将未标注数据集合和随机伪目标的标注数据输入深度学习模型中进行模型训练，也就是常规有监督目标检测训练，得到伪目标检测模型。

S103、使用人工已标注数据集合继续训练伪目标检测模型得到目标检测模型。

本实施例在得到伪目标检测模型后，将人工已标注数据集合输入该模型进行常规有监督目标检测训练，得到最终模型即目标检测模型。最终模型检测效果优于仅使用人工已标注数据进行常规有监督目标检测训练的模型。

S104、获取待检测目标数据，并将待检测目标数据输入目标检测模型，得到待检测目标的检测结果。

本实施例并不限定获取方式，只要能得到待检测目标数据即可。即，本实施例将真实数据即待检测目标数据输入到训练好的目标检测模型，得到待检测目标的检测结果。使用无标注的数据即无标注数据集合进行模型预训练，能更高效地利用所有数据信息，并且能够在不同的领域获取比仅使用有标注数据训练得到更好的效果。例如，在玻片影像扫描仪的上位机控制软件中，用于阴道微环境样本显微镜下霉菌和滴虫的检测，使用无标注数据进行模型预学习，比仅利用人工已标注数据能够得到更优效果。

基于上述技术方案，本实施例根据未标注数据集合得到随机伪目标，并将该未标注数据集合和随机伪目标的标注数据经过深度学习训练得到伪目标检测模型，再使用人工已标注数据集合继续训练该预训练模型，得到目标检测模型，最终得到待检测目标的检测结果，即充分利用了未标注数据集合，更不提高数据成本的前提下，提升了目标检测的效果。

下面对本申请实施例提供的一种目标检测装置进行介绍，下文描述的目标检测装置与上文描述的目标检测方法可相互对应参照，相关模块均设置于中，参考图2，图2为本申请实施例所提供的一种目标检测装置的结构示意图，包括：

在一些具体的实施例中，具体包括：

确定模块201，用于根据获取到的未标注数据集合确定随机伪目标，并确定随机伪目标的标注数据；

第一训练模块202，用于使用未标注数据集合和标注数据训练深度学习模型，得到伪目标检测模型；

第二训练模块203，用于使用人工已标注数据集合继续训练伪目标检测模型得到目标检测模型；

输入模块204，用于将待检测目标数据输入目标检测模型，得到待检测目标的检测结果。

在一些具体的实施例中，确定模块201，包括：

选取子模块，用于当未标注数据集合为未标注图像集合时，对未标注图像集合中的各个图像选取随机框，并将随机框作为随机伪目标。

在一些具体的实施例中，选取子模块，包括：

选取单元，用于对未标注图像集合中各个图像选取预设数量的区域，并将区域作为初始随机框；初始随机框的交并比小于预设阈值；

特征处理单元，用于对初始随机框进行特征处理，得到随机框。

在一些具体的实施例中，特征处理单元，包括：

透明填充子单元，用于使用随机色像素点对初始随机框进行透明填充，得到随机框。

在一些具体的实施例中，选取单元，包括：

设定子单元，用于根据待检测目标的宽高比，从未标注图像集合各个图像中选取预设数量的区域，并将区域作为初始随机框。

在一些具体的实施例中，确定模块201，包括：

获取子模块，用于获取随机伪目标的位置、大小和类别，并将位置、大小和类别作为标注数据。

由于目标检测装置部分的实施例与目标检测方法部分的实施例相互对应，因此目标检测装置部分的实施例请参见目标检测方法部分的实施例的描述，这里暂不赘述。

下面对本申请实施例提供的一种电子设备进行介绍，下文描述的电子设备与上文描述的方法可相互对应参照。

本申请提供一种电子设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行计算机程序时实现如上述目标检测方法的步骤。

由于电子设备部分的实施例与目标检测方法部分的实施例相互对应，因此电子设备部分的实施例请参见目标检测方法部分的实施例的描述，这里暂不赘述。

下面对本申请实施例提供的一种存储介质进行介绍，下文描述的存储介质与上文描述的目标检测方法可相互对应参照。

本申请提供一种存储介质，存储介质上存储有计算机程序，计算机程序被处理器执行时实现如上述目标检测方法的步骤。

由于存储介质部分的实施例与目标检测方法部分的实施例相互对应，因此存储介质部分的实施例请参见目标检测方法部分的实施例的描述，这里暂不赘述。

说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器（RAM）、内存、只读存储器（ROM）、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上对本申请所提供的一种目标检测方法、装置、电子设备及存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以对本申请进行若干改进和修饰，这些改进和修饰也落入本申请权利要求的保护范围内。

Claims

1.一种目标检测方法，其特征在于，包括：

2.根据权利要求1所述目标检测方法，其特征在于，所述根据获取到的未标注数据集合确定随机伪目标，包括：

3.根据权利要求2所述目标检测方法，其特征在于，对所述未标注图像集合中的各个图像选取随机框，包括：

对所述初始随机框进行特征处理，得到所述随机框。

4.根据权利要求3所述目标检测方法，其特征在于，对所述初始随机框进行特征处理，得到所述随机框，包括：

5.根据权利要求3所述目标检测方法，其特征在于，对所述未标注图像集合中各个图像选取预设数量的区域，并将所述区域作为初始随机框，包括：

6.根据权利要求3所述目标检测方法，其特征在于，确定所述随机伪目标的标注数据，包括：

获取所述随机伪目标的位置、大小和类别，并将所述位置、大小和类别作为所述标注数据；其中，所述随机伪目标的类别是根据特征提取的方式而确定的，即对所述初始随机框不同的特征提取方式对应不同的随机伪目标类别。

7.一种目标检测装置，其特征在于，包括：

第二训练模块，用于使用人工已标注数据集合继续训练所述伪目标检测模型得到目标检测模型；

8.根据权利要求7所述目标检测装置，其特征在于，所述确定模块，包括：

9.一种电子设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至6任一项所述目标检测方法的步骤。

10.一种存储介质，其特征在于，所述存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述目标检测方法的步骤。