CN111753870A

CN111753870A - 目标检测模型的训练方法、装置和存储介质

Info

Publication number: CN111753870A
Application number: CN202010298486.7A
Authority: CN
Inventors: 张凯; 谭文明; 李哲暘; 石大虎
Original assignee: Hangzhou Hikvision Digital Technology Co Ltd
Current assignee: Hangzhou Hikvision Digital Technology Co Ltd
Priority date: 2020-04-16
Filing date: 2020-04-16
Publication date: 2020-10-09
Anticipated expiration: 2040-04-16
Also published as: CN111753870B

Abstract

本申请实施例提出了一种目标检测模型的训练方法、装置和存储介质，其中，上述方法包括：获取训练样本；将所述训练样本输入至预置目标检测模型进行训练，得到第一梯度；根据预置第一区间数对所述第一梯度进行不均匀划分，得到第一区间集合，并根据所述第一区间集合内的每个区间的样本数获得所述每个区间的第一梯度密度，其中，所述第一区间集合包括多个不均匀的区间；根据所述第一梯度密度对所述预置目标检测模型继续进行训练，得到训练后的目标检测模型。本申请通过对训练样本的梯度进行不均匀划分，可以有效解决训练样本不均衡问题，从而可以提高模型的检测性能。

Description

目标检测模型的训练方法、装置和存储介质

【技术领域】

本申请涉及计算机视觉技术领域，尤其涉及一种目标检测模型的训练方法、装置和存储介质。

【背景技术】

目标检测技术是计算机视觉技术的基础，目标检测技术可以帮助检测出图像中包含的诸如人像、动物或物品等多种目标对象，在实际应用中目标检测技术还可应用于诸多场景，例如，基于目标检测技术实现人员统计或图像修复。

目前，目标检测技术主要包含传统的目标检测方法和基于深度学习的目标检测方法，其中，基于深度学习的目标检测方法通常是对神经网络进行训练，从而通过训练后的神经网络检测出图像中包含的目标对象。然而在训练过程中，通常都会存在正样本与负样本、难样本与易样本之间不均衡的问题。现阶段，通常会采用梯度均衡机制(GradientHarmonizing Mechanism，GHM)解决上述问题，即对样本的梯度进行均匀划分，由此来抑制样本失衡，然而样本之间差异性很大，梯度的分布也往往有很大的不同，因此，均匀划分的梯度区间局限性很大，也无法有效解决样本均衡的问题。综上所述，若无法有效抑制上述样本之间的不均衡，势必会导致目标检测模型的性能降低。

【发明内容】

本申请实施例提供了一种目标检测模型的训练方法、装置和存储介质，以实现在训练过程中对训练样本的梯度进行不均匀划分，从而可以解决训练样本之间的不均衡问题，平衡训练样本对目标检测模型在训练过程中的贡献，提高模型的检测性能。

第一方面，本申请实施例提供一种目标检测模型的训练方法，包括：

获取训练样本；

将所述训练样本输入至预置目标检测模型进行训练，得到第一梯度；

根据预置第一区间数对所述第一梯度进行不均匀划分，得到第一区间集合，并根据所述第一区间集合内的每个区间的样本数获得所述每个区间的第一梯度密度，其中，所述第一区间集合包括多个不均匀的区间；

根据所述第一梯度密度对所述预置目标检测模型继续进行训练，得到训练后的目标检测模型。

第二方面，本申请实施例提供一种目标检测模型的训练装置，包括：

获取模块，用于获取训练样本；

训练模块，用于将所述训练样本输入至预置目标检测模型进行训练，得到第一梯度；

调整模块，用于根据预置第一区间数对所述第一梯度进行不均匀划分，得到第一区间集合，并根据所述第一区间集合内的每个区间的样本数获得所述每个区间的第一梯度密度，其中，所述第一区间集合包括多个不均匀的区间；

输出模块，用于根据所述第一梯度密度对所述预置目标检测模型继续进行训练，得到训练后的目标检测模型。

第三方面，本申请实施例提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行如上所述的方法。

以上技术方案中，通过对训练样本的梯度进行不均匀划分，可以抑制大量易样本对模型训练造成的影响，从而可以解决训练样本之间的不均衡问题，平衡训练样本对目标检测模型在训练过程中的贡献，提高训练效率。

【附图说明】

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本申请实施例提供的训练样本的梯度示意图；

图2为本申请目标检测模型的训练方法一个实施例的流程图；

图3为本申请特征融合一个实施例的流程示意图；

图4A为本申请梯度划分一个实施例的示意图；

图4B为本申请梯度划分另一个实施例的示意图；

图5为本申请目标检测模型的训练装置一个实施例的结构示意图；

图6为本申请目标检测模型的训练装置另一个实施例的结构示意图；

图7为本申请目标检测模型的训练装置再一个实施例的结构示意图；

图8为本申请系统架构一个实施例的示意图。

【具体实施方式】

为了更好的理解本申请的技术方案，下面结合附图对本申请实施例进行详细描述。

应当明确，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。

目前，在对目标检测模型的训练过程中，可以获取到与训练样本对应的梯度，该梯度用于表征检测的难易程度，例如，梯度越大则表示检测难度越大；该梯度可以通过交叉熵损失求梯度得来，公式如下：

其中，g为梯度，p为该目标检测模型预测的概率，p^*为真实值标签。如图1所示为梯度示意图，在梯度接近于0的时候样本数量最多，这些样本可归类为易样本；而在梯度接近于1的时候样本也较多，这些样本可归类为超难样本，其中，该超难样本还包括真值错标或者漏标的样本。如果目标检测模型过多关注于这些易样本和超难样本，势必会降低模型的准确度，同时也会降低模型的检测性能。

图2为本申请目标检测模型的训练方法一个实施例的流程图，如图2所示，上述目标检测模型的训练方法可以包括：

步骤101，获取训练样本。

具体地，上述训练样本可以是待训练图像，该待训练图像可以用于输入目标检测模型进行检测，最终通过该目标检测模型输出一个检测结果，该检测结果为识别该待训练图像中的目标对象及位置信息；通过上述训练过程，该目标检测模型可以学习到该训练样本中的特征，并由此提高识别能力。

需要说明的是，在该训练样本中，可以包含大量的待训练图像，而待训练图像可以包含简易识别的图像及难识别的图像，其中，简易识别的图像与难识别的图像的数量比例可以是任意的。

可选地，在获取训练样本的过程中，可以同时对该训练样本进行预处理，该预处理可以包括去均值、除方差以及改变图像大小等操作；其中，在改变图像大小的操作中，长宽比是否要保持一致可以视训练情况而定。

步骤102，将所述训练样本输入至预置目标检测模型进行训练，得到第一梯度。

具体地，在获取到训练样本后，可将训练样本输入至预置目标检测模型中进行第一轮训练，以得到如图1所示的梯度图。从该梯度图中，可以获取梯度的区间。

需要说明的是，梯度可以是一个归一化的值，因此通常是位于0和1之间，其中，该梯度可以与该训练样本对应。

可选地，在对该训练样本进行本轮训练时，一轮训练可以包含很多次，该训练的次数可以预先设定，当训练次数确定后，可以根据该训练次数将该训练样本数进行分配，可以均匀分配，也可以不均匀分配，由此可以获得每一次训练的训练样本数。

进一步地，在将训练样本输入至该预置目标检测模型中进行训练的过程中，可以先对该训练样本进行特征提取，该特征提取可以通过特征提取网络，例如，ResNet50、ResNet101、MobileNet等主干网络，通过上述特征提取网络可以对该训练样本进行特征的提取，由此获得8倍、16倍、32倍或64倍的多尺度特征；其中，在特征提取的过程中，也可以附加进行一系列的卷积和池化等操作，以增强训练样本的特征提取，由此提高目标检测模型的学习效率。

进一步地，在对该训练样本进行特征提取获得多尺度特征后，还可以将该多尺度特征输入特征融合网络进行特征融合，由此获得多尺度融合特征；该特征融合网络可以是FPN，PAFPN、M2Det或BFPN等网络；需要说明的是，FPN网络是传统卷积神经网络(Convolutional Neural Networks,CNN)对图像信息进行表达输出的一种增强，其目的是为了改进CNN网络的特征提取方式，从而可以使最终输出的特征更好地表示出输入图像各个维度的信息。FPN网络包括如下三个过程：自下至上的通路(即自下至上的不同维度特征生成)、自上至下的通路(即自上至下的特征补充增强)、CNN网络层特征与最终输出的各维度特征之间的关联表达。如图3所示为特征融合的示意图，其中，C3、C4、C5为训练样本经过特征提取后的多尺度特征，C4通过C3进行8倍下采样获得，C5通过C4进行16倍下采样获得，C6通过C5进行32倍下采样获得，C7通过C6进行64倍下采样获得；而对C5进行卷积操作后可以获得p5(即增强C5)，该卷积操作可以是1*1卷积，也可以是3*3卷积或其它形式的卷积，然后可以将P5进行16倍上采样后与C4进行特征融合，获得P4(即增强C4)，最后将P4进行8倍上采样后与C3进行特征融合，获得P3(即增强C3)，由此获得P3、P4、P5、C6及C7，并可以将上述P3、P4、P5、C6及C7这些融合特征输入目标检测模型，以获得最终检测结果的输出。

需要说明的是，当目标检测模型收到上述P3、P4、P5、C6及C7这些融合特征后，还可以进一步在卷积层、全连接层或者两者的组合层上对各个尺度的特征进行操作，并由此输出最终的检测结果，该检测结果可以包括该训练样本中的目标对象的分类及位置。

由图3可知，经过特征融合，得到的多尺度融合特征(P3、P4、P5)与同层的原始特征(C3、C4、C5)相比，同时具有低层的目标位置信息和高层的特征语义信息，这有利于不同层特征图的目标检测，提高了目标检测的准确性。

需要说明的是，图3仅作为一种示例，在实际应用中，可以根据需求增加下采样的深度，获取更多层的特征，并根据上述特征融合过程，得到更多层的特征。

应理解，训练样本在输入至该预置目标检测模型之前可以进行特征提取，也可以进行特征提取+特征融合，本申请实施例对此不作限定。

步骤103，根据预置第一区间数对所述第一梯度进行不均匀划分，得到第一区间集合，并根据所述第一区间集合内的每个区间的样本数获得所述每个区间的第一梯度密度，其中，所述第一区间集合包括多个不均匀的区间。

具体地，当该预置目标检测模型对该样本数据完成一轮训练后，可以获得对应的梯度(即第一梯度)，接着可以对该第一梯度进行划分，由此获得多个区间；在划分过程中，可以对该第一梯度根据预设的区间数进行划分，举例来说，如果预设的区间数为5，则将当前梯度划分为5个区间，上述5个区间即组成第一区间集合。

需要说明的是，虽然区间数是确定的，但是每个区间的大小不相同，由此达到不均匀划分梯度的目的，即该第一区间集合中的区间可以是不等大小的。其中，区间的大小可以是前面一部分稀疏的均匀划分，后面一部分紧密的均匀划分，即前疏后密，如图4A所示；或者前面一部分紧密的均匀划分，后面一部分稀疏的均匀划分，即前密后疏，如图4B所示；也可以是前面和后面都不均匀划分，本申请实施例对此不作限定。

可选地，为了确定每个区间的大小，可以先确定对应的分隔端点及原始区间，其中，分隔端点数与区间数对应，即一个区间对应两个端点，而由于区间是连续的，因此两个区间对应三个端点，以此类推；以区间数3，原始区间[0,1]进行举例，假设端点分别为0.2和0.6，则组成的是[0,0.2]、[0.2,0.6]及[0.6,1]这三个不均匀区间。

需要说明的是，由于训练样本之间的差异性，因此原始梯度区间不一定在[0,1]之间，实际的原始梯度区间可以根据训练后的梯度图中获得，本申请实施例对此不作限定。

当获取到第一区间集合后，可以分别统计该第一区间集合中每个区间内的样本数，并可以根据预先设置的计算公式进行计算，以获得第一梯度密度，其中，该第一梯度密度可以分别与每个区间对应；该计算公式可以是与样本数相关的函数，例如，m＝f(n)，其中，m为第一梯度密度，n为样本数，在具体实现时，f(n)可以是n/A，其中，A是一个定常数，f(n)也可以是log(n)，以两个区间为例，第一个区间的样本数为10000，第二个区间的样本数为1000，A＝100，则第一个区间的梯度密度m1＝10000/100＝100，第二个区间的梯度密度m2＝1000/100＝10。

步骤104，根据所述第一梯度密度对所述预置目标检测模型继续进行训练，得到训练后的目标检测模型。

具体地，该第一梯度密度可以是在第一轮训练中获得的，而训练可以是多轮的，其中，每一轮训练的样本可以不同；当对第一轮训练后的梯度进行不均匀划分后，可以根据第一梯度密度对该训练样本进行再次训练，其中，再次训练可以是进行新一轮的训练，在新的一轮训练中，每一次的训练的样本数与前一轮相比，可以是相同，也可以是不同。通过新的一轮的训练，可以获得新的梯度，由此可以确定样本抑制的效果，并可以不断训练，其中，每一轮的训练都可以获得新的梯度，而每一轮的训练都可以在上一轮训练后获得的梯度基础上进行；当通过不断训练，获得的梯度达到预设要求时，例如，从梯度图中可以观察到样本抑制的效果达到预设目标，这时可以结束训练，并可以将当前的目标检测模型作为训练过后的最终目标检测模型。

本实施例中，通过对梯度进行不均匀划分，获得多个不均匀的区间，以及与该区间对应的梯度密度，通过该梯度密度对该训练样本再训练，可以有效解决样本不均衡的问题，提高目标检测模型的检测性能。

可选的，在本申请的一些实施例中，步骤104还可以包括：

在所述训练过程中，获取任一次训练后的正负样本比值；

根据所述正负样本比值与所述第一梯度密度的比较结果调整所述预置第一区间数，获得第二区间数；

根据所述第二区间数进行训练，得到训练后的目标检测模型。

具体地，当完成一轮训练，进入下一轮训练时，可以在下一轮训练的过程中，任意选取一次训练，并获取该次训练的正负样本比值，其中，一轮训练可以包括多次训练；通常情况下，负样本都会远远大于正样本，而负样本是要被抑制的，若负样本不被抑制，则大量的负样本会产生主导作用，大大降低正样本对目标检测模型的贡献，由此会降低训练的效率；因此可以将正负样本的比值与上一轮训练获得的梯度密度进行比较，如果正负样本的比值远大于该梯度密度，例如，负样本与正样本的比值为1000:1，而梯度密度为50，由于1000远远大于50，说明负样本偏大，即没有得到抑制，这时可以增加第一区间数，以获得第二区间数；

需要说明的是，当区间数增加以后，可以对区间的分隔端点进行相应的添加，由此获得对应的不同区间，并根据每个区间内统计出的训练样本数，获得新的梯度密度，通过新的梯度密度进行下一次训练，由此可以进一步对负样本进行抑制。

当对区间数进行调整后，可以根据调整后的区间数(即第二区间数)继续进行训练，即在后续训练中保持第二区间数不变，直到本轮训练结束，也可以在后续训练中调整区间数，即在第二区间数的基础上进行训练时，可以通过调整第二区间数，获得第三区间数，并可以在每一次训练过程中调整区间数，直至本轮训练结束。

本实施例中，通过在一轮训练中对一次训练后的区间数进行调整，由此可以平衡正负样本，解决正负样本不均衡的问题，提高模型的检测性能。

可选的，在本申请的一些实施例中，步骤104之后还可以包括：

在所述训练过程中，获取任一轮训练后的第二梯度；

根据所述第二梯度与所述第一梯度的比较结果调整所述第一区间集合，获得第二区间集合；

根据所述第二区间集合获得对应的第二梯度密度，并根据所述第二梯度密度对所述预置目标检测模型继续进行训练，得到训练后的目标检测模型。

具体地，在完成任一轮训练之后，可以获取该轮训练的梯度(即第二梯度)，通过第二梯度与第一梯度的比较，可以确定样本是否均衡，若样本不均衡，则可以对第一区间集合进行调整，以获得第二区间集合；由于该第一区间集合包含多个不均匀的区间，因此调整后的区间也可以是不均匀的，例如，第一区间集合是先密后疏，第二区间集合可以是先疏后密，也可以在密的区间范围内再增加区间数。

可选地，在确定第二区间集合的过程中，可以先获取第二区间集合的多个分隔端点，将该多个分隔端点插入到当前的梯度中，就可获得对应的第二区间集合。

当对第一区间集合进行调整，获得第二区间集合后，可以根据该第二区间集合进行计算获得对应的梯度密度(即第二梯度密度)，在计算过程中，由于第二区间集合中的每个区间都可能发生了改变，因此相应地每个区间的样本数也会随之改变，而每个区间的梯度密度与样本数相关，因此每个区间的梯度密度也会随之改变，当获得每个区间的梯度密度后，就可根据第二区间集合中每个区间的梯度密度进行下一轮训练，由此衡量样本均衡的效果。

本实施例中，通过将不同轮次的训练结果进行比对，并根据比对结果调整梯度密度，可以有效解决难易样本不均衡问题，提高模型的检测性能。

图5为本申请目标检测模型的训练装置50一个实施例的结构示意图。

如图5所示，上述目标检测模型的训练装置50可以包括：获取模块51、训练模块52、调整模块53和输出模块54；

获取模块51，用于获取训练样本；

训练模块52，用于将所述训练样本输入至预置目标检测模型进行训练，得到第一梯度；

调整模块53，用于根据预置第一区间数对所述第一梯度进行不均匀划分，得到第一区间集合，并根据所述第一区间集合内的每个区间的样本数获得所述每个区间的第一梯度密度，其中，所述第一区间集合包括多个不均匀的区间；

输出模块54，用于根据所述第一梯度密度对所述预置目标检测模型继续进行训练，得到训练后的目标检测模型。

在一种可能的实现方式中，输出模块54可以包括：获取单元541、比较单元542和输出单元543；

获取单元541，用于在所述训练过程中，获取任一次训练后的正负样本比值；

比较单元542，用于根据所述正负样本比值与所述第一梯度密度的比较结果调整所述预置第一区间数，得到第二区间数；

输出单元543，用于根据所述第二区间数进行训练，得到训练后的目标检测模型。

在一种可能的实现方式中，调整模块53还可以用于获取与所述预置第一区间数对应的第一分隔端点集合，根据所述第一分隔端点集合中的分隔端点将所述第一梯度划分为多个区间，得到第一区间集合，其中，所述第一分隔端点集合包括一个或多个分隔端点。

图5所示实施例提供的目标检测模型的训练装置50可用于执行本申请图1-图4所示方法实施例的技术方案，其实现原理和技术效果可以进一步参考方法实施例中的相关描述。

图6为本申请目标检测模型的训练装置60另一个实施例的结构示意图，与图5所示的目标检测模型的训练装置50不同，图6所示的目标检测模型的训练装置60中，输出模块54还可以包括：获取单元641、比较单元642和输出单元643；

获取单元641，用于在所述训练过程中，获取任一轮训练后的第二梯度；

比较单元642，用于根据所述第二梯度与所述第一梯度的比较结果调整所述第一区间集合，得到第二区间集合；

输出单元643，根据所述第二区间集合获得对应的第二梯度密度，并根据所述第二梯度密度对所述预置目标检测模型继续进行训练，得到训练后的目标检测模型。

在一种可能的实现方式中，比较单元642可以包括：获取子单元6421和比较子单元6422；

获取子单元6421，用于获取所述第二梯度与所述第一梯度的比较结果，其中，所述比较结果用于表征本轮训练样本中难样本与易样本的抑制效果；

比较子单元6422，用于若所述第一梯度的抑制效果优于所述第二梯度的抑制效果，则获取与所述预置第一区间数对应的第二分隔端点集合，根据所述第二分隔端点集合中的分隔端点将所述第一梯度划分为多个区间，得到第二区间集合。

图6所示实施例提供的目标检测模型的训练装置60可用于执行本申请方法实施例的技术方案，其实现原理和技术效果可以进一步参考方法实施例中的相关描述。

图7为本申请目标检测模型的训练装置70再一个实施例的结构示意图，与图5所示的目标检测模型的训练装置50不同，图7所示的目标检测模型的训练装置70中，训练模块52可以包括：特征提取单元521、特征融合单元522和训练单元523；

特征提取单元块521，用于将所述训练样本输入至预置特征提取网络，得到所述训练样本的多尺度特征；

特征融合单元522，用于将所述训练样本的多尺度特征输入至预置特征融合网络，得到所述训练样本的融合特征；

训练单元523，用于将所述训练样本的融合特征输入至预置目标检测模型进行第一轮训练。

图7所示实施例提供的目标检测模型的训练装置70可用于执行本申请方法实施例的技术方案，其实现原理和技术效果可以进一步参考方法实施例中的相关描述。

应理解以上图5～图7所示的目标检测模型的训练装置的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块以软件通过处理元件调用的形式实现，部分模块通过硬件的形式实现。例如，模块可以为单独设立的处理元件，也可以集成在电子设备的某一个芯片中实现。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

例如，以上这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(Application Specific Integrated Circuit；以下简称：ASIC)，或，一个或多个微处理器(Digital Singnal Processor；以下简称：DSP)，或，一个或者多个现场可编程门阵列(Field Programmable Gate Array；以下简称：FPGA)等。再如，这些模块可以集成在一起，以片上系统(System-On-a-Chip；以下简称：SOC)的形式实现。

图8为本申请实施例提供的系统架构800的示意图。该系统架构用于实现上述方法实施例中提供的方法。

处理中心810用于指示存储控制中心820，以获取本次的训练样本。

在一种可能的实现方式中，处理中心810还用于将从存储控制中心820获取的训练样本发送给图像处理中心830，以提取该训练样本的多尺度特征。

处理中心810还用于将训练样本发送至训练控制中心840进行训练，以获得梯度。

处理中心810还用于根据该训练控制中心840反馈的梯度进行不均匀划分，以获得梯度密度。

在一种可能的实现方式中，该处理中心810还用于对梯度密度进行调整，以对训练样本进行下一轮训练。

在一种可能的实现方式中，该处理中心810还用于在训练控制中心840的训练过程中，对梯度区间数进行调整。

存储控制中心820用于存储训练样本。

存储控制中心820还用于根据处理中心810的指示发送对应的训练样本。

在一种可能的实现方式中，存储控制中心820还用于对该训练样本进行预处理。

图像处理中心830用于接收训练样本。

图像处理中心830还用于对该训练样本进行特征提取，以得到该训练样本的多尺度特征。

在一种可能的实现方式中，图像处理中心830还用于对训练样本的多尺度特征进行特征融合，以得到多尺度融合特征。

在一种可能的实现方式中，图像处理中心830还用于根据处理中心810的指示将训练样本的多尺度特征发送至训练中心进行训练。

训练控制中心840用于接收训练样本，并对该训练样本进行训练，以获得梯度。

训练控制中心840还用于接收训练样本，并根据处理中心810的指示对该训练样本进行训练，以获得新的梯度，其中，该指示包括各梯度区间的梯度密度。

训练控制中心840还用于将新一轮训练的梯度发送至处理中心810。

在一种可能的实现方式中，训练控制中心840还用于将任一次训练中的正负样本比值结果发送至处理中心810。

本申请实施例还提供一种非暂态计算机可读存储介质，上述非暂态计算机可读存储介质存储计算机指令，上述计算机指令使上述计算机执行本申请实施例提供的目标检测模型的训练方法。

上述非暂态计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(Read Only Memory；以下简称：ROM)、可擦式可编程只读存储器(Erasable ProgrammableRead Only Memory；以下简称：EPROM)或闪存、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LocalArea Network；以下简称：LAN)或广域网(Wide Area Network；以下简称：WAN)连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机装置(可以是个人计算机，服务器，或者网络装置等)或处理器(Processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory；以下简称：ROM)、随机存取存储器(Random Access Memory；以下简称：RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。

Claims

1.一种目标检测模型的训练方法，其特征在于，包括：

获取训练样本；

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一梯度密度对所述预置目标检测模型继续进行训练，得到训练后的目标检测模型包括：

在所述训练过程中，获取任一次训练后的正负样本比值；

根据所述正负样本比值与所述第一梯度密度的比较结果调整所述预置第一区间数，得到第二区间数；

3.根据权利要求1所述的方法，其特征在于，所述根据预置第一区间数对所述第一梯度进行不均匀划分，得到第一区间集合包括：

获取与所述预置第一区间数对应的第一分隔端点集合，根据所述第一分隔端点集合中的分隔端点将所述第一梯度划分为多个区间，得到第一区间集合，其中，所述第一分隔端点集合包括一个或多个分隔端点。

4.根据权利要求1所述的方法，其特征在于，所述根据所述第一梯度密度对所述预置目标检测模型继续进行训练，得到训练后的目标检测模型包括：

在所述训练过程中，获取任一轮训练后的第二梯度；

根据所述第二梯度与所述第一梯度的比较结果调整所述第一区间集合，得到第二区间集合；

5.根据权利要求4所述的方法，其特征在于，所述根据所述第二梯度与所述第一梯度的比较结果调整所述第一区间集合，得到第二区间集合包括：

获取所述第二梯度与所述第一梯度的比较结果，其中，所述比较结果用于表征本轮训练样本中难样本与易样本的抑制效果；

若所述第一梯度的抑制效果优于所述第二梯度的抑制效果，则获取与所述预置第一区间数对应的第二分隔端点集合，根据所述第二分隔端点集合中的分隔端点将所述第一梯度划分为多个区间，得到第二区间集合。

6.根据权利要求1-5任一项所述的方法，其特征在于，所述将所述训练样本输入至预置目标检测模型进行训练包括：

将所述训练样本输入至预置特征提取网络，得到所述训练样本的多尺度特征；

将所述训练样本的多尺度特征输入至预置特征融合网络，得到所述训练样本的融合特征；

将所述训练样本的融合特征输入至预置目标检测模型进行训练。

7.一种目标检测模型的训练装置，其特征在于，包括：

获取模块，用于获取训练样本；

8.根据权利要求7所述的装置，其特征在于，所述输出模块包括：

获取单元，用于在所述训练过程中，获取任一次训练后的正负样本比值；

比较单元，用于根据所述正负样本比值与所述第一梯度密度的比较结果调整所述预置第一区间数，得到第二区间数；

输出单元，用于根据所述第二区间数进行训练，得到训练后的目标检测模型。

9.根据权利要求7所述的装置，其特征在于，所述调整模块还用于获取与所述预置第一区间数对应的第一分隔端点集合，根据所述第一分隔端点集合中的分隔端点将所述第一梯度划分为多个区间，得到第一区间集合，其中，所述第一分隔端点集合包括一个或多个分隔端点。

10.根据权利要求7所述的装置，其特征在于，所述输出模块包括：

获取单元，用于在所述训练过程中，获取任一轮训练后的第二梯度；

比较单元，用于根据所述第二梯度与所述第一梯度的比较结果调整所述第一区间集合，得到第二区间集合；

输出单元，用于根据所述第二区间集合获得对应的第二梯度密度，并根据所述第二梯度密度对所述预置目标检测模型继续进行训练，得到训练后的目标检测模型。

11.根据权利要求10所述的装置，其特征在于，所述比较单元包括：

获取子单元，用于获取所述第二梯度与所述第一梯度的比较结果，其中，所述比较结果用于表征本轮训练样本中难样本与易样本的抑制效果；

比较子单元，用于若所述第一梯度的抑制效果优于所述第二梯度的抑制效果，则获取与所述预置第一区间数对应的第二分隔端点集合，根据所述第二分隔端点集合中的分隔端点将所述第一梯度划分为多个区间，得到第二区间集合。

12.根据权利要求7-11所述的装置，其特征在于，所述训练模块包括：

特征提取单元，用于将所述训练样本输入至预置特征提取网络，得到所述训练样本的多尺度特征；

特征融合单元，用于将所述训练样本的多尺度特征输入至预置特征融合网络，得到所述训练样本的融合特征；

训练单元，用于将所述训练样本的融合特征输入至预置目标检测模型进行训练。

13.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行如权利要求1至6任一所述的方法。