CN114612784A

CN114612784A - 目标检测网络训练方法、装置、设备及存储介质

Info

Publication number: CN114612784A
Application number: CN202210260168.0A
Authority: CN
Inventors: 王祎男; 关瀛洲; 王相玲; 曹容川; 魏源伯; 付仁涛
Original assignee: FAW Group Corp
Current assignee: FAW Group Corp
Priority date: 2022-03-16
Filing date: 2022-03-16
Publication date: 2022-06-10

Abstract

本发明公开了一种目标检测网络训练方法、装置、设备及存储介质。该方法包括：获取目标检测网络的当前网络参数；其中，所述当前网络参数为浮点型；基于预设正切函数，对所述当前网络参数进行量化，以更新所述目标检测网络；根据样本图像和样本标签训练更新后的目标检测网络，以调整更新前的目标检测网络的当前网络参数。本申请实施例提高了二值化训练得到的目标检测网络中网络参数的量化精度。

Description

目标检测网络训练方法、装置、设备及存储介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种目标检测网络训练方法、装置、设备及存储介质。

背景技术

随着神经网络模型的不断发展，人们对神经网络模型的精度要求也随之越来越高。

现有的神经网络模型，随着网络的层数加深，网络的复杂度越来越高，计算量也越来越大，导致了复杂神经网络不能够运行在监控摄像头等嵌入式设备上。

为了降低神经网络模型的复杂度，现有技术通常直接对神经网络的浮点权重或浮点激活进行二值化操作，导致神经网络模型二值化后的权重值精确度较低。并且，神经网络模型训练过程中，容易产生振荡，导致量化训练过程中的模型收敛较慢。

发明内容

本发明提供了一种目标检测网络训练方法、装置、设备及存储介质，以提高二值化训练得到的目标检测网络中网络参数的量化精度。

根据本发明的一方面，提供了一种目标检测网络训练方法，该方法包括：

获取目标检测网络的当前网络参数；其中，所述当前网络参数为浮点型；

基于预设正切函数，对所述当前网络参数进行量化，以更新所述目标检测网络；

根据样本图像和样本标签训练更新后的目标检测网络，以调整更新前的目标检测网络的当前网络参数。

根据本发明的另一方面，提供了一种目标检测网络训练装置，该装置包括：

当前网络参数获取模块，用于获取目标检测网络的当前网络参数；其中，所述当前网络参数为浮点型；

目标检测网络更新模块，用于基于预设正切函数，对所述当前网络参数进行量化，以更新所述目标检测网络；

当前网络参数调整模块，用于根据样本图像和样本标签训练更新后的目标检测网络，以调整更新前的目标检测网络的当前网络参数。

根据本发明的另一方面，提供了一种电子设备，所述电子设备包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行本发明任一实施例所述的目标检测网络训练方法。

根据本发明的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现本发明任一实施例所述的目标检测网络训练方法。

本实施例方案通过获取目标检测网络的当前网络参数；其中，当前网络参数为浮点型；基于预设正切函数，对当前网络参数进行量化，以更新目标检测网络；根据样本图像和样本标签训练更新后的目标检测网络，以调整更新前的目标检测网络的当前网络参数。上述方案通过采用正切函数，对目标检测网络的网络参数进行量化，并对量化后的网络参数进行不断调整的方式，对目标检测网络进行二值化训练，提高了二值化训练得到的目标检测网络中网络参数的量化精度。避免了采用sgnx函数将浮点型的权重参数直接进行量化导致的量化结果的准确度低的情况；通过采用正切函数，基于反向传播函数，不断逐层训练调整二值化之前的网络参数的方式，使得二值化量化后的结果更加精确，同时提高了网络的收敛性。

应当理解，本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征，也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例一提供的一种目标检测网络训练方法的流程图；

图2是根据本发明实施例二提供的一种目标检测网络训练方法的流程图；

图3是根据本发明实施例三提供的一种目标检测网络训练方法的流程图；

图4是根据本发明实施例四提供的一种目标检测网络训练装置的结构示意图；

图5是实现本发明实施例的目标检测网络训练方法的电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“当前”、“目标”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例一

图1为本发明实施例一提供了一种目标检测网络训练方法的流程图，本实施例可适用于将权重参数二值化后的目标检测网络应用于嵌入式设备中的情况，该方法可以由目标检测网络训练装置来执行，该目标检测网络训练装置可以采用硬件和/或软件的形式实现，该目标检测网络训练装置可配置于电子设备中。如图1所示，该方法包括：

S110、获取目标检测网络的当前网络参数；其中，当前网络参数为浮点型。

目标检测网络可以是待进行二值化训练的网络，例如，目标检测网络可以是用于人脸识别、车辆检测或物体识别等技术领域的能够进行目标检测的网络。目标检测网络的当前网络参数可以是未进行二值化训练之前得到的浮点型参数。当前网络参数可以是目标检测网络的权重参数。

S120、基于预设正切函数，对当前网络参数进行量化，以更新目标检测网络。

其中，预设正切函数可以由相关技术人员预先设置在目标检测网络中，预设正切函数用于对目标检测网络的浮点型当前网络参数，进行二值化量化。采用二值化量化后的网络参数，更新目标检测网络的当前网络参数。

示例性的，根据在目标检测网络中预先设定的正切函数，对目标检测网络的浮点型的当前网络参数进行二值化，以得到更新后的目标检测网络中的二值化网络参数。

S130、根据样本图像和样本标签训练更新后的目标检测网络，以调整更新前的目标检测网络的当前网络参数。

样本图像可以是用于训练目标检测网络的样本训练集。示例性的，可以将样本图像和样本标签输入至二值化后的目标检测网络中，以训练更新后的目标检测网络；根据训练得到的目标检测网络的预测值和样本标签对应的真实值，基于预设的损失函数，判断是否完成对目标检测网络的训练，具体可以是根据损失函数的计算结果判断目标检测模型是否收敛。若是，则完成对目标网络参数的训练，得到目标检测网络的二值化网络参数；若否，则根据预设的反向传播函数，调整更新前的目标检测网络的当前网络参数，即未进行二值化的网络参数，并将根据反向传播函数调整后的网络参数，再进行二值化操作，更新目标检测网络，直至目标检测模型收敛。

实施例二

图2为本发明实施例二提供的一种目标检测网络训练方法的流程图，本实施例在上述各技术方案的基础上，进行了优化改进。

进一步的，当前网络参数包括权重参数和所述权重参数对应的权重偏移参数；相应的，将步骤“基于预设正切函数，对当前网络参数进行量化，以更新目标检测网络”细化为“根据权重参数和权重参数对应的权重偏移参数的差值，确定权重偏移量；根据权重偏移量和预设放大系数，确定权重量化结果；采用权重量化结果替换目标检测网络中相应的权重参数，以更新目标检测网络。”以完善对目标检测网络的更新方式。

如图2所示，该方法包括以下具体步骤：

S210、获取目标检测网络的当前网络参数；其中，当前网络参数为浮点型；当前网络参数包括权重参数和权重参数对应的权重偏移参数。

其中，权重参数和权重偏移参数均在目标检测网络的训练过程中得到。

S220、根据权重参数和权重参数对应的权重偏移参数的差值，确定权重偏移量。

需要说明的是，对于不满足权重分布为高斯分布的权重参数，可能存在一定的偏移量，为减小权重偏移对网络训练过程中，网络参数的精度的影响，在确定权重量化结果的过程中引入权重偏移参数，且权重偏移参数在对目标检测网络训练的过程中得到。

示例性的，可以确定目标检测网络中各网络层中各通道对应的权重参数和权重偏移参数；采用各网络层中的各通道对应的权重参数减去权重偏移参数，得到各网络层中各通道对应的权重偏移量。

S230、根据权重偏移量和预设放大系数，确定权重量化结果。

其中，预设放大系数用于在训练迭代的过程中平稳过渡量化结果。预设放大系数可以由相关技术人员预先设定，例如，预设放大系数可以是预先设定的固定数值，如2¹⁰。

可选的，预设放大系数可以随着训练次数的增加而增大。需要说明的是，随着预设放大系数在网络训练过程中，随着训练迭代次数的不断增加而增大，使得量化结果逐渐趋近于二值化值。例如，二值化值可以是为-1或1等，实现了在训练过程中，随着训练迭代次数的增加使得量化结果不断接近二值化值，从而达到渐进性量化的目的，提高了网络训练过程中的量化过程的精确度。

预设放大系数可以是预先设定的取值范围，且随着训练次数的增加，以指数形式递增。可选的，不同训练次数所采用的预设放大系数底数相同且大于1，指数随着训练次数的增加而增大。

示例性的，预设放大系数的取值范围可以是[2，2¹⁶]。随着训练过程中训练次数的增加，预设放大系数逐渐增大。例如，目标检测网络第一次训练过程中的预设放大系数为2，第二次训练过程中的预设放大系数为2²，第三次训练过程中的预设放大系数为2³等，具体可以由相关技术人员预先设定，并在训练过程中，使预设放大系数能够随着迭代次数的增加而自动的增大。

示例性的，可以采用以下正切函数，更新目标检测网络的浮点型网络参数：

其中，

为权重参数的量化结果，β为预设放大系数，W_ic为权重参数，B_ic为权重参数对应的权重偏移参数，i为目标检测网络的层级标识，c为目标检测网络的网络层中的通道标识。其中，W_ic-B_ic即为权重偏移量。

S240、采用权重量化结果替换目标检测网络中相应的权重参数，以更新目标检测网络。

示例性的，采用基于正切函数，即用于进行二值化的量化函数，得到的权重量化结果，替换目标检测网络中量化前的权重参数，更新目标检测网络。

S250、根据样本图像和样本标签训练更新后的目标检测网络，以调整更新前的目标检测网络的当前网络参数。

本实施例方案通过根据权重参数和权重参数对应的权重偏移参数的差值，确定权重偏移量；根据权重偏移量和预设放大系数，确定权重量化结果；采用权重量化结果替换目标检测网络中相应的权重参数，以更新目标检测网络。上述方案通过引入权重偏移量，解决了对于不满足高斯分布的权重参数可能存在权重偏移而影响量化精度的问题；通过引入预设放大系数，使预设放大系数随着训练次数的增大而逐渐增加，实现了目标检测网络在二值化量化的训练过程中能够逐步量化，从而提高了权重量化结果的准确性。

实施例三

图3为本发明实施例三提供的一种目标检测网络训练方法的流程图，本实施例在上述各技术方案的基础上，进行了优化改进。

进一步的，将步骤“根据样本图像和样本标签训练更新后的目标检测网络，以调整更新前的目标检测网络的当前网络参数”细化为“将样本图像输入至更新后的目标检测网络，得到样本预测结果；根据样本预测结果和所述样本标签，确定目标损失；确定更新前的目标检测网络的当前网络参数在目标反向传播函数下的反向传播结果；其中，目标反向传播函数为所述预设正切函数的导数函数；根据目标损失和反向传播结果，调整更新前的目标检测网络的当前网络参数。”

如图3所示，该方法包括以下具体步骤：

S310、获取目标检测网络的当前网络参数；其中，当前网络参数为浮点型。

S320、基于预设正切函数，对所述当前网络参数进行量化，以更新目标检测网络。

S330、将样本图像输入至更新后的目标检测网络，得到样本预测结果。

其中，更新后的目标检测网络可以是基于预设正切函数，对目标检测网络中的浮点型参数进行二值化量化后得到的目标检测网络。

示例性的，可以将样本图像输入至更新后的目标检测网络，对目标检测网络进行训练，得到样本预测结果。

S340、根据样本预测结果和样本标签，确定目标损失。

其中，样本标签中包括样本图像对应的样本真实结果；目标损失可以是根据样本预测结果和样本标签，基于预设的损失函数，得到的目标损失值。其中，损失函数可以由相关技术人员预先设定。例如，损失函数可以是log对数损失函数或指数损失函数等。

示例性的，根据样本预测结果和样本标签中的样本真实结果，基于预设的损失函数，得到目标损失结果，其中，目标损失结果可以是目标损失值。根据目标损失结果可以确定对目标检测网络的训练是否完成，即目标检测网络是否收敛。具体的，若目标损失结果随着训练次数增加已趋于稳定，则可以表示目标检测模型已收敛，目标检测网络已完成训练。或者，若目标损失结果为目标损失值，则还可以判断目标损失值是否小于等于预设损失阈值；若是，则可以表示目标检测模型已收敛，目标检测网络已完成训练；若否，则可以表示目标检测模型未收敛，目标检测网络未完成训练。

需要说明的是，为避免网络训练过程中的过拟合现象，可以在用于确定目标损失的损失函数中引入正则项；同时，为确保权重量化结果尽可能的逼近原始的浮点型的权重参数，还可以在正则项中引入尺度因子。

在一个可选实施例中，根据样本预测结果和所述样本标签，确定目标损失，包括：根据样本预测结果和样本标签，确定初始损失；根据更新前的目标检测网络的当前网络参数，确定各层当前网络参数对应的尺度因子；根据各层当前网络参数与相应尺度因子的距离，确定正则损失；根据初始损失和所述正则损失，确定目标损失。

其中，更新前的目标检测网络的当前网络参数为每一次迭代训练过程中，未进行二值化量化之前的浮点型网络参数。其中，目标检测网络的每一个网络层分别对应一个尺度因子。

示例性的，可以根据样本预测结果和样本标签，基于预设的初始损失函数，确定初始损失；根据二值化量化之前的浮点型网络参数，确定目标检测网络的各网络层分别对应的尺度因子。将各网络层的二值化量化之前的浮点型网络参数与对应的尺度因子的差值，作为各层当前网络参数与相应尺度因子的距离。

根据各层当前网络参数与相应尺度因子的距离，确定正则损失。其中，正则损失的公式如下：

R＝∑_i(W_i-A_i-1)²；

其中，i为目标检测网络的层级标识，W_i为权重参数，A_i为尺度因子。

根据初始损失和所述正则损失，确定目标损失。其中，目标损失可以基于目标损失函数确定，目标损失函数的公式如下：

J(W)＝L(W)+αR；

其中，L(W)为预设的初始损失函数；α为可调参数；R为正则项。

在一个可选实施例中，根据更新前的目标检测网络的当前网络参数，确定各层当前网络参数对应的尺度因子，包括：针对更新前的目标检测网络中的各层当前网络参数，确定该层当前网络参数的中值；将中值确定结果作为该层当前网络参数对应的尺度因子。

示例性的，可以将更新前的目标检测网络中，各网络层的当前网络参数的中值，作为该网络层当前网络参数对应的尺度因子。需要说明的是，若当前网络参数的参数值为负数，则先对参数值为负数的当前网络参数去绝对值，再确定各层网络参数对应的尺度因子。

其中，尺度因子的确定公式如下：

A_i＝＝median(W_i|)；

其中，W_i为权重参数；i为目标检测网络的层级标识。

可选的，还可以针对更新前的目标检测网络中各层当前网络参数，确定该层当前网络参数的均值；将均值确定结果作为该层当前网络参数对应的尺度因子。

S350、确定更新前的目标检测网络的当前网络参数在目标反向传播函数下的反向传播结果；其中，目标反向传播函数为预设正切函数的导数函数。

其中，更新前的目标检测网络的当前网络参数为二值化量化前的浮点型网络参数。目标反向传播函数根据预设正切函数确定。

其中，目标反向传播函数的公式如下：

其中，β为预设放大系数，W_ic为权重参数，B_ic为权重参数对应的权重偏移参数，i为目标检测网络的层级标识，c为目标检测网络的网络层中的通道标识。

示例性的，目标检测模型在未收敛之前，通过目标反向传播函数对目标检测模型进行反向训练，以更新二值化之前的浮点型网络参数；基于正切函数，对更新后的浮点型网络参数进行二值化量化，以更新目标检测模型。

S360、根据目标损失和反向传播结果，调整更新前的目标检测网络的当前网络参数。

示例性的，在目标检测网络的二值化训练过程中，基于预设正切函数，对浮点型的当前网络参数进行量化，得到量化后的网络参数，从而更新目标检测网络。将样本图像输入至更新后的目标检测网络，得到样本预测结果；根据样本预测结果和样本标签，确定目标损失；根据目标损失确定目标检测模型是否收敛。若更新后的目标检测网络未收敛，即未完成训练，则由目标反向传播函数进行反向训练，此时，目标反向传播函数训练的网络参数为二值化之前的浮点型网络参数，由目标反向传播函数对浮点型网络参数进行调整后，再由正切函数对调整后的浮点型网络参数进行二值化量化，再次更新目标检测网络，直至目标检测网络的网络模型收敛。

已完成训练的目标检测网络的二值化权重趋近于sgn(W-B)；其中，W为目标检测模型的权重参数，B为目标检测模型的权重参数对应的权重偏移参数。

可选的，把尺度因子加入目标检测网络每层后，网络的输入到输出的推导过程：

其中，X_i表示输入值；Y_i表示输出值；A_i表示尺度因子；W_i ^b表示二值化量化后的权重参数；i为目标检测网络的层级标识。

本实施例方案通过将样本图像输入至更新后的目标检测网络，得到样本预测结果；根据样本预测结果和样本标签，确定目标损失；确定更新前的目标检测网络的当前网络参数在目标反向传播函数下的反向传播结果；其中，目标反向传播函数为所述预设正切函数的导数函数；根据目标损失和反向传播结果，调整更新前的目标检测网络的当前网络参数。上述方案通过采用目标反向传播函数反向训练二值化量化之前的浮点型网络参数的方式，实现了对浮点型网络参数的调整，通过目标损失和反向传播结果，不断调整浮点型网络参数和二值化后的网络参数的方式，提高了二值化训练得到的目标检测网络中网络参数的量化精度，提高了网络的收敛速度。

实施例四

图4为本发明实施例四提供的一种目标检测网络训练装置的结构示意图。本发明实施例所提供的一种目标检测网络训练装置，该装置可适用于将权重参数二值化后的目标检测网络应用于嵌入式设备中的情况，该装置可采用软件和/或硬件的方式实现。如图4所示，该装置具体包括：当前网络参数获取模块401、目标检测网络更新模块402和当前网络参数调整模块403。其中，

当前网络参数获取模块401，用于获取目标检测网络的当前网络参数；其中，所述当前网络参数为浮点型；

目标检测网络更新模块402，用于基于预设正切函数，对所述当前网络参数进行量化，以更新所述目标检测网络；

当前网络参数调整模块403，用于根据样本图像和样本标签训练更新后的目标检测网络，以调整更新前的目标检测网络的当前网络参数。

可选的，所述当前网络参数包括权重参数和所述权重参数对应的权重偏移参数；

相应的，所述目标检测网络更新模块402，包括：

权重偏移量确定单元，用于根据所述权重参数和所述权重参数对应的权重偏移参数的差值，确定权重偏移量；

权重量化结果确定单元，用于根据所述权重偏移量和预设放大系数，确定权重量化结果；

目标检测网络更新单元，用于采用所述权重量化结果替换所述目标检测网络中相应的权重参数，以更新所述目标检测网络。

可选的，所述预设放大系数随着训练次数的增加而增大。

可选的，不同训练次数所采用的预设放大系数底数相同且大于1，指数随着训练次数的增加而增大。

可选的，所述当前网络参数调整模块403，包括：

样本预测结果确定单元，用于将所述样本图像输入至更新后的目标检测网络，得到样本预测结果；

目标损失确定单元，用于根据所述样本预测结果和所述样本标签，确定目标损失；

反向传播结果确定单元，用于确定更新前的目标检测网络的当前网络参数在目标反向传播函数下的反向传播结果；其中，所述目标反向传播函数为所述预设正切函数的导数函数；

当前网络参数调整单元，用于根据所述目标损失和所述反向传播结果，调整更新前的目标检测网络的当前网络参数。

可选的，所述目标损失确定单元，包括：

初始损失确定子单元，用于根据所述样本预测结果和所述样本标签，确定初始损失；

尺度因子确定子单元，用于根据更新前的目标检测网络的当前网络参数，确定各层当前网络参数对应的尺度因子；

正则损失确定子单元，用于根据各层当前网络参数与相应尺度因子的距离，确定正则损失；

目标损失确定子单元，用于根据所述初始损失和所述正则损失，确定所述目标损失。

可选的，所述尺度因子确定子单元，具体用于：

针对更新前的目标检测网络中的各层当前网络参数，确定该层当前网络参数的中值；

将中值确定结果作为该层当前网络参数对应的尺度因子。

上述目标检测网络训练装置可执行本发明任意实施例所提供的目标检测网络训练方法，具备执行各目标检测网络训练方法相应的功能模块和有益效果。

实施例5

图5示出了可以用来实施本发明的实施例的电子设备50的结构示意图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本发明的实现。

如图5所示，电子设备50包括至少一个处理器51，以及与至少一个处理器51通信连接的存储器，如只读存储器(ROM)52、随机访问存储器(RAM)53等，其中，存储器存储有可被至少一个处理器执行的计算机程序，处理器51可以根据存储在只读存储器(ROM)52中的计算机程序或者从存储单元58加载到随机访问存储器(RAM)53中的计算机程序，来执行各种适当的动作和处理。在RAM 53中，还可存储电子设备50操作所需的各种程序和数据。处理器51、ROM 52以及RAM 53通过总线54彼此相连。输入/输出(I/O)接口55也连接至总线54。

电子设备50中的多个部件连接至I/O接口55，包括：输入单元56，例如键盘、鼠标等；输出单元57，例如各种类型的显示器、扬声器等；存储单元58，例如磁盘、光盘等；以及通信单元59，例如网卡、调制解调器、无线通信收发机等。通信单元59允许电子设备50通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理，例如目标检测网络训练方法。

在一些实施例中，目标检测网络训练方法可被实现为计算机程序，其被有形地包含于计算机可读存储介质，例如存储单元58。在一些实施例中，计算机程序的部分或者全部可以经由ROM 52和/或通信单元59而被载入和/或安装到电子设备50上。当计算机程序加载到RAM 53并由处理器51执行时，可以执行上文描述的目标检测网络训练方法的一个或多个步骤。备选地，在其他实施例中，处理器51可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行目标检测网络训练方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器，使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本发明的上下文中，计算机可读存储介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。备选地，计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在电子设备上实施此处描述的系统和技术，该电子设备具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、区块链网络和互联网。

计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务中，存在的管理难度大，业务扩展性弱的缺陷。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本发明的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种目标检测网络训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述当前网络参数包括权重参数和所述权重参数对应的权重偏移参数；

所述基于预设正切函数，对所述当前网络参数进行量化，以更新所述目标检测网络，包括：

根据所述权重参数和所述权重参数对应的权重偏移参数的差值，确定权重偏移量；

根据所述权重偏移量和预设放大系数，确定权重量化结果；

采用所述权重量化结果替换所述目标检测网络中相应的权重参数，以更新所述目标检测网络。

3.根据权利要求2所述的方法，其特征在于，所述预设放大系数随着训练次数的增加而增大。

4.根据权利要求3所述的方法，其特征在于，不同训练次数所采用的预设放大系数底数相同且大于1，指数随着训练次数的增加而增大。

5.根据权利要求1-4任一项所述的方法，其特征在于，所述根据样本图像和样本标签训练更新后的目标检测网络，以调整更新前的目标检测网络的当前网络参数，包括：

将所述样本图像输入至更新后的目标检测网络，得到样本预测结果；

根据所述样本预测结果和所述样本标签，确定目标损失；

确定更新前的目标检测网络的当前网络参数在目标反向传播函数下的反向传播结果；其中，所述目标反向传播函数为所述预设正切函数的导数函数；

根据所述目标损失和所述反向传播结果，调整更新前的目标检测网络的当前网络参数。

6.根据权利要求5所述的方法，其特征在于，所述根据所述样本预测结果和所述样本标签，确定目标损失，包括：

根据所述样本预测结果和所述样本标签，确定初始损失；

根据更新前的目标检测网络的当前网络参数，确定各层当前网络参数对应的尺度因子；

根据各层当前网络参数与相应尺度因子的距离，确定正则损失；

根据所述初始损失和所述正则损失，确定所述目标损失。

7.根据权利要求6所述的方法，其特征在于，所述根据更新前的目标检测网络的当前网络参数，确定各层当前网络参数对应的尺度因子，包括：

将中值确定结果作为该层当前网络参数对应的尺度因子。

8.一种目标检测网络训练装置，其特征在于，包括：

9.一种电子设备，其特征在于，所述电子设备包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的目标检测网络训练方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的目标检测网络训练方法。