CN114898108B

CN114898108B - 一种基于fpga的cnn模型轻量化方法、目标检测方法及系统

Info

Publication number: CN114898108B
Application number: CN202210321733.XA
Authority: CN
Inventors: 赵延龙; 尹振东; 吴芝路; 范浩天; 李大森
Original assignee: Harbin Institute of Technology
Current assignee: Harbin Institute of Technology
Priority date: 2022-03-30
Filing date: 2022-03-30
Publication date: 2023-01-06
Anticipated expiration: 2042-03-30
Also published as: CN114898108A

Abstract

一种基于FPGA的CNN模型轻量化方法、一种目标检测方法及系统，涉及目标检测技术领域，用以解决现有基于FPGA的CNN模型在目标检测中能量效率较低导致不能满足低功耗、低延时计算需求的问题。本发明的技术要点包括：对SqueezeNet网络模型的卷积层进行定点化，定点化是指对计算和内存存储中的浮点数进行定点表示和运算，包括对输入特征图的定点化、对卷积层参数的定点化和对卷积层激活函数的定点化，其中，输入特征图和卷积层参数均为单精度浮点数；进而还提供一种包含上述SqueezeNet网络模型的目标检测方法及系统。本发明降低了检测网络的计算复杂度，适用于特定场景下的边缘计算平台，提升了检测模型的能量使用效率。

Description

一种基于FPGA的CNN模型轻量化方法、目标检测方法及系统

技术领域

本发明涉及目标检测技术领域，具体涉及一种基于FPGA的CNN模型轻量化方法、一种目标检测方法及系统。

背景技术

目标检测是计算机视觉中一个重要研究方向，其任务是识别并定位出图像中的目标。在无人机、机器人等边缘计算平台上，由于其有限的计算资源，并且对实时性和低功耗的要求很高，实现比较复杂。在这类场景下通常选取计算量较小的轻量级CNN(卷积神经网络)模型进行检测任务，如SqueezeNet V1.1网络模型。此外，为了能快速运行CNN模型，一般可选择FPGA(现场可编程逻辑门阵列)作为解决方案，FPGA具有较高的能量利用效率，其可同GPU(图形处理器)具有相近的运算性能，功耗却显著低于GPU，并且FPGA的开发难度远小于ASIC(专用集成电路)芯片，可以灵活地重新配置。所以，通常选择FPGA作为此类场景下的CNN硬件加速器的解决方案。现有的FPGA2016^[1]、FPT2017^[2]和SqueezeNet^[3]等研究实现了基于FPGA的CNN模型的定点化和加速算法，但是这些方法的能量效率(即单位功耗下FPGA能实现的计算性能)较低，不能满足低功耗、低延时的计算需求。

发明内容

鉴于以上问题，本发明提出一种基于FPGA的CNN模型轻量化方法、一种目标检测方法及系统，用以解决现有基于FPGA的CNN模型在目标检测中能量效率较低导致不能满足低功耗、低延时计算需求的问题。

根据本发明的一方面，提供一种基于FPGA的CNN模型轻量化方法，该方法包括：对SqueezeNet网络模型包含的卷积层进行定点化，所述定点化是指对计算和内存存储中的浮点数进行定点表示和运算；包括对输入特征图的定点化、对卷积层参数的定点化、对卷积层激活函数输出的激活图定点化；其中，卷积层参数包括卷积层权重参数和卷积层偏置参数；所述输入特征图和所述卷积层参数为单精度浮点数。

进一步地，采用线性量化方法对输入特征图或卷积层参数进行定点化，具体包括：假设输入特征图或卷积层参数的数量为N，

首先，对输入特征图X或卷积层权重参数W或卷积层偏置参数b的绝对值分别进行降序排序；

然后，使降序排序后的N个绝对值的前M个绝对值所对应的输入特征图X或卷积层权重参数W或卷积层偏置参数b在线性量化之后溢出量化范围，从而获得降序排序后的输入特征图X或卷积层权重参数W或卷积层偏置参数b的第M+1个绝对值；

然后，根据第M+1个绝对值分别确定输入特征图X所对应的第一动态范围参数Q₁、卷积层权重参数W所对应的第二动态范围参数Q₂、卷积层偏置参数b所对应的第三动态范围参数Q₃；其中，

x_M+1表示降序排序后的输入特征图X的第M+1个绝对值；

w_M+1表示降序排序后的卷积层权重参数W的第M+1个绝对值；

b_M+1表示降序排序后的卷积层偏置参数b的第M+1个绝对值；

然后，根据第一动态范围参数Q₁、第二动态范围参数Q₂、第三动态范围参数Q₃分别获得B比特线性量化之后的输入特征图或卷积层参数：

式中，x′_i、w′_i、b′_i分别表示定点化后的输入特征图、卷积层权重参数和卷积层偏置参数；x_i、w_i、b_i分别表示未定点化前的输入特征图、卷积层权重参数和卷积层偏置参数；B表示定点化表示所需的比特数。

进一步地，对卷积层激活函数的定点化采用线性量化方法进行定点化，所述激活函数为ReLU函数；具体包括：卷积层中激活值均为非负值，假设卷积层共有N1个激活值；

首先，对N1个激活值进行降序排序；

然后，使降序排序后的N1个激活值的前M1个激活值在线性量化之后溢出量化范围，从而获得第M1+1个激活值；

然后，根据第M1+1个激活值确定动态范围参数P，

其中，a_M1+1表示第M1+1个激活值；

然后，根据动态范围参数P获得B比特线性量化之后的激活值：

式中，a_i'表示定点化后的激活值；a_i表示未定点化前的激活值。

根据本发明的另一方面，提供一种目标检测方法，该方法包括以下步骤：

步骤一、获取多张图像对应的特征图；

步骤二、利用CNN模型对输入的特征图进行目标检测，获取检测结果；其中，CNN模型是利用上述基于FPGA的CNN模型轻量化方法获得的SqueezeNet网络模型。

根据本发明的另一方面，提供一种目标检测系统，该系统包括：

特征图获取模块，其配置成获取多张图像对应的特征图；

目标检测模块，其配置成利用CNN模型对输入的特征图进行目标检测，CNN模型为SqueezeNet网络模型；包括CNN模型轻量化子模块，所述CNN模型轻量化子模块配置成：对SqueezeNet网络模型包含的卷积层进行定点化，所述定点化是指对计算和内存存储中的浮点数进行定点表示和运算；

检测结果输出模块，其配置成输出目标检测结果。

进一步地，所述CNN模型轻量化子模块包括输入特征图定点化单元、卷积层参数定点化单元、卷积层激活函数定点化单元；其中，

所述输入特征图定点化单元，其配置成采用线性量化方法对输入特征图进行定点化，所述输入特征图为单精度浮点数；具体包括：假设输入特征图的数量为N，

首先，对输入特征图X的绝对值进行降序排序；

然后，使降序排序后的N个绝对值的前M个绝对值所对应的输入特征图X在线性量化之后溢出量化范围，从而获得降序排序后的输入特征图X的第M+1个绝对值；

然后，根据第M+1个绝对值确定输入特征图X所对应的第一动态范围参数Q₁，

x_M+1表示降序排序后的输入特征图X的第M+1个绝对值；

然后，根据第一动态范围参数Q₁获得B比特线性量化之后的输入特征图：

式中，x′_i表示定点化后的输入特征图；x_i表示未定点化前的输入特征图；B表示定点化表示所需的比特数。

进一步地，所述卷积层参数定点化单元配置成采用线性量化方法对卷积层参数进行定点化，所述卷积层参数包括卷积层权重参数和卷积层偏置参数，所述卷积层参数为单精度浮点数；具体包括：假设卷积层参数的数量为N，首先，对卷积层权重参数W或卷积层偏置参数b的绝对值分别进行降序排序；

然后，使降序排序后的N个绝对值的前M个绝对值所对应的卷积层权重参数W或卷积层偏置参数b在线性量化之后溢出量化范围，从而获得降序排序后的卷积层权重参数W或卷积层偏置参数b的第M+1个绝对值；

然后，根据第M+1个绝对值分别确定卷积层权重参数W所对应的第二动态范围参数Q₂、卷积层偏置参数b所对应的第三动态范围参数Q₃；其中，

w_M+1表示降序排序后的卷积层权重参数W的第M+1个绝对值；

b_M+1表示降序排序后的卷积层偏置参数b的第M+1个绝对值；

然后，根据第二动态范围参数Q₂、第三动态范围参数Q₃分别获得B比特线性量化之后的卷积层参数：

式中，w′_i、b′_i分别表示定点化后的卷积层权重参数和卷积层偏置参数；w_i、b_i分别表示未定点化前的卷积层权重参数和卷积层偏置参数。

进一步地，采用线性量化方法对卷积层激活函数的激活图进行定点化，所述激活函数为ReLU函数；具体包括：激活图中激活值均为非负值，假设卷积层共有N1个激活值；

首先，对N1个激活值进行降序排序；

然后，根据第M1+1个激活值确定动态范围参数P，

其中，a_M1+1表示第M1+1个激活值；

本发明的有益技术效果是：

本发明提供一种基于FPGA的CNN模型轻量化方法，并将其应用在基于CNN模型的目标检测中，本发明针对广泛使用的SqueezeNet目标检测模型，通过对网络卷积层的输入特征图、卷积层参数和激活图进行定点化，实现了网络模型轻量化的目的，降低了检测网络的计算复杂度，使其能够适用于特定场景下的边缘计算平台，提升了检测模型的能量使用效率。

附图说明

本发明可以通过参考下文中结合附图所给出的描述而得到更好的理解，所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分，而且用来进一步举例说明本发明的优选实施例和解释本发明的原理和优点。

图1示出了SqueezeNet V1.1网络模型结构图；

图2示出了本发明实施例中SqueezeNet V1.1网络模型中卷积层定点化的过程图；

图3示出了本发明实施例中SqueezeNet V1.1网络模型中卷积层参数的量化位数和模型准确率之间的关系对比图；

图4示出了本发明实施例基于FPGA和CNN模型的目标检测方法的过程示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，在下文中将结合附图对本发明的示范性实施方式或实施例进行描述。显然，所描述的实施方式或实施例仅仅是本发明一部分的实施方式或实施例，而不是全部的。基于本发明中的实施方式或实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式或实施例，都应当属于本发明保护的范围。

对于在无人机、机器人等边缘计算平台上的目标检测任务，一般通过摄像头捕获到图像后，对图像数据使用FPGA实现的相关算法进行一系列处理，在处理过程中目标检测是为了将图像中的目标识别并定位，利用CNN模型可以对图像进行目标检测处理。对于需要实时处理的多帧图像，为了满足目标检测实时性的需要，通常都选择由Iandola等人^[4]提出的小型CNN网络结构-SqueezeNet网络。图1示出了SqueezeNet V1.1的网络模型结构，SqueezeNet V1.1网络中使用了1*1卷积对输入特征图进行压缩的结构被称为Fire层，其极大降低了网络的运算量和参数存储所需的空间，满足实时性场景的需要。

本发明第一实施例提供一种基于FPGA的CNN模型轻量化方法，该方法包括：对SqueezeNet网络模型包含的卷积层进行定点化，定点化是指对计算和内存存储中的浮点数进行定点表示和运算；包括对输入特征图的定点化、对卷积层参数的定点化、对卷积层激活图的定点化；其中，卷积层参数包括卷积层权重参数和卷积层偏置参数；输入特征图和卷积层参数为单精度浮点数。

本实施例中，可选地，对输入特征图或卷积层参数的定点化采用线性量化方法进行定点化，具体包括：假设输入特征图或卷积层参数的数量为N，

x_M+1表示降序排序后的输入特征图X的第M+1个绝对值；

w_M+1表示降序排序后的卷积层权重参数W的第M+1个绝对值；

b_M+1表示降序排序后的卷积层偏置参数b的第M+1个绝对值；

本实施例中，可选地，对卷积层激活图的定点化采用线性量化方法进行定点化，激活函数为ReLU函数；具体包括：激活图中激活值均为非负值，假设激活图共有N1个激活值；

首先，对N1个激活值进行降序排序；

然后，根据第M1+1个激活值确定动态范围参数P，

其中，a_M1+1表示第M1+1个激活值；

着眼于检测网络中具有大量参数运算的卷积层的定点化，本发明第二实施例提出一种基于FPGA的CNN模型轻量化方法，主要是对SqueezeNet V1.1网络模型的参数进行定点化，因为FPGA消耗同样的逻辑资源，定点运算相比于浮点的计算速度更快。又因为SqueezeNet V1.1网络模型只包含卷积层和池化层，所以将模型的卷积层定点化后，池化层的相关运算也可以用定点数运算表示。因此，将SqueezeNet V1.1网络模型中的卷积层定点化，即可实现整个模型的定点化。

对于任意卷积层输出特征图的任意元素Y，其计算过程可以表示为：

Y＝max(W·X+b,0)

其中，X为输入特征图，为单精度浮点数；W为单精度浮点权重参数；b为单精度浮点偏置参数；max(*)表示ReLU激活层的实现函数。

对SqueezeNet V1.1网络模型进行定点化，是分别对输入特征图的定点化、对卷积层参数(权重和偏置)的定点化和对卷积层激活函数的定点化，如图2所示。

SqueezeNet V1.1网络模型中输入特征图、卷积层的权重参数和卷积层的偏置参数基本成0均值的正态分布，本发明实施例采用线性量化方法实现对输入特征图、卷积层的权重参数和卷积层的偏置参数的定点化。接下来以卷积层的权重参数为例进行说明，假设某卷积层有n个权重参数，记该卷积层的全部权重参数为向量W，其中：

W＝(w₀,w₁,...,w_n-1)，

在对参数进行线性量化时，首先将所有权重参数取绝对值得到：

W_abs＝(|w₀|,|w₁|,...,|w_n-1|)；

然后对权重参数的绝对值进行降序排序得到：

为了提高量化精度，可使绝对值最大的一部分权重参数(W_sorted中靠前的元素)在量化之后溢出量化范围，记溢出的比例为overflow，那么没有溢出量化范围的权重参数的最大绝对值w_max，

其中，

0≤overflow≤1；

表示向下取整。

此时，可确定参数的动态范围，令

除了溢出部分外，所有权重参数的满足：-2^Q≤w^* _j≤2^Q,j≥index。

对W中的所有权重参数进行B bit线性量化之后的结果w′_i为：

式中，B表示定点化卷积层权重参数所需的比特数，w_i可以近似表示为：

w_i≈w′_i×2^Q+1-B,i＝0,1,...,n-1。

对溢出部分的权重参数进行钳位，对所有w_k’满足w_k’>2^B-1-1：

w′_k＝2^B-1-1，

对所有w_l’满足w_l’<-2^B-1：

w′_l＝-2^B-1。

此时，B bit线性量化之后的权重参数为

W’＝(w′₀,w′₁,...,w′_n-1)。

网络模型中的偏置参数b和输入特征图X，都可以按照上述权重参数W的定点化方法来进行定点化。

而对于激活层的定点化如下过程所示：

由于SqueezeNet V1.1网络模型中使用的激活函数为ReLU函数，其函数表达式f(x)为：

f(x)＝max(0,x)

所以模型中所有卷积层激活图中任意元素均未非负数，激活图为激活函数的输出值。假设某一卷积层中激活图共有n个激活值，该卷积层的全部激活值记为A＝(a₀,a₁,...,a_n-1)，其中，

a_i≥0,i＝0,1,...,n-1

对所有激活值进行降序排列：

为了提高量化精度，可使绝对值最大的一小部分激活值在量化之后溢出量化范围，记溢出的比例为overflow，可确定溢出overflow下的最大值a_max：

其中，

0≤overflow≤1，

表示向下取整。

此时可确定激活值的动态范围，令：

除溢出部分外，所有激活值满足：

0≤a_j≤2^P-1

对A中全部激活值进行B bit线性量化的结果为：

a_i可近似表示为：

a_i≈a′_i×2^P-B,i＝0,1,...,n-1

再对溢出部分的激活值进行钳位，对所有a′_k满足a′_k＞2^B-1：

a′_k＝2^B-1

此时，B bit线性量化之后的激活值为：

A^’＝(a′₀,a′₁,...,a′_n-1)

通过以上对卷积层权重参数定点化和卷积层激活图定点化的说明，同时将对卷积层权重参数的线性定点化方法套用到输入特征图和卷积层偏置参数定点化过程。使用W^int表示定点化后的卷积层权重参数向量，X^int表示定点化后的输入特征图，b^int表示定点化后的卷积层偏置参数向量，Y^int表示定点化后的输出特征图(激活图)。经定点化后的卷积层运算过程可表示为：

Y^int＝max(W^int·X^int+b^int,0)

进一步通过实验验证本发明实施例的技术效果。图3示出了SqueezeNet V1.1网络模型参数的量化位数和模型准确率之间的关系对比图。从图3中可以看出，当网络模型量化位数下降时，网络模型的准确率也下降。但是，经测试当降低至8位时，本发明实施例所改进的CNN模型仍可保证很好的效果。在FPGA上，卷积层参数和激活图的位数越低，消耗的逻辑资源越少，计算速度越快。本实施例中权重参数、偏置、激活图采用了8bit定点化SqueezeNet V1.1网络模型，模型在ImageNet 2012验证集上top-5上的正确率为80.194％。

进一步地，将在相同FPGA厂商Intel公司生产的同制程超大体量的FPGA平台上相关研究FPGA2016、FPT2017和在不同FPGA厂商Xilinx公司生产的同制程、面向嵌入式系统的FPGA平台上相关研究SqueezeJet进行对比实验，实验结果如表1所示。

表1本发明与相关研究对比

表1中能量效率表示的是单位功耗下FPGA能实现的计算性能，从表1可以看出，本发明方法对FPGA硬件资源的要求较低，能量效率约为其他相关研究的1.9倍。

本发明第三实施例提供一种目标检测方法，如图4所示，该方法包括以下步骤：

步骤一、获取多张图像对应的特征图；

步骤二、利用CNN模型对输入的特征图进行目标检测，获取检测结果；其中，CNN模型是利用第一实施例或第二实施例的基于FPGA的CNN模型轻量化方法获得的SqueezeNet网络模型。

本发明第三实施例提供一种目标检测系统，该系统包括：

特征图获取模块，其配置成获取多张图像对应的特征图；

目标检测模块，其配置成利用CNN模型对输入的特征图进行目标检测，所述CNN模型为SqueezeNet网络模型；包括CNN模型轻量化子模块，CNN模型轻量化子模块配置成：对SqueezeNet网络模型包含的卷积层进行定点化，定点化是指对计算和内存存储中的浮点数进行定点表示和运算；

检测结果输出模块，其配置成输出目标检测结果。

本实施例中，可选地，CNN模型轻量化子模块包括输入特征图定点化单元、卷积层参数定点化单元、卷积层激活函数定点化单元；其中，

输入特征图定点化单元，其配置成采用线性量化方法对输入特征图进行定点化，输入特征图为单精度浮点数；具体包括：假设输入特征图的数量为N，

首先，对输入特征图X的绝对值进行降序排序；

x_M+1表示降序排序后的输入特征图X的第M+1个绝对值；

本实施例中，可选地，卷积层参数定点化单元配置成采用线性量化方法对卷积层参数进行定点化，卷积层参数包括卷积层权重参数和卷积层偏置参数，卷积层参数为单精度浮点数；具体包括：假设卷积层参数的数量为N，首先，对卷积层权重参数W或卷积层偏置参数b的绝对值分别进行降序排序；

w_M+1表示降序排序后的卷积层权重参数W的第M+1个绝对值；

b_M+1表示降序排序后的卷积层偏置参数b的第M+1个绝对值；

本实施例中，可选地，采用线性量化方法对卷积层激活函数进行定点化，激活函数为ReLU函数；具体包括：卷积层的激活图均为非负值，假设卷积层共有N1个激活值；

首先，对N1个激活值进行降序排序；

然后，根据第M1+1个激活值确定动态范围参数P，

其中，a_M1+1表示第M1+1个激活值；

式中，a_i′表示定点化后的激活值；a_i表示未定点化前的激活值。

尽管根据有限数量的实施例描述了本发明，但是受益于上面的描述，本技术领域内的技术人员明白，在由此描述的本发明的范围内，可以设想其它实施例。对于本发明的范围，对本发明所做的公开是说明性的，而非限制性的，本发明的范围由所附权利要求书限定。

本发明所援引的文献如下：

[1]Suda N,Chandra V,Dasika G,et al.Throughput-Optimized OpenCL-basedFPGA Accelerator for Large-Scale Convolutional Neural Networks[J].2016:16-25.

[2]Wang D,Xu K,Jiang D.PipeCNN:An OpenCL-based open-source FPGAaccelerator for convolution neural networks[C]//International Conference onField Programmable Technology.IEEE,2018:279-282.

[3]Mousouliotis P G,Petrou LP.SqueezeJet:High-level SynthesisAccelerator Design for Deep Convolutional Neural Networks[J].2018.

[4]Iandola F N,Han S,Moskewicz M W,et al.SqueezeNet:AlexNet-levelaccuracy with 50x fewer parameters and<0.5MB model size[J].arXiv:ComputerVision and Pattern Recognition,2017.

Claims

1.一种目标检测方法，其特征在于，包括以下步骤：

步骤一、获取多张图像对应的特征图；

步骤二、利用CNN模型对输入的特征图进行目标检测，获取检测结果；其中，所述CNN模型是利用基于FPGA的CNN模型轻量化方法获得的SqueezeNet网络模型；所述基于FPGA的CNN模型轻量化方法的具体过程为：对SqueezeNet网络模型包含的卷积层进行定点化，所述定点化是指对计算过程或内存存储中的浮点数表示进行定点数表示、浮点数运算进行定点数运算；包括对输入特征图的定点化、对卷积层参数的定点化、对卷积层激活函数的定点化；其中，卷积层参数包括卷积层权重参数和卷积层偏置参数；所述输入特征图和所述卷积层参数为单精度浮点数；

其中，对输入特征图或卷积层参数的定点化采用线性量化方法进行定点化，具体包括：假设输入特征图或卷积层参数的数量为N，

然后，根据预设的溢出比例查找降序排序后N个绝对值中的第M+1个绝对值；其中，前M个绝对值所对应的输入特征图X或卷积层权重参数W或卷积层偏置参数b在线性量化之后溢出量化范围；

x_M+1表示降序排序后的输入特征图X的第M+1个绝对值；

w_M+1表示降序排序后的卷积层权重参数W的第M+1个绝对值；

b_M+1表示降序排序后的卷积层偏置参数b的第M+1个绝对值；

式中，x′_i、w′_i、b′_i分别表示定点化后的输入特征图、卷积层权重参数和卷积层偏置参数；x_i、w_i、b_i分别表示未定点化前的输入特征图、卷积层权重参数和卷积层偏置参数；B表示定点化表示所需的比特数；

对卷积层激活函数的输出值为激活图，采用线性量化方法进行定点化，所述激活函数为ReLU函数，激活图的激活值均为非负值；具体包括：假设卷积层共有N1个激活值；

首先，对N1个激活值进行降序排序；

然后，根据预设的溢出比例查找降序排序后N1个激活值中的第M1+1个激活值；其中，前M1个激活值在线性量化之后溢出量化范围；

然后，根据第M1+1个激活值确定动态范围参数P，

其中，a_M1+1表示第M1+1个激活值；

2.一种目标检测系统，其特征在于，包括：

特征图获取模块，其配置成获取多张图像对应的特征图；

目标检测模块，其配置成利用CNN模型对输入的特征图进行目标检测，所述CNN模型为SqueezeNet网络模型；包括CNN模型轻量化子模块，所述CNN模型轻量化子模块配置成：对SqueezeNet网络模型包含的卷积层进行定点化，所述定点化是指对计算过程或内存存储中的浮点数表示进行定点数表示、浮点数运算进行定点数运算；所述CNN模型轻量化子模块包括输入特征图定点化单元、卷积层参数定点化单元和卷积层激活函数定点化单元；其中，

首先，对输入特征图X的绝对值进行降序排序；

然后，根据预设的溢出比例查找降序排序后N个绝对值中的第M+1个绝对值；其中，前M个绝对值所对应的输入特征图X在线性量化之后溢出量化范围；

x_M+1表示降序排序后的输入特征图X的第M+1个绝对值；

式中，x′_i表示定点化后的输入特征图；x_i表示未定点化前的输入特征图；B表示定点化表示所需的比特数；

检测结果输出模块，其配置成输出目标检测结果。

3.根据权利要求2所述的一种目标检测系统，其特征在于，所述卷积层参数定点化单元配置成采用线性量化方法对卷积层参数进行定点化，所述卷积层参数包括卷积层权重参数和卷积层偏置参数，所述卷积层参数为单精度浮点数；具体包括：假设卷积层参数的数量为N，首先，对卷积层权重参数W或卷积层偏置参数b的绝对值分别进行降序排序；

然后，根据预设的溢出比例查找降序排序后N个绝对值中的第M+1个绝对值；其中，前M个绝对值所对应的卷积层权重参数W或卷积层偏置参数b在线性量化之后溢出量化范围；

w_M+1表示降序排序后的卷积层权重参数W的第M+1个绝对值；

b_M+1表示降序排序后的卷积层偏置参数b的第M+1个绝对值；

4.根据权利要求3所述的一种目标检测系统，其特征在于，所述卷积层激活函数定点化单元配置成采用线性量化方法对卷积层激活函数进行定点化，所述激活函数为ReLU函数；具体包括：卷积层中激活图均为非负值，假设卷积层共有N1个激活值；

首先，对N1个激活值进行降序排序；

然后，根据第M1+1个激活值确定动态范围参数P，

其中，a_M1+1表示第M1+1个激活值；