WO2021093780A1

WO2021093780A1 - 一种目标识别方法及装置

Info

Publication number: WO2021093780A1
Application number: PCT/CN2020/128171
Authority: WO
Inventors: 杨希超; 张渊; 谢迪; 浦世亮
Original assignee: 杭州海康威视数字技术股份有限公司
Priority date: 2019-11-13
Filing date: 2020-11-11
Publication date: 2021-05-20
Also published as: CN112800813A; CN112800813B

Abstract

一种目标识别方法及装置，所述方法包括：获取待识别图片（S101），将待识别图片输入预先训练的目标深度学习模型，得到待识别图片中的目标特征，其中，针对目标深度学习模型中的每一个网络层，将输入该网络层的输入特征、该网络层的网络权重和该网络层输出的输出特征中的至少一项量化为位宽小于16比特的整型数据（S102）。将该目标特征与预先标定的目标特征进行比较，得到待识别图片的目标识别结果（S103）。对于每个网络层，参与运算的是位宽较低的低比特整型数据，降低了参与运算的数据的位宽和数据量，能够提升目标深度学习模型进行目标识别的运算速率，从而提高了目标识别的效率。

Description

一种目标识别方法及装置

本申请要求于2019年11月13日提交中国专利局、申请号为201911108141.4、发明名称为“一种目标识别方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及机器学习技术领域，特别是涉及一种目标识别方法及装置。

背景技术

深度神经网络作为机器学习研究中的一个新兴领域，通过模仿人脑的机制来解析数据，是一种通过建立和模拟人脑进行分析学习的智能模型。目前，深度学习模型，如卷积神经网络模型、循环神经网络模型、长短期记忆网络模型等已在图像分类、目标检测、语音识别等方面成为了主流的应用方法。

目前，在目标识别的场景下，将待识别图片输入到训练好的目标深度学习模型中，由目标深度学习模型中的各网络层进行运算，基于运算结果能够识别出待识别图片中的目标。目标深度学习模型中的各网络层在进行运算时，参与运算的数据为单精度浮点数据，由于单精度浮点数据具有较高的位宽，参与运算的数据量较大，导致目标识别的效率较低。

发明内容

本申请实施例的目的在于提供一种目标识别方法及装置，以提高目标识别的效率。具体技术方案如下：

第一方面，本申请实施例提供了一种目标识别方法，该方法包括：

获取待识别图片；

将待识别图片输入预先训练的目标深度学习模型，得到待识别图片中的目标特征，其中，针对目标深度学习模型中的每一个网络层，将输入该网络层的输入特征、该网络层的网络权重和该网络层输出的输出特征中的至少一项量化为位宽小于16比特的整型数据；

将目标特征与预先标定的目标特征进行比较，得到待识别图片的目标识别结果。

可选的，在将待识别图片输入预先训练的目标深度学习模型，得到待识别图片中的目标特征的步骤之前，该方法还包括：

对待识别图片进行预处理操作，得到预处理后的待识别图片，其中，预处理操作至少包括对待识别图片进行裁剪。

可选的，目标深度学习模型中的网络层包括：卷积层、全连接层、池化层、批归一化层、合并层和拼接层。

可选的，将该网络层的网络权重量化为位宽小于16比特的整型数据的步骤，包括：

针对该网络层的各滤波器，读取该滤波器中绝对值最大的网络权重；

根据绝对值最大的网络权重及小于16比特的预设位宽，计算该滤波器对应的量化步长；

利用量化步长，将该滤波器中的各网络权重量化为预设位宽的整型数据。

可选的，将输入该网络层的输入特征量化为位宽小于16比特的整型数据的步骤，包括：

获取多个预设的待定步长，其中，待定步长对应的位宽小于16比特；

分别计算利用各待定步长对输入特征进行量化的量化误差；

利用最小的量化误差对应的待定步长，将输入特征量化为位宽小于16比特的整型数据。

可选的，将该网络层输出的输出特征量化为位宽小于16比特的整型数据的步骤，包括：

分别计算利用各待定步长对输出特征进行量化的量化误差；

利用最小的量化误差对应的待定步长，将输出特征量化为位宽小于16比特的整型数据。

可选的，获取待识别图片的步骤，包括：

获取人脸采集设备采集的人脸图片，或者，获取车辆采集设备采集的车辆图片；

将待识别图片输入预先训练的目标深度学习模型，得到待识别图片中的目标特征的步骤，包括：

将人脸图片输入预先训练的目标深度学习模型，得到人脸图片中的目标人脸特征，或者，将车辆图片输入预先训练的目标深度学习模型，得到车辆图片中的目标车辆特征；

将目标特征与预先标定的目标特征进行比较，得到待识别图片的目标识别结果的步骤，包括：

将目标人脸特征与预设人脸特征进行比较，得到人脸识别结果，或者，将目标车辆特征与预设车辆特征进行比较，得到车辆识别结果。

第二方面，本申请实施例提供了一种目标识别装置，该装置包括：

获取模块，用于获取待识别图片；

计算模块，用于将待识别图片输入预先训练的目标深度学习模型，得到待识别图片中的目标特征，其中，针对目标深度学习模型中的每一个网络层，将输入该网络层的输入特征、该网络层的网络权重和该网络层输出的输出特征中的至少一项量化为位宽小于16比特的整型数据；

比较模块，用于将目标特征与预先标定的目标特征进行比较，得到待识别图片的目标识别结果。

可选的，该装置还包括：

预处理模块，用于对待识别图片进行预处理操作，得到预处理后的待识别图片，其中，预处理操作至少包括对待识别图片进行裁剪。

可选的，计算模块，在用于将该网络层的网络权重量化为位宽小于16比特的整型数据时，具体用于：

可选的，计算模块，在用于将输入该网络层的输入特征量化为位宽小于16比特的整型数据时，具体用于：

分别计算利用各待定步长对输入特征进行量化的量化误差；

可选的，计算模块，在用于将该网络层输出的输出特征量化为位宽小于16比特的整型数据时，具体用于：

分别计算利用各待定步长对输出特征进行量化的量化误差；

可选的，获取模块，具体用于：

计算模块，具体用于：

比较模块，具体用于：

第三方面，本申请实施例提供了一种计算机设备，包括处理器和机器可读存储介质，机器可读存储介质存储有能够被处理器执行的机器可执行指令，处理器被机器可执行指令促使：实现本申请实施例第一方面提供的方法。

第四方面，本申请实施例提供了一种机器可读存储介质，存储有机器可执行指令，在被处理器调用和执行时，实现本申请实施例第一方面提供的方法。

第五方面，本申请实施例提供了一种计算机程序产品，用于在运行时执行本申请实施例第一方面提供的方法。

本申请实施例提供的一种目标识别方法及装置，获取待识别图片，将待识别图片输入预先训练的目标深度学习模型，得到待识别图片中的目标特征，将该目标特征与预先标定的目标特征进行比较，得到待识别图片的目标识别结果。其中，目标深度学习模型在对输入的待识别图片进行运算时，针对目标深度学习模型中的每一个网络层，将输入该网络层的输入特征、该网络层的网络权重和该网络层输出的输出特征中的至少一项量化为位宽小于16比特的整型数据。针对目标深度学习模型中的各网络层，输入网络层的输入特征、网络层的网络权重或者网络层输出的输出特征被量化成位宽小于16比特的整型数据，这样，对于每个网络层，参与运算的是位宽较低的低比特整型数据，降低了参与运算的数据的位宽和数据量，能够提升目标深度学习模型进行目标识别的运算速率，从而提高了目标识别的效率。

附图说明

为了更清楚地说明本申请实施例和现有技术的技术方案，下面对实施例和现有技术中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例的目标识别方法的流程示意图；

图2a为本申请实施例的卷积层的结构示意图；

图2b为本申请实施例的全连接层的结构示意图；

图2c为本申请实施例的池化层的结构示意图；

图2d为本申请实施例的批归一化层的结构示意图；

图2e为本申请实施例的合并层的结构示意图；

图2f为本申请实施例的拼接层的结构示意图；

图3为本申请实施例的目标识别装置的结构示意图；

图4为本申请实施例的计算机设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案、及优点更加清楚明白，以下参照附图并举实施例，对本申请进一步详细说明。显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了提高目标识别的效率，本申请实施例提供了一种目标识别方法、装置、计算机设备及机器可读存储介质。下面，首先对本申请实施例所提供的目标识别方法进行介绍。

本申请实施例所提供的一种目标识别方法的执行主体可以为具有目标识别功能的计算机设备，例如智能相机、目标识别器等，执行主体中至少包括具有数据处理能力的核心处理芯片。实现本申请实施例所提供的一种目标识别方法的方式可以为设置于执行主体中的软件、硬件电路和逻辑电路的至少一种方式。

如图1所示，为本申请实施例的目标识别方法的流程示意图，该方法可以包括如下步骤。

S101，获取待识别图片。

待识别图片为包含有需要识别的目标的图片，例如，需要进行人脸目标识别，则待识别图片可以为智能相机对监控区域进行拍摄，在有行人进入监控区域时拍摄到的包含有人脸目标的图片，也可以是用户根据需求输入的包含有人脸目标的图片。本申请实施例所提及的目标不限于人脸目标，还可以为汽车、自行车、建筑等目标。

S102，将待识别图片输入预先训练的目标深度学习模型，得到待识别图片中的目标特征，其中，针对目标深度学习模型中的每一个网络层，将输入该网络层的输入特征、该网络层的网络权重和该网络层输出的输出特征中的至少一项量化为位宽小于16比特的整型数据。

获取到待识别图片后，将待识别图片输入到目标深度学习模型中，目标深度学习模型为深度学习网络模型，例如卷积神经网络模型、循环神经网络模型、长短期记忆网络模型等，经过目标深度学习模型中各网络层的运算，目标深度学习模型可以输出待识别图片中的目标特征。

目标深度学习模型是预先基于训练样本训练得到的，训练样本可以是预先标记了指定目标的样本图片，将训练样本输入到初始的网络模型中，利用BP(Back Propagation，反向传播)算法或者其他模型训练算法，对训练样本进行运算，将运算结果和设置的标称值进行比较，基于比较结果，对网络模型的网络权值进行调整。通过将不同的训练样本依次输入神经网络模型，迭代执行上述步骤，对网络权值的不断地进行调整，网络模型的输出会越来越逼近于标称值，直至网络模型的输出与标称值的差异足够小(小于预设阈值)，或者网络模型的输出收敛时，则将最终的网络模型确定为目标深度学习模型。

在利用目标深度学习模型对输入的待识别图片进行运算的过程中，针对目标深度学习模型中的每一个网络层，将输入该网络层的输入特征、该网络层的网络权重和该网络层输出的输出特征中的至少一项量化为位宽小于16比特的整型数据，即将输入该网络层的输入特征、该网络层的网络权重和该网络层输出的输出特征中的至少一项量化为位宽小于16比特的低比特整型数据。经过这样的量化处理，使得参与运算的数据从单精度浮点数据变为了位宽小于16比特的低比特整型数据，降低了参与运算的数据的位宽和数据量。

在本申请实施例的一种实现方式中，目标深度学习模型中的网络层可以包括：卷积层、全连接层、池化层、批归一化层、合并层和拼接层。

对于深度学习模型而言，具体可以包括如下网络层：Convolution层(卷积层)(如图2a所示)、InnerProduct层(全连接层)(如图2b所示)、Pooling层(池化层)(如图2c所示)、用于调节通道的尺度的BN层(Batch Normalization，批归一化层)(如图2d所示)、用于将两个输入相加合并的Eltwise层(合并层)(如图2e所示)和用于将两个输入拼接的Concat层(拼接层)(如图2f所示)，深度学习模型中每个类型的网络层的数目不做限定。图2a至图2f中，I _INTn表示n比特的整型输入特征，W _INTn表示n比特的整型网络权重，O _INTn表示n比特的整型输出特征，I1 _INTn和I2 _INTn表示2个分支的n比特的整型输入特征，这里的n小于16。一种可实现的方式中，上述各网络层类型中，网络权重、输入特征、输出特征均可以为n比特整型数据。

S103，将该目标特征与预先标定的目标特征进行比较，得到待识别图片的目标识别结果。

在利用目标深度学习模型计算得到待识别图片中的目标特征后，可以将该目标特征与预先标定的目标特征进行比较，通过特征值的一一比对，判断该目标特征是否为标定的目标特征，从而可以得到待识别图片中的目标是否为标定的目标、待识别图片中的目标是标定的目标的可能性有多大、目标在待识别图片中的位置等识别结果。具体的比较过程可以是逐特征点进行比较，判断每个特征点和标定的目标特征中相应的特征点是否相同，如果相同的特征点的数目超过阈值，则认为待识别图片中的目标为标定的目标。

应用本申请实施例，获取待识别图片，将待识别图片输入预先训练的目标深度学习模型，得到待识别图片中的目标特征，将该目标特征与预先标定的目标特征进行比较，得到待识别图片的目标识别结果。其中，目标深度学习模型在对输入的待识别图片进行运算时，针对目标深度学习模型中的每一个网络层，将输入该网络层的输入特征、该网络层的网络权重和该网络层输出的输出特征中的至少一项量化为位宽小于16比特的整型数据。针对目标深度学习模型中的各网络层，输入网络层的输入特征、网络层的网络权重或者网络层输出的输出特征被量化成位宽小于16比特的整型数据，这样，对于每个网络层，参与运算的是位宽较低的低比特整型数据，降低了参与运算的数据的位宽和数据量，能够提升目标深度学习模型进行目标识别的运算速率，从而提高了目标识别的效率。

基于图1所示实施例，在人脸识别的场景下，人脸识别的执行过程主要包括：获取人脸采集设备采集的人脸图片；将人脸图片输入预先训练的目标深度学习模型，得到人脸图片中的目标人脸特征；将目标人脸特征与预设人脸特征进行比较，得到人脸识别结果。

在车辆识别的场景下，车辆识别的执行过程主要包括：获取车辆采集设备采集的车辆图片；将车辆图片输入预先训练的目标深度学习模型，得到车辆图片中的目标车辆特征；将目标车辆特征与预设车辆特征进行比较，得到车辆识别结果。

在本申请实施例的一种实现方式中，在图1所示实施例中，将网络层的网络权重量化为位宽小于16比特的整型数据的步骤，具体可以为：

针对网络层的各滤波器，读取该滤波器中绝对值最大的网络权重；根据绝对值最大的网络权重及小于16比特的预设位宽，计算该滤波器对应的量化步长；利用量化步长，将该滤波器中的各网络权重量化为预设位宽的整型数据。

一个网络层是由多个filter(滤波器)组成的，一个filter就是一个卷积核，一个filter中包括多个网络权重，针对于每一个filter，可以从该filter中读取出绝对值最大的网络权重W _max，预设位宽是期望将网络权重量化到多大位宽，预设位宽小于16比特，根据绝对值最大的网络权重W _max和小于16比特的预设位宽bitwidth，可以计算出该filter对应的量化步长step _W，具体可以利用公式(1)进行计算：

step _W＝W _max/(2 ^bitwidth-1) (1)

在计算得到量化步长step _W后，可以利用量化步长step _W对滤波器中的各网络权重进行量化，量化得到预设位宽的低比特整型数据。

在本申请实施例的一种实现方式中，在图1所示实施例中，将输入该网络层的输入特征量化为位宽小于16比特的整型数据的步骤，具体可以为：获取多个预设的待定步长，其中，待定步长对应的位宽小于16比特；分别计算利用各待定步长对输入特征进行量化的量化误差；利用最小的量化误差对应的待定步长，将输入特征量化为位宽小于16比特的整型数据。

在本申请实施例的一种实现方式中，在图1所示实施例中，将该网络层输出的输出特征量化为位宽小于16比特的整型数据的步骤，具体可以为：获取多个预设的待定步长，其中，待定步长对应的位宽小于16比特；分别计算利用各待定步长对输出特征进行量化的量化误差；利用最小的量化误差对应的待定步长，将输出特征量化为位宽小于16比特的整型数据。

对于输入特征或者输出特征，可以利用多个预设的待定步长step分别对特征进行量化，可以得到该待定步长step下量化后的特征整型值A _q，利用原本的特征浮点值A _float减去待定步长step与特征整型值A _q的乘积，得到该待定步长step下的量化误差，可以得到多个量化误差，利用公式(2)，得到量化误差的最小值，该最小值所对应的待定步长即为输入特征/输出特征的量化步长Step _a，利用该量化步长Step _a对输入特征/输出特征进行量化，量化得到预设位宽的低比特整型数据。

step _a＝argmin _step||A _float-step*A _q|| _n (2)

在利用步长，对输入特征、网络权重、输出特征进行量化时，具体可以利用公式(3)计算得到量化后的数据。

Q _float＝step*Q _INTn (3)

其中，Q _float为原始的输入特征、网络权重或输出特征的浮点值，step为量化所使用的步长，Q _INTn为量化后的数据。

在对网络层的网络权重进行量化时，量化参数可以是预先计算好的，也可以是在进行量化时实时计算的，不论是预先计算量化参数还是实时计算量化参数，都可以采用上述公式，预先计算量化参数的情况下，计算好的量化参数预先记录在一个缓存中，在进行量化时直接从缓存中读取量化参数进行量化。

在本申请实施例的一种实现方式中，本申请实施例在执行S102之前，还可以执行：对待识别图片进行预处理操作，得到预处理后的待识别图片，其中，预处理操作至少可以包括对待识别图片进行裁剪。

在获取到待识别图片后，由于原始的待识别图片过大、图片质量较差等问题，目标深度学习模型无法对原始的待识别图片直接进行运算，则需要对待识别图片先进行预处理操作，预处理操作至少包括对待识别图片进行裁剪，还可以包括对待识别图像进行灰度化、像素值归一化等操作。经过预处理操作，将待识别图像预处理为更易于目标深度学习模型运算的图片，再将预处理后的待识别图片输入目标深度学习模型，由目标深度学习模型对其进行运算。

相应于上述方法实施例，本申请实施例提供了一种目标识别装置，如图3所示，该装置可以包括：

获取模块310，用于获取待识别图片；

计算模块320，用于将待识别图片输入预先训练的目标深度学习模型，得到待识别图片中的目标特征，其中，针对目标深度学习模型中的每一个网络层，将输入该网络层的输入特征、该网络层的网络权重和该网络层输出的输出特征中的至少一项量化为位宽小于16比特的整型数据；

比较模块330，用于将该目标特征与预先标定的目标特征进行比较，得到待识别图片的目标识别结果。

在本申请实施例的一种实现方式中，该装置还可以包括：

在本申请实施例的一种实现方式中，计算模块320，在用于将该网络层的网络权重量化为位宽小于16比特的整型数据时，具体可以用于：针对该网络层的各滤波器，读取该滤波器中绝对值最大的网络权重；根据绝对值最大的网络权重及小于16比特的预设位宽，计算该滤波器对应的量化步长；利用量化步长，将该滤波器中的各网络权重量化为预设位宽的整型数据。

在本申请实施例的一种实现方式中，计算模块320，在用于将输入该网络层的输入特征量化为位宽小于16比特的整型数据时，具体可以用于：获取多个预设的待定步长，其中，待定步长对应的位宽小于16比特；分别计算利用各待定步长对输入特征进行量化的量化误差；利用最小的量化误差对应的待定步长，将输入特征量化为位宽小于16比特的整型数据。

在本申请实施例的一种实现方式中，计算模块320，在用于将该网络层输出的输出特征量化为位宽小于16比特的整型数据时，具体可以用于：获取多个预设的待定步长，其中，待定步长对应的位宽小于16比特；分别计算利用各待定步长对输出特征进行量化的量化误差；利用最小的量化误差对应的待定步长，将输出特征量化为位宽小于16比特的整型数据。

在本申请实施例的一种实现方式中，获取模块310，具体可以用于：获取人脸采集设备采集的人脸图片，或者，获取车辆采集设备采集的车辆图片；

计算模块320，具体可以用于：将人脸图片输入预先训练的目标深度学习模型，得到人脸图片中的目标人脸特征，或者，将车辆图片输入预先训练的目标深度学习模型，得到车辆图片中的目标车辆特征；

比较模块330，具体可以用于：将目标人脸特征与预设人脸特征进行比较，得到人脸识别结果，或者，将目标车辆特征与预设车辆特征进行比较，得到车辆识别结果。

本申请实施例提供了一种计算机设备，如图4所示，可以包括处理器401和机器可读存储介质402，机器可读存储介质402存储有能够被处理器401执行的机器可执行指令，处理器401被机器可执行指令促使：实现如上述目标识别方法的步骤。

上述机器可读存储介质可以包括RAM(Random Access Memory，随机存取存储器)，也可以包括NVM(Non-Volatile Memory，非易失性存储器)，例如至少一个磁盘存储器。可选的，机器可读存储介质还可以是至少一个位于远离上述处理器的存储装置。

上述处理器可以是通用处理器，包括CPU(Central Processing Unit，中央处理器)、NP(Network Processor，网络处理器)等；还可以是DSP(Digital Signal Processing，数字信号处理器)、ASIC(Application Specific Integrated Circuit，专用集成电路)、FPGA(Field-Programmable Gate Array，现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

机器可读存储介质402与处理器401之间可以通过有线连接或者无线连接的方式进行数据传输，并且计算机设备可以通过有线通信接口或者无线通信接口与其他的设备进行通信。图4所示的仅为处理器401与机器可读存储介质402之间通过总线进行数据传输的示例，不作为具体连接方式的限定。

本实施例中，处理器401通过读取机器可读存储介质402中存储的机器可执行指令，并通过运行该机器可执行指令，能够实现：获取待识别图片，将待识别图片输入预先训练的目标深度学习模型，得到待识别图片中的目标特征，将该目标特征与预先标定的目标特征进行比较，得到待识别图片的目标识别结果。其中，目标深度学习模型在对输入的待识别图片进行运算时，针对目标深度学习模型中的每一个网络层，将输入该网络层的输入特征、该网络层的网络权重和该网络层输出的输出特征中的至少一项量化为位宽小于16比特的整型数据。针对目标深度学习模型中的各网络层，输入网络层的输入特征、网络层的网络权重或者网络层输出的输出特征被量化成位宽小于16比特的整型数据，这样，对于每个网络层，参与运算的是位宽较低的低比特整型数据，降低了参与运算的数据的位宽和数据量，能够提升目标深度学习模型进行目标识别的运算速率，从而提高了目标识别的效率。

本申请实施例还提供了一种机器可读存储介质，存储有机器可执行指令，在被处理器调用和执行时，实现如上述目标识别方法的步骤。

本实施例中，机器可读存储介质存储有在运行时执行本申请实施例所提供的目标识别方法的机器可执行指令，因此能够实现：获取待识别图片，将待识别图片输入预先训练的目标深度学习模型，得到待识别图片中的目标特征，将该目标特征与预先标定的目标特征进行比较，得到待识别图片的目标识别结果。其中，目标深度学习模型在对输入的待识别图片进行运算时，针对目标深度学习模型中的每一个网络层，将输入该网络层的输入特征、该网络层的网络权重和该网络层输出的输出特征中的至少一项量化为位宽小于16比特的整型数据。针对目标深度学习模型中的各网络层，输入网络层的输入特征、网络层的网络权重或者网络层输出的输出特征被量化成位宽小于16比特的整型数据，这样，对于每个网络层，参与运算的是位宽较低的低比特整型数据，降低了参与运算的数据的位宽和数据量，能够提升目标深度学习模型进行目标识别的运算速率，从而提高了目标识别的效率。

本申请实施例还提供一种计算机程序产品，用于在运行时执行上述目标识别方法的步骤。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在机器可读存储介质中，或者从一个机器可读存储介质向另一个机器可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、DSL(Digital Subscriber Line，数字用户线))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述机器机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如DVD(Digital Versatile Disc，数字多功能光盘))、或者半导体介质(例如SSD(Solid State Disk，固态硬盘))等。

对于装置、计算机设备、机器可读存储介质和计算机程序产品实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，所述的程序可以存储于计算机可读取存储介质中，这里所称得的存储介质，如：ROM/RAM、磁碟、光盘等。

以上所述仅为本申请的较佳实施例，并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本申请的保护范围内。

Claims

一种目标识别方法，其特征在于，所述方法包括：

获取待识别图片；

将所述待识别图片输入预先训练的目标深度学习模型，得到所述待识别图片中的目标特征，其中，针对所述目标深度学习模型中的每一个网络层，将输入该网络层的输入特征、该网络层的网络权重和该网络层输出的输出特征中的至少一项量化为位宽小于16比特的整型数据；

将所述目标特征与预先标定的目标特征进行比较，得到所述待识别图片的目标识别结果。
根据权利要求1所述的方法，其特征在于，在所述将所述待识别图片输入预先训练的目标深度学习模型，得到所述待识别图片中的目标特征之前，所述方法还包括：

对所述待识别图片进行预处理操作，得到预处理后的所述待识别图片，所述预处理操作至少包括对所述待识别图片进行裁剪。
根据权利要求1所述的方法，其特征在于，所述目标深度学习模型中的网络层包括：卷积层、全连接层、池化层、批归一化层、合并层和拼接层。
根据权利要求1所述的方法，其特征在于，所述将该网络层的网络权重量化为位宽小于16比特的整型数据，包括：

针对该网络层的各滤波器，读取该滤波器中绝对值最大的网络权重；

根据所述绝对值最大的网络权重及小于16比特的预设位宽，计算该滤波器对应的量化步长；

利用所述量化步长，将该滤波器中的各网络权重量化为所述预设位宽的整型数据。
根据权利要求1所述的方法，其特征在于，所述将输入该网络层的输入特征量化为位宽小于16比特的整型数据，包括：

获取多个预设的待定步长，所述待定步长对应的位宽小于16比特；

分别计算利用各待定步长对所述输入特征进行量化的量化误差；

利用最小的量化误差对应的待定步长，将所述输入特征量化为位宽小于16比特的整型数据。
根据权利要求1所述的方法，其特征在于，所述将该网络层输出的输出特征量化为位宽小于16比特的整型数据，包括：

获取多个预设的待定步长，所述待定步长对应的位宽小于16比特；

分别计算利用各待定步长对所述输出特征进行量化的量化误差；

利用最小的量化误差对应的待定步长，将所述输出特征量化为位宽小于16比特的整型数据。
根据权利要求1所述的方法，其特征在于，所述获取待识别图片，包括：

获取人脸采集设备采集的人脸图片，或者，获取车辆采集设备采集的车辆图片；

所述将所述待识别图片输入预先训练的目标深度学习模型，得到所述待识别图片中的目标特征，包括：

将所述人脸图片输入预先训练的目标深度学习模型，得到所述人脸图片中的目标人脸特征，或者，将所述车辆图片输入预先训练的目标深度学习模型，得到所述车辆图片中的目标车辆特征；

所述将所述目标特征与预先标定的目标特征进行比较，得到所述待识别图片的目标识别结果，包括：

将所述目标人脸特征与预设人脸特征进行比较，得到人脸识别结果，或者，将所述目标车辆特征与预设车辆特征进行比较，得到车辆识别结果。
一种目标识别装置，其特征在于，所述装置包括：

获取模块，用于获取待识别图片；

计算模块，用于将所述待识别图片输入预先训练的目标深度学习模型，得到所述待识别图片中的目标特征，其中，针对所述目标深度学习模型中的每一个网络层，将输入该网络层的输入特征、该网络层的网络权重和该网络层输出的输出特征中的至少一项量化为位宽小于16比特的整型数据；

比较模块，用于将所述目标特征与预先标定的目标特征进行比较，得到所述待识别图片的目标识别结果。
根据权利要求8所述的装置，其特征在于，所述装置还包括：

预处理模块，用于对所述待识别图片进行预处理操作，得到预处理后的所述待识别图片，所述预处理操作至少包括对所述待识别图片进行裁剪。
根据权利要求8所述的装置，其特征在于，所述目标深度学习模型中的网络层包括：卷积层、全连接层、池化层、批归一化层、合并层和拼接层。
根据权利要求8所述的装置，其特征在于，所述计算模块，在用于所述将该网络层的网络权重量化为位宽小于16比特的整型数据时，具体用于：

针对该网络层的各滤波器，读取该滤波器中绝对值最大的网络权重；

根据所述绝对值最大的网络权重及小于16比特的预设位宽，计算该滤波器对应的量化步长；

利用所述量化步长，将该滤波器中的各网络权重量化为所述预设位宽的整型数据。
根据权利要求8所述的装置，其特征在于，所述计算模块，在用于所述将输入该网络层的输入特征量化为位宽小于16比特的整型数据时，具体用于：

获取多个预设的待定步长，所述待定步长对应的位宽小于16比特；

分别计算利用各待定步长对所述输入特征进行量化的量化误差；

利用最小的量化误差对应的待定步长，将所述输入特征量化为位宽小于16比特的整型数据。
根据权利要求8所述的装置，其特征在于，所述计算模块，在用于所述将该网络层输出的输出特征量化为位宽小于16比特的整型数据时，具体用于：

获取多个预设的待定步长，所述待定步长对应的位宽小于16比特；

分别计算利用各待定步长对所述输出特征进行量化的量化误差；

利用最小的量化误差对应的待定步长，将所述输出特征量化为位宽小于16比特的整型数据。
根据权利要求8所述的装置，其特征在于，所述获取模块，具体用于：

获取人脸采集设备采集的人脸图片，或者，获取车辆采集设备采集的车辆图片；

所述计算模块，具体用于：

将所述人脸图片输入预先训练的目标深度学习模型，得到所述人脸图片中的目标人脸特征，或者，将所述车辆图片输入预先训练的目标深度学习模型，得到所述车辆图片中的目标车辆特征；

所述比较模块，具体用于：

将所述目标人脸特征与预设人脸特征进行比较，得到人脸识别结果，或者，将所述目标车辆特征与预设车辆特征进行比较，得到车辆识别结果。
一种计算机设备，其特征在于，包括处理器和机器可读存储介质，所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令，所述处理器被所述机器可执行指令促使：实现权利要求1至7中任意一项所述的方法。
一种机器可读存储介质，其特征在于，所述机器可读存储介质内存储有机器可执行指令，在被处理器调用和执行时，实现权利要求1至7中任意一项所述的方法。
一种计算机程序产品，其特征在于，用于在运行时执行：权利要求1至7中任意一项所述的方法。