CN110020616A

CN110020616A - 一种目标识别方法及设备

Info

Publication number: CN110020616A
Application number: CN201910232056.2A
Authority: CN
Inventors: 陈海波
Original assignee: Deep Blue Technology Shanghai Co Ltd
Current assignee: Shenlan Robot Shanghai Co ltd
Priority date: 2019-03-26
Filing date: 2019-03-26
Publication date: 2019-07-16
Anticipated expiration: 2039-03-26
Also published as: CN110020616B

Abstract

本发明公开了一种目标识别方法及设备，涉及目标识别技术领域，用以解决现有技术中，利用复杂数据类型的参数构建神经网络模型的过程复杂且占用资源较多，且构建的神经网络模型处理任务时占用计算资源多，处理任务效率低下的问题，本发明方法包括：将用于目标识别的图像数据输入神经网络模型，利用神经网络模型对所述图像数据进行目标识别过程中，确定需要进行量化的一组处理数据，根据所述一组处理数据中各处理数据绝对值的最大值以及量化基准值，确定数据量化系数，利用所述数据量化系数对所述一组处理参数中的任一处理数据进行量化处理，根据所述量化处理后的处理数据，通过所述神经网络模型输出所述目标识别的识别结果。

Description

一种目标识别方法及设备

技术领域

本发明涉及目标识别技术领域，特别涉及一种目标识别方法及设备。

背景技术

随着计算机技术、神经网络技术的发展，越来越多的人用神经网络模型进行目标识别，但在用神经网络模型进行目标识别的过程中，存在着大量复杂数据的运算，如各个网络层的浮点型模型参数，以及可能为小数形式的图像数据，上述各个网络层的模型参数以及上述图像数据间的运算直接影响着神经网络模型进行目标识别的效率，但由于上述各个网络层的参数常常是浮点数或者小数，在利用上述参数构建神经网络模型时，固件消耗时间较长，且构建出的神经网络模型处理任务时，占用的计算机资源多、消耗时间长，且在使用神经网络模型处理任务时，又时长需要更新重建模型，此时对各个网络层的参数处理的复杂度会导致构建模型效率低下，进而极大地降低了神经网络模型进行目标识别的效率；

综上所述，在利用神经网络模型进行目标识别时，利用复杂数据类型的参数构建神经网络模型的过程复杂且占用资源较多，且构建的神经网络模型处理任务时占用计算资源多，消耗时间长，处理任务效率低下的问题。

发明内容

本发明提供一种目标识别方法及设备，用以解决现有技术中，在利用神经网络模型进行目标识别时，利用复杂数据类型的参数构建神经网络模型的过程复杂且占用资源较多，且构建的神经网络模型处理任务时占用计算资源多，消耗时间长，处理任务效率低下的问题。

第一方面，本申请提供一种目标识别方法，该方法包括：

将用于目标识别的图像数据输入神经网络模型；

利用神经网络模型对所述图像数据进行目标识别过程中，确定需要进行量化的一组处理数据；

根据所述一组处理数据中各处理数据绝对值的最大值以及量化基准值，确定数据量化系数；

利用所述数据量化系数对所述一组处理参数中的任一处理数据进行量化处理；

根据所述量化处理后的处理数据，通过所述神经网络模型输出所述目标识别的识别结果。

上述方法中，在利用神经网络模型进行目标识别的过程中，对复杂数据类型的处理数据进行量化，数据量化的步骤少，所用时间少，且占用资源少，因此利用量化后的参数构建神经网络模型的过程占用资源较少、消耗时间短，且构建的神经网络模型处理任务时占用计算资源少，消耗时间短，提高了利用神经网络模型进行目标识别的效率。

在一种可能的实现方式中，所述处理数据包括如下任一或任多：

所述神经网络模型的模型参数；

所述用于目标识别的图像数据；

上述方法中，对复杂数据类型的模型参数进行量化，不仅能加快构建神经网络模型的速度，还能提高体用构建的神经网络模型进行目标识别的效率；对用于目标识别的图像数据进行量化，一方面能够在训练神经网络模型时，加快训练的速度，另一方面，在利用神经网络模型进行目标识别时，由于输入模型的图像数据是经过量化的，能够加快神经网络模型进行目标识别的效率。

在一种可能的实现方式中，所述神经网络模型的模型参数包括如下任一：

所述神经网络模型的卷积层的每个网络层的偏置；

所述神经网络模型的卷积层的每个网络层的权重。

在一种可能的实现方式中，根据如下方法确定所述量化基准值：

根据设定的数据量化位数，确定所述数据量化位数表示的最大数据值为所述量化基准值。

在一种可能的实现方式中，确定所述数据量化位数表示的最大数据值，包括：

根据设定的数据量化位数确定第一预设值的幂k；

根据所述第一预设值及其幂k确定所述最大数据值。

在一种可能的实现方式中，根据所述第一预设值及其幂k确定所述最大数据值，包括如下任一步骤：

将所述第一预设值的k次幂的结果减去第二预设值的结果，作为所述最大数据值。

在一种可能的实现方式中，根据所述设定的数据量化位数确定第一预设值的幂k，包括：

当所述一组处理数据中不包含标识数据正负的符号位时，将所述设定的数据量化位数确定为所述第一预设值的幂k；

当所述一组处理数据中包含标识数据正负的预设个数的符号位时，将所述设定的数据量化位数减去所述预设个数的结果，确定为所述第一预设值的幂k。

上述方法中，分别提供针对有符号的数据和无符号的处理数据，根据数据量化位数确定第一预设值的幂k，进而根据第一预设值进行k次的幂次方运算结果确定上述数据量化位数表示的最大数据值，灵活且准确。

在一种可能的实现方式中，根据所述一组处理数据中各数据绝对值的最大值以及量化基准值，确定数据量化系数，包括：

将量化基准值与所述一组处理数据中各数据绝对值的最大值的比值，确定为所述数据量化系数。

上述方法中，将设定的数据量化位数表示的最大数据值与各数据绝对值的最大值的比值确定为数据量化系数，以便使得使用上述数据量化系数量化后的处理数据与量化前的处理数据的偏离程度不会过大，保证对处理数据进行量化的准确度。

在一种可能的实现方式中，当所述一组处理数据为二进制数据时，所述第一预设值为2，所述第二预设值为1，所述预设个数为1。

上述方法中，当需要量化的处理数据为二进制数据时，上述n个字符表示的处理数据最大值为(2ⁿ-1)；当上述二进制数据有一个符号表示数据的符号位时，上述数据量化位数个字符表示的数据最大值为(2^n-1-1)，其中，n为大于0的整数。

在一种可能的实现方式中，利用所述数据量化系数对所述一组处理数据中的任一处理数据进行量化处理，包括：

确定所述一组处理数据中的任一处理数据与所述数据量化系数的乘积；

对所述乘积进行四舍五入的取整操作，获得所述任一处理数据的量化数据。

上述方法中，对上述乘积进行四舍五入的取整操作，能够将浮点数或不易计算的小数量化为整数，以便减少后期用量化后的处理数据进行运算的资源消耗和运算复杂度。

第二方面，本申请提供一种目标识别设备，该设备包括处理器和存储器，其中，所述存储器存储可执行程序，所述处理器在所述可执行程序被执行时实现如下过程：

将用于目标识别的图像数据输入神经网络模型；

第三方面，本申请还提供一种计算机存储介质，其上存储有计算机程序，该程序被处理单元执行时实现第一方面所述方法的步骤。

另外，第二方面至第四方面中任一种实现方式所带来的技术效果可参见第一方面中不同实现方式所带来的技术效果，此处不再赘述。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例一提供的一种目标识别方法的示意图；

图2为本发明实施例二提供的一种目标识别设备的示意图；

图3为本发明实施例二提供的一种目标识别装置的示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部份实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

本发明实施例描述的应用场景是为了更加清楚的说明本发明实施例的技术方案，并不构成对于本发明实施例提供的技术方案的限定，本领域普通技术人员可知，随着新应用场景的出现，本发明实施例提供的技术方案对于类似的技术问题，同样适用。其中，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

随着计算机技术的发展，各种场景中数据的处理直接影响着任务执行的效率，如在卷积神经网络中，各个网络层的参数直接影响着卷积神经网络模型处理的效率，但由于上述各个网络层的参数常常是浮点数或者小数，在利用上述参数处理任务时，需要对上述参数进行量化处理。

因此本发明实施例一种目标识别方法及设备。

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

针对上述场景，下面结合说明书附图对本发明实施例做进一步详细描述。

实施例一：

如图1所示，本实施例提供一种目标识别方法，具体包括以下步骤：

步骤101，将用于目标识别的图像数据输入神经网络模型；

步骤102，利用神经网络模型对上述图像数据进行目标识别过程中，确定需要进行量化的一组处理数据；

上述需要进行量化的一组处理数据可以但不局限于为二进制、八进制或十六进制表示的数据，且上述一组处理数据可以但不局限于为浮点数、小数、正数或负数；

作为一种可选的实施方式，在获取上述一组处理数据时，可以但不局限于，将利用神经网络模型对上述图像数据进行目标识别过程中的大范围的一组处理数据按照不同进制表示形式，或者按照正负，或者按照数据处理负荷需求，将上述大范围的一组处理数据划分成不同组的需进行量化的数据组；

步骤103，根据上述一组数据中各处理数据绝对值的最大值以及量化基准值，确定数据量化系数；

作为一种可选的实施方式，上述数据量化基准值可以但不局限于技术人员通过经验设置的一个数据值，或者按照设定的一个数据值，通过一定的运算关系计算而得，能够反映对数据量化的度的数据值；

步骤104，利用上述数据量化系数对上述一组处理数据中的任一处理数据进行量化处理；

作为一种可选的实施方式，可以利用上述数据量化系数对上述获取的需要进行量化的一组处理数据进行量化处理；

步骤105，根据上述量化处理后的处理数据，通过上述神经网络模型输出上述目标识别的识别结果。

作为一种可选的实施方式，上述处理数据包括如下任一或任多：

上述神经网络模型的模型参数；

上述用于目标识别的图像数据。

作为一种可选的实施方式，上述神经网络模型的模型参数包括如下任一：

上述神经网络模型的卷积层的每个网络层的偏置；

上述神经网络模型的卷积层的每个网络层的权重。

作为一种可选的实施方式，可以但不局限于根据如下方法确定上述量化基准值：

根据设定的数据量化位数，确定上述数据量化位数表示的最大数据值为上述量化基准值。

作为一种可选的实施方式，当上述一组处理数据为二进制数据，记上述数据量化位数为n时，确定n个二进制字符表示的最大数据值为上述量化基准值，其中，上述n为大于0的整数；

作为一种可选的实施方式，确定上述数据量化位数表示的最大数据值，包括：

根据设定的数据量化位数n确定第一预设值的幂k；

根据上述第一预设值及其幂k确定上述最大数据值。

在本实施例中，当上述一组处理数据为二进制数据时，上述第一预设值为2；

作为一种可选的实施方式，根据上述设定的数据量化位数n确定第一预设值的幂k，包括：

当上述一组处理数据中的每个处理数据不包含表示数据正负的符号位时，将上述设定的数据量化位数确定为上述第一预设值的幂k；

当上述一组处理数据中包含表示数据正负的预设个数的符号位时，将上述设定的数据量化位数减去上述预设个数的结果，确定为上述第一预设值的幂k。

在本实施例中，上述一组处理数据中的每个处理数据不包含表示数据正负的符号位时，将设定的数据量化位数n确定为上述第一预设值的幂k，即此时k＝n；当上述一组处理数据中的每个处理数据包含标识数据正负的预设个数m的符号位时，将上述设定的数据量化位数n减去上述预设个数m的结果，确定为上述第一预设值的幂k，即此时k＝(n-m)。

作为一种可选的实施方式，根据上述第一预设值及其幂k确定上述最大数据值，包括如下任一步骤：

将上述第一预设值的k次幂的结果减去第二预设值的结果，作为上述最大数据值。

在本实施例中，将上述第一预设值的k次幂的结果减去第二预设值的结果作为上述最大数据值，即当需要量化的处理数据为二进制数据，确定的最大数据值为(2^k-1)；

即当需要量化的处理数据为用二进制数字表示时，且上述一组处理数据中的每个处理数据包含标识数据正负的m个符号位时，确定的上述最大数据值为(2^n-m-1)，其中，m为大于等于0的整数；如当上述需要量化的处理数据用二进制表示时，用每个处理数据的第一个二进制数字表示数据的符号，此时m即为1；

即需要量化的处理数据为二进制，且上述一组处理数据中不包含标识数据正负的符号位时，m的值为0，确定的上述最大数据值为(2ⁿ-1)；当需要量化的处理数据为二进制，且上述一组处理数据中的每个处理数据包含标识数据正负的一个符号位时，m的值为1，确定的上述最大数据值为(2^n-1-1)；

在一种可能的实现方式中，根据上述一组处理数据中各数据绝对值的最大值以及量化基准值，确定数据量化系数，包括：

将量化基准值与上述一组处理数据中各数据绝对值的最大值的比值，确定为上述数据量化系数；

即其中qx为上述数据量化系数，s为上述量化基准值，max为上述一组处理数据中各数据绝对值的最大值。

在一种可能的实现方式中，利用上述数据量化系数对上述一组处理数据中的任一处理数据进行量化处理，包括：

确定上述一组处理数据中的任一处理数据与上述数据量化系数的乘积；

对上述乘积进行四舍五入的取整操作，获得上述任一处理数据的量化数据。

在本实施例中，xq＝round(qx×xf)，其中，xf为需要被量化的任一处理数据，qx为上述数据量化系数，round()表示对括号内的数值进行四舍五入取整操作，xq为上述xf量化后的处理数据；

即在本实施例中，对一组二进制表示的处理数据中任一处理数据进行量化的完整的公式为下述公式1：

公式1：

其中，上述公式1中，xf为需要被量化的任一处理数据，qx为上述数据量化系数，round()表示对括号内的数值进行四舍五入取整操作，xq为上述xf量化后的处理数据，n为上述设定的数据量化位数，且n为大于0的整数，max为上述一组数据中各数据绝对值的最大值，m为一组处理数据中每个处理数据包含标识数据正负的符号位的个数，且m为大于等于0的整数，且上述公式1中的乘法运算可以由现场可编程门阵列FPGA(Field－ProgrammableGateArray)实现。

需要说明的是，本发明实施例中所列举的对二进制数据进行量化处理的方式只是举例说明，任何一种可以对数据进行量化的方式都适用于本发明实施例。

实施例二：

如图2所示，基于相同的发明构思，本实施例提供一种目标识别设备，该设备包括处理器201和存储器202，其中，上述存储器存储可执行程序，上述处理器在上述可执行程序被执行时实现如下过程：

将用于目标识别的图像数据输入神经网络模型；

利用神经网络模型对上述图像数据进行目标识别过程中，确定需要进行量化的一组处理数据；

根据上述一组处理数据中各处理数据绝对值的最大值以及量化基准值，确定数据量化系数；

利用上述数据量化系数对上述一组处理参数中的任一处理数据进行量化处理；

根据上述量化处理后的处理数据，通过上述神经网络模型输出上述目标识别的识别结果。可选地，上述处理数据包括如下任一或任多：

上述神经网络模型的模型参数；

上述用于目标识别的图像数据；

可选地，上述神经网络模型的模型参数包括如下任一：

上述神经网络模型的卷积层的每个网络层的偏置；

上述神经网络模型的卷积层的每个网络层的权重。

可选地，上述处理器具体用于，根据如下方法确定上述量化基准值：

可选地，上述处理器具体用于，根据设定的数据量化位数确定第一预设值的幂k，根据上述第一预设值及其幂k确定上述最大数据值。

可选地，上述处理器具体用于，将上述第一预设值的k次幂的结果减去第二预设值的结果，作为上述最大数据值。

可选地，上述处理器具体用于，当上述一组处理数据中不包含标识数据正负的符号位时，将上述设定的数据量化位数确定为上述第一预设值的幂k；

当上述一组处理数据中包含标识数据正负的预设个数的符号位时，将上述设定的数据量化位数减去上述预设个数的结果，确定为上述第一预设值的幂k。

可选地，上述处理器具体用于，将量化基准值与上述一组处理数据中各处理数据绝对值的最大值的比值，确定为上述数据量化系数。

可选地，当上述一组处理数据为二进制数据时，上述第一预设值为2，上述第二预设值为1，上述预设个数为1。

可选地，上述处理器具体用于，确定上述一组处理数据中的任一数据与上述数据量化系数的乘积，对上述乘积进行四舍五入的取整操作，获得上述任一处理数据的量化数据。

如图3所示，基于相同的发明构思，本实施例提供一种目标识别装置，该装置包括：

目标识别输入单元301，用于将用于目标识别的图像数据输入神经网络模型；

处理数据确定单元302，用于利用神经网络模型对上述图像数据进行目标识别过程中，确定需要进行量化的一组处理数据；

数据量化系数确定单元303，用于根据上述一组处理数据中各处理数据绝对值的最大值以及量化基准值，确定数据量化系数；

数据量化单元304，用于利用上述数据量化系数对上述一组处理参数中的任一处理数据进行量化处理；

目标识别结果输出单元305，用于根据上述量化处理后的处理数据，通过上述神经网络模型输出上述目标识别的识别结果。

可选地，上述处理数据包括如下任一或任多：

上述神经网络模型的模型参数；

上述用于目标识别的图像数据；

可选地，上述神经网络模型的模型参数包括如下任一：

上述神经网络模型的卷积层的每个网络层的偏置；

上述神经网络模型的激活层的每个网络层的权重。

可选地，上述数据量化系数确定单元用于，根据如下方法确定上述量化基准值：

可选地，上述数据量化系数确定单元用于，根据设定的数据量化位数确定第一预设值的幂k，根据上述第一预设值及其幂k确定上述最大数据值。

可选地，上述数据量化系数确定单元用于，将上述第一预设值的k次幂的结果减去第二预设值的结果，作为上述最大数据值。

可选地，上述数据量化系数确定单元用于，当上述一组处理数据中不包含标识数据正负的符号位时，将上述设定的数据量化位数确定为上述第一预设值的幂k；

可选地，上述数据量化系数确定单元用于，将量化基准值与上述一组处理数据中各数据绝对值的最大值的比值，确定为上述数据量化系数。

可选地，上述数据量化单元用于，确定上述一组处理数据中的任一处理数据与上述数据量化系数的乘积，对上述乘积进行四舍五入的取整操作，获得上述任一处理数据的量化数据。

实施例三：

本发明实施例还提供一种计算机可读非易失性存储介质，包括程序代码，当上述程序代码在计算终端上运行时，上述程序代码用于使所述计算终端执行上述本发明实施例一的方法的步骤。

以上参照示出根据本申请实施例的方法、装置(系统)和/或计算机程序产品的框图和/或流程图描述本申请。应理解，可以通过计算机程序指令来实现框图和/或流程图示图的一个块以及框图和/或流程图示图的块的组合。可以将这些计算机程序指令提供给通用计算机、专用计算机的处理器和/或其它可编程数据处理装置，以产生机器，使得经由计算机处理器和/或其它可编程数据处理装置执行的指令创建用于实现框图和/或流程图块中所指定的功能/动作的方法。

相应地，还可以用硬件和/或软件(包括固件、驻留软件、微码等)来实施本申请。更进一步地，本申请可以采取计算机可使用或计算机可读存储介质上的计算机程序产品的形式，其具有在介质中实现的计算机可使用或计算机可读程序代码，以由指令执行系统来使用或结合指令执行系统而使用。在本申请上下文中，计算机可使用或计算机可读介质可以是任意介质，其可以包含、存储、通信、传输、或传送程序，以由指令执行系统、装置或设备使用，或结合指令执行系统、装置或设备使用。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种目标识别方法，其特征在于，该方法包括：

将用于目标识别的图像数据输入神经网络模型；

2.如权利要求1所述的方法，其特征在于，所述处理数据包括如下任一或任多：

所述神经网络模型的模型参数；

所述用于目标识别的图像数据。

3.如权利要求1所述的方法，其特征在于，所述神经网络模型的模型参数包括如下任一或任多：

所述神经网络模型的卷积层的每个网络层的偏置；

所述神经网络模型的卷积层的每个网络层的权重。

4.如权利要求1所述的方法，其特征在于，根据如下方法确定所述量化基准值：

5.如权利要求4所述的方法，其特征在于，确定所述数据量化位数表示的最大数据值，包括：

根据设定的数据量化位数确定第一预设值的幂k；

根据所述第一预设值及其幂k确定所述最大数据值。

6.如权利要求5所述的方法，其特征在于，根据所述第一预设值及其幂k确定所述最大数据值，包括：

7.如权利要求6所述的方法，其特征在于，根据所述设定的数据量化位数确定第一预设值的幂k，包括：

8.如权利要求1所述的方法，其特征在于，根据所述一组处理数据中各处理数据绝对值的最大值以及量化基准值，确定数据量化系数，包括：

9.如权利要求4～8任一所述的方法，其特征在于，当所述一组处理数据为二进制数据时，所述第一预设值为2，所述第二预设值为1，所述预设个数为1。

10.如权利要求1所述的方法，其特征在于，利用所述数据量化系数对所述一组处理数据中的任一处理数据进行量化处理，包括：

对所述乘积进行四舍五入的取整操作，获得所述任一处理数据的量化参数值。

11.一种目标识别设备，其特征在于，该设备包括处理器和存储器，其中，所述存储器存储可执行程序，所述处理器在所述可执行程序被执行时实现如下过程：

获取需要进行量化的一组数据；

根据所述一组数据中各数据绝对值的最大值以及量化基准值，确定数据量化系数；

利用所述数据量化系数对所述一组数据中的任一数据进行量化处理。

12.一种计算机可存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1～10任一所述方法的步骤。