CN110782029B

CN110782029B - 神经网络预测方法、装置、电子设备和自动驾驶系统

Info

Publication number: CN110782029B
Application number: CN201911023009.3A
Authority: CN
Inventors: 徐立华
Original assignee: Apollo Intelligent Technology Beijing Co Ltd
Current assignee: Apollo Intelligent Technology Beijing Co Ltd
Priority date: 2019-10-25
Filing date: 2019-10-25
Publication date: 2022-11-22
Anticipated expiration: 2039-10-25
Also published as: CN110782029A

Abstract

本申请公开了神经网络的预测方法、装置、电子设备及存储介质，涉及人工智能领域，尤其是自动驾驶(包括自主泊车)领域。具体实现方案为：根据神经网络的第一输入张量和第二输入张量，确定对应的第一初始输入量化参数和第二初始输入量化参数；量化处理第一初始输入量化参数和第二初始输入量化参数，分别得到第一目标输入量化参数和第二目标输入量化参数；确定神经网络的输出张量对应的初始输出量化参数；根据量化处理的量化尺度以及初始输出量化参数，确定目标输出量化参数；根据第一输入张量、第一目标输入量化参数、第二输入张量、第二目标输入量化参数和目标输出量化参数，预测输出张量的量化值。本申请可以减少资源使用量，降低功耗。

Description

神经网络预测方法、装置、电子设备和自动驾驶系统

技术领域

本申请涉及一种信息技术领域，尤其涉及人工智能领域，尤其是自动驾驶(包括自主泊车)领域。

背景技术

目前深度学习领域常用的卷积神经网络中，为了提高运算效率，在神经网络的预测阶段，多采用定点量化的方式。例如：采用输入量化参数对输入数据进行量化；在预测过程中用量化后的输入数据得到量化的输出数据；对采用输出量化参数对量化的输出数据进行反量化，得到输出数据。由于输入量化参数和输出量化参数均为浮点数或高精度定点数，因此对资源的使用量较大，功耗也较大。

在人工智能领域，尤其是自动驾驶领域，也存在同样的问题。例如，在自主泊车领域的应用场景中，传统的神经网络的计算基于浮点数或高精度定点数的量化参数，造成大量的资源浪费。

发明内容

本申请实施例提供一种神经网络预测方法、装置、电子设备和自动驾驶系统，以解决相关技术存在的问题，技术方案如下：

第一方面，本申请实施例提供了一种神经网络预测方法，包括：根据神经网络的第一输入张量和第二输入张量，确定对应的第一初始输入量化参数和第二初始输入量化参数；量化处理第一初始输入量化参数和第二初始输入量化参数，分别得到第一目标输入量化参数和第二目标输入量化参数；确定神经网络的输出张量对应的初始输出量化参数；根据量化处理的量化尺度以及初始输出量化参数，确定目标输出量化参数；根据第一输入张量、第一目标输入量化参数、第二输入张量、第二目标输入量化参数和目标输出量化参数，预测输出张量的量化值。

上述技术方案对输入张量和输出张量对应的量化参数进行量化处理，并利用量化后的量化参数对输入张量进行量化，由于量化后的量化参数的比特位(bit)较少，因此可以减少资源使用量，降低功耗。

在一种实施方式中，根据量化处理的量化尺度以及初始输出量化参数，确定目标输出量化参数，包括：融合量化处理的量化尺度以及述初始输出量化参数，确定目标输出量化参数；其中，量化处理的量化尺度包括第一目标输入量化参数与第一初始输入量化参数的变化倍数或第二目标输入量化参数与第二初始输入量化参数的变化倍数。

上述技术方案通过将量化参数的变化倍数与量化前的输出量化参数进行融合，从而使得在线性预算过程中，融合后的输出量化参数能够保持高精度，以最大限度保持运算精度。

在一种实施方式中，量化处理第一初始输入量化参数和第二初始输入量化参数，分别得到第一目标输入量化参数和第二目标输入量化参数，包括：

量化处理第一初始输入量化参数和第二初始输入量化参数，并使第一初始输入量化参数、第一目标输入量化参数、第二初始输入量化参数和第二目标输入量化参数，满足以下关系：

new_scale1/new_scale2﹣scale1/scale2＝min(x/y-scale1/scale2)，

其中，x＝1,2,3,…,2ⁿ-1，y＝1,2,3,...,2ⁿ-1，n表示预设的量化比特数，new_scale1表示第一目标输入量化参数，scale1表示第一初始输入量化参数，new_scale2表示第二目标输入量化参数，scale2表示第二初始输入量化参数。

上述技术方案可以在尽可能减少精度损失的条件下，减少输入量化参数的比特位。

第二方面，本申请实施例提供一种确定量化参数的方法，包括：量化处理第一初始输入量化参数和第二初始输入量化参数，分别得到第一目标输入量化参数和第二目标输入量化参数，第一初始输入量化参数和第二初始输入量化参数分别根据神经网络的第一输入张量和第二输入张量而确定；根据量化处理的量化尺度以及初始输出量化参数，确定目标输出量化参数，初始输出量化参数与神经网络的输出张量相对应；将第一目标输入量化参数、第二目标输入量化参数和目标输出量化参数，发送至神经网络预测设备，以使神经网络预测设备根据第一输入张量、第一目标输入量化参数、第二输入张量、第二目标输入量化参数和目标输出量化参数，预测神经网络的输出张量的量化值。

上述技术方案基于中央处理器进行量化参数的量化，并将量化后的量化参数下发到神经网络预测设备中，由神经网络预测设备基于量化后的量化参数进行预测，从而可以优化资源配置，降低神经网络预测设备的资源使用量和功耗。

在一种实施方式中，根据初始输入量化参数和目标输入量化参数的变化，以及初始输出量化参数，确定目标输出量化参数，包括：融合量化处理的量化尺度以及述初始输出量化参数，确定目标输出量化参数；其中，量化处理的量化尺度包括第一目标输入量化参数与第一初始输入量化参数的变化倍数或第二目标输入量化参数与第二初始输入量化参数的变化倍数。

new_scale1/new_scale2﹣scale1/scale2＝min(x/y-scale1/scale2)

第三方面，本申请实施例提供一种神经网络预测方法，包括：获取神经网络的第一输入数据和第二输入数据；从中央处理器接收第一目标输入量化参数、第二目标输入量化参数和目标输出量化参数，第一目标输入量化参数、第二目标输入量化参数和目标输出量化参数为中央处理器根据第二方面中任一实施方式的方法而确定；根据第一输入张量、第一目标输入量化参数、第二输入张量、第二目标输入量化参数和目标输出量化参数，预测神经网络的输出张量的量化值。

第四方面，本申请实施例提供一种神经网络预测装置，包括：初始输入量化参数确定模块，用于根据神经网络的第一输入张量和第二输入张量，确定对应的第一初始输入量化参数和第二初始输入量化参数；第一量化处理模块，用于量化处理第一初始输入量化参数和第二初始输入量化参数，分别得到第一目标输入量化参数和第二目标输入量化参数；初始输出量化参数确定模块，用于确定神经网络的输出张量对应的初始输出量化参数；第一目标输出量化参数确定模块，根据量化处理的量化尺度以及初始输出量化参数，确定目标输出量化参数；第一预测模块，用于根据第一输入张量、第一目标输入量化参数、第二输入张量、第二目标输入量化参数和目标输出量化参数，预测输出张量的量化值。

第五方面，本申请实施例提供一种确定量化参数的装置，包括：第二量化处理模块，用于量化处理第一初始输入量化参数和第二初始输入量化参数，分别得到第一目标输入量化参数和第二目标输入量化参数，第一初始输入量化参数和第二初始输入量化参数分别根据神经网络的第一输入张量和第二输入张量而确定；第二目标输出量化参数确定模块，用于根据量化处理的量化尺度以及初始输出量化参数，确定目标输出量化参数，初始输出量化参数与神经网络的输出张量相对应；发送模块，用于将第一目标输入量化参数、第二目标输入量化参数和目标输出量化参数，发送至专用集成电路，以使专用集成电路根据第一输入张量、第一目标输入量化参数、第二输入张量、第二目标输入量化参数和目标输出量化参数，预测神经网络的输出张量的量化值。

第六方面，本申请实施例提供一种神经网络预测装置，包括：获取模块，用于获取神经网络的第一输入数据和第二输入数据；接收模块，用于从中央处理器接收第一目标输入量化参数、第二目标输入量化参数和目标输出量化参数，第一目标输入量化参数、第二目标输入量化参数和目标输出量化参数为中央处理器根据以上第二方面中任一实施方式的方法而确定；第二预测模块，用于根据第一输入张量、第一目标输入量化参数、第二输入张量、第二目标输入量化参数和目标输出量化参数，预测神经网络的输出张量的量化值。

第七方面，本申请实施例提供一种电子设备，包括：至少一个第一处理器；以及与至少一个第一处理器通信连接的第一存储器；其中，第一存储器存储有可被至少一个第一处理器执行的指令，指令被至少一个第一处理器执行，以使至少一个第一处理器能够执行第一方面中任一实施方式的方法。

第八方面，本申请实施例提供一种确定量化参数的设备，包括：至少一个中央处理器；以及与至少一个中央处理器通信连接的第二存储器；其中，第二存储器存储有可被至少一个第二处理器执行的指令，指令被至少一个中央处理器执行，以使至少一个中央处理器能够执行第二方面中任一实施方式的方法。

第九方面，本申请实施例提供一种神经网络预测设备，神经网络预测设备能够执行第三方面中的方法。

在一种实施方式中，神经网络预测设备包括专用集成电路、现场可编程逻辑门阵列、数字信号处理器和图形处理器中的任一种。

第十方面，本申请实施例提供一种系统，包括第八方面的确定量化参数的设备，以及第九方面中任一实施方式的神经网络预测设备，确定量化参数的设备和神经网络预测设备通信连接。

在一种实施方式中，系统为自动驾驶系统。

第十一方面，本申请实施例提供一种存储有计算机指令的非瞬时计算机可读存储介质，计算机指令用于使计算机执行上述任一方法。

上述实施方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请实施例一的示意图；

图2是根据本申请实施例二的应用场景的示意图；

图3是根据本申请实施例二的一种实施方式的示意图；

图4是根据本申请实施例二的另一种实施方式的示意图；

图5是根据本申请实施例三的示意图；

图6是根据本申请实施例四的一种实施方式的示意图；

图7是根据本申请实施例四的另一种实施方式的示意图；

图8是用来实现本申请实施例一的电子设备的框图。

图9是用来实现本申请实施例二的一种实施方式的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

神经网络的具体实现方式中，为了提升运行效率，可以采用量化处理的方式。量化即在计算中使用低数值精度以提升计算速度。低bit量化技术是在保证精度的基础上对计算过程中以及在其前后的处理步骤的数据进行量化，降低数据的表示范围。量化包括定点量化。在神经网络预测系统中，神经网络预测设备如专用集成电路(Application SpecificIntegrated Circuit，ASIC)、现场可编程逻辑门阵列(Field Programmable Gate Array，FPGA)、数字信号处理器(digital signal processor，DSP)、图形处理器(GraphicsProcessing Unit，GPU)等，都对定点量化有很好的支持。

在一个示例中，卷积神经网络的对位相加(Element-wise，简称EW)算子在预测阶段，会对输入数据进行定点量化，以获得更快的速度。在卷积神经网络预测阶段，EW算子是将输入的两个张量逐点相加或者相减。即：ofm＝ifm1+ifm2。其中，ifm1表示第一输入张量，ifm2表示第二输入张量，ofm表示输出张量。

以8bit量化为例，在相关技术中，张量所有的数据均被量化成8bit定点数。即：ifm1_fix＝ifm1/scale_1*127，ifm2_fix＝ifm2/scale_2*127，其中，scale_1表示第一输入量化参数，scale_2表示第二输入量化参数，ifm1_fix表示第一输入张量的量化值，ifm2_fix表示第二输入张量的量化值。如果输入的两幅图像数据量化尺度不同，需要分别对输入数据进行反量化，然后进行相加。即：ofm_fix＝(ifm1_fix/127*scale1+ifm2_fix/127*scale2)/scale_o*127。其中，scale_o表示初始输出量化参数，ofm_fix表示输出张量的量化值。进一步地，ofm_fix＝(ifm1_fix*scale1+ifm2_fix*scale2)/scale_o。其中，scal1、scale2、scale_o均为浮点数或者高精度定点数。在神经网络预测设备中，尤其是在FPGA中，用浮点数或者高精度定点数意味着资源使用量大，功耗大。

本申请实施例对输入张量和输出张量对应的量化参数进行量化处理，并利用量化后的量化参数对输入张量进行量化，由于量化后的量化参数为低bit，因此可以减少资源使用量，降低功耗。

实施例一

图1是根据本实施例的神经网络预测方法的流程图。参见图1，该方法包括：

步骤S101、根据神经网络的第一输入张量和第二输入张量，确定对应的第一初始输入量化参数和第二初始输入量化参数。

在静态量化方式中，在神经网络初始化阶段可以根据所有输入张量的数据范围确定第一初始输入量化参数和第二初始输入量化参数。在动态量化方式中，神经网络上一层计算完成后，可以根据当前层的输入张量的数据，进而确定第一初始输入量化参数和第二初始输入量化参数。

步骤S102、量化处理第一初始输入量化参数和第二初始输入量化参数，分别得到第一目标输入量化参数和第二目标输入量化参数。

在静态量化方式中，可以在神经网络初始化阶段对第一初始输入量化参数和第二初始输入量化参数进行量化处理，从而得到第一目标输入量化参数和第二目标输入量化参数。在动态量化方式中，可以在神经网络执行阶段，在上一层计算完成后，量化处理第一初始输入量化参数和第二初始输入量化参数，得到当前层的第一目标输入量化参数和第二目标输入量化参数。

步骤S103、确定神经网络的输出张量对应的初始输出量化参数。

在静态量化方式中，在神经网络初始化阶段可以通过统计预测值来确定初始输出量化参数。在动态量化方式中，神经网络上一层计算完成后，可以统计当前层的预测值来确定初始输出量化参数。

步骤S104、根据量化处理的量化尺度以及初始输出量化参数，确定目标输出量化参数。

在静态量化方式中，在神经网络初始化阶段可以根据量化处理的量化尺度以及初始输出量化参数，确定目标输出量化参数。在动态量化方式中，神经网络上一层计算完成后，可以根据量化处理的量化尺度以及初始输出量化参数，确定当前层的目标输出量化参数。

步骤S105、根据第一输入张量、第一目标输入量化参数、第二输入张量、第二目标输入量化参数和目标输出量化参数，预测输出张量的量化值。

在预测过程中，需要对输入张量进行反量化。在一个示例中，ofm_fix＝(ifm1*new_scale1+ifm2*new_scale2)/new_scale_o。其中，ofm_fix表示输出张量ofm的量化值，ifm1表示第一输入张量，ifm2表示第二输入张量，new_scale1表示第一目标输入量化参数，new_scale2表示第二目标输入量化参数，new_scale_o表示目标输出量化参数。

在一种实施方式中，在步骤S104中可以包括：融合量化处理的量化尺度以及述初始输出量化参数，确定目标输出量化参数；其中，量化处理的量化尺度包括第一目标输入量化参数与第一初始输入量化参数的变化倍数或第二目标输入量化参数与第二初始输入量化参数的变化倍数。即：new_scale_o＝scale_o*scale1/new_scale1，或者，new_scale_o＝scale_o*scale2/new_scale2。

输入量化参数的改变会导致输入张量的量化值的改变，由于EW算子为线性运算，可以将输入张量的量化值的变化倍数，也就是输入量化参数的变换倍数，再融合到输出量化参数new_scale_o中，从而使得输出张量的量化仍然保持高精度的运算模式，即可在最大限度上保持运算精度。

在一种实施方式中，在步骤S102中可以包括：量化处理第一初始输入量化参数和第二初始输入量化参数，并使第一初始输入量化参数、第一目标输入量化参数、第二初始输入量化参数和第二目标输入量化参数，满足以下关系：

new_scale1/new_scale2﹣scale1/scale2＝min(x/y-scale1/scale2)，其中，x＝1,2,3,…,2n-1，y＝1,2,3,...,2n-1，n表示预设的量化比特数。

scale1和scale2为高精度数据，在尽可能减少精度损失的条件下转换scale1和scale2以得到低精度的new_scale1和new_scale2。其中，new_scale1和new_scale2都是nbit量化后的数值。

本实施例的方法通过对输入张量和输出张量对应的量化参数进行量化处理，并利用量化后的量化参数对输入张量进行量化，由于量化后的量化参数为低bit，因此可以减少资源使用量，降低功耗。进一步地，将输入张量的量化值的变化倍数再融合到输出张量的量化值new_scale_o中，输出张量的量化仍然保持高精度的运算模式，即可在最大限度上保持运算精度。

本实施例可应用于人工智能领域，尤其是自动驾驶领域。例如，在自主泊车领域的应用场景中，可用泊车位的环境参数和泊车车身的航向角作为输入张量，用方向盘的转角作为输出张量。其中，泊车位的环境参数可包括泊车位的大小及位置。在一个示例中，输入张量还可包括车身位置，例如车身右后点的坐标。通过训练好的神经网络计算方向盘的转角，再根据计算出的方向盘的转角、泊车位数据和车身位置可完成自动泊车控制。

在自主泊车领域的应用场景中，可对神经网络的输入张量对应的输入张量量化参数做量化处理。例如对泊车位的环境参数和泊车车身的航向角对应的输入张量量化参数做量化处理。利用量化处理后的量化参数预测输出张量的量化值，如能够完成自动泊车控制的方向盘的转角的量化值，从而在节省资源，降低功耗。

实施例二

图2示出本申请实施例的应用场景图。在图2所示的预测系统中，包括中央处理器(central processing unit，CPU)和神经网络预测设备。其中，中央处理器可以用于计算量化后的量化参数，即第一目标输入量化参数、第二目标输入量化参数和目标输出量化参数。神经网络预测设备可以用于根据第一目标输入量化参数、第二目标输入量化参数和目标输出量化参数，预测输出张量的量化值。其中，神经网络预测设备包括但不限于ASIC、FPGA、DSP和GPU。

如3示出本实施例的确定量化参数的方法的流程图，该方法可以应用于CPU端。如图3所示，该方法可以包括：

步骤S301、量化处理第一初始输入量化参数和第二初始输入量化参数，分别得到第一目标输入量化参数和第二目标输入量化参数，第一初始输入量化参数和第二初始输入量化参数分别根据神经网络的第一输入张量和第二输入张量而确定；

步骤S302、根据量化处理的量化尺度以及初始输出量化参数，确定目标输出量化参数，初始输出量化参数与神经网络的输出张量相对应；

步骤S303、将第一目标输入量化参数、第二目标输入量化参数和目标输出量化参数，发送至神经网络预测设备，以使神经网络预测设备根据第一输入张量、第一目标输入量化参数、第二输入张量、第二目标输入量化参数和目标输出量化参数，预测神经网络的输出张量的量化值。

在一种实施方式中，在步骤S302中包括：融合量化处理的量化尺度以及述初始输出量化参数，确定目标输出量化参数；其中，量化处理的量化尺度包括第一目标输入量化参数与第一初始输入量化参数的变化倍数或第二目标输入量化参数与第二初始输入量化参数的变化倍数。

在一种实施方式中，在步骤S301中包括：量化处理第一初始输入量化参数和第二初始输入量化参数，并使第一初始输入量化参数、第一目标输入量化参数、第二初始输入量化参数和第二目标输入量化参数，满足以下关系：

new_scale1/new_scale2﹣scale1/scale2＝min(x/y-scale1/scale2)。

步骤S301和步骤S302的方法和有益效果可以参见上述实施例一方法中的对应描述，在此不再赘述。

图4示出本实施例的神经网络预测方法的流程图。该方法可以应用于神经网络预测设备端，如图4所示，该方法可以包括：

步骤S401、获取神经网络的第一输入数据和第二输入数据；

步骤S402、从中央处理器接收第一目标输入量化参数、第二目标输入量化参数和目标输出量化参数，第一目标输入量化参数、第二目标输入量化参数和目标输出量化参数为中央处理器根据第二方面中任一实施方式的方法而确定；

步骤S403、根据第一输入张量、第一目标输入量化参数、第二输入张量、第二目标输入量化参数和目标输出量化参数，预测神经网络的输出张量的量化值。

在一个示例中，神经网络预测设备为FPGA，即预测系统为包括CPU和FPGA的异构系统，本实施例的方法可以包括：

(1)神经网络初始化阶段：CPU计算各个EW算子第一输入张量和第二输入张量对应的第一目标输入量化参数new_scale1和第二目标输入量化参数new_scale2；

(2)神经网络初始化阶段：根据CPU计算各个EW算子的输出张量对应的目标输出量化参数new_scale_o；

(3)神经网络运行阶段：CPU将以上两个步骤中的运算结果下发到FPGA，包括new_scale1(低精度)、new_scale2(低精度)、new_scale_o(高精度)。

(4)神经网络运行阶段：在FPGA中并行执行运算过程：

ofm_fix＝(ifm1*new_scale1+ifm2*new_scale2)/new_scale_o。

上述步骤(1)～(4)适用于静态量化方式。如果是动态量化方式，那么以上步骤(1)和(2)在神经网络执行过程中，在对应的EW算子执行前，由CPU完成。

本实施例的预测系统可以为自动驾驶系统。其中，CPU用于在自动驾驶系统中实现各种自动驾驶控制算法的处理运算，具有较强的运算能力，因此利用该优势来进行目标输入量化参数和目标输出量化参数的计算，并将计算结果下发给FPGA。FPGA利用目标输入量化参数和目标输出量化参数，执行神经网络的预测。由于目标输入量化参数为低bit数据，可以降低对FPGA的资源占用，从而优化系统的资源配置。

实施例三

图5示出本实施例的神经网络预测装置的结构框图。如图5所示，该装置包括：

初始输入量化参数确定模块501，用于根据神经网络的第一输入张量和第二输入张量，确定对应的第一初始输入量化参数和第二初始输入量化参数；第一量化处理模块502，用于量化处理第一初始输入量化参数和第二初始输入量化参数，分别得到第一目标输入量化参数和第二目标输入量化参数；初始输出量化参数确定模块503，用于确定神经网络的输出张量对应的初始输出量化参数；第一目标输出量化参数确定模块504，根据量化处理的量化尺度以及初始输出量化参数，确定目标输出量化参数；第一预测模块505，用于根据第一输入张量、第一目标输入量化参数、第二输入张量、第二目标输入量化参数和目标输出量化参数，预测输出张量的量化值。

在一种实施方式中，第一目标输出量化参数确定模块504还用于：融合量化处理的量化尺度以及述初始输出量化参数，确定目标输出量化参数；其中，量化处理的量化尺度包括第一目标输入量化参数与第一初始输入量化参数的变化倍数或第二目标输入量化参数与第二初始输入量化参数的变化倍数。

在一种实施方式中，第一量化处理模块502还用于量化处理第一初始输入量化参数和第二初始输入量化参数，并使第一初始输入量化参数、第一目标输入量化参数、第二初始输入量化参数和第二目标输入量化参数，满足以下关系：new_scale1/new_scale2﹣scale1/scale2＝min(x/y-scale1/scale2)。

实施例四

本实施例提供一种确定量化参数的装置，如图6所示，该装置包括：第二量化处理模块601，用于量化处理第一初始输入量化参数和第二初始输入量化参数，分别得到第一目标输入量化参数和第二目标输入量化参数，第一初始输入量化参数和第二初始输入量化参数分别根据神经网络的第一输入张量和第二输入张量而确定；第二目标输出量化参数确定模块602，用于根据量化处理的量化尺度以及初始输出量化参数，确定目标输出量化参数，初始输出量化参数与神经网络的输出张量相对应；发送模块603，用于将第一目标输入量化参数、第二目标输入量化参数和目标输出量化参数，发送至专用集成电路，以使专用集成电路根据第一输入张量、第一目标输入量化参数、第二输入张量、第二目标输入量化参数和目标输出量化参数，预测神经网络的输出张量的量化值。

在一种实施方式中，第二目标输出量化参数确定模块602还用于：融合量化处理的量化尺度以及述初始输出量化参数，确定目标输出量化参数；其中，量化处理的量化尺度包括第一目标输入量化参数与第一初始输入量化参数的变化倍数或第二目标输入量化参数与第二初始输入量化参数的变化倍数。

在一种实施方式中，第二量化处理模块601还用于：量化处理第一初始输入量化参数和第二初始输入量化参数，并使第一初始输入量化参数、第一目标输入量化参数、第二初始输入量化参数和第二目标输入量化参数，满足以下关系：new_scale1/new_scale2﹣scale1/scale2＝min(x/y-scale1/scale2)。

本实施例还提供一种神经网络预测装置，如图7所示，该装置包括：获取模块701，用于获取神经网络的第一输入数据和第二输入数据；接收模块702，用于从中央处理器接收第一目标输入量化参数、第二目标输入量化参数和目标输出量化参数，第一目标输入量化参数、第二目标输入量化参数和目标输出量化参数为中央处理器根据以上第二方面中任一实施方式的方法而确定；第二预测模块703，用于根据第一输入张量、第一目标输入量化参数、第二输入张量、第二目标输入量化参数和目标输出量化参数，预测神经网络的输出张量的量化值。

本申请实施例各装置中的各模块的功能可以参见上述方法中的对应描述，在此不再赘述。

实施例五

根据本申请的实施例，本申请还提供了一种电子设备。如图8所示，该电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图8所示，该电子设备包括：一个或多个第一处理器801、第一存储器802，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。第一处理器可以对在电子设备内执行的指令进行处理，包括存储在第一存储器中或者第一存储器上以在外部输入/第一输出装置(诸如，耦合至接口的显示设备)上显示图形用户界面(Graphical User Interface，GUI)的图形信息的指令。在其它实施方式中，若需要，可以将多个第一处理器和/或多条总线与多个第一存储器和多个第一存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多第一处理器系统)。图8中以一个第一处理器801为例。

第一存储器802即为本申请所提供的一种非瞬时计算机可读存储介质。其中，所述第一存储器存储有可由至少一个第一处理器执行的指令，以使所述至少一个第一处理器执行本申请所提供的实体关系抽取模型的训练方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行实施例一的方法。

第一存储器802作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如实施例一的方法对应的程序指令/模块(例如，附图5所示的初始输入量化参数确定模块501、第一量化处理模块502、初始输出量化参数确定模块503和第一目标输出量化参数确定模块504和第一预测模块505)。第一处理器801通过运行存储在第一存储器802中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现实施例一中的方法。

第一存储器802可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据电子设备的使用所创建的数据等。此外，第一存储器802可以包括高速随机存取第一存储器，还可以包括非瞬时第一存储器，例如至少一个磁盘第一存储器件、闪存器件、或其他非瞬时固态第一存储器件。在一些实施例中，第一存储器802可选包括相对于第一处理器801远程设置的第一存储器，这些远程第一存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

电子设备还可以包括：第一输入装置803和第一输出装置804。第一处理器801、第一存储器802、第一输入装置803和第一输出装置804可以通过总线或者其他方式连接，图8中以通过总线连接为例。

第一输入装置803可接收输入的数字或字符信息，以及产生与电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等第一输入装置。第一输出装置804可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(Liquid Cr8stal Displa8，LCD)、发光二极管(Light EmittingDiode，LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用集成电路(Application Specific Integrated Circuits，ASIC)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(programmable logic device，PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(Cathode Ray Tube，阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(Local Area Network，LAN)、广域网(Wide Area Network，WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

实施例六

本申请实施例还提供一种系统，包括确定量化参数的设备和上述的神经网络预测设备，其中，确定量化参数的设备和神经网络预测设备通信连接。

如图9所示，确定量化参数的设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图9所示，该电子设备包括：一个或多个中央处理器901、第二存储器902，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。中央处理器可以对在电子设备内执行的指令进行处理，包括存储在第二存储器中或者第二存储器上以在外部输入/第二输出装置(诸如，耦合至接口的显示设备)上显示图形用户界面(Graphical User Interface，GUI)的图形信息的指令。在其它实施方式中，若需要，可以将多个中央处理器和/或多条总线与多个第二存储器和多个第二存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多中央处理器系统)。图9中以一个中央处理器901为例。

第二存储器902即为本申请所提供的又一非瞬时计算机可读存储介质。其中，所述第二存储器存储有可由至少一个中央处理器执行的指令，以使所述至少一个中央处理器执行实施例二中确定量化参数的方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行实施例二中确定量化参数的方法。

第二存储器902作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本实施例二中的确定量化参数的方法对应的程序指令/模块(例如，附图6所示的第二量化处理模块601、第二目标输出量化参数确定模块602和发送模块603)。中央处理器901通过运行存储在第二存储器902中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现实施例二的确定量化参数的方法。

第二存储器902可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储实施例二的确定量化参数的方法的电子设备的使用所创建的数据等。此外，第二存储器902可以包括高速随机存取第二存储器，还可以包括非瞬时第二存储器，例如至少一个磁盘第二存储器件、闪存器件、或其他非瞬时固态第二存储器件。在一些实施例中，第二存储器902可选包括相对于中央处理器901远程设置的第二存储器，这些远程第二存储器可以通过网络连接至抽取实体关系的方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

该电子设备还可以包括：第二输入装置903和第二输出装置904。中央处理器901、第二存储器902、第二输入装置903和第二输出装置904可以通过总线或者其他方式连接，图9中以通过总线连接为例。

第二输入装置903可接收输入的数字或字符信息，以及产生与抽取实体关系的方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等第二输入装置。第二输出装置904可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(Liquid Cr9stal Displa9，LCD)、发光二极管(Light Emitting Diode，LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种神经网络预测方法，其特征在于，包括：

根据神经网络的第一输入张量和第二输入张量，确定对应的第一初始输入量化参数和第二初始输入量化参数；所述第一输入张量包括泊车位的大小及位置，所述第二输入张量包括泊车车身的航向角；

量化处理所述第一初始输入量化参数和所述第二初始输入量化参数，分别得到第一目标输入量化参数和第二目标输入量化参数；所述第一目标输入量化参数的精度低于所述第一初始输入量化参数的精度，所述第二目标输入量化参数的精度低于所述第二初始输入量化参数的精度；

确定所述神经网络的输出张量对应的初始输出量化参数；所述输出张量为方向盘的转角；

融合所述量化处理的量化尺度以及所述初始输出量化参数，确定所述目标输出量化参数，具体包括：new_scale_o＝scale_o*scale1/new_scale1，或者，new_scale_o＝scale_o*scale2/new_scale2，其中，new_scale_o表示所述目标输出量化参数，scale_o表示初始输出量化参数，scale1表示第一初始输入量化参数，new_scale1表示第一目标输入量化参数，scale2表示第二初始输入量化参数，new_scale2表示第二目标输入量化参数；所述量化处理的量化尺度包括所述第一目标输入量化参数与所述第一初始输入量化参数的变化倍数或所述第二目标输入量化参数与所述第二初始输入量化参数的变化倍数；所述目标输出量化参数保持所述初始输出量化参数的精度；

根据所述第一输入张量、所述第一目标输入量化参数、所述第二输入张量、所述第二目标输入量化参数和所述目标输出量化参数，预测所述输出张量的量化值。

2.根据权利要求1所述的方法，其特征在于，量化处理所述第一初始输入量化参数和所述第二初始输入量化参数，分别得到第一目标输入量化参数和第二目标输入量化参数，包括：

量化处理所述第一初始输入量化参数和所述第二初始输入量化参数，并使所述第一初始输入量化参数、所述第一目标输入量化参数、所述第二初始输入量化参数和所述第二目标输入量化参数，满足以下关系：

new_scale1/new_scale2﹣scale1/scale2＝min(x/y-scale1/scale2)

其中，x＝1,2,3,…,2ⁿ-1，y＝1,2,3,...,2ⁿ-1，n表示预设的量化比特数，new_scale1表示所述第一目标输入量化参数，scale1表示所述第一初始输入量化参数，new_scale2表示所述第二目标输入量化参数，scale2表示所述第二初始输入量化参数。

3.一种确定量化参数的方法，其特征在于，包括：

量化处理第一初始输入量化参数和第二初始输入量化参数，分别得到第一目标输入量化参数和第二目标输入量化参数，所述第一初始输入量化参数和所述第二初始输入量化参数分别根据神经网络的第一输入张量和第二输入张量而确定；所述第一输入张量包括泊车位的大小及位置，所述第二输入张量包括泊车车身的航向角，所述第一目标输入量化参数的精度低于所述第一初始输入量化参数的精度，所述第二目标输入量化参数的精度低于所述第二初始输入量化参数的精度；

融合所述量化处理的量化尺度以及所述初始输出量化参数，确定所述目标输出量化参数，具体包括：new_scale_o＝scale_o*scale1/new_scale1，或者，new_scale_o＝scale_o*scale2/new_scale2，其中，new_scale_o表示所述目标输出量化参数，scale_o表示初始输出量化参数，scale1表示第一初始输入量化参数，new_scale1表示第一目标输入量化参数，scale2表示第二初始输入量化参数，new_scale2表示第二目标输入量化参数；所述量化处理的量化尺度包括所述第一目标输入量化参数与所述第一初始输入量化参数的变化倍数或所述第二目标输入量化参数与所述第二初始输入量化参数的变化倍数；所述目标输出量化参数保持所述初始输出量化参数的精度，所述初始输出量化参数与所述神经网络的输出张量相对应；所述输出张量为方向盘的转角；

将所述第一目标输入量化参数、所述第二目标输入量化参数和所述目标输出量化参数，发送至神经网络预测设备，以使所述神经网络预测设备根据所述第一输入张量、所述第一目标输入量化参数、所述第二输入张量、所述第二目标输入量化参数和所述目标输出量化参数，预测所述神经网络的输出张量的量化值。

4.根据权利要求3所述的方法，其特征在于，量化处理所述第一初始输入量化参数和所述第二初始输入量化参数，分别得到第一目标输入量化参数和第二目标输入量化参数，包括：

new_scale1/new_scale2﹣scale1/scale2＝min(x/y-scale1/scale2)

5.一种神经网络预测方法，其特征在于，包括：

获取神经网络的第一输入数据和第二输入数据；

从中央处理器接收第一目标输入量化参数、第二目标输入量化参数和目标输出量化参数，所述第一目标输入量化参数、所述第二目标输入量化参数和所述目标输出量化参数为所述中央处理器根据权利要求3或4所述的方法而确定；

根据所述第一输入张量、所述第一目标输入量化参数、所述第二输入张量、所述第二目标输入量化参数和所述目标输出量化参数，预测所述神经网络的输出张量的量化值；所述第一输入张量包括泊车位的大小及位置，所述第二输入张量包括泊车车身的航向角，所述输出张量为方向盘的转角。

6.一种神经网络预测装置，其特征在于，包括：

初始输入量化参数确定模块，用于根据神经网络的第一输入张量和第二输入张量，确定对应的第一初始输入量化参数和第二初始输入量化参数；所述第一输入张量包括泊车位的大小及位置，所述第二输入张量包括泊车车身的航向角；

第一量化处理模块，用于量化处理所述第一初始输入量化参数和所述第二初始输入量化参数，分别得到第一目标输入量化参数和第二目标输入量化参数；所述第一目标输入量化参数的精度低于所述第一初始输入量化参数的精度，所述第二目标输入量化参数的精度低于所述第二初始输入量化参数的精度；

初始输出量化参数确定模块，用于确定所述神经网络的输出张量对应的初始输出量化参数；所述输出张量为方向盘的转角；

第一目标输出量化参数确定模块，用于融合所述量化处理的量化尺度以及所述初始输出量化参数，确定所述目标输出量化参数，具体用于执行：new_scale_o＝scale_o*scale1/new_scale1，或者，new_scale_o＝scale_o*scale2/new_scale2，其中，new_scale_o表示所述目标输出量化参数，scale_o表示初始输出量化参数，scale1表示第一初始输入量化参数，new_scale1表示第一目标输入量化参数，scale2表示第二初始输入量化参数，new_scale2表示第二目标输入量化参数；所述量化处理的量化尺度包括所述第一目标输入量化参数与所述第一初始输入量化参数的变化倍数或所述第二目标输入量化参数与所述第二初始输入量化参数的变化倍数；所述目标输出量化参数保持所述初始输出量化参数的精度；

第一预测模块，用于根据所述第一输入张量、所述第一目标输入量化参数、所述第二输入张量、所述第二目标输入量化参数和所述目标输出量化参数，预测所述输出张量的量化值。

7.一种确定量化参数的装置，其特征在于，包括：

第二量化处理模块，用于量化处理第一初始输入量化参数和第二初始输入量化参数，分别得到第一目标输入量化参数和第二目标输入量化参数，所述第一初始输入量化参数和所述第二初始输入量化参数分别根据神经网络的第一输入张量和第二输入张量而确定；所述第一输入张量包括泊车位的大小及位置，所述第二输入张量包括泊车车身的航向角，所述第一目标输入量化参数的精度低于所述第一初始输入量化参数的精度，所述第二目标输入量化参数的精度低于所述第二初始输入量化参数的精度；

第二目标输出量化参数确定模块，用于融合所述量化处理的量化尺度以及所述初始输出量化参数，确定所述目标输出量化参数，具体用于执行：new_scale_o＝scale_o*scale1/new_scale1，或者，new_scale_o＝scale_o*scale2/new_scale2，其中，new_scale_o表示所述目标输出量化参数，scale_o表示初始输出量化参数，scale1表示第一初始输入量化参数，new_scale1表示第一目标输入量化参数，scale2表示第二初始输入量化参数，new_scale2表示第二目标输入量化参数；所述量化处理的量化尺度包括所述第一目标输入量化参数与所述第一初始输入量化参数的变化倍数或所述第二目标输入量化参数与所述第二初始输入量化参数的变化倍数；所述目标输出量化参数保持所述初始输出量化参数的精度，所述初始输出量化参数与所述神经网络的输出张量相对应；所述输出张量为方向盘的转角；

发送模块，用于将所述第一目标输入量化参数、所述第二目标输入量化参数和所述目标输出量化参数，发送至神经网络预测设备，以使所述神经网络预测设备根据所述第一输入张量、所述第一目标输入量化参数、所述第二输入张量、所述第二目标输入量化参数和所述目标输出量化参数，预测所述神经网络的输出张量的量化值。

8.一种神经网络预测装置，其特征在于，包括：

获取模块，用于获取神经网络的第一输入数据和第二输入数据；

接收模块，用于从中央处理器接收第一目标输入量化参数、第二目标输入量化参数和目标输出量化参数，所述第一目标输入量化参数、所述第二目标输入量化参数和所述目标输出量化参数为所述中央处理器根据权利要求3或4所述的方法而确定；

第二预测模块，用于根据所述第一输入张量、所述第一目标输入量化参数、所述第二输入张量、所述第二目标输入量化参数和所述目标输出量化参数，预测所述神经网络的输出张量的量化值；所述第一输入张量包括泊车位的大小及位置，所述第二输入张量包括泊车车身的航向角，所述输出张量为方向盘的转角。

9.一种电子设备，其特征在于，包括：

至少一个第一处理器；以及

与所述至少一个第一处理器通信连接的第一存储器；其中，

所述第一存储器存储有可被所述至少一个第一处理器执行的指令，所述指令被所述至少一个第一处理器执行，以使所述至少一个第一处理器能够执行权利要求1或2所述的方法。

10.一种确定量化参数的设备，其特征在于，包括：

至少一个中央处理器；以及

与所述至少一个中央处理器通信连接的第二存储器；

其中，所述第二存储器存储有可被所述至少一个第二处理器执行的指令，所述指令被所述至少一个中央处理器执行，以使所述至少一个中央处理器能够执行权利要求3或4所述的方法。

11.一种神经网络预测设备，其特征在于，所述神经网络预测设备能够执行权利要求5所述的方法。

12.根据权利要求11所述的神经网络预测设备，其特征在于，所述神经网络预测设备包括专用集成电路、现场可编程逻辑门阵列、数字信号处理器和图形处理器中任一种。

13.一种神经网络预测系统，其特征在于，包括权利要求10所述的确定量化参数的设备，以及权利要求11或12所述的神经网络预测设备，所述确定量化参数的设备和所述神经网络预测设备通信连接。

14.根据权利要求13所述的系统，其特征在于，所述神经网络预测系统为自动驾驶系统。

15.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的方法。