WO2020135602A1

WO2020135602A1 - 图像处理方法、装置、智能驾驶系统和车载运算平台

Info

Publication number: WO2020135602A1
Application number: PCT/CN2019/128764
Authority: WO
Inventors: 温拓朴; 程光亮; 石建萍
Original assignee: 北京市商汤科技开发有限公司
Priority date: 2018-12-29
Filing date: 2019-12-26
Publication date: 2020-07-02
Also published as: JP2022515343A; KR20210092254A; CN111383156A; CN111383156B

Abstract

一种图像处理方法、装置、智能驾驶系统和车载运算平台。该方法包括：根据运算单元（703）的定点位宽硬件资源量，将卷积神经网络使用浮点表示的网络参数定点化处理（S101，S201），获取待处理的图像（S102，S203），控制运算单元（703）根据所述卷积神经网络定点化处理后的网络参数处理图像，得到图像的处理结果（S103）。

Description

图像处理方法、装置、智能驾驶系统和车载运算平台

本申请要求在2018年12月29日提交中国专利局、申请号为CN201811643406.6、发明名称为“图像处理方法、装置、智能驾驶系统和车载运算平台”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及定点化技术，尤其涉及一种图像处理方法、装置、智能驾驶系统和车载运算平台。

背景技术

随着深度卷积神经网络技术在计算机视觉识别中的性能提升，卷积神经网络技术越来越频繁的被应用到如图像处理、无人驾驶系统、辅助驾驶系统等产品中。由于卷积神经网络处理的是图像数据，卷积神经网络技术通常应用依赖于高性能的图形处理器(Graphics Processing Unit，GPU)，且需要巨大的运算量，消耗较大的内存。

发明内容

本申请实施例提供一种图像处理方法、装置、智能驾驶系统和车载运算平台。

根据本申请实施例的一个方面，提供的一种图像处理方法，包括：

根据运算单元的定点位宽硬件资源量，将卷积神经网络使用浮点表示的网络参数定点化处理，定点化处理后的网络参数为采用2的幂次表示的值；

获取待处理的图像；

控制所述运算单元根据所述卷积神经网络定点化处理后的网络参数处理所述图像，得到所述图像的处理结果。

根据本申请实施例的另一方面，提供的一种图像处理装置，包括：

参数定点化模块，用于根据运算单元的定点位宽硬件资源量，将卷积神经网络使用浮点表示的网络参数定点化处理，定点化处理后的网络参数为采用2的幂次表示的值；

图像获取模块，用于获取待处理的图像；

图像处理模块，用于控制所述运算单元根据所述卷积神经网络定点化处理后的网络参数处理所述图像，得到所述图像的处理结果。

根据本申请实施例的又一方面，提供的一种智能驾驶系统，包括：车载摄像头，卷积神经网络子系统和控制子系统；其中，所述控制子系统用于：

根据运行所述卷积神经网络子系统的运算单元的定点位宽硬件资源量，将卷积神经网络使用浮点表示的网络参数定点化处理，定点化处理后的网络参数为采用2的幂次表示的值；

控制所述卷积神经网络子系统根据所述卷积神经网络定点化处理后的网络参数处理所述车载摄像头采集到的车辆行驶路面的图像，得到所述图像的处理结果；

根据所述图像的处理结果进行车辆智能驾驶。

根据本申请实施例的还一方面，提供的一种基于FPGA的车载运算平台，包括：处理器、外部存储器、内存和FPGA运算单元；

所述外部存储器中存储有所述神经网络的定点化处理后的网络参数，或者，存储有所述神经网络的定点化处理后的网络参数对应的二进制值和查找表，所述查找表用于指示不同的网络参数的幂次值对应的二进制值；定点化处理后的网络参数为采用2的幂次表示的值；

所述处理器将所述神经网络的定点化处理的网络参数读入所述内存，将所述内存上的数据和待处理的图像信息输入到所述FPGA运算单元；或者，所述处理器将根据所述二进制值和所述查找表，查找得到定点化处理的网络参数读入所述内存，将所述内存上的数据和待处理的图像信息输入到所述FPGA运算单元；

所述FPGA运算单元根据所述待处理的图像信息和定点化处理的网络参数得到移位运算结果，对多次结果求和运算，得到所述图像的处理结果。

根据本申请实施例的再一方面，提供的一种电子设备，包括：

处理器和存储器；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如任一项实施例所述的图像处理方法对应的操作。

处理器和任一项实施例所述的图像处理装置；在处理器运行所述图像处理装置时，任一项实施例所述的图像处理装置中的模块被运行。

根据本申请实施例的再一方面，提供的一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，所述计算机程序用于执行上述第一方面任一可行的实现方式中的图像处理方法步骤。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，而非限制本公开。

本申请实施例提供一种图像处理方法、装置、智能驾驶系统和车载运算平台，图像处理方法包括：根据运算单元的定点位宽硬件资源量，将卷积神经网络使用浮点表示的网络参数定点化处理，获取待处理的图像，控制运算单元根据卷积神经网络定点化处理后的网络参数处理图像，得到图像的处理结果。通过对卷积神经网络的网络参数进行定点化，采用2的幂次来定点化表示网络参数，可减少存储空间占用以及运算过程中对内存空间的占用，节约了FPGA等硬件平台的资源。同时，采用2的幂次来表示网络参数可降低了运算复杂度，提高运算速度，实现快速实时响应，降低运算过程中的功耗，尤其在运算单元为FPGA等硬件资源有限的硬件时，解决了卷积神经网络无法应用在硬件上或者无法在硬件上实现加速运算的问题。

下面通过附图和实施例，对本申请的技术方案做进一步的详细描述。

附图说明

构成说明书的一部分的附图描述了本申请的实施例，并且连同描述一起用于解释本发明的原理。

参照附图，根据下面的详细描述，可以更加清楚地理解本申请，其中：

图1是本申请实施例提供的图像处理方法的一个流程示意图。

图2是本申请实施例提供的图像处理方法的另一流程示意图。

图3是本申请实施例提供的图像处理装置的一个结构示意图。

图4是本申请实施例提供的图像处理装置的另一结构示意图。

图5是本申请实施例提供的智能驾驶系统的一个结构示意图。

图6是本申请实施例提供的基于FPGA的车载运算平台的结构示意图。

图7是本申请实施例提供的电子设备的结构示意图。

具体实施方式

现在将参照附图来详细描述本申请的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本申请的范围。

同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本申请及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

本申请实施例可以应用于计算机系统/服务器，其可与众多其它通用或专用计算系统环境或配置一起操作。适于与计算机系统/服务器一起使用的众所周知的计算系统、环境和/或配置的例子包括但不限于：个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统﹑大型计算机系统和包括上述任何系统的分布式云计算技术环境，等等。

计算机系统/服务器可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常，程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等，它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施，分布式云计算环境中，任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中，程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。

图1是本申请实施例提供的图像处理方法的一个流程示意图。本申请实施例的执行主体示例性的可以为图像处理装置、处理器等电子设备，还可以为应用图像处理方法的任意装置和系统，例如监控系统、智能驾驶系统等。如图1所示，图像处理方法，包括：

S101、根据运算单元的定点位宽硬件资源量，将卷积神经网络使用浮点表示的网络参数定点化处理。

其中，定点化处理后的网络参数为采用2的幂次表示的值。

示例性的，本申请实施例中的运算单元可以为支持定点运算的计算单元，比如现场可编程逻辑门阵列(Field Programmable Gate Array，简称FPGA)中的数字信号处理器(Digital Signal Processor，简称DSP)等。当运算单元为FPGA等硬件平台时，为了发挥FPGA等硬件平台低功耗、加速运算等方面的综合优势，运算单元的定点位宽资源量通常较为有限。某些情形下，为了实现更低功耗往往会选择尽量小的定点位宽资源量，比如8比特或4比特位甚至更少宽资源量来实现定点运算。然而，定点位宽资源量少往往会影响运算速度，对于要求快速响应甚至是实时响应的平台，例如自动驾驶的车载运算平台等，本申请实施例通过对卷积神经网络进行适配硬件定点位宽资源量的优化，实现了在有限资源平台上的高速运算。

卷积神经网络通常包括多个卷积层，用于对待处理的图像进行特征提取，对提取到的特征进行分类，以实现卷积神经网络的各类功能。卷积神经网络中包含有多个网络参数，卷积神经网络中的网络参数的取值决定了卷积神经网络的性能。为提高卷积神经网络的性能，卷积神经网络的网络参数通常为浮点数表达。可选地，本申请实施例中的卷积神经网络可以为经过训练的卷积神经网络。但是浮点数形式的网络参数存在占用存储空间，计算复杂度高问题，本申请实施例中对卷积神经网络使用浮点表示的网络参数进行定点化处理，使得定点化处理后的网络参数为采用2的幂次表示的值，一方面减少了网络参数对存储空间的占用，另一方面简化了基于卷积神经网络进行图像处理时所需的运算。

例如，采用2的幂次来定点化表示网络参数，在存储时，可仅存储网络参数对应的幂次数值，进而可减少存储空间占用以及运算过程中对内存空间的占用，节约了FPGA等硬件平台的资源。同时，当采用2的幂次来表示网络参数时，对于卷积神经网络中大量的乘法运算，可使得运算单元可以采用移位与加和运算的方式来替代处理速度较慢且功耗较大的乘法运算，实现图像处理。采用2的幂次来表示网络参数可大大降低运算复杂度，提高运算速度，实现快速实时响应，降低运算过程中的功耗，尤其在运算单元为FPGA等硬件资源有限的硬件时，可解决卷积神经网络无法应用在硬件上或者无法在硬件上实现加速运算的问题。

示例性的，在对卷积神经网络的网络参数进行定点化之前，可先检测网络参数的形式是否为浮点数，若是，则需对网络参数的取值进行定点化。

示例性的，在一种可能的实现方式中定点化处理后的网络参数为M个2的幂次之和，M为大于1的整数。

可选地，本实施例中，对于一个浮点数，可采用M个2的次幂来表示。例如，对于浮点数36.11，可采用2 ⁵+2 ²来表示。例如，对于浮点数21.42，可采用2 ⁴+2 ²+2 ¹来表示。例如，对于浮点数16.25，可采用2 ⁴+2 ^-2来表示。通过采用M个2的幂次之和来对网络参数的取值进行定点化，一方面在偏差较小的情况下，减少了网络参数对存储空间的占用，确保了卷积神经网络的性能，另一方面，可将卷积神经网络中的与网络参数相关的乘法操作简化为移位操作，简化了卷积神经网络的运算，提高了卷积神经网络的运算速率。

可以理解的是，定点化后的网络参数也可以采用少于M个的2的幂次之和来表示。例如，对于浮点数32，可采用2 ⁵来表示。

可选的，在一种可能的实现方式中，M等于2。例如，对于某一网络参数的定点化结果，可采用2 ^k+2 ^j来表示。

示例性的，通过均采用两个2的幂次来表示，可在确保网络参数的准确度的同时，不增加过多的计算量，降低了内存及存储资源的占用量。

示例性的，在存储卷积神经网络的网络参数的取值时，由于网络参数数量较多，且每个网络参数的取值不同，在存储网络参数的取值时，存在占用存储空间较多的问题。为进一步减少存储空间占用，本申请实施例提供一种可能的定点化处理后的网络参数的存储方式，该种方式中：

定点化处理后的网络参数为2的k次幂与2的j次幂之和，k和j均为整数，k大于j、且k与j之差小于预设阈值。

可选地，对于任一浮点数，可采用2 ^k+2 ^j来进行定点化表示，其中k和j均为整数，且k大于j。为了简化网络参数的定点化过程，减少定点化处理后的网络参数存储时占用的空间，可限定k与j之差小于预设阈值。

示例性的，确定预设阈值的过程首先可以确定卷积神经网络的所有网络参数的初始值，然后根据所有初始值的精度，确定最小精度值s，最小精度值s即为j的可能取值的最小值。然后根据所有初始值中最大的初始值，确定最大数值，最大数值可以为对最大初始值进行向上取整。示例性的，可采用一个2的次幂，如2 ^t表示最大数值，或M个2的幂次表示最大数值，如2 ^p+2 ^q。t、p、q为整数，且p大于q。t或p即为k的可能取值的最大值。当k和j的差值大于预设阈值时，可将j的可能的最小取值增大，也即降低网络参数的定点化精度。

可选的，在本实施例中，当定点化处理后的网络参数为2的k次幂与2的j次幂之和，存储定点化处理后的网络参数的可选方式可以包括：

根据k与j，以及，二进制值映射表，获取定点化处理后的网络参数对应的二进制值，二进制值映射表用于指示不同k与j取值组合对应的二进制值；

存储定点化处理后的网络参数对应的二进制值。

示例性的，定点化处理后的网络参数为2的k次幂与2的j次幂之和，考虑到k和j为不相同的整数，且k与j之差小于预设阈值d，故可确定卷积神经网络的定点化处理后的网络参数，取值的所有可能性为

种。其中，d＝k-j+1。例如，当k和j之间差值的预设阈值d为7，此时，网络参数的取值可能为28种。对于28个不同的数值，可采用5位比位数进行区分。因此，可建立二进制值映射表，二进制映射表中指示了不同k与j取值组合对应的二进制值，从而减少了定点化处理后的网络参数在存储时占用的存储空间。

示例性的，在确定定点化处理后的网络参数对应的二进制值时，可采用2log d比特位来编码定点化处理后的网络参数。可以为前log d比特位用于表示第一个2的幂次，后log d比特位表示后一个2的幂次。

在一个可选示例中，该步骤S101可以由处理器调用存储器存储的相应指令执行，也可以由被处理器运行的参数定点化模块301执行。

S102、获取待处理的图像。

示例性地，待处理的图像可以为监控摄像头拍摄得到的图像，还可以为车载摄像头拍摄得到图像，还可以为预存储在的图像库中的图像等，本申请实施例不限制待处理的图像的获取方式。

在一个可选示例中，该步骤S102可以由处理器调用存储器存储的相应指令执行，也可以由被处理器运行的图像获取模块302执行。

S103、控制运算单元根据卷积神经网络定点化处理后的网络参数处理图像，得到图像的处理结果。

在一个可选示例中，该步骤S103可以由处理器调用存储器存储的相应指令执行，也可以由被处理器运行的图像处理模块303执行。

示例性地，图像的处理结果包括但不限于以下至少之一：对象检测/跟踪结果、特征提取结果、分割结果、分类结果。

示例性地，当采用存储二进制值的方式来指示定点化处理后的网络参数时，控制运算单元根据网络参数经过定点化处理的卷积神经网络处理图像，可包括：

S11、控制运算单元根据二进制值和二进制映射表，确定卷积神经网络的定点化处理后的网络参数。

示例性地，控制运算单元根据存储的二进制值，在二进制映射表中通过查找确定卷积神经网络的定点化处理后的网络参数，或者，在二进制映射表中通过查找确定幂次k和j，从而可确定定点化处理后的网络参数2 ^k+2 ^j。

S12、根据卷积神经网络定点化处理后的网络参数处理图像。

本申请实施例提供的图像处理方法包括：根据运算单元的定点位宽硬件资源量，将卷积神经网络使用浮点表示的网络参数定点化处理，获取待处理的图像，控制运算单元根据卷积神经网络定点化处理后的网络参数处理图像，得到图像的处理结果。通过对卷积神经网络的网络参数进行定点化，采用2的幂次来定点化表示网络参数，可减少存储空间占用以及运算过程中对内存空间的占用，节约了FPGA等硬件平台的资源。同时，采用2的幂次来表示网络参数降低了运算复杂度，提高运算速度，实现快速实时响应，降低运算过程中的功耗，尤其在运算单元为FPGA等硬件资源有限的硬件时，解决了卷积神经网络无法应用在硬件上或者无法在硬件上实现加速运算的问题。

示例性地，在图1所示实施例的基础上，本申请实施例还提供了一种图像处理方法，图2是本申请实施例提供的图像处理方法的另一流程示意图。如图2所示，图像处理方法，包括：

S201、根据运算单元的定点位宽硬件资源量，将卷积神经网络使用浮点表示的网络参数定点化处理。

S202、采用训练数据训练包括定点化处理后的网络参数的卷积神经网络，以对定点化处理后的网络参数进行修正。

示例性的，训练数据可以为标注有标签的数据。例如，当采用卷积神经网络进行图像中的人脸检测或可行驶区域检测时，训练数据则为标注有人脸区域或可行驶区域的图像。

示例性的，对卷积神经网络的网络参数的训练、定点化以及再训练过程可以多次执行，以提高网络参数的准确性。

S203、获取待处理的图像。

S204、控制运算单元根据卷积神经网络经过修正后的网络参数处理图像，得到图像的处理结果。

本实施例提供的图像处理方法中，在对卷积神经网络使用浮点表示的网络参数进行定点化处理后，采用训练数据再次训练包括定点化处理后的网络参数的卷积神经网络，以对定点化处理后的网络参数进行修正，可提高卷积神经网络的网络参数的准确性。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

图3是本申请实施例提供的图像处理装置的一个结构示意图。如图3所示，图像处理装置包括：

参数定点化模块301，用于根据运算单元的定点位宽硬件资源量，将卷积神经网络使用浮点表示的网络参数定点化处理。

其中，定点化处理后的网络参数为采用2的幂次表示的值。

图像获取模块302，用于获取待处理的图像。

图像处理模块303，用于控制运算单元根据卷积神经网络定点化处理后的网络参数处理图像，得到图像的处理结果。

可选的，定点化处理后的网络参数为M个2的幂次之和，M为大于1的整数。

可选的，M等于2。

可选的，定点化处理后的网络参数为2的k次幂与2的j次幂之和，k和j均为整数，k大于j、且k与j之差小于预设阈值。

示例性的，在图3所示实施例的基础上，本申请实施例还提供了一种图像处理装置。图4是本申请实施例二提供的图像处理装置的结构示意图。如图4所示，图像处理装置还包括：

存储模块304，用于根据k与j，以及，二进制值映射表，获取定点化处理后的网络参数对应的二进制值，二进制值映射表用于指示不同k与j取值组合对应的二进制值；存储定点化处理后的网络参数对应的二进制值。

可选的，上述图4所示实施例中的图像处理模块303，用于：

控制运算单元根据二进制值和二进制映射表，确定卷积神经网络的定点化处理后的网络参数；

根据卷积神经网络定点化处理后的网络参数处理图像。

示例性的，如图4所示，图像处理装置还包括：

训练模块305，用于在控制运算单元根据卷积神经网络定点化处理后的网络参数处理图像之前，采用训练数据训练包括定点化处理后的网络参数的卷积神经网络，以对定点化处理后的网络参数进行修正。

可选的，图像的处理结果包括但不限于以下至少之一：对象检测/跟踪结果、特征提取结果、分割结果、分类结果。

本公开实施例提供的图像处理装置任一实施例的工作过程、设置方式及相应技术效果，均可以参照本公开上述相应方法实施例的具体描述，限于篇幅，在此不再赘述。

本申请实施例另一方面还提供一种智能驾驶系统，采用了上述实施例中的图像处理方法，具有相同或相似的技术特征和技术效果。

图5是本申请实施例提供的智能驾驶系统的一个结构示意图。如图5所示，智能驾驶系统包括：车载摄像头501，卷积神经网络子系统502和控制子系统503；其中，控制子系统503用于：

根据运行卷积神经网络子系统502的运算单元的定点位宽硬件资源量，将卷积神经网络使用浮点表示的网络参数定点化处理，定点化处理后的网络参数为采用2的幂次表示的值；

控制卷积神经网络子系统502根据卷积神经网络定点化处理后的网络参数处理车载摄像头501采集到的车辆行驶路面的图像，得到图像的处理结果；

根据图像的处理结果进行车辆智能驾驶。

示例性的，智能驾驶包括但不限于：辅助驾驶，自动驾驶，以及辅助驾驶和自动驾驶等多种驾驶模式之间的切换等多种情形。

可选的，M等于2。

可选的，控制子系统503还用于，根据k与j，以及，二进制值映射表，获取定点化处理后的网络参数对应的二进制值，二进制值映射表用于指示不同k与j取值组合对应的二进制值。

对应的，智能驾驶系统还包括：存储子系统504；

存储子系统504，用于存储定点化处理后的网络参数对应的二进制值。

可选的，控制子系统503用于，

控制卷积神经网络子系统根据存储子系统中存储的二进制值和二进制值映射表，确定卷积神经网络的定点化处理后的网络参数；

根据卷积神经网络定点化处理后的网络参数处理车载摄像头采集到的车辆行驶路面的图像，得到图像的处理结果。

可选的，智能驾驶系统还包括：训练子系统505；

训练子系统505用于，采用训练数据训练包括定点化处理后的网络参数的卷积神经网络，以对定点化处理后的网络参数进行修正。

可选的，图像的处理结果包括但不限于以下至少之一：车牌识别结果、可行驶区域检测结果、车道线检测结果、车道线属性检测结果、车载摄像头姿态检测结果。

本申请实施例另一方面还提供一种基于FPGA的车载运算平台，采用了上述实施例中的图像处理方法，具有相同或相似的技术特征和技术效果。

图6是本申请实施例提供的基于FPGA的车载运算平台的结构示意图。如图6所示，基于FPGA的车载运算平台包括：处理器601、外部存储器602、内存603和FPGA运算单元604；其中，

外部存储器602中存储有神经网络的定点化处理后的网络参数，或者，存储有神经网络的定点化处理后的网络参数对应的二进制值和查找表，查找表用于指示不同的网络参数的幂次值对应的二进制值；定点化处理后的网络参数为采用2的幂次表示的值；

处理器601将神经网络的定点化处理的网络参数读入内存603，将内存上的数据和待处理的图像信息输入到FPGA运算单元604；或者，处理器601将根据二进制值和查找表，查找得到定点化处理的网络参数读入内存603，将内存603上的数据和待处理的图像信息输入到FPGA运算单元604；

FPGA运算单元604根据待处理的图像信息和定点化处理的网络参数得到移位运算结果，对多次结果求和运算，得到图像的处理结果。

可选的，M等于2。

可选的，外部存储器602中存储有k与j；

查找表指示了不同的k和j的取值组合对应的二进制值。

本申请实施例另一方面还提供一种电子设备，图7是本申请实施例提供的电子设备的结构示意图，如图7所示，该电子设备包括：处理器702和存储器701；

存储器701用于存放至少一可执行指令，可执行指令使处理器702执行如上述任一项实施例提供的图像处理方法对应的操作。

示例性地，如图7所示，电子设备还包括运算单元703，运算单元703用于实现上述任一实施例中的卷积神经网络的运算。

本申请实施例另一方面还提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，计算机程序用于执行上述任一实施例提供的的图像处理方法步骤。

本实施例中的装置与前述实施例中的方法是基于同一发明构思下的两个方面，在前面已经对方法实施过程作了详细的描述，所以本领域技术人员可根据前述描述清楚地了解本实施中的系统的结构及实施过程，为了说明书的简洁，在此就不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本说明书中各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言，由于其与方法实施例基本对应，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

可能以许多方式来实现本申请的方法和装置。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本申请的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明，本申请的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本申请实施为记录在记录介质中的程序，这些程序包括用于实现根据本申请的方法的机器可读指令。因而，本申请还覆盖存储用于执行根据本申请的方法的程序的记录介质。

本申请的描述是为了示例和描述起见而给出的，而并不是无遗漏的或者将本申请限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本申请的原理和实际应用，并且使本领域的普通技术人员能够理解本申请从而设计适于特定用途的带有各种修改的各种实施例。

Claims

一种图像处理方法，其特征在于，包括：

根据运算单元的定点位宽硬件资源量，将卷积神经网络使用浮点表示的网络参数定点化处理，定点化处理后的网络参数为采用2的幂次表示的值；

获取待处理的图像；

控制所述运算单元根据所述卷积神经网络定点化处理后的网络参数处理所述图像，得到所述图像的处理结果。
根据权利要求1所述的方法，其特征在于，所述定点化处理后的网络参数为M个2的幂次之和，所述M为大于1的整数。
根据权利要求2所述的方法，其特征在于，所述M等于2。
根据权利要求1-3任一所述的方法，其特征在于，所述定点化处理后的网络参数为2的k次幂与2的j次幂之和，所述k和所述j均为整数，所述k大于所述j、且所述k与所述j之差小于预设阈值。
根据权利要求4所述的方法，其特征在于，所述将卷积神经网络使用浮点表示的网络参数定点化处理之后，所述方法还包括：

根据所述k与所述j，以及，二进制值映射表，获取所述定点化处理后的网络参数对应的二进制值，所述二进制值映射表用于指示不同k与j取值组合对应的二进制值；

存储所述定点化处理后的网络参数对应的二进制值。
根据权利要求5所述的方法，其特征在于，所述控制所述运算单元根据所述卷积神经网络定点化处理后的网络参数处理所述图像，包括：

控制所述运算单元根据所述二进制值和所述二进制映射表，确定所述卷积神经网络的定点化处理后的网络参数；

根据所述卷积神经网络定点化处理后的网络参数处理所述图像。
根据权利要求1-6任一项所述的方法，其特征在于，所述控制所述运算单元根据定点化处理后的网络参数处理所述图像之前，还包括：

采用训练数据训练包括定点化处理后的网络参数的卷积神经网络，以对所述定点化处理后的网络参数进行修正。
根据权利要求1-7任一项所述的方法，其特征在于，所述图像的处理结果包括以下至少之一：对象检测/跟踪结果、特征提取结果、分割结果、分类结果。
一种图像处理装置，其特征在于，包括：

参数定点化模块，用于根据运算单元的定点位宽硬件资源量，将卷积神经网络使用浮点表示的网络参数定点化处理，定点化处理后的网络参数为采用2的幂次表示的值；

图像获取模块，用于获取待处理的图像；

图像处理模块，用于控制所述运算单元根据所述卷积神经网络定点化处理后的网络参数处理所述图像，得到所述图像的处理结果。
根据权利要求9所述的装置，其特征在于，所述定点化处理后的网络参数为M个2的幂次之和，所述M为大于1的整数。
根据权利要求10所述的装置，其特征在于，所述M等于2。
根据权利要求9-11任一所述的装置，其特征在于，所述定点化处理后的网络参数为2的k次幂与2的j次幂之和，所述k和所述j均为整数，所述k大于所述j、且所述k与所述j之差小于预设阈值。
根据权利要求12所述的装置，其特征在于，还包括：

存储模块，用于根据所述k与所述j，以及，二进制值映射表，获取所述定点化处理后的网络参数对应的二进制值，所述二进制值映射表用于指示不同k与j取值组合对应的二进制值；存储所述定点化处理后的网络参数对应的二进制值。
根据权利要求13所述的装置，其特征在于，所述图像处理模块，用于：

控制所述运算单元根据所述二进制值和所述二进制映射表，确定所述卷积神经网络的定点化处理后的网络参数；

根据所述卷积神经网络定点化处理后的网络参数处理所述图像。
根据权利要求9-14任一项所述的装置，其特征在于，所述装置还包括：

训练模块，用于在控制所述运算单元根据所述卷积神经网络定点化处理后的网络参数处理所述图像之前，采用训练数据训练包括定点化处理后的网络参数的卷积神经网络，以对所述定点化处理后的网络参数进行修正。
根据权利要求9-15任一项所述的装置，其特征在于，所述图像的处理结果包括以下至少之一：对象检测/跟踪结果、特征提取结果、分割结果、分类结果。
一种智能驾驶系统，其特征在于，包括：车载摄像头，卷积神经网络子系统和控制子系统；其中，所述控制子系统用于：

根据运行所述卷积神经网络子系统的运算单元的定点位宽硬件资源量，将卷积神经网络使用浮点表示的网络参数定点化处理，定点化处理后的网络参数为采用2的幂次表示的值；

控制所述卷积神经网络子系统根据所述卷积神经网络定点化处理后的网络参数处理所述车载摄像头采集到的车辆行驶路面的图像，得到所述图像的处理结果；

根据所述图像的处理结果进行车辆智能驾驶。
根据权利要求17所述的系统，其特征在于，所述定点化处理后的网络参数为M个2的幂次之和，所述M为大于1的整数。
根据权利要求18所述的系统，其特征在于，所述M等于2。
根据权利要求17-19任一所述的系统，其特征在于，所述定点化处理后的网络参数为2的k次幂与2的j次幂之和，所述k和所述j均为整数，所述k大于所述j、且所述k与所述j之差小于预设阈值。
根据权利要求20所述的系统，其特征在于，所述控制子系统还用于，

根据所述k与所述j，以及，二进制值映射表，获取所述定点化处理后的网络参数对应的二进制值，所述二进制值映射表用于指示不同k与j取值组合对应的二进制值；

所述智能驾驶系统还包括：存储子系统；

所述存储子系统，用于存储所述定点化处理后的网络参数对应的二进制值。
根据权利要求21所述的系统，其特征在于，所述控制子系统用于，

控制所述卷积神经网络子系统根据所述存储子系统中存储的二进制值和二进制值映射表，确定所述卷积神经网络的定点化处理后的网络参数；

根据所述卷积神经网络定点化处理后的网络参数处理所述车载摄像头采集到的车辆行驶路面的图像，得到所述图像的处理结果。
根据权利要求17-22任一项所述的系统，其特征在于，所述智能驾驶系统还包括：训练子系统；

所述训练子系统用于，采用训练数据训练包括定点化处理后的网络参数的所述卷积神经网络，以对所述定点化处理后的网络参数进行修正。
根据权利要求17-21任一项所述的系统，其特征在于，所述图像的处理结果包括以下至少之一：车牌识别结果、可行驶区域检测结果、车道线检测结果、车道线属性检测结果、车载摄像头姿态检测结果。
一种基于FPGA的车载运算平台，其特征在于，包括：处理器、外部存储器、内存和FPGA运算单元；

所述外部存储器中存储有神经网络的定点化处理后的网络参数，或者，存储有所述神经网络的定点化处理后的网络参数对应的二进制值和查找表，所述查找表用于指示不同的网络参数的幂次值对应的二进制值；定点化处理后的网络参数为采用2的幂次表示的值；

所述处理器将所述神经网络的定点化处理的网络参数读入所述内存，将所述内存上的数据和待处理的图像信息输入到所述FPGA运算单元；或者，所述处理器将根据所述二进制值和所述查找表，查找得到定点化处理的网络参数读入所述内存，将所述内存上的数据和待处理的图像信息输入到所述FPGA运算单元；

所述FPGA运算单元根据所述待处理的图像信息和定点化处理的网络参数得到移位运算结果，对多次结果求和运算，得到所述图像的处理结果。
根据权利要求25所述的平台，其特征在于，所述定点化处理后的网络参数为M个2的幂次之和，所述M为大于1的整数。
根据权利要求26所述的平台，其特征在于，所述M等于2。
根据权利要求25-27任一所述的平台，其特征在于，所述定点化处理后的网络参数为2的k次幂与2的j次幂之和，所述k和所述j均为整数，所述k大于所述j、且所述k与所述j之差小于预设阈值。
根据权利要求28所述的平台，其特征在于，所述外部存储器中存储有所述k与所述j；

所述查找表指示了不同的k和j的取值组合对应的二进制值。
根据权利要求25-29任一项所述的平台，其特征在于，所述图像的处理结果包括以下至少之一：对象检测/跟踪结果、特征提取结果、分割结果、分类结果。
一种电子设备，其特征在于，包括：处理器和存储器；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求1-8任一项所述的图像处理方法对应的操作。
一种电子设备，其特征在于，包括：

处理器和权利要求9-16任一项所述的图像处理装置；在处理器运行所述图像处理装置时，权利要求9-16任一项所述的图像处理装置中的模块被运行。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，所述计算机程序用于执行权利要求1-8任一项所述的图像处理方法步骤。