CN111881828A

CN111881828A - 一种面向移动端设备的障碍物检测方法

Info

Publication number: CN111881828A
Application number: CN202010738838.6A
Authority: CN
Inventors: 王闻箫; 蔡登�
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2020-07-28
Filing date: 2020-07-28
Publication date: 2020-11-03
Anticipated expiration: 2040-07-28
Also published as: CN111881828B

Abstract

本发明公开了一种面向移动端设备的障碍物检测方法，包括：(1)选择障碍物检测模型；(2)将训练完的检测模型的识别准确率a作为因变量，模型的深度d、宽度w和图片大小r作为自变量；(3)分别对模型的深度d、宽度w和图片大小r进行剪枝，并在数据集上对模型进行微调，用函数f拟合a与d、w、r之间的关系；(4)通过优化函数求解最优的深度、宽度和图片大小(d_m，w_m，r_m)，并根据求得的(d_m，w_m，r_m)，导出对应的精简模型结构；(5)在数据集上对精简模型进行训练；(6)在移动端设备运行精简模型，实时输入周围的环境照片，进行障碍物识别。本发明使深度卷积神经网络可以满足移动端设备的流畅性要求，同时使障碍物检测具有较高的准确率。

Description

一种面向移动端设备的障碍物检测方法

技术领域

本发明属于计算机视觉技术领域，尤其是涉及一种面向移动端设备的障碍物检测方法。

背景技术

随着计算机视觉技术的发展，图像识别、目标检测等技术被广泛应用于自动驾驶、门禁系统等领域。而深度卷积神经网络是计算机视觉领域最重要深度学习框架之一，它由多个卷积层和全连接层组成的，目前准确率最高的图像识别、目标检测等算法，都使用了深度卷积神经网络。然而，深度卷积神经网络的运行需要消耗大量的计算资源，而大部分移动设备(例如手机、车载芯片等)的计算资源都非常有限，这严重阻碍了深度卷积神经网络在移动端的部署，因此，对深度卷积神经网络进行加速是必不可少的。

对深度卷积神经网络(下称模型)进行加速的基本思路就是减小模型推理过程中的浮点运算量，同时尽量保证模型的准确率损失最小。通常来说，有三种手段：1)减小模型的深度；2)减小模型的宽度；3)减小模型使用的图片尺寸大小。(注：深度指模型的层数，层数越多则越深；宽度指模型每层的过滤器数量，数量越多则越宽)。

大多数以往的神经网络加速系统都只专注于其中一种加速手段，以2)为例，他们认为同一层内不同的过滤器的重要程度是不一样的，因此着重研究在减小模型的宽度时应该删除哪些过滤器才能对模型准确率影响最小。但是，在实际使用中发现，给定一个计算量，单纯的减小宽度、深度或图片大小都会使模型准确率下降很大。相反，如果能够同时减小这三者的大小，找到一个最优的组合策略，则可以把模型准确率损失降到最小，但是如何才能找到最优的三者的组合是一个很难解决的问题。

目前已有的技术是通过近似暴力搜索的方式来寻找最优组合的，即将计算量满足要求的可能的深度、宽度、图片大小都训练一个新的模型，并选择出准确率最高的一个，但是这种方法十分耗时。

发明内容

本发明提供了一种面向移动端设备的障碍物检测方法，使深度卷积神经网络可以满足移动端设备的流畅性要求，同时使障碍物检测具有较高的准确率。

一种面向移动端设备的障碍物检测方法，包括：

(1)选择障碍物检测模型，并在数据集中进行训练；

(2)将训练完的检测模型的识别准确率a作为因变量，模型的深度d、模型的宽度w和图片的大小r作为自变量；

(3)分别对模型的深度d、模型的宽度w和图片的大小r进行剪枝，并在数据集上对模型进行微调，用函数f(d,w,r)拟合识别准确率a与深度d、宽度w和图片的大小r之间的关系；

(4)通过优化函数求解最优的深度、宽度和图片大小(d_m,w_m,r_m)，并根据求得的(d_m,w_m,r_m)，导出对应的精简模型结构；

(5)在数据集上对精简模型进行训练直到模型收敛；

(6)在移动端设备运行精简模型，实时输入周围的环境照片，进行障碍物识别。

本发明的方法，把模型的识别准确率a作为因变量，把深度d、宽度w和图片大小r作为自变量，把寻找最佳的深度、宽度和图片大小转化为了一个凸优化问题，并找到了一个合适的函数来拟合这4个变量的关系，并通过求解凸优化函数确定了最佳的d、w和r。最终，利用得出了d、w、r设计了一个新的障碍物检测模型。在对新的模型进行训练后，得到一个高效、精简、计算量小、可以在移动端流程运行的高速障碍物检测系统。

步骤(1)中，所述的障碍物检测模型为可以为ResNet50-SSD，所述的数据集可以采用cityscape公开数据集。

步骤(3)中，所述的函数f(d,w,r)具有可分离性、非负性、递增性、凹性，具体为：

分离性：f(d,w,r)可以被表示成三个独立函数的乘积，即f(d,w,r)＝c*h₁(d)h₂(w)h₃(r)；

非负性：0≤f(d,w,r)≤1；

递增性：f(d,w,r)随着d、w、r的增大而增大；即

凹性：f(d,w,r)是一个凹函数；即

同时，d、w、r中任意一个变量为0时，模型的准确率就是0，即f(0,w,r)＝f(d,0,r)＝f(d,w,0)＝0。

步骤(3)中，所述的函数f(d,w,r)为：

式中，c,k₁,k₂,k₃为待定参数。

步骤(4)中，采用拉格朗日乘子法和KKT条件求解出最优的深度、宽度和图片大小(d_m,w_m,r_m)，优化目标为：

d,w,r＝argmaxf(d,w,r)

s.t.g(d,w,r)≤T*g(d₀,w₀,r₀)

式中，g(d,w,r)为模型计算量，d₀,w₀,r₀代表原始模型的深度、宽度和图片大小，g(d₀,w₀,r₀)是原始模型的计算量，0<T<1是一个人为设定的超参，代表剪枝微调后模型的计算量与原模型计算量的比值。

与现有技术相比，本发明具有以下有益效果：

本发明的方法，将模型加速的问题转化为一个数值优化的问题，并将障碍物检测模型精简后运行在移动端设备上，与现有的针对移动端设备的检测模型相比，计算成本相当，但是识别的准确率远高于现有的检测模型。尤其是在用于自动驾驶场景时，本发明的方法可以帮助车辆更好的感知周围环境，使障碍物检测具有较高的准确率，以便车辆能够更加安全的行驶。

附图说明

图1为本发明方法的流程示意图。

具体实施方式

下面结合附图和实施例对本发明做进一步详细描述，需要指出的是，以下所述实施例旨在便于对本发明的理解，而对其不起任何限定作用。

如图1所示，一种面向移动端设备的障碍物检测方法，包括：选择障碍物检测模型；把模型的识别准确率a作为因变量，把深度d、宽度w和图片大小r作为自变量，把寻找最佳的深度、宽度和图片大小转化为了一个凸优化问题，并找到了一个合适的函数来拟合这4个变量的关系，并通过求解凸优化函数确定了最佳的d、w和r。最终，利用得出了d、w、r设计了一个新的障碍物检测模型。在对模型进行训练后，导出了一个高效、精简、计算量小、可以在移动端流程运行的高速障碍物检测系统，并用于障碍物识别的应用。

下面以自动驾驶场景使用的障碍物检测模型为例说明本发明的实施方案。本文涉及到的几个概念：

mAP：这是评价某个目标检测模型在某个特定数据集上的准确率的一个指标，取值范围为0～1，越大代表准确率越高。

剪枝：剪枝是神经网络加速的算法之一，它通过定位并删除卷积神经网络中不重要的过滤器或层来减小模型的宽度或深度,然后再在数据集上微调模型来恢复其准确率。

本发明首先取得一个训练好的针对服务器端的障碍物检测模型ResNet50-SSD。已知该模型识别准确率很高(mAP＝0.83)，但是模型过于笨重(深度50，宽度64，图片大小512*512)而不能满足移动端的使用要求。通过利用ResNet50-SSD来设计本发明的精简模型的流程如下：

1、尝试将ResNet50-SSD通过剪枝算法剪枝到25层，并在cityscape数据集上微调模型得到mAP为0.78。

2、尝试将ResNet50-SSD通过剪枝算法将宽度剪枝为45，并在cityscape数据集上微调模型得到mAP为0.77

3、尝试将ResNet50-SSD的输入图片大小改为360*360，并在cityscape数据集上微调模型得到mAP为0.74。

4、根据上述三条数据用函数f拟合模型准确率a和深度d、宽度w和图片大小r之间的关系。所述的函数f(d,w,r)为：

式中，c,k₁,k₂,k₃为待定参数。

5、用过优化函数f寻找最佳的d、w、r，并根据d、w、r导出一个对应的模型结构newResNet-SSD。

6、在cityscape公开数据集上训练newResNet-SSD至收敛，得到最终导出的模型。该模型在cityscape验证数据集上的识别准确率可以达到mAP＝0.81，仅仅比原始的服务器端的模型低0.02。

本发明通过同时减小宽度、深度或图片大小，合理的时间内找到最佳的组合方案，并根据这个方案训练并给出相应的神经网络，并将该网络运行在移动端设备，该模型比服务器端的原始模型更加精简、高效，因此计算量大大减小，可以在车载芯片等移动端设备上流畅运行，可以满足自动驾驶场景对于识别准确率的要求。

以上所述的实施例对本发明的技术方案和有益效果进行了详细说明，应理解的是以上所述仅为本发明的具体实施例，并不用于限制本发明，凡在本发明的原则范围内所做的任何修改、补充和等同替换，均应包含在本发明的保护范围之内。

Claims

1.一种面向移动端设备的障碍物检测方法，其特征在于，包括：

(1)选择障碍物检测模型，并在数据集中进行训练；

(3)分别对模型的深度d、模型的宽度w和图片的大小r进行剪枝，并在数据集上对模型进行微调，用函数f(d，w，r)拟合识别准确率a与深度d、宽度w和图片的大小r之间的关系；

(4)通过优化函数求解最优的深度、宽度和图片大小(d_m，w_m，r_m)，并根据求得的(d_m，w_m，r_m)，导出对应的精简模型结构；

(5)在数据集上对精简模型进行训练直到模型收敛；

2.根据权利要求1所述的面向移动端设备的障碍物检测方法，其特征在于，步骤(1)中，所述的障碍物检测模型为ResNet50-SSD。

3.根据权利要求1所述的面向移动端设备的障碍物检测方法，其特征在于，步骤(1)中，所述的数据集采用cityscape公开数据集。

4.根据权利要求1所述的面向移动端设备的障碍物检测方法，其特征在于，步骤(3)中，所述的函数f(d，w，r)具有可分离性、非负性、递增性、凹性，具体为：

分离性：f(d，w，r)可以被表示成三个独立函数的乘积，f(d，w，r)＝c*h₁(d)h₂(w)h₃(r)；

非负性：0≤f(d，w，r)≤1；

递增性：f(d，w，r)随着d、w、r的增大而增大；

凹性：f(d，w，r)是一个凹函数；

同时，d、w、r中任意一个变量为0时，模型的准确率就是0。

5.根据权利要求1所述的面向移动端设备的障碍物检测方法，其特征在于，步骤(3)中，所述的函数f(d，w，r)为：

式中，c，k₁，k₂，k₃为待定参数。

6.根据权利要求1所述的面向移动端设备的障碍物检测方法，其特征在于，步骤(4)中，采用拉格朗日乘子法和KKT条件求解出最优的深度、宽度和图片大小(d_m，w_m，r_m)，优化目标为：

d，w，r＝argmaxf(d，w，r)

s.t.g(d，w，r)≤T*g(d₀，w₀，r₀)

式中，g(d，w，r)为模型计算量，d₀，w₀，r₀代表原始模型的深度、宽度和图片大小，g(d₀，w₀，r₀)是原始模型的计算量，0＜T＜1是一个人为设定的超参，代表剪枝微调后模型的计算量与原模型计算量的比值。