CN108416440A

CN108416440A - 一种神经网络的训练方法、物体识别方法及装置

Info

Publication number: CN108416440A
Application number: CN201810231307.0A
Authority: CN
Inventors: 恽为民; 任翰驰; 夏晓斌; 庞作伟
Original assignee: Shanghai Xpartner Robotics Co Ltd
Current assignee: Shanghai Xpartner Robotics Co Ltd
Priority date: 2018-03-20
Filing date: 2018-03-20
Publication date: 2018-08-17

Abstract

本发明实施例公开了一种神经网络的训练方法、物体识别方法及装置。其中神经网络的训练方法包括建立初始神经网络模型，其中，所述初始神经网络模型为超轻量级网络SqueezeNet模型；获取训练样本，并对所述训练样本进行预处理；将预处理得到的训练样本输入至初始神经网络模型，并确定根据所述初始神经网络模型的第一输出与预设期望的损失值；根据所述损失值调节所述初始神经网络模型的网络参数，生成目标神经网络模型。建立了参数少、占用内存小的高精度目标神经网络，使得训练得到的目标神经网络模型可应用于移动终端，不在依赖于GPU的设置，提高了目标神经网络模型的适应性。

Description

一种神经网络的训练方法、物体识别方法及装置

技术领域

本发明实施例涉及图像处理技术，尤其涉及一种神经网络的训练方法、物体识别方法及装置。

背景技术

随着深度学习技术突飞猛进的发展，深度卷积神经网络在物体识别、单物体定位、多物体检测和图像语义及实例分割领域取得了重大技术突破和快速发展。在国际顶尖的大规模物体识别竞赛上，基于深度卷积神经网络的物体识别技术的识别准确率已达到超越人类的识别率。

但是目前的神经网络模型需要使用相应的计算框架，通过布置多块高性能图形处理器(GPU，Graphics Processing Unit)，且占用内存大，无法适用于设置有传统中央处理器，且内存空间较小的诸如智能手机或者平板电脑等的移动终端。

发明内容

本发明提供一种神经网络的训练方法、物体识别方法及装置，以实现建立运行速度快、占用内存小的神经网络模型。

第一方面，本发明实施例提供了一种神经网络的训练方法，该神经网络的训练方法包括：建立初始神经网络模型，其中，所述初始神经网络模型为超轻量级网络SqueezeNet模型；

获取训练样本，并对所述训练样本进行预处理；

将预处理得到的训练样本输入至初始神经网络模型，并确定根据所述初始神经网络模型的第一输出与预设期望的损失值；

根据所述损失值调节所述初始神经网络模型的网络参数，生成目标神经网络模型。

可选的，所述初始神经网络模型包括预设数量的结构模块，其中，每一个所述结构模块包括卷积核为1×1的第一卷积层、卷积核为1×1的第二卷积层和卷积核为3×3的第三卷积层。

可选的，所述第二卷积层与所述第三卷积层并联，串联于所述第一卷积层的输出端。

可选的，所述初始神经网络模型包括Dropout层。

可选的，所述初始神经网络模型包括全连接模块，其中，所述全连接模块包括全连接层或者卷积核为1×1的第四卷积层与池化层。

可选的，对所述训练样本进行预处理，包括：

将所述训练样本缩放至第一预设尺寸，计算缩放后的训练样本的三通道均值；

根据所述三通道均值对所述缩放后的训练样本进行去均值处理。

可选的，在计算缩放后的训练样本的三通道均值之前，还包括：

对所述缩放后的训练样本进行参数变换，形成近似样本；

相应的，计算缩放后的训练样本的三通道均值包括：

计算缩放后的训练样本和所述近似样本的三通道均值。

第二方面，本发明实施例还提供了一种物体识别方法，该物体识别方法包括：

获取待识别物体的图像；

根据目标神经网络模型的预处理参数对所述待识别物体的图像进行预处理；

基于所述目标神经网络模型，对所述预处理后的图像进行识别，输出识别物体和对应的置信度，其中，所述目标神经网络模型根据本发明实施例提的神经网络的训练方法训练得到的超轻量级网络SqueezeNet模型；

根据所述识别物体和对应的置信度确定所述待识别物体的识别结果。

可选的，根据目标神经网络模型的预处理参数对所述待识别物体的图像进行预处理，包括：

将所述待识别物体的图像缩放至第二预设尺寸；

获取所述目标神经网络的样本均值，根据所述样本均值对缩放后的图像进行去均值处理。

可选的，根据所述识别物体和对应的置信度确定所述待识别物体的识别结果，包括：

在所述置信度中筛选最大置信度，将所述最大置信度对应的识别物体确定为所述待识别物体的识别结果。

第三方面，本发明实施例还提供了一种神经网络的训练装置，该装置包括：

模型建立模块，用于建立初始神经网络模型，其中所述初始神经网络模型为超轻量级网络SqueezeNet模型；

第一预处理模块，用于获取训练样本，并对所述训练样本进行预处理；

样本输入模块，用于将预处理得到的训练样本输入至初始神经网络模型，并确定根据所述初始神经网络模型的第一输出与预设期望的损失值；

模型训练模块，用于根据所述损失值调节所述初始神经网络模型的网络参数，生成目标神经网络模型。

第四方面，本发明实施例还提供了一种物体识别装置，该物体识别装置包括：

图像获取模块，用于获取待识别物体的图像；

第二预处理模块，用于根据目标神经网络模型的预处理参数对所述待识别物体的图像进行预处理；

图像识别模块，用于基于所述目标神经网络模型，对所述预处理后的图像进行识别，输出识别物体和对应的置信度，其中，所述目标神经网络模型根据本发明实施例提的神经网络的训练方法训练得到的超轻量级网络SqueezeNet模型；

识别结果确定模块，用于根据所述识别物体和对应的置信度确定所述待识别物体的识别结果。

第五方面，本发明实施例还提供了一种服务器，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如本发明任意实施例提供的一种神经网络的训练方法。

第六方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明任意实施例提供的一种神经网络的训练方法。

第七方面，本发明实施例还提供了一种终端，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如本发明任意实施例提供的一种物体识别方法。

第八方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明任意实施例提供的一种物体识别方法。

本发明实施例通过建立SqueezeNet的初始神经网络模型，获取大量的训练样本，对训练样本进行预处理后依次输入至初始神经网络模型，根据第一输出和与预设期望的损失值，反向传输至初始神经网络模型，以调节初始神经网络模型的网络参数，得到目标神经网络模型。建立了参数少、占用内存小的高精度目标神经网络，使得训练得到的目标神经网络模型可应用于移动终端，不在依赖于GPU的设置，提高了目标神经网络模型的适应性。

附图说明

图1是本发明实施例一提供的一种神经网络的训练方法的流程图；

图2是本发明实施例二提供的一种物体识别方法的流程图；

图3是本发明实施例三提供的一种神经网络的训练装置的结构示意图；

图4是本发明实施例四提供的一种物体识别装置的结构示意图；

图5是本发明实施例五提供的一种服务器的结构示意图；

图6是本发明实施例七提供的一种终端的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的一种神经网络的训练方法的流程图，本实施例可适用于建立并训练得到一种内存小且计算速度快的神经网络模型的情况，该方法可以由服务器来执行，该服务器可采用软件和/或硬件的方式实现。该方法具体包括：

S110、建立初始神经网络模型，其中，初始神经网络模型为超轻量级网络SqueezeNet模型。

其中，超轻量级网络SqueezeNet模型具有模型参数少和占用内存小的特点，相对于AlexNet等的神经网络模型，在具有相同识别精度的前提下，超轻量级网络SqueezeNet模型所占用的内存减少了近50倍。本实施例中，建立超轻量级网络SqueezeNet模型，以降低神经网络模型占用的内存，提高神经网络模型的适用性。

可选的，初始神经网络模型包括预设数量的结构模块，结构模块的数量可以是根据神经网络的需求精度确定，示例性的，结构模块的数量可以是8。其中，每一个结构模块包括卷积核为1×1的第一卷积层、卷积核为1×1的第二卷积层和卷积核为3×3的第三卷积层，第二卷积层与第三卷积层并联，串联于第一卷积层的输出端。将第二卷积层与第三卷积层的输出信息进行融合，得到该结构模块的输出结果，作为下一个结构模块中第一卷积层的输入信息，其中，对第二卷积层与第三卷积层的输出信息进行融合可以是将第二卷积层的输出信息与第三卷积层的输出信息进行对应相加或者加权相加。

对于每一个卷积层，其卷积核越小，参数的数量越少，计算速度越快。本实施例中，每一个结构模块中包含第一卷积层、第二卷积层和第三卷积层，且第一卷积层和第二卷积层的卷积核均为1×1，减少了初始神经网络模型中的参数数量，进一步增大了初始神经网络模型的计算速度，减少了初始神经网络模型占用的内存。

可选的，初始神经网络模型包括Dropout层。Dropout层用于在神经网络的训练过程中根据百分比设置网络的中的参数无效，使其不再进行参数更新，降低训练和计算过程中的参数数量，减少了初始神经网络模型中的参数数量，进一步增大了初始神经网络模型的计算速度，减少了初始神经网络模型占用的内存。

可选的，初始神经网络模型包括全连接模块，其中，全连接模块包括全连接层或者卷积核为1×1的第四卷积层与池化层。其中，全连接模块用于对上一层的输出整合相加得到一个预设长度的一维向量。全连接模块可以是包含一个全连接层，优选的，还可以是包含一个卷积核为1×1的第四卷积层与一个池化层。由于全连接层中的参数数量大，通过一个卷积核为1×1的第四卷积层与一个池化层替代全连接层，在达到全连接层功能的基础上，减少了神经网络中参数数量。同时当全连接模块包含一个卷积核为1×1的第四卷积层与一个池化层时，无需限定输入神经网络模型的图像的尺寸，简化了输入图像的预处理过程。

可选的，初始神经网络模型还包括池化层，用于根据池化层的预设参数对上一层的输出图像进行降维；初始神经网络模型还包括非线性激活层，用于对上一层的输出进行非线性变换。

需要说明的是，初始神经网络模型中的Dropout层、池化层、非线性激活层和全连接模块的数量和设置位置根据功能需求和精度需求进行设置，本实施例对此不做限定。

S120、获取训练样本，并对训练样本进行预处理。

其中，训练样本指的是用于对初始神经网络模型进行训练所需的样本图像。可选的，训练样本可以是根据关键词在网络中爬取，和/或以不同角度、不同距离以及不同光照条件下拍摄获得。

可选的，对训练样本进行预处理，包括：将训练样本缩放至第一预设尺寸，计算缩放后的训练样本的三通道均值；根据三通道均值对缩放后的训练样本进行去均值处理。

其中，第一预设尺寸可以是根据初始神经网络模型的输入层参数确定。获取缩放后的训练样本的RGB(Red，Green，Blue，红绿蓝)值，并确定所有的训练样本的各个像素点的RGB三通道均值。对每一个训练样本进行去均值处理，得到可输入至初始神经网络模型的图像，其中去均值处理指的是将训练样本中各像素点的RGB值减去对应的三通道均值。

本实施例中，通过对训练样本进行去均值处理，可简化对训练样本的处理过程，进一步简化对初始神经网络模型的训练过程。

可选的，在计算缩放后的训练样本的三通道均值之前，还包括：对缩放后的训练样本进行参数变换，形成近似样本；相应的，计算缩放后的训练样本的三通道均值包括：计算缩放后的训练样本和近似样本的三通道均值。

本实施例中，通过对缩放后的训练样本进行参数变换，形成至少一个近似样本，将得到的近似样本作为训练样本，以增加训练样本的数量，降低了大量训练样本的获取难度，提高初始神经网络模型的训练精度。

其中，参数变换可以是但不限于镜像变换、颜色通道转换、图像亮度变换和尺寸裁剪等。

S130、将预处理得到的训练样本输入至初始神经网络模型，并确定根据初始神经网络模型的第一输出与预设期望的损失值。

其中，可以是设置损失层，连接在初始神经网络模型的输出层，用于确定根据初始神经网络模型的第一输出与预设期望的损失值。损失值是用来表征神经网络的第一输出与期望输出的不一致程度，损失值越小，神经网络的鲁棒性通常越好。其中，预设期望可以是根据训练样本预先设置的图像标签。

S140、根据损失值调节初始神经网络模型的网络参数，生成目标神经网络模型。

初始神经网络模型的训练过程包括训练样本的正传过程和损失值的反传过程。在正传过程中，训练样本输入初始神经网络模型，依次经过各卷积层、池化层、非线性激活层和全连接模块等的处理，输出结构。在反传过程中，损失值反向输入初始神经网络模型，并反向依次经过各卷积层等，确定各卷积层、池化层、非线性激活层和全连接模块等的损失值，并将该各层的损失值作为各层的网络参数的调节依据。上述正传过程和反传过程是迭代进行的，网络参数不断调节的过程直至满足训练完成条件，该过程就是初始神经网络模型的优化训练过程。本实施例中，将损失值进行梯度反传，并根据损失值调节初始神经网络模型的网络参数。可选的，网络参数包括但不限于权重和偏移值。

可选的，目标神经网络模型训练完成条件可根据实际情况确定，实现方式灵活，例如：若损失值满足预设条件，则可停止对初始神经网络模型的训练，即生成目标神经网络模型；或者，若迭代次数超过预定次数阈值，可停止对初始神经网络模型的训练，即生成目标神经网络模型。本实施例中，基于损失值进行训练判停的预设条件可以是损失值为零，或者小于某一阈值，或者损失值达到稳定不下降状态，例如若当前损失值小于上一次损失值，则继续对初始神经网络模型进行优化训练，直到当前损失值为零，或者等于上一次损失值，确定生成目标神经网络模型。

本实施例中得到的目标神经网络，在保证了高精度的基础上，简化了神经网络参数，可应用与设置有传统CPU(Central Processing Unit，中央处理器)的终端内，不在依赖于GPU(Graphics Processing Unit，图形处理器)，使得无法布置GPU的移动终端同样可运行上述目标神经网络，提高了目标神经网络的适用性。

本实施例的技术方案，通过建立SqueezeNet的初始神经网络模型，获取大量的训练样本，对训练样本进行预处理后依次输入至初始神经网络模型，根据第一输出和与预设期望的损失值，反向传输至初始神经网络模型，以调节初始神经网络模型的网络参数，得到目标神经网络模型。建立了参数少、占用内存小的高精度目标神经网络，使得训练得到的目标神经网络模型可应用于移动终端，不在依赖于GPU的设置，提高了目标神经网络模型的适应性。

实施例二

图2是本发明实施例二提供的一种物体识别方法的流程图，本实施例可适用于设置有占用内存小的神经网络模型的移动终端快速识别物体的情况，该方法可以由移动终端来执行，其中移动终端可以是设置有传统中央处理器的诸如智能手机、平板电脑或机器人等，该移动终端可采用软件和/或硬件的方式实现。该方法具体包括：

S210、获取待识别物体的图像。

其中，图像可以是通过对待识别物体进行拍摄获取，还可以是通过网络资源或者云数据的方式获取。

S220、根据目标神经网络模型的预处理参数对待识别物体的图像进行预处理。

本实施例中，在获取待识别物体的图像之后，可以是将获取的图像输入至前向传播框架NCNN，其中，NCNN框架是一种可应用移动端的神经网络计算框架，是针对在低性能的CPU上运行深度神经网络而开发的，其基于C语言开发，保证了对CPU计算和内存资源的充分利用，还可应用多线程进行计算，具有良好的计算性能。本实施例中，将目标神经网络模型移植到NCNN框架，以使得目标神经网络模型可以在移动端运行。

其中，预处理参数可以是包括目标神经网络模型的样本均值和输入层信息。样本均值指的是目标神经网络模型在训练过程中训练样本的三通道均值。

可选的，步骤S220包括：将待识别物体的图像缩放至第二预设尺寸；获取目标神经网络的样本均值，根据样本均值对缩放后的图像进行去均值处理。

本实施例中，第二预设尺寸根据输入层信息确定，第二预设尺寸可以是与第一预设尺寸一致。根据样本均值对缩放后的图像进行去均值处理，具体的，将缩放后的图像中各像素的RGB值分别减去对应的三通道均值，得到预处理后的输入图像。本实施例中通过对待识别物体的图像进行去均值处理，简化了对待识别物体的图像的处理过程。

S230、基于目标神经网络模型，对预处理后的图像进行识别，输出识别物体和对应的置信度。

其中，目标神经网络模型根据本发明实施例提的的神经网络的训练方法训练得到的超轻量级网络SqueezeNet模型。

本实施例中，将经过预处理得到的待识别物体的图像输入至目标神经网络模型，目标神经网络模型对输入的图像进行识别处理，并获取目标神经网络模型的输出结果，输出结果包括识别物体和对应的置信度。其中，识别物体可以是预先设置的物体列表中的一个或多个，置信度指的是图像中的待识别物体属于识别物体的概率。

S240、根据识别物体和对应的置信度确定待识别物体的识别结果。

可选的，在目标神经网络模型的输出层连接分类层，分类层根据上一层的输出的识别物体和对应的置信度，确定识别结果。可选的，步骤S240包括：在置信度中筛选最大置信度，将最大置信度对应的识别物体确定为待识别物体的识别结果。

示例性的，若目标神经网络模型的输出结果为：识别物体为狗的置信度为75％，识别物体为猫的置信度为15％，识别物体为马的置信度为5％，识别物体为汽车的置信度为5％，则确定最大置信度为75％，进一步可确定待识别物体的识别结果为狗。

本实施例的技术方案，通过将获取的待识别物体的图像进行预处理后，输入至预先训练得到的目标神经网络模型中，以对待识别物体进行识别，得到识别结果，其中目标神经网络模型为超轻量级网络SqueezeNet模型，计算精度高，占用内存小，可应用于设置有传统中央处理器的移动端内，使得移动端可运行高精度的神经网络模型，提高移动端的物体识别精度。

实施例三

图3是本发明实施例三提供的一种神经网络的训练装置的结构示意图，该装置包括：

模型建立模块310，用于建立初始神经网络模型，其中初始神经网络模型为超轻量级网络SqueezeNet模型；

第一预处理模块320，用于获取训练样本，并对训练样本进行预处理；

样本输入模块330，用于将预处理得到的训练样本输入至初始神经网络模型，并确定根据初始神经网络模型的第一输出与预设期望的损失值；

模型训练模块340，用于根据损失值调节初始神经网络模型的网络参数，生成目标神经网络模型。

可选的，初始神经网络模型包括预设数量的结构模块，其中，每一个结构模块包括卷积核为1×1的第一卷积层、卷积核为1×1的第二卷积层和卷积核为3×3的第三卷积层。

可选的，第二卷积层与第三卷积层并联，串联于第一卷积层的输出端。

可选的，初始神经网络模型包括Dropout层。

可选的，初始神经网络模型包括全连接模块，其中，全连接模块包括全连接层或者卷积核为1×1的第四卷积层与池化层。

可选的，第一预处理模块320包括：

第一样本缩放单元，用于将训练样本缩放至第一预设尺寸；

第一去均值处理单元，用于计算缩放后的训练样本的三通道均值，根据三通道均值对缩放后的训练样本进行去均值处理。

可选的，第一预处理模块320还包括：近似样本确定单元，用于在计算缩放后的训练样本的三通道均值之前，对缩放后的训练样本进行参数变换，形成近似样本；

相应的，第一去均值处理单元包括：计算缩放后的训练样本和近似样本的三通道均值。

本发明实施例提供的神经网络的训练装置可执行本发明任意实施例所提供的神经网络的训练方法，具备执行神经网络的训练方法相应的功能模块和有益效果。

实施例四

图4是本发明实施例四提供的一种物体识别装置的结构示意图，该装置包括：

图像获取模块410，用于获取待识别物体的图像；

第二预处理模块420，用于根据目标神经网络模型的预处理参数对待识别物体的图像进行预处理；

图像识别模块430，用于基于目标神经网络模型，对预处理后的图像进行识别，输出识别物体和对应的置信度，其中，目标神经网络模型根据本发明实施例提供的神经网络的训练方法训练得到的超轻量级网络SqueezeNet模型；

识别结果确定模块440，用于根据识别物体和对应的置信度确定待识别物体的识别结果。

可选的，第二预处理模块420包括：

第二样本缩放单元，用于将待识别物体的图像缩放至第二预设尺寸；

第二去均值单元，用于获取目标神经网络的样本均值，根据样本均值对缩放后的图像进行去均值处理。

可选的，识别结果确定模块440具体用于：

在置信度中筛选最大置信度，将最大置信度对应的识别物体确定为待识别物体的识别结果。

本发明实施例提供的物体识别装置可执行本发明任意实施例所提供的物体识别方法，具备执行物体识别方法相应的功能模块和有益效果。

实施例五

图5是本发明实施例五提供的一种服务器结构示意图。参见图5，该服务器包括：

一个或多个处理器510；

存储器520，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器510执行，使得所述一个或多个处理器510实现如本发明实施例提供的神经网络的训练方法。

图5中以一个处理器为例；处理器和存储器可以通过总线或其他方式连接，

图5中以通过总线连接为例。

存储器作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块。处理器通过运行存储在存储器中的软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述的神经网络的训练方法。

存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

另外，根据服务器的不同形式，除了处理器和存储器，控制终端还可以包括其他模块或结构，例如，服务器可以具备语音播报功能，则还包括扬声器；又如，服务器可以是具有显示功能的设备，则还包括显示屏幕，用于显示地图数据，也可供用户在导航软件界面上进行触控操作。

本实施例提出的服务器与本发明实施例提出的神经网络的训练方法属于同一发明构思，未在本实施例中详尽描述的技术细节可参见上述实施例，并且本实施例与上述实施例具有相同的有益效果。

实施例六

本实施例提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例提出的神经网络的训练方法。

本实施例提出的计算机可读存储介质与实施例提出的神经网络的训练方法属于同一发明构思，未在本实施例中详尽描述的技术细节可参见上述实施例，并且本实施例与上述实施例具有相同的有益效果。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(RandomAccess Memory，RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

实施例七

图6是本发明实施例七提供的一种终端结构示意图。参见图6，该终端包括：

一个或多个处理器610；

存储器620，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器610执行，使得所述一个或多个处理器610实现如本发明实施例提供的物体识别方法。

图6中以一个处理器为例；处理器和存储器可以通过总线或其他方式连接，图6中以通过总线连接为例。

存储器作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块。处理器通过运行存储在存储器中的软件程序、指令以及模块，从而执行终端的各种功能应用以及数据处理，即实现上述的物体识别方法。

存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

另外，根据终端的不同形式，除了处理器和存储器，控制终端还可以包括其他模块或结构，例如，终端可以具备语音播报功能，则还包括扬声器；又如，终端可以是具有显示功能的设备，则还包括显示屏幕，用于显示地图数据，也可供用户在导航软件界面上进行触控操作。

本实施例提出的终端与本发明实施例提出的物体识别方法属于同一发明构思，未在本实施例中详尽描述的技术细节可参见上述实施例，并且本实施例与上述实施例具有相同的有益效果。

实施例八

本实施例提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例提出的物体识别方法。

本实施例提出的计算机可读存储介质与实施例提出的物体识别方法属于同一发明构思，未在本实施例中详尽描述的技术细节可参见上述实施例，并且本实施例与上述实施例具有相同的有益效果。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种神经网络的训练方法，其特征在于，包括：

建立初始神经网络模型，其中，所述初始神经网络模型为超轻量级网络SqueezeNet模型；

获取训练样本，并对所述训练样本进行预处理；

2.根据权利要求1所述的方法，其特征在于，所述初始神经网络模型包括预设数量的结构模块，其中，每一个所述结构模块包括卷积核为1×1的第一卷积层、卷积核为1×1的第二卷积层和卷积核为3×3的第三卷积层。

3.根据权利要求2所述的方法，其特征在于，所述第二卷积层与所述第三卷积层并联，串联于所述第一卷积层的输出端。

4.根据权利要求1所述的方法，其特征在于，所述初始神经网络模型还包括Dropout层。

5.根据权利要求1所述的方法，其特征在于，所述初始神经网络模型还包括全连接模块，其中，所述全连接模块包括全连接层或者卷积核为1×1的第四卷积层与池化层。

6.根据权利要求1所述的方法，其特征在于，对所述训练样本进行预处理，包括：

7.根据权利要求6所述的方法，其特征在于，在计算缩放后的训练样本的三通道均值之前，还包括：

对所述缩放后的训练样本进行参数变换，形成近似样本；

相应的，计算缩放后的训练样本的三通道均值包括：

计算缩放后的训练样本和所述近似样本的三通道均值。

8.一种物体识别方法，其特征在于，包括：

获取待识别物体的图像；

基于所述目标神经网络模型，对所述预处理后的图像进行识别，输出识别物体和对应的置信度，其中，所述目标神经网络模型根据权利要求1-7任一所述的神经网络的训练方法训练得到的超轻量级网络SqueezeNet模型；

9.根据权利要求8所述的方法，其特征在于，根据目标神经网络模型的预处理参数对所述待识别物体的图像进行预处理，包括：

将所述待识别物体的图像缩放至第二预设尺寸；

10.根据权利要求8所述的方法，其特征在于，根据所述识别物体和对应的置信度确定所述待识别物体的识别结果，包括：

11.一种神经网络的训练装置，其特征在于，包括：

12.一种物体识别装置，其特征在于，包括：

图像获取模块，用于获取待识别物体的图像；

图像识别模块，用于基于所述目标神经网络模型，对所述预处理后的图像进行识别，输出识别物体和对应的置信度，其中，所述目标神经网络模型根据权利要求1-7任一所述的神经网络的训练方法训练得到的超轻量级网络SqueezeNet模型；

13.一种服务器，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-7中任一所述的方法。

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一所述的方法。

15.一种终端，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求8-10中任一所述的方法。

16.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求8-10中任一所述的方法。