CN109086806A

CN109086806A - 一种基于低分辨率压缩图像的iot便携式设备视觉识别加速方法

Info

Publication number: CN109086806A
Application number: CN201810778973.6A
Authority: CN
Inventors: 钱慧; 陈晓旭
Original assignee: Fuzhou University
Current assignee: Fuzhou University
Priority date: 2018-07-16
Filing date: 2018-07-16
Publication date: 2018-12-25

Abstract

本发明涉及一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法，首先通过设备的采集端进行图像采集，获得原始图像；接着将步骤S1采集到的原始图像经过低分辨率压缩，减少数据量，并将压缩后的图像数据传输至设备的推理端；最后设备的推理端利用已经训练好的卷积神经网络进行推理识别，并将推理识别结果实时显示出来。本发明能够在不怎么损失精度的情况下，大幅度的减少了计算量和参数数量。

Description

一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法

技术领域

本发明涉及IOT设备设计领域，特别是一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法。

背景技术

近年来，随着人工智能技术发展和相关硬件性能的提升，卷积神经网络已经广泛应用于视觉识别领域。而基于视觉识别的IOT便携式设备一直是人们研究的一个焦点，但由于IOT便携式设备属于低功耗设备，在计算量、存储量上都有一定的限制，不适合直接将计算复杂、参数数量庞大的卷积神经网络运行在设备中，而且在某些情况下设备需要达到实时性要求，这势必需要加快卷积神经网络的计算时间。

针对以上提出的问题，目前已经有许多在IOT便携式设备上加速卷积神经网络视觉识别的方法。一种方案是对IOT便携式设备的图像采集端设计符合的硬件，提出了角度敏感像素代替传统相机，它是一种基于光学边缘滤波的图像传感器，能够直接将采集到的数据作为卷积神经网络的第一层，节省了图像传感器功耗，数据带宽和卷积神经网络的计算复杂度。但角度敏感像素在降低分辨率、低亮光时，识别效果相对较差。

另一种方案通过现场可编程门阵列平台加速卷积神经网络，能够根据硬件资源快速设计出针对卷积神经网络加速的硬件处理单元，例如部分计算并行化处理、量化参数、软硬件协同设计等，处理单元相对于通用处理器有高性能、低功耗特点。但该方案由于需要大量的对硬件架构进行优化，设计难度大，开发时间周期长。

还有一种方案是优化卷积神经网络算法，通过结构化稀疏学习方法来正则化卷积神经网络中卷积层的滤波器、通道、滤波器形状、深度结构，结构化稀疏学习能够从卷积神经网络中学习紧凑的结构，减少计算开销，能够获得一种硬件友好的卷积神经网络结构稀疏性，有效加速了卷积神经网络在CPU或GPU的运行，同时能够改进分类识别的精度。该方案在计算时间上有了很大的优势，但由于只针对卷积层进行优化，对卷积神经网络全连接层中庞大的参数问题并没有得到解决，无法有效的应用到IOT便携式设备中。

发明内容

有鉴于此，本发明的目的是提出一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法，在不怎么损失精度的情况下，大幅度的减少了计算量和参数数量。

本发明采用以下方案实现：一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法，包括以下步骤：

步骤S1：通过设备的采集端进行图像采集，获得原始图像；

步骤S2：将步骤S1采集到的原始图像经过低分辨率压缩，减少数据量，并将压缩后的图像数据传输至设备的推理端；

步骤S3：设备的推理端利用已经训练好的卷积神经网络进行推理识别，并将推理识别结果实时显示出来。

本发明从优化卷积神经网络输入单元的角度出发，利用降低图像分辨率的方法，将原始图像进行低分辨率压缩，在保留每帧图像主要特征的前提下实现了减少了数据量，并将低分辨率压缩后的数据作为卷积神经网络的输入单元，保持原有卷积神经网络模型，在不怎么损失精度的情况下，大幅度的减少了计算量和参数数量，因此适合应用在IOT便携式设备上加速视觉识别。

进一步地，所述步骤S2中，采用M×N的高斯随机矩阵对原始图像进行低分辨率压缩，该矩阵中的元素服从均值为0、方差为1的正态分布，且元素间相互独立，其中M为低分辨率压缩后图像像素个数，N为原始图像像素个数。

进一步地，步骤S3中，将经过低分辨率压缩得到的图像数据作为卷积神经网络的输入单元，将经过低分辨率压缩的一维数据重新调整成二维数据并作为卷积神经网络的输入。

进一步地，步骤S3中，所述卷积神经网络采用LeNet-5结构，包括卷积层1、池化层1、卷积层2、池化层2、全连接层3以及全连接层4；其中，卷积层1、卷积层2分别由32个和64个大小为5×5、步长为1的滤波器组成，采用padding进行补零操作，保证卷积层输入维度和输出维度一致；池化层1、池化层2均由大小为2×2、步长为2的滤波器组成，采用最大池化方式下采样；全连接层3和全连接层4分别产生256×1和10×1的有效特征向量。

进一步地，步骤S3中，所述卷积神经网络使用ReLU作为激活函数，最终经过softmax分类器选择向量最大值确定识别内容。

进一步地，所述卷积神经网络的训练具体为：利用55000张MNIST手写数字图像作为训练集，卷积神经网络每次输入样本的批尺寸大小为100，为了防止过拟合现象，全连接层FC3中设置dropout为0.7，损失函数采用交叉熵，并使用Adam优化算法,学习率设置为0.0001进行权重参数优化，利用不同的5000张MNIST图像作为验证集，进行超参数调整，通过不断的迭代，达到最佳的识别精度。

与现有技术相比，本发明有以下有益效果：

1、本发明利用低分辨率压缩的图像，降低了图像的数据维度，减少IOT便携式设备从采集端到推理端数据传输时间和带宽。

2、本发明利用低分辨率压缩后的图像作为卷积神经网络模型的输入单元，极大程度地减少了模型的计算量和模型参数数量，能够实现在IOT便携式设备上实现视觉识别加速。

附图说明

图1为本发明实施例的方法流程示意图1。

图2为本发明实施例的方法流程示意图2。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

如图1以及图2所示，本实施例提供了一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法，包括以下步骤：

步骤S1：通过设备的采集端进行图像采集，获得原始图像；

本实施例从优化卷积神经网络输入单元的角度出发，利用降低图像分辨率的方法，将原始图像进行低分辨率压缩，在保留每帧图像主要特征的前提下实现了减少了数据量，并将低分辨率压缩后的数据作为卷积神经网络的输入单元，保持原有卷积神经网络模型，在不怎么损失精度的情况下，大幅度的减少了计算量和参数数量，因此适合应用在IOT便携式设备上加速视觉识别。

在本实施例中，所述步骤S2中，采用M×N的高斯随机矩阵对原始图像进行低分辨率压缩，该矩阵中的元素服从均值为0、方差为1的正态分布，且元素间相互独立，其中M为低分辨率压缩后图像像素个数，N为原始图像像素个数。M远小于N，因此大大降低了图像数据量，由于低分辨率压缩是线性映射，能够保留大部分原始图像的信息，特别是重要特征信息，对于后续图像快速识别是切实可行的方案。

在本实施例中，步骤S3中，将经过低分辨率压缩得到的图像数据作为卷积神经网络的输入单元，将经过低分辨率压缩的一维数据重新调整成二维数据并作为卷积神经网络的输入。相比于使用原始图像数据作为输入单元，识别过程中计算量和模型参数数量都有明显减少，因此能够在IOT便携式设备上实现了视觉识别加速。

在本实施例中，步骤S3中，所述卷积神经网络采用LeNet-5结构，包括卷积层1、池化层1、卷积层2、池化层2、全连接层3以及全连接层4；其中，卷积层1、卷积层2分别由32个和64个大小为5×5、步长为1的滤波器组成，采用padding进行补零操作，保证卷积层输入维度和输出维度一致；池化层1、池化层2均由大小为2×2、步长为2的滤波器组成，采用最大池化方式下采样；全连接层3和全连接层4分别产生256×1和10×1的有效特征向量。

在本实施例中，步骤S3中，所述卷积神经网络使用ReLU作为激活函数，最终经过softmax分类器选择向量最大值确定识别内容。通过上述方式修改模型参数，能够更适合目前的场景。

在本实施例中，所述卷积神经网络的训练具体为：利用55000张MNIST手写数字图像作为训练集，卷积神经网络每次输入样本的批尺寸大小为100，为了防止过拟合现象，全连接层FC3中设置dropout为0.7，损失函数采用交叉熵，并使用Adam优化算法,学习率设置为0.0001进行权重参数优化，利用不同的5000张MNIST图像作为验证集，进行超参数调整，通过不断的迭代，达到最佳的识别精度。在推理阶段则直接利用训练好的参数进行识别，与输入原始图像相比，经过低分辨率压缩的图像在不怎么损失识别精度的情况下，减少了参数数量，提高了识别速度。

以上所述仅为本发明的较佳实施例，凡依本发明申请专利范围所做的均等变化与修饰，皆应属本发明的涵盖范围。

Claims

1.一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法，其特征在于：包括以下步骤：

步骤S1：通过设备的采集端进行图像采集，获得原始图像；

2.根据权利要求1所述的一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法，其特征在于：所述步骤S2中，采用M×N的高斯随机矩阵对原始图像进行低分辨率压缩，该矩阵中的元素服从均值为0、方差为1的正态分布，且元素间相互独立，其中M为低分辨率压缩后图像像素个数，N为原始图像像素个数。

3.根据权利要求1所述的一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法，其特征在于：步骤S3中，将经过低分辨率压缩得到的图像数据作为卷积神经网络的输入单元，将经过低分辨率压缩的一维数据重新调整成二维数据并作为卷积神经网络的输入。

4.根据权利要求1所述的一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法，其特征在于：步骤S3中，所述卷积神经网络采用LeNet-5结构，包括卷积层1、池化层1、卷积层2、池化层2、全连接层3以及全连接层4；其中，卷积层1、卷积层2分别由32个和64个大小为5×5、步长为1的滤波器组成，采用padding进行补零操作，保证卷积层输入维度和输出维度一致；池化层1、池化层2均由大小为2×2、步长为2的滤波器组成，采用最大池化方式下采样；全连接层3和全连接层4分别产生256×1和10×1的有效特征向量。

5.根据权利要求4所述的一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法，其特征在于：步骤S3中，所述卷积神经网络使用ReLU作为激活函数，最终经过softmax分类器选择向量最大值确定识别内容。

6.根据权利要求4所述的一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法，其特征在于：所述卷积神经网络的训练具体为：利用55000张MNIST手写数字图像作为训练集，卷积神经网络每次输入样本的批尺寸大小为100，为了防止过拟合现象，全连接层FC3中设置dropout为0.7，损失函数采用交叉熵，并使用Adam优化算法,学习率设置为0.0001进行权重参数优化，利用不同的5000张MNIST图像作为验证集，进行超参数调整，通过不断的迭代，达到最佳的识别精度。