CN112070211A

CN112070211A - 基于计算卸载机制的图像识别方法

Info

Publication number: CN112070211A
Application number: CN202010852263.0A
Authority: CN
Inventors: 石宇光; 米振强; 郭宇
Original assignee: University of Science and Technology Beijing USTB
Current assignee: University of Science and Technology Beijing USTB
Priority date: 2020-08-21
Filing date: 2020-08-21
Publication date: 2020-12-11
Anticipated expiration: 2040-08-21
Also published as: CN112070211B

Abstract

本发明涉及机器视觉领域，特别涉及一种处理器计算能力无法直接满足神经网络对计算能力需求情况下的低成本图像识别方案的基于计算卸载机制的图像识别方法。该方法根据网络分段后移动设备上计算任务占比、通信数据量和前后段网络模型任务耦合性等指标，计算分段点，对前段网络模型产生的特征图进行频域压缩，后端网络接收数据进行图像处理得到识别结果；这样，采用分段部署将系统的前段网络模型和数据压缩算法结合，能够很好的对输入数据进行压缩，以平衡移动端、云端和网络传输三者的时间消耗，将系统时延降低，在保证实时性的同时，能够保障整个网络模型的性能衰减控制在可以接受的范围之中，对具体任务的执行精度没有明显的影响。

Description

基于计算卸载机制的图像识别方法

技术领域

本发明涉及机器视觉领域，特别涉及一种处理器计算能力无法直接满足神经网络对计算能力需求情况下的低成本图像识别方案的基于计算卸载机制的图像识别方法。

背景技术

在当今社会，图像识别系统在工业测控、安防监测等领域有着广泛的应用，开发人员和用户对于移动设备端进行图像识别的实时响应有着较高需求。与服务器级GPU相比，移动设备的计算能力和成本受到了更严格的限制。目前，在图像分类、图像目标检测、图像分割等任务中，基于卷积神经网络的图像分析方法在分析准确率和效率上取得了突破性的成果。但是，基于卷积神经网络的图像识别算法需要占用处理器大量计算资源，并且需要一定成本才能在移动端部署具有相应计算能力的处理器以实现理想的探测精度。

目前国内外以研发了多种图像识别技术，用于在计算能力不足的移动设备中的图像识别，但由于深度学习的训练时间过长且需要的训练数据量大，并不能在识别准确率和时延问题上得到很好的效果。

鲁迪针对上述问题，提出一种移动边缘计算环境下的图像识别算法(鲁迪.移动边缘计算环境下的图像识别算法研究与实现[D].北京邮电大学,2019.)，实验表明，该方法可以占用更小的核心网带宽、且能获得实时响应的图像识别结果。但是该方法中的图像特征提取算法是一种线性的子空间学习算法并且不能在深度学习的识别准确率和时延问题上得到很好的结果。

发明内容

本发明要解决的技术问题是提供一种图像自动识别方法，以解决现有技术所存在的目标识别任务中所存在的高成本、算法占用处理器计算力大的问题。

为解决上述技术问题，本发明实施例提供一种低成本图像识别方法，包括：

获取具有识别目标的图像和对应的语义标注的图像数据，以预训练轻量级神经网络模型。

通过对系统中分段运行的神经网络需求进行分析，通过分析前段网络模型计算量占比、网络耦合性和特征图数据传输量这三个方面，对网络中的每一层给出分段有效性评价，以计算网络分段点。

其中，所述前段网络模型计算量占比M_y，具体公式如下所示：

其中，D为神经网络所包含的卷积层的层数，m_i为第i层的计算任务消耗；

且，

其中，l_n为第n层的网络输出特征图的边长，k_n为第n层的卷积核边长，C_n为第n层的输入图像的特征图的通道数，α为变换系数且为固定的常数；

S2.2)计算卷积神经网络中某一层的感受野大小公式为：

其中，j_n表示为第n层之前对每一层的步长stride的累积，r_n即为第n层的感受野大小，初始值为j_n＝1,r_n＝1，Sn为每一层的步长；

进一步地，定义一个评价指标η，η越小则表明越适合在该层进行分段。

其中，所述η计算公式为：

其中，l_n为第n层的网络输出特征图的边长，C_n为第n层的特征图的通道数；C₀为输入图片的通道数,l₀为输入图片的边长；

通过对网络中的每一层计算分段有效性评价值，选择网络中最适合分段的层级。

根据分段结果，将轻量级神经网络模型分段依次部署在移动端和云端，两段网络模型之间的联系依赖于数据通信传输；

对后段网络模型进行再训练；

学习率更新公式为：

β_N＝β₀·0.98^N-1，

其中，N表示训练轮数，β₀表示网络预训练时最后一轮的学习率。

移动端获取摄像头传入的图像作为处理图像；

将图像传入前段网络模型进行特征提取输出特征图，使系统的整体输入数据点数小于原始输入数据点数；

对特征图原始的矩阵进行分块切割为6x6大小的分块矩阵；

将分块矩阵缩放为-127至128之间缩略图。

进一步地，8位图像数据精度范围缩放公式为：

其中X为输入值，max(|X|)表示X的绝对值的最大值。

进一步地，对缩略图进行离散余弦正变换，将输入图像数据转换为频域数据，从而依据图像的频域特性进行不同的操作。

进一步地，离散余弦正变换公式为：

其中，f(x,y)为输入信号,F_dct(u,v)为计算的离散余弦变换的输出信号，

进一步地，α(u)表示为：

使用可动态更新量化间隔参数的频域非均匀量化法对特征图的频域数据进行量化处理，用更小的数据精度表示原始数据。

将量化后的数据展平为一个稀疏矩阵。

采用稀疏矩阵行压缩储存压缩算法将稀疏矩阵压缩为三个一维向量。

对经过稀疏压缩后的特征图数据进行全局霍夫曼编码，保证最终编码输出的平均长度最短，降低数据量。

将数据压缩后上传至云端。

将霍夫曼编码树、非均匀离散量化表部署至云端，即可避免在每次执行任务时重新生成和上传数据。

云端接收来自移动端的特征压缩数据。

将接收到的压缩数据进行霍夫曼解码和稀疏矩阵行解压缩，还原为稀疏矩阵。

对稀疏矩阵进行反量化与反缩放，重建得到近似的特征图。

将近似的特征图传入后段网络模型进行识别。

将识别结果从云端返回至移动端，完成识别。

本发明的上述技术方案的有益效果：由于采用上述技术方案，本发明的方法根据网络分段后移动设备上计算任务占比、通信数据量和前后段网络模型任务耦合性等指标，计算分段点，对前段网络模型产生的特征图进行频域压缩，后端网络接收数据进行图像处理得到识别结果；这样，采用分段部署将系统的前段网络模型和数据压缩算法结合，能够很好的对输入数据进行压缩，以平衡移动端、云端和网络传输三者的时间消耗，将系统时延降低，在保证实时性的同时，能够保障整个网络模型的性能衰减控制在可以接受的范围之中，对具体任务的执行精度没有明显的影响。

附图说明

图1为本发明一种基于计算卸载机制的图像识别方法的流程图。

图2为本发明实施例提供的MobileNetV2网络各层值曲线图。

图3为本发明实施例提供的分段算法模型流程示意图。

图4为本发明实施例提供的移动端图像识别方案的流程图。

图5为本发明实施例提供的特征压缩算法流程示意图。

图6为本发明实施例提供的云端工作流程图。

图7为本发明实施例提供的云端数据近似恢复流程示意图。

图8为本发明实施例提供的测试数据集一个部分数据示意图。

图9为本发明实施例提供的图像识别实验测试图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。

如图1所示，基于计算卸载机制的图像识别方法，其特征在于，该方法具体包括以下步骤：

S1)利用数据集对轻量级神经网络模型进行训练；

S2)根据训练后的轻量级神经网络模型中每个卷积层中输出的特征图大小、感受野大小以及前段网络模型的计算量比率，从而计算出模型中每个卷积层的分段评价值，建立分段评价值曲线图，根据分段评价值曲线图确定合理的分段点；

S3)根据分段点计算结果，将训练后的轻量级神经网络模型分为部署在移动端的前段网络模型和部署在云端的后段网络模型，并建立通信连接；

S4)利用所述数据集对后段网络模型进行再训练；

S5)将移动端采集的图像输入前段网络模型，得到输入图像的特征图，对输入图像的特征图进行压缩，并发送后段网络模型；

S6)所述后段网络模型将接收到的输入图像的特征图进行解压缩和近似恢复；

S7)将解压后的输入图像的特征图通过后段网络模型进行识别，将识别后的信息返回到移动端，完成识别。

所述轻量级神经网络模型为MobileNetV2模型或LeNet模型。

所述S2)的具体步骤为：

S2.1)通过以下公式求出所述前段网络模型计算量比率M_n：

且，

S2.2)计算卷积神经网络中某一层的感受野大小公式为：

其中，j_n表示为第n层之前对每一层的步长stride的累积，r_n即为第n层的感受野大小，初始值为j_n＝1,r_n＝1，S_n为每一层的步长；

S2.3)设分段评价值为η，η越小则表明越适合在所在层进行分段，所述分段评价值η的计算公式为：

其中，l_n为第n层的网络输出特征图的边长，C_n为第n层的特征图的通道数；C₀为输入图像的特征图的通道数,l₀为输入图像的特征图的边长，

根据计算出模型中每层的分段评价值，建立分段评价值曲线图；

S2.4)根据S2.3)得到网络各层η_n值曲线图，确定分段点。

所述S4)的具体步骤为：

S4.1)对后段网络模型进行再训练，学习率更新公式为：

β_N＝β₀·0.98^N-1,

其中，N为训练轮数，β₀为网络预训练时最后一轮的学习率。

所述S5)的具体步骤为：

S5.1)将移动端获取的传入的图像作为处理图像，输入前段网络模型提取输入图像的特征图，得到特征图矩阵；

S5.2)对得到的特征图矩阵进行分块切割为6x6大小的分块矩阵；

S5.3)再将S5.2)得到的分块矩阵采用位图缩放方法缩放为-127 至128之间缩略图，并发送后段网络模型。

所述位图缩放方法采用8位图像数据精度范围缩放公式进行缩放，公式如下所示：

其中，X’为缩放输出值，X为输入值，max(|X|)表示X的绝对值的最大值。

所述S6)的具体步骤为：

S6.1)后段网络模型将接收到的数据解压缩：

S6.11对缩略图进行离散余弦正变换，将输入图像数据转换为频域数据；

S6.12)使用可动态更新量化间隔参数的频域非均匀量化法对输入图像的特征图的频域数据进行量化处理；

S6.13)将量化后的数据展平为一个稀疏矩阵；

S6.14)采用稀疏矩阵行压缩储存压缩算法将稀疏矩阵压缩为三个一维向量，对经过稀疏压缩后的特征图进行全局霍夫曼编码，

S6.2)近似恢复：

S6.21)：将接收到的S6.14)处理后的压缩数据进行霍夫曼解码得到三个一维向量；

S6.22)：将所述三个一维向量进行稀疏矩阵行解压缩压缩得到一个稀疏矩阵；

S6.23)：将稀疏矩阵进行反量化得到近似频域数据；

S6.24)：将S6.23)得到近似频域数据反缩放，重建得到近似的输入图像特征图。

所述离散余弦正变换公式为：

其中，f(x,y)为输入信号,F_dct(u,v)为计算的离散余弦变换的输出信号，π为圆周率,x，y为输入特征图的横纵坐标u，v为离散余弦变换的输出坐标，

一种实现上述的基于计算卸载机制的图像识别方法的计算机程序。

一种实现上述的基于计算卸载机制的图像识别方法的信息处理终端。

一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行上述的基于计算卸载机制的图像识别方法。

实施例：

本发明针对现有技术所存在的目标识别任务中所存在的高成本、算法占用处理器计算力大的问题，提供一种低成本图像识别方法，包括：

步骤1：将所需要使用模型的相关数据进行数据模型训练，其中包括图像数据、标注信息等；

步骤2：计算出训练好的模型每层中输出的特征图大小、感受野大小以及前段网络模型的计算量比率，从而可以计算出网络模型每层的分段评价值，根据分段评价值曲线图确定合理的分段点；

步骤3：根据分段点计算结果，将模型前段网络模型部署在移动端，后段网络模型部署在云端，两段网络模型之间的联系则依赖于数据通信传输，通过前段网络模型的特征提取能力，可以使系统的整体输入数据点数小于原始输入数据点数；

步骤4：对后段网络模型进行再训练；

步骤5：对前段网络模型特征值进行压缩；

步骤6：后段网络模型将接收到的数据解压缩和近似恢复；

步骤7：将解压后的数据通过后段网络模型进行识别，将识别后的信息返回到移动端，完成识别。

本发明实施例所述的低成本图像识别方法，将所需要使用模型的相关数据进行数据模型训练；根据训练好的模型每层中输出的特征图大小、感受野大小以及前段网络模型的计算量比率，计算出网络模型每层的分段评价值，根据分段评价值曲线图确定合理的分段点；根据分段点计算结果，将模型前段网络模型部署在移动端，后段网络模型部署在云端，两段网络模型之间的联系则依赖于数据通信传输，通过前段网络模型的特征提取能力，使系统的整体输入数据点数小于原始输入数据点数；对后段网络模型进行再训练；对前段网络模型特征值进行压缩；后段网络模型将接收到的数据解压缩和近似恢复；将解压后的数据通过后段网络模型进行识别，将识别后的标签信息返回到移动端，以实现对目标图像的自动识别。这样，采用分段部署的思想，可以将系统的前段网络模型和数据压缩算法结合，能够很好的对输入数据进行压缩，以平衡移动端、云端和网络传输三者的时间消耗，将系统时延降低，在保证实时性的同时，能够保障整个网络模型的性能衰减控制在可以接受的范围之中的同时，做到目标识别精度没有明显的降低。

本实施例中，搭建了实验平台以测试分段前后卷积神经网络在其他条件不变时的分段效果和性能变化，该实验平台主要分为三部分，分别为机器人端、通信信道、云端。实验系统中，利用无线路由器将由树莓派模拟的移动机器人和由阿里云服务器模拟的云端连接起来。

其中，为了模拟移动端在实际执行任务中的复杂通信环境，以验证整个任务过程的性能，本实施例中将通信的信道带宽限制为4 Mbps。实验平台各个部分的主要环境参数如表1所示：

表1实验平台环境参数

为了更好地理解本发明实施例提供的低成本图像识别方法，对其进行详细说明，所述计算卸载分段点选择方法为：

将神经网络模型各模块层网络计算量占比、网络耦合性和特征图数据传输量的组合作为分段选择的评价指标η。

进一步地，所述轻量级神经网络模型包括：

MobileNetV2模型、本实施例中选择MobileNetV2网络模型。

本实施例中，分段点评价指标的计算公式为：

其中，j_n表示为第n层之前对每一层的步长stride的累积，r_n即为第n层的感受野大小，l_n表示第n层的网络输出特征图的边长，c_n表示第n层的特征图的通道数，m_n表示第n层的计算任务消耗， Mn为计算量占比；

第n层的计算任务消耗的计算公式为：

其中，l_n为第n层的网络输出特征图的边长，k_n为第n层的卷积核边长，C_n为第n层的特征图的通道数，α为变换系数，为固定的常数；

本实施例中，通过依次计算MobileNetV2网络模型中每层瓶颈层bottleneck的计算任务比率、感受野大小以及前段网络模型计算量比率，并计算相应的分段有效性评价值，如图2所示，得出 MobileNetV2网络模型的每层的分段评价值。

本实施例中，根据计算得到的MobileNetV2网络各层值曲线图，η在第5层与第8层之间存在低谷，且在第五层处出现最小值，确定第五层是比较合理的分段点。

本实施例中，如图3所示，所述模型分段包括：

步骤8：将MobileNetV2网络模型从第五层进行分段，前5层部署在移动端；

步骤9：配置IP地址与端口号，将移动端与云端相连接，以传输数据，其中IP地址为202.204.54.46，端口号为40005；

步骤11：将读取的图片数据传入前段网络模型，得到目标的特征图；

步骤12：将后段网络模型再次训练以优化网络，避免模型性能发生跳变；

步骤13：再训练后的后段网络模型部署至云端。

进一步地，后段网络模型再训练的学习率更新公式为：

β_N＝β₀·0.98^N-1，

本实施例中，以树莓派模拟移动端为例，采用计算卸载的方法，将前段网络模型部署在移动端，其中移动端图像识别方法的具体实施流程如图4所示，包括：

步骤14：加载MobileNetV2模型预训练好的权重参数；

步骤15：将特征图进行压缩，其中压缩数据包命名为 compress.pth.tar；

步骤16：将压缩数据包上传至云端；

步骤16：接收云端返回的标签信息，并打印输出。

进一步地，所述特征图压缩方法如图4，具体步骤包括：

步骤17：对特征图原始的矩阵进行分块切割为6x6大小的分块矩阵，并将分块矩阵缩放为-127至128之间缩略图。

本实施例中，8位图像数据精度范围缩放公式为：

其中X为输入值，max(|X|)表示X的绝对值的最大值；

步骤18：将缩放后的缩略图进行离散余弦正变换，也就是对输入信号执行了一次动态卷积操作，在每次卷积时采用不同的卷积核计算卷积结果，通过这种方式将输入图像数据转换为频域数据，其数值从输出的二维矩阵的左上角至右下角对应着输入的频域数据的低频到高频。

本实施例中，离散余弦正变换公式为：

其中，f(x,y)为输入信号,F_dct(u,v)为计算的离散余弦变换的输出信号。

进一步地，α(u)表示为：

步骤19：对特征图的频域数据使用可动态更新量化间隔参数的频域非均匀量化法进行量化处理，用更小的数据精度表示原始数据。

本实施例中，图像编码算法中的图像亮度量化矩阵为：

步骤20：将量化后的数据展平为一个稀疏矩阵。

步骤21：将稀疏矩阵通过稀疏矩阵行压缩储存压缩算法压缩为三个一维向量，分别为非零数据点向量D_s、行间隔向量E_s和列索引 Ls，且CSR压缩后不存储数值为0的数据点。

步骤22：对经过稀疏压缩后的特征图数据进行全局霍夫曼编码，保证最终编码输出的平均长度最短，以降低数据量。

所述测试ILSVRC 2012数据集，共有1000种不同分类的图片，本实施例中，使用一个分类数据如图8，为金鱼分类；并用相机拍摄了真实场景下的鹦鹉图片，作为测试数据集。

本实施例中，云端图像识别方法的具体实施流程如图6所示，包括：

步骤23：加载MobileNetV2模型再训练好的权重参数；

步骤24：将前段网络模型整体训练后所对应的非均匀量化表和霍夫曼编码表部署在云端中，避免每次执行任务时重新生成和上传。

步骤25：配置IP地址与端口号，其中IP地址为202.204.54.46，端口号为40005；

步骤26：接收移动端发送的高度压缩的数据；

步骤27：将接收到的压缩数据做解压缩和近似恢复处理；

步骤28：将解压缩和近似恢复处理后得到的近似特征图传入后段网络模型，进行目标识别；

步骤29：将识别结果返回至移动端；

步骤30：云端进入休眠状态，等待下一次数据的接收。

进一步地，所述特征图数据解压缩和近似恢复方法如图7所示，包括：

步骤27-1：将接收到的压缩数据进行霍夫曼解码得到三个一维向量；

步骤27-2：将这三个一维向量进行稀疏矩阵行解压缩压缩得到一个稀疏矩阵；

步骤27-3：将稀疏矩阵进行反量化得到近似频域数据；

步骤27-3：将频域数据反缩放，重建得到近似的特征图。

本实施例中，移动端图像识别程序运行结果如图9所示：

真实场景拍摄的图片和数据集中的图片均识别正确，得到了目标真正的语义标签。

本发明实例所述低成本图像识别方法，通过将云端的计算能力导入，协助移动设备完成大规模的计算任务，可以为复杂的基于计算机视觉的深度学习应用在实际场景中的部署提供契机，而不再受制于移动设备计算力弱小的缺陷，并在视觉任务对输入数据的巨大传输需求和系统实时性要求的矛盾中找到平衡。

上述说明示出并描述了本发明的优选实施例，应当理解本发明并非局限于本文所披露的形式，不应看作是对其他实例的排除，而可用于各种其他组合、修改和环境，并能够在本文发明构想范围内，通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围，则都应在本发明所附权利要求的保护范围内。