CN112070211A - 基于计算卸载机制的图像识别方法 - Google Patents

基于计算卸载机制的图像识别方法 Download PDF

Info

Publication number
CN112070211A
CN112070211A CN202010852263.0A CN202010852263A CN112070211A CN 112070211 A CN112070211 A CN 112070211A CN 202010852263 A CN202010852263 A CN 202010852263A CN 112070211 A CN112070211 A CN 112070211A
Authority
CN
China
Prior art keywords
network model
data
layer
image
characteristic diagram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010852263.0A
Other languages
English (en)
Other versions
CN112070211B (zh
Inventor
石宇光
米振强
郭宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology Beijing USTB
Original Assignee
University of Science and Technology Beijing USTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology Beijing USTB filed Critical University of Science and Technology Beijing USTB
Priority to CN202010852263.0A priority Critical patent/CN112070211B/zh
Publication of CN112070211A publication Critical patent/CN112070211A/zh
Application granted granted Critical
Publication of CN112070211B publication Critical patent/CN112070211B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及机器视觉领域,特别涉及一种处理器计算能力无法直接满足神经网络对计算能力需求情况下的低成本图像识别方案的基于计算卸载机制的图像识别方法。该方法根据网络分段后移动设备上计算任务占比、通信数据量和前后段网络模型任务耦合性等指标,计算分段点,对前段网络模型产生的特征图进行频域压缩,后端网络接收数据进行图像处理得到识别结果;这样,采用分段部署将系统的前段网络模型和数据压缩算法结合,能够很好的对输入数据进行压缩,以平衡移动端、云端和网络传输三者的时间消耗,将系统时延降低,在保证实时性的同时,能够保障整个网络模型的性能衰减控制在可以接受的范围之中,对具体任务的执行精度没有明显的影响。

Description

基于计算卸载机制的图像识别方法
技术领域
本发明涉及机器视觉领域,特别涉及一种处理器计算能力无法直接满足神经网络对计算能力需求情况下的低成本图像识别方案的基于计算卸载机制的图像识别方法。
背景技术
在当今社会,图像识别系统在工业测控、安防监测等领域有着广泛的应用,开发人员和用户对于移动设备端进行图像识别的实时响应有着较高需求。与服务器级GPU相比,移动设备的计算能力和成本受到了更严格的限制。目前,在图像分类、图像目标检测、图像分割等任务中,基于卷积神经网络的图像分析方法在分析准确率和效率上取得了突破性的成果。但是,基于卷积神经网络的图像识别算法需要占用处理器大量计算资源,并且需要一定成本才能在移动端部署具有相应计算能力的处理器以实现理想的探测精度。
目前国内外以研发了多种图像识别技术,用于在计算能力不足的移动设备中的图像识别,但由于深度学习的训练时间过长且需要的训练数据量大,并不能在识别准确率和时延问题上得到很好的效果。
鲁迪针对上述问题,提出一种移动边缘计算环境下的图像识别算法(鲁迪.移动边缘计算环境下的图像识别算法研究与实现[D].北京邮电大学,2019.),实验表明,该方法可以占用更小的核心网带宽、且能获得实时响应的图像识别结果。但是该方法中的图像特征提取算法是一种线性的子空间学习算法并且不能在深度学习的识别准确率和时延问题上得到很好的结果。
发明内容
本发明要解决的技术问题是提供一种图像自动识别方法,以解决现有技术所存在的目标识别任务中所存在的高成本、算法占用处理器计算力大的问题。
为解决上述技术问题,本发明实施例提供一种低成本图像识别方法,包括:
获取具有识别目标的图像和对应的语义标注的图像数据,以预训练轻量级神经网络模型。
通过对系统中分段运行的神经网络需求进行分析,通过分析前段网络模型计算量占比、网络耦合性和特征图数据传输量这三个方面,对网络中的每一层给出分段有效性评价,以计算网络分段点。
其中,所述前段网络模型计算量占比My,具体公式如下所示:
Figure BDA0002645128120000021
其中,D为神经网络所包含的卷积层的层数,mi为第i层的计算任务消耗;
且,
Figure BDA0002645128120000022
其中,ln为第n层的网络输出特征图的边长,kn为第n层的卷积核边长,Cn为第n层的输入图像的特征图的通道数,α为变换系数且为固定的常数;
S2.2)计算卷积神经网络中某一层的感受野大小公式为:
Figure BDA0002645128120000031
其中,jn表示为第n层之前对每一层的步长stride的累积,rn即为第n层的感受野大小,初始值为jn=1,rn=1,Sn为每一层的步长;
进一步地,定义一个评价指标η,η越小则表明越适合在该层进行分段。
其中,所述η计算公式为:
Figure BDA0002645128120000032
其中,ln为第n层的网络输出特征图的边长,Cn为第n层的特征图的通道数;C0为输入图片的通道数,l0为输入图片的边长;
通过对网络中的每一层计算分段有效性评价值,选择网络中最适合分段的层级。
根据分段结果,将轻量级神经网络模型分段依次部署在移动端和云端,两段网络模型之间的联系依赖于数据通信传输;
对后段网络模型进行再训练;
学习率更新公式为:
βN=β0·0.98N-1
其中,N表示训练轮数,β0表示网络预训练时最后一轮的学习率。
移动端获取摄像头传入的图像作为处理图像;
将图像传入前段网络模型进行特征提取输出特征图,使系统的整体输入数据点数小于原始输入数据点数;
对特征图原始的矩阵进行分块切割为6x6大小的分块矩阵;
将分块矩阵缩放为-127至128之间缩略图。
进一步地,8位图像数据精度范围缩放公式为:
Figure BDA0002645128120000041
其中X为输入值,max(|X|)表示X的绝对值的最大值。
进一步地,对缩略图进行离散余弦正变换,将输入图像数据转换为频域数据,从而依据图像的频域特性进行不同的操作。
进一步地,离散余弦正变换公式为:
Figure BDA0002645128120000042
其中,f(x,y)为输入信号,Fdct(u,v)为计算的离散余弦变换的输出信号,
进一步地,α(u)表示为:
Figure BDA0002645128120000051
使用可动态更新量化间隔参数的频域非均匀量化法对特征图的频域数据进行量化处理,用更小的数据精度表示原始数据。
将量化后的数据展平为一个稀疏矩阵。
采用稀疏矩阵行压缩储存压缩算法将稀疏矩阵压缩为三个一维向量。
对经过稀疏压缩后的特征图数据进行全局霍夫曼编码,保证最终编码输出的平均长度最短,降低数据量。
将数据压缩后上传至云端。
将霍夫曼编码树、非均匀离散量化表部署至云端,即可避免在每次执行任务时重新生成和上传数据。
云端接收来自移动端的特征压缩数据。
将接收到的压缩数据进行霍夫曼解码和稀疏矩阵行解压缩,还原为稀疏矩阵。
对稀疏矩阵进行反量化与反缩放,重建得到近似的特征图。
将近似的特征图传入后段网络模型进行识别。
将识别结果从云端返回至移动端,完成识别。
本发明的上述技术方案的有益效果:由于采用上述技术方案,本发明的方法根据网络分段后移动设备上计算任务占比、通信数据量和前后段网络模型任务耦合性等指标,计算分段点,对前段网络模型产生的特征图进行频域压缩,后端网络接收数据进行图像处理得到识别结果;这样,采用分段部署将系统的前段网络模型和数据压缩算法结合,能够很好的对输入数据进行压缩,以平衡移动端、云端和网络传输三者的时间消耗,将系统时延降低,在保证实时性的同时,能够保障整个网络模型的性能衰减控制在可以接受的范围之中,对具体任务的执行精度没有明显的影响。
附图说明
图1为本发明一种基于计算卸载机制的图像识别方法的流程图。
图2为本发明实施例提供的MobileNetV2网络各层值曲线图。
图3为本发明实施例提供的分段算法模型流程示意图。
图4为本发明实施例提供的移动端图像识别方案的流程图。
图5为本发明实施例提供的特征压缩算法流程示意图。
图6为本发明实施例提供的云端工作流程图。
图7为本发明实施例提供的云端数据近似恢复流程示意图。
图8为本发明实施例提供的测试数据集一个部分数据示意图。
图9为本发明实施例提供的图像识别实验测试图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
如图1所示,基于计算卸载机制的图像识别方法,其特征在于,该方法具体包括以下步骤:
S1)利用数据集对轻量级神经网络模型进行训练;
S2)根据训练后的轻量级神经网络模型中每个卷积层中输出的特征图大小、感受野大小以及前段网络模型的计算量比率,从而计算出模型中每个卷积层的分段评价值,建立分段评价值曲线图,根据分段评价值曲线图确定合理的分段点;
S3)根据分段点计算结果,将训练后的轻量级神经网络模型分为部署在移动端的前段网络模型和部署在云端的后段网络模型,并建立通信连接;
S4)利用所述数据集对后段网络模型进行再训练;
S5)将移动端采集的图像输入前段网络模型,得到输入图像的特征图,对输入图像的特征图进行压缩,并发送后段网络模型;
S6)所述后段网络模型将接收到的输入图像的特征图进行解压缩和近似恢复;
S7)将解压后的输入图像的特征图通过后段网络模型进行识别,将识别后的信息返回到移动端,完成识别。
所述轻量级神经网络模型为MobileNetV2模型或LeNet模型。
所述S2)的具体步骤为:
S2.1)通过以下公式求出所述前段网络模型计算量比率Mn
Figure BDA0002645128120000081
其中,D为神经网络所包含的卷积层的层数,mi为第i层的计算任务消耗;
且,
Figure BDA0002645128120000082
其中,ln为第n层的网络输出特征图的边长,kn为第n层的卷积核边长,Cn为第n层的输入图像的特征图的通道数,α为变换系数且为固定的常数;
S2.2)计算卷积神经网络中某一层的感受野大小公式为:
Figure BDA0002645128120000083
其中,jn表示为第n层之前对每一层的步长stride的累积,rn即为第n层的感受野大小,初始值为jn=1,rn=1,Sn为每一层的步长;
S2.3)设分段评价值为η,η越小则表明越适合在所在层进行分段,所述分段评价值η的计算公式为:
Figure BDA0002645128120000091
其中,ln为第n层的网络输出特征图的边长,Cn为第n层的特征图的通道数;C0为输入图像的特征图的通道数,l0为输入图像的特征图的边长,
根据计算出模型中每层的分段评价值,建立分段评价值曲线图;
S2.4)根据S2.3)得到网络各层ηn值曲线图,确定分段点。
所述S4)的具体步骤为:
S4.1)对后段网络模型进行再训练,学习率更新公式为:
βN=β0·0.98N-1,
其中,N为训练轮数,β0为网络预训练时最后一轮的学习率。
所述S5)的具体步骤为:
S5.1)将移动端获取的传入的图像作为处理图像,输入前段网络模型提取输入图像的特征图,得到特征图矩阵;
S5.2)对得到的特征图矩阵进行分块切割为6x6大小的分块矩阵;
S5.3)再将S5.2)得到的分块矩阵采用位图缩放方法缩放为-127 至128之间缩略图,并发送后段网络模型。
所述位图缩放方法采用8位图像数据精度范围缩放公式进行缩放,公式如下所示:
Figure BDA0002645128120000101
其中,X’为缩放输出值,X为输入值,max(|X|)表示X的绝对值的最大值。
所述S6)的具体步骤为:
S6.1)后段网络模型将接收到的数据解压缩:
S6.11对缩略图进行离散余弦正变换,将输入图像数据转换为频域数据;
S6.12)使用可动态更新量化间隔参数的频域非均匀量化法对输入图像的特征图的频域数据进行量化处理;
S6.13)将量化后的数据展平为一个稀疏矩阵;
S6.14)采用稀疏矩阵行压缩储存压缩算法将稀疏矩阵压缩为三个一维向量,对经过稀疏压缩后的特征图进行全局霍夫曼编码,
S6.2)近似恢复:
S6.21):将接收到的S6.14)处理后的压缩数据进行霍夫曼解码得到三个一维向量;
S6.22):将所述三个一维向量进行稀疏矩阵行解压缩压缩得到一个稀疏矩阵;
S6.23):将稀疏矩阵进行反量化得到近似频域数据;
S6.24):将S6.23)得到近似频域数据反缩放,重建得到近似的输入图像特征图。
所述离散余弦正变换公式为:
Figure BDA0002645128120000111
其中,f(x,y)为输入信号,Fdct(u,v)为计算的离散余弦变换的输出信号,π为圆周率,x,y为输入特征图的横纵坐标u,v为离散余弦变换的输出坐标,
Figure BDA0002645128120000112
一种实现上述的基于计算卸载机制的图像识别方法的计算机程序。
一种实现上述的基于计算卸载机制的图像识别方法的信息处理终端。
一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行上述的基于计算卸载机制的图像识别方法。
实施例:
本发明针对现有技术所存在的目标识别任务中所存在的高成本、算法占用处理器计算力大的问题,提供一种低成本图像识别方法,包括:
步骤1:将所需要使用模型的相关数据进行数据模型训练,其中包括图像数据、标注信息等;
步骤2:计算出训练好的模型每层中输出的特征图大小、感受野大小以及前段网络模型的计算量比率,从而可以计算出网络模型每层的分段评价值,根据分段评价值曲线图确定合理的分段点;
步骤3:根据分段点计算结果,将模型前段网络模型部署在移动端,后段网络模型部署在云端,两段网络模型之间的联系则依赖于数据通信传输,通过前段网络模型的特征提取能力,可以使系统的整体输入数据点数小于原始输入数据点数;
步骤4:对后段网络模型进行再训练;
步骤5:对前段网络模型特征值进行压缩;
步骤6:后段网络模型将接收到的数据解压缩和近似恢复;
步骤7:将解压后的数据通过后段网络模型进行识别,将识别后的信息返回到移动端,完成识别。
本发明实施例所述的低成本图像识别方法,将所需要使用模型的相关数据进行数据模型训练;根据训练好的模型每层中输出的特征图大小、感受野大小以及前段网络模型的计算量比率,计算出网络模型每层的分段评价值,根据分段评价值曲线图确定合理的分段点;根据分段点计算结果,将模型前段网络模型部署在移动端,后段网络模型部署在云端,两段网络模型之间的联系则依赖于数据通信传输,通过前段网络模型的特征提取能力,使系统的整体输入数据点数小于原始输入数据点数;对后段网络模型进行再训练;对前段网络模型特征值进行压缩;后段网络模型将接收到的数据解压缩和近似恢复;将解压后的数据通过后段网络模型进行识别,将识别后的标签信息返回到移动端,以实现对目标图像的自动识别。这样,采用分段部署的思想,可以将系统的前段网络模型和数据压缩算法结合,能够很好的对输入数据进行压缩,以平衡移动端、云端和网络传输三者的时间消耗,将系统时延降低,在保证实时性的同时,能够保障整个网络模型的性能衰减控制在可以接受的范围之中的同时,做到目标识别精度没有明显的降低。
本实施例中,搭建了实验平台以测试分段前后卷积神经网络在其他条件不变时的分段效果和性能变化,该实验平台主要分为三部分,分别为机器人端、通信信道、云端。实验系统中,利用无线路由器将由树莓派模拟的移动机器人和由阿里云服务器模拟的云端连接起来。
其中,为了模拟移动端在实际执行任务中的复杂通信环境,以验证整个任务过程的性能,本实施例中将通信的信道带宽限制为4 Mbps。实验平台各个部分的主要环境参数如表1所示:
表1实验平台环境参数
Figure BDA0002645128120000141
为了更好地理解本发明实施例提供的低成本图像识别方法,对其进行详细说明,所述计算卸载分段点选择方法为:
将神经网络模型各模块层网络计算量占比、网络耦合性和特征图数据传输量的组合作为分段选择的评价指标η。
进一步地,所述轻量级神经网络模型包括:
MobileNetV2模型、本实施例中选择MobileNetV2网络模型。
本实施例中,分段点评价指标的计算公式为:
Figure BDA0002645128120000151
其中,jn表示为第n层之前对每一层的步长stride的累积,rn即为第n层的感受野大小,ln表示第n层的网络输出特征图的边长,cn表示第n层的特征图的通道数,mn表示第n层的计算任务消耗, Mn为计算量占比;
第n层的计算任务消耗的计算公式为:
Figure BDA0002645128120000152
其中,ln为第n层的网络输出特征图的边长,kn为第n层的卷积核边长,Cn为第n层的特征图的通道数,α为变换系数,为固定的常数;
Figure BDA0002645128120000153
其中,jn表示为第n层之前对每一层的步长stride的累积,rn即为第n层的感受野大小,初始值为jn=1,rn=1,Sn为每一层的步长;
本实施例中,通过依次计算MobileNetV2网络模型中每层瓶颈层bottleneck的计算任务比率、感受野大小以及前段网络模型计算量比率,并计算相应的分段有效性评价值,如图2所示,得出 MobileNetV2网络模型的每层的分段评价值。
本实施例中,根据计算得到的MobileNetV2网络各层值曲线图,η在第5层与第8层之间存在低谷,且在第五层处出现最小值,确定第五层是比较合理的分段点。
本实施例中,如图3所示,所述模型分段包括:
步骤8:将MobileNetV2网络模型从第五层进行分段,前5层部署在移动端;
步骤9:配置IP地址与端口号,将移动端与云端相连接,以传输数据,其中IP地址为202.204.54.46,端口号为40005;
步骤11:将读取的图片数据传入前段网络模型,得到目标的特征图;
步骤12:将后段网络模型再次训练以优化网络,避免模型性能发生跳变;
步骤13:再训练后的后段网络模型部署至云端。
进一步地,后段网络模型再训练的学习率更新公式为:
βN=β0·0.98N-1
其中,N表示训练轮数,β0表示网络预训练时最后一轮的学习率。
本实施例中,以树莓派模拟移动端为例,采用计算卸载的方法,将前段网络模型部署在移动端,其中移动端图像识别方法的具体实施流程如图4所示,包括:
步骤14:加载MobileNetV2模型预训练好的权重参数;
步骤15:将特征图进行压缩,其中压缩数据包命名为 compress.pth.tar;
步骤16:将压缩数据包上传至云端;
步骤16:接收云端返回的标签信息,并打印输出。
进一步地,所述特征图压缩方法如图4,具体步骤包括:
步骤17:对特征图原始的矩阵进行分块切割为6x6大小的分块矩阵,并将分块矩阵缩放为-127至128之间缩略图。
本实施例中,8位图像数据精度范围缩放公式为:
Figure BDA0002645128120000171
其中X为输入值,max(|X|)表示X的绝对值的最大值;
步骤18:将缩放后的缩略图进行离散余弦正变换,也就是对输入信号执行了一次动态卷积操作,在每次卷积时采用不同的卷积核计算卷积结果,通过这种方式将输入图像数据转换为频域数据,其数值从输出的二维矩阵的左上角至右下角对应着输入的频域数据的低频到高频。
本实施例中,离散余弦正变换公式为:
Figure BDA0002645128120000172
其中,f(x,y)为输入信号,Fdct(u,v)为计算的离散余弦变换的输出信号。
进一步地,α(u)表示为:
Figure BDA0002645128120000181
步骤19:对特征图的频域数据使用可动态更新量化间隔参数的频域非均匀量化法进行量化处理,用更小的数据精度表示原始数据。
本实施例中,图像编码算法中的图像亮度量化矩阵为:
Figure BDA0002645128120000182
步骤20:将量化后的数据展平为一个稀疏矩阵。
步骤21:将稀疏矩阵通过稀疏矩阵行压缩储存压缩算法压缩为三个一维向量,分别为非零数据点向量Ds、行间隔向量Es和列索引 Ls,且CSR压缩后不存储数值为0的数据点。
步骤22:对经过稀疏压缩后的特征图数据进行全局霍夫曼编码,保证最终编码输出的平均长度最短,以降低数据量。
所述测试ILSVRC 2012数据集,共有1000种不同分类的图片,本实施例中,使用一个分类数据如图8,为金鱼分类;并用相机拍摄了真实场景下的鹦鹉图片,作为测试数据集。
本实施例中,云端图像识别方法的具体实施流程如图6所示,包括:
步骤23:加载MobileNetV2模型再训练好的权重参数;
步骤24:将前段网络模型整体训练后所对应的非均匀量化表和霍夫曼编码表部署在云端中,避免每次执行任务时重新生成和上传。
步骤25:配置IP地址与端口号,其中IP地址为202.204.54.46,端口号为40005;
步骤26:接收移动端发送的高度压缩的数据;
步骤27:将接收到的压缩数据做解压缩和近似恢复处理;
步骤28:将解压缩和近似恢复处理后得到的近似特征图传入后段网络模型,进行目标识别;
步骤29:将识别结果返回至移动端;
步骤30:云端进入休眠状态,等待下一次数据的接收。
进一步地,所述特征图数据解压缩和近似恢复方法如图7所示,包括:
步骤27-1:将接收到的压缩数据进行霍夫曼解码得到三个一维向量;
步骤27-2:将这三个一维向量进行稀疏矩阵行解压缩压缩得到一个稀疏矩阵;
步骤27-3:将稀疏矩阵进行反量化得到近似频域数据;
步骤27-3:将频域数据反缩放,重建得到近似的特征图。
本实施例中,移动端图像识别程序运行结果如图9所示:
真实场景拍摄的图片和数据集中的图片均识别正确,得到了目标真正的语义标签。
本发明实例所述低成本图像识别方法,通过将云端的计算能力导入,协助移动设备完成大规模的计算任务,可以为复杂的基于计算机视觉的深度学习应用在实际场景中的部署提供契机,而不再受制于移动设备计算力弱小的缺陷,并在视觉任务对输入数据的巨大传输需求和系统实时性要求的矛盾中找到平衡。
上述说明示出并描述了本发明的优选实施例,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实例的排除,而可用于各种其他组合、修改和环境,并能够在本文发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (11)

1.基于计算卸载机制的图像识别方法,其特征在于,该方法具体包括以下步骤:
S1)利用数据集对轻量级神经网络模型进行训练;
S2)根据训练后的轻量级神经网络模型中每个卷积层中输出的特征图大小、感受野大小以及前段网络模型的计算量比率,从而计算出模型中每个卷积层的分段评价值,建立分段评价值曲线图,根据分段评价值曲线图确定合理的分段点;
S3)根据分段点计算结果,将训练后的轻量级神经网络模型分为部署在移动端的前段网络模型和部署在云端的后段网络模型,并建立通信连接;
S4)利用所述数据集对后段网络模型进行再训练;
S5)将移动端采集的图像输入前段网络模型,得到输入图像的特征图,对输入图像的特征图进行压缩,并发送后段网络模型;
S6)所述后段网络模型将接收到的输入图像的特征图进行解压缩和近似恢复;
S7)将解压后的输入图像的特征图通过后段网络模型进行识别,将识别后的信息返回到移动端,完成识别。
2.根据权利要求1所述的方法,其特征在于,所述轻量级神经网络模型为MobileNetV2模型或LeNet模型。
3.根据权利要求2所述的方法,其特征在于,所述S2)的具体步骤为:
S2.1)通过以下公式求出所述前段网络模型计算量比率Mn
Figure FDA0002645128110000021
其中,D为神经网络所包含的卷积层的层数,mi为第i层的计算任务消耗;
且,
Figure FDA0002645128110000022
其中,ln为第n层的网络输出特征图的边长,kn为第n层的卷积核边长,Cn为第n层的输入图像的特征图的通道数,α为变换系数且为固定的常数;
S2.2)计算卷积神经网络中某一层的感受野大小公式为:
Figure DEST_PATH_IMAGE001
其中,jn表示为第n层之前对每一层的步长stride的累积,rn即为第n层的感受野大小,初始值为jn=1,rn=1,Sn为每一层的步长;
S2.3)设分段评价值为η,η越小则表明越适合在所在层进行分段,所述分段评价值η的计算公式为:
Figure FDA0002645128110000031
其中,C0为输入图像的特征图的通道数,l0为输入图像的特征图的边长,
根据计算出模型中每层的分段评价值,建立分段评价值曲线图;
S2.4)根据S2.3)得到网络各层ηn值曲线图,确定分段点。
4.根据权利要求2所述的方法,其特征在于,所述S4)的具体步骤为:
S4.1)对后段网络模型进行再训练,学习率更新公式为:
βN=β0·0.98N-1
其中,N为训练轮数,β0为网络预训练时最后一轮的学习率。
5.根据权利要求3所述的方法,其特征在于,所述S5)的具体步骤为:
S5.1)将移动端获取的传入的图像作为处理图像,输入前段网络模型提取输入图像的特征图,得到特征图矩阵;
S5.2)对得到的特征图矩阵进行分块切割为6x6大小的分块矩阵;
S5.3)再将S5.2)得到的分块矩阵采用位图缩放方法缩放为-127 至128之间缩略图,并发送后段网络模型。
6.根据权利要求4所述的方法,其特征在于,所述位图缩放方法采用8位图像数据精度范围缩放公式进行缩放,公式如下所示:
Figure FDA0002645128110000041
其中,X’为缩放输出值,X为输入值,max(|X|)表示X的绝对值的最大值。
7.根据权利要求5所述的方法,其特征在于,所述S6)的具体步骤为:
S6.1)后段网络模型将接收到的数据解压缩:
S6.11对缩略图进行离散余弦正变换,将输入图像数据转换为频域数据;
S6.12)使用可动态更新量化间隔参数的频域非均匀量化法对输入图像的特征图的频域数据进行量化处理;
S6.13)将量化后的数据展平为一个稀疏矩阵;
S6.14)采用稀疏矩阵行压缩储存压缩算法将稀疏矩阵压缩为三个一维向量,对经过稀疏压缩后的特征图进行全局霍夫曼编码,
S6.2)近似恢复:
S6.21):将接收到的S6.14)处理后的压缩数据进行霍夫曼解码得到三个一维向量;
S6.22):将所述三个一维向量进行稀疏矩阵行解压缩压缩得到一个稀疏矩阵;
S6.23):将稀疏矩阵进行反量化得到近似频域数据;
S6.24):将S6.23)得到近似频域数据反缩放,重建得到近似的输入图像特征图。
8.根据权利要求6所述的方法,其特征在于,所述离散余弦正变换公式为:
Figure FDA0002645128110000051
其中,f(x,y)为输入信号,Fdct(u,v)为计算的离散余弦变换的输出信号,π为圆周率,x,y为输入特征图的横纵坐标,u,v为离散余弦变换的输出坐标,
Figure FDA0002645128110000052
9.一种实现如权利要求1-7任一项所述的基于计算卸载机制的图像识别方法的计算机程序。
10.一种实现如权利要求1-7任一项所述的基于计算卸载机制的图像识别方法的信息处理终端。
11.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-7任意一项所述的基于计算卸载机制的图像识别方法。
CN202010852263.0A 2020-08-21 2020-08-21 基于计算卸载机制的图像识别方法 Active CN112070211B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010852263.0A CN112070211B (zh) 2020-08-21 2020-08-21 基于计算卸载机制的图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010852263.0A CN112070211B (zh) 2020-08-21 2020-08-21 基于计算卸载机制的图像识别方法

Publications (2)

Publication Number Publication Date
CN112070211A true CN112070211A (zh) 2020-12-11
CN112070211B CN112070211B (zh) 2024-04-05

Family

ID=73659853

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010852263.0A Active CN112070211B (zh) 2020-08-21 2020-08-21 基于计算卸载机制的图像识别方法

Country Status (1)

Country Link
CN (1) CN112070211B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113469169A (zh) * 2021-07-26 2021-10-01 湖州师范学院 一种钢瓶穿孔编码定位与识别系统及识别方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024398A (zh) * 2013-01-15 2013-04-03 山东大学 基于稀疏矩阵的高光谱遥感图像的压缩感知处理方法
CN106612435A (zh) * 2016-01-16 2017-05-03 四川用联信息技术有限公司 一种基于svd-dwt-dct的联合图像压缩方法
CN107832837A (zh) * 2017-11-28 2018-03-23 南京大学 一种基于压缩感知原理的卷积神经网络压缩方法及解压缩方法
US20180250826A1 (en) * 2017-03-03 2018-09-06 Futurewei Technologies, Inc. Fine-grained object recognition in robotic systems
CN108933815A (zh) * 2018-06-15 2018-12-04 燕山大学 一种移动边缘计算卸载的边缘服务器的控制方法
CN109116834A (zh) * 2018-09-04 2019-01-01 湖州师范学院 一种基于深度学习的间歇过程故障检测方法
CN109785847A (zh) * 2019-01-25 2019-05-21 东华大学 基于动态残差网络的音频压缩算法
CN110399970A (zh) * 2019-05-05 2019-11-01 首都经济贸易大学 小波卷积小波神经网络及情报分析方法与系统
CN111242180A (zh) * 2020-01-03 2020-06-05 南京邮电大学 一种基于轻量化卷积神经网络的图像识别方法及系统
CN111479286A (zh) * 2020-02-26 2020-07-31 国网河南省电力公司电力科学研究院 一种边缘计算系统减少通信流量的数据处理方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024398A (zh) * 2013-01-15 2013-04-03 山东大学 基于稀疏矩阵的高光谱遥感图像的压缩感知处理方法
CN106612435A (zh) * 2016-01-16 2017-05-03 四川用联信息技术有限公司 一种基于svd-dwt-dct的联合图像压缩方法
US20180250826A1 (en) * 2017-03-03 2018-09-06 Futurewei Technologies, Inc. Fine-grained object recognition in robotic systems
CN107832837A (zh) * 2017-11-28 2018-03-23 南京大学 一种基于压缩感知原理的卷积神经网络压缩方法及解压缩方法
CN108933815A (zh) * 2018-06-15 2018-12-04 燕山大学 一种移动边缘计算卸载的边缘服务器的控制方法
CN109116834A (zh) * 2018-09-04 2019-01-01 湖州师范学院 一种基于深度学习的间歇过程故障检测方法
CN109785847A (zh) * 2019-01-25 2019-05-21 东华大学 基于动态残差网络的音频压缩算法
CN110399970A (zh) * 2019-05-05 2019-11-01 首都经济贸易大学 小波卷积小波神经网络及情报分析方法与系统
CN111242180A (zh) * 2020-01-03 2020-06-05 南京邮电大学 一种基于轻量化卷积神经网络的图像识别方法及系统
CN111479286A (zh) * 2020-02-26 2020-07-31 国网河南省电力公司电力科学研究院 一种边缘计算系统减少通信流量的数据处理方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
SHUAI YU等: "Computation Offloading for Mobile Edge Computing: A Deep Learning Approach", 《PIMRC》, pages 1 - 6 *
YU GUO等: "An Energy Sensitive Computation Offloading Strategy in Cloud Robotic Network Based On GA", 《IEEE SYSTEMS JOURNAL》, pages 1 - 11 *
孙锰阳: "基于卷积神经网络压缩算法的关键词识别系统设计", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 2020, pages 136 - 191 *
杨江平: "基于BWDSP平台的DNN模型计算与部署优化研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 2019, pages 138 - 1129 *
郭宇: "云机器人系统网络优化与计算卸载相关技术研究", 《中国博士学位论文全文数据库 信息科技辑》, no. 2020, pages 140 - 45 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113469169A (zh) * 2021-07-26 2021-10-01 湖州师范学院 一种钢瓶穿孔编码定位与识别系统及识别方法
CN113469169B (zh) * 2021-07-26 2023-11-24 湖州师范学院 一种钢瓶穿孔编码定位与识别系统及识别方法

Also Published As

Publication number Publication date
CN112070211B (zh) 2024-04-05

Similar Documents

Publication Publication Date Title
KR101323439B1 (ko) 특징 디스크립터를 표현하고 식별하는 방법, 장치 및 컴퓨터 판독가능 저장 매체
CN111368636B (zh) 目标分类方法、装置、计算机设备和存储介质
CN110830807B (zh) 图像压缩方法、装置及存储介质
KR20220137076A (ko) 이미지 프로세싱 방법 및 관련된 디바이스
US20230401833A1 (en) Method, computer device, and storage medium, for feature fusion model training and sample retrieval
CN109344893B (zh) 一种基于移动终端的图像分类方法
CN110557633B (zh) 图像数据的压缩传输方法、系统和计算机可读存储介质
US20220067417A1 (en) Bandwidth limited context based adaptive acquisition of video frames and events for user defined tasks
KR20180123810A (ko) X-Ray 의료 영상 판독을 위한 데이터 심화학습 처리 기술 및 그 방법
CN116978011B (zh) 一种用于智能目标识别的图像语义通信方法及系统
CN116469100A (zh) 一种基于Transformer的双波段图像语义分割方法
CN112070211B (zh) 基于计算卸载机制的图像识别方法
CN110555120A (zh) 图片压缩控制方法、装置、计算机设备及存储介质
CN114066914A (zh) 一种图像处理方法以及相关设备
CN111314707A (zh) 数据映射识别方法、装置、设备及可读存储介质
CN112949814A (zh) 卷积神经网络的压缩和加速方法、装置及嵌入式设备
CN116090543A (zh) 模型压缩方法及装置、计算机可读介质和电子设备
CN115546236A (zh) 基于小波变换的图像分割方法及装置
Feng et al. Compression for text detection and recognition based on low bit-width quantization
CN111626298A (zh) 一种实时图像语义分割装置及分割方法
CN111314708B (zh) 一种图像数据压缩方法、装置、存储介质和电子设备
CN112749666B (zh) 一种动作识别模型的训练及动作识别方法与相关装置
CN112580772B (zh) 卷积神经网络的压缩方法及装置
CN116758618B (zh) 图像识别方法、训练方法、装置、电子设备及存储介质
CN114898187B (zh) 一种用于云边端的目标检测网络构建方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant