CN112085195A

CN112085195A - 一种基于x-admm的深度学习模型环境自适应方法

Info

Publication number: CN112085195A
Application number: CN202010920846.2A
Authority: CN
Inventors: 郭斌; 仵允港; 王虹力; 刘思聪; 刘佳琪; 於志文
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2020-09-04
Filing date: 2020-09-04
Publication date: 2020-12-15
Anticipated expiration: 2040-09-04
Also published as: CN112085195B

Abstract

本发明提供一种基于X‑ADMM的深度学习模型环境自适应方法，聚焦深度学习模型硬件资源消耗巨大，且不能根据动态环境变化实现自适应演化问题。为了解决深度学习模型根据环境动态演化的问题，我们提出了X‑ADMM(X Alternating Direction Method of Multipliers)模型。我们将感知深度学习模型的硬件资源变化，综合使用模型压缩和模型分割的方法处理深度学习模型结构。通过这种方法，模型完成对动态环境的自适应。通过实时感知上下文的环境变化，为模型结构改变提供约束。这能够大幅度降低深度学习模型的资源消耗并实现模型结构的动态自适应。

Description

一种基于X-ADMM的深度学习模型环境自适应方法

技术领域

本发明为一种基于X-ADMM的深度学习模型环境自适应方法，涉及深度学习模型运行环境感知和模型结构优化领域，尤其深度学习模型环境自适应的方法。

背景技术

随着物联网和人工智能技术的快速发展与加速融合，智能物联网(AIin loT,AIoT)正成长为一个具有广泛发展前景的新兴前沿领域。近年来，基于深度计算模型的物联网智能应用和服务已经逐步融入国家重大需求和民生的各个领域，例如智慧城市、智能制造、无人驾驶、健康卫生等。面向这些智能物联场景，将深度学习模型(如实时视频数据处理)离线部署在资源受限且环境多变的物联网终端设备本地逐渐成为一种趋势，具有低计算延时、低传输成本、保护数据隐私等优势。然而，在资源受限的移动端运行深度学习模型仍面临着“硬件资源限制”和“应用环境复杂”两项关键挑战，制约了其落地和大规模的运用。

为了解决上述挑战，部分研究者已经以不同的方式作出模型自适应压缩和加速的初步尝试。例如AdaDeep提出了压缩技术组合的方法来解决对深度学习模型的资源消耗自适应的问题；哈佛大学的Teerapittayanon等人通过选择网络的不同”提前退出”分支实现深度模型的运行时加速研究；浙江大学提出的Deepthing方法将深度学习模型分割为多个分块然后分配给不同的移动边缘终端，在整体资源消耗和终端运行性能上实现自适应的最优折中。然而上述工作对于如何使模型根据动态环境变化实现自适应演化还没有提出切实有效的解决办法。

发明内容

针对深度学习模型硬件资源消耗巨大，且不能根据动态环境变化实现自适应演化问题。，本发明提出一种基于X-ADMM的深度学习模型环境自适应方法。其技术方案为：一种基于X-ADMM的深度学习模型环境自适应方法，首先对任务硬件环境进行建模；其次对深度神经网络的各项指标进行建模；基于ADMM模型压缩技术简化模型结构，最终以层为粒度动态进行模型分割。

进一步地，一种基于X-ADMM的深度学习模型环境自适应方法，所述对深度神经网络的各项指标进行建模包括以下步骤：首先对深度学习模型进行压缩：使用结构化剪枝技术缩小深度学习模型的结构；其次对深度学习模型进行分割：在感知到的硬件约束条件下，将压缩后的模型以层粒度进行分割；最后综合使用模型压缩和模型分割技术，实现深度学习模型对硬件资源的自适应。

进一步地，一种基于X-ADMM的深度学习模型环境自适应方法，所述深度神经网络的各项指标包括：深度神经网络的精度、存储需求、能源消耗。

进一步地，一种基于X-ADMM的深度学习模型环境自适应方法，所述方法包括以下具体步骤：

步骤1：获取任务的相关硬件资源信息以及上下文信息；将存储、能源、算力状态分别表示成S_i，E_i，C_i；

步骤2：对深度神经网络的精度、存储需求、能源消耗指标进行建模；

S＝S_f+S_p＝|χ|B_a+|ω|B_w

E＝E_c+E_m＝ε₁C+ε₂S_p+ε₃S_f

其中，A是模型的推断精度，

和d_i分别表示分类器决策和真实标签，D_mb代表小批次中的样本；S是模型的存储需求，S_f和S_p表示激活和权值的存储需求，χ和ω是网络中所有激活值和权值，B_a和B_w分别表示激活和权值的精度；E是模型的能源需求，ε₁和C分别表示每个MAC的操作能耗和MAC的总数，ε₂和ε₃分别表示访问Cache和DRAM内存时每比特的能源成本；

步骤3：利用基于ADMM的结构化剪枝方法，简化深度学习模型结构：

其中，θ_i为每一层的权重参数，z_i是启用基于ADMM的解决方案的辅助变量，u_i是与约束相关联的拉格朗日乘数，g_i是权重稀疏约束的指标函数，ρ＞0是给定的扩充参数；

步骤4：将步骤3的方程分解为两个子问题迭代求解：

其中，k是迭代索引，拉格朗日乘子更新为

步骤5：模型被ADMM压缩之后，根据硬件资源的环境变化，以层为粒度动态选择最佳模型分割点。

进一步地，一种基于X-ADMM的深度学习模型环境自适应方法，所述上下文信息包括时间、光线。

进一步地，一种基于X-ADMM的深度学习模型环境自适应方法，所述层包括环境感知层、应用层。

本发明的有益效果为：本发明聚焦深度学习模型硬件资源消耗巨大，且不能根据动态环境变化实现自适应演化问题。为了解决深度学习模型根据环境动态演化的问题，我们提出了X-ADMM(X Alternating Direction Method of Multipliers)模型。我们将感知深度学习模型的硬件资源变化，综合使用模型压缩和模型分割的方法处理深度学习模型结构。通过这种方法，模型完成对动态环境的自适应。通过实时感知上下文的环境变化，为模型结构改变提供约束。这能够大幅度降低深度学习模型的资源消耗并实现模型结构的动态自适应。

附图说明

图1为本发明实例中基于X-ADMM的深度学习模型环境自适应方法框架图；

图2为本发明X-ADMM的模型。

具体实施方式

下面结合附图来进一步描述本发明的技术方案：

本发明共有2幅附图，请参阅图1所示，本发明的具体步骤如下：

一种基于X-ADMM的深度学习模型环境自适应方法，首先对任务硬件环境进行建模；其次对深度神经网络的各项指标进行建模；基于ADMM模型压缩技术简化模型结构，最终以层为粒度动态进行模型分割。

其中所述对深度神经网络的各项指标进行建模包括以下步骤：首先对深度学习模型进行压缩：使用结构化剪枝技术缩小深度学习模型的结构；其次对深度学习模型进行分割：在感知到的硬件约束条件下，将压缩后的模型以层粒度进行分割；最后综合使用模型压缩和模型分割技术，实现深度学习模型对硬件资源的自适应。

本发明中，所述深度神经网络的各项指标包括：深度神经网络的精度、存储需求、能源消耗；所述上下文信息包括时间、光线；所述层包括环境感知层、应用层。

实施例：

一种基于X-ADMM的深度学习模型环境自适应方法，所述方法包括以下具体步骤：

S＝S_f+S_p＝|χ|B_a+|ω|B_w

E＝E_c+E_m＝ε₁C+ε₂S_p+ε₃S_f

其中，A是模型的推断精度，

步骤4：将步骤3的方程分解为两个子问题迭代求解：

其中，k是迭代索引，拉格朗日乘子更新为