CN115562760B

CN115562760B - 基于边缘计算节点打分表的深度学习模型分层卸载方法

Info

Publication number: CN115562760B
Application number: CN202211469689.3A
Authority: CN
Inventors: 郭永安; 奚城科; 周金粮; 王宇翱; 钱琪杰
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2022-11-22
Filing date: 2022-11-22
Publication date: 2023-05-30
Anticipated expiration: 2042-11-22
Also published as: CN115562760A

Abstract

本发明公开了一种基于边缘计算节点打分表的深度学习模型分层卸载方法，属于边端协同计算技术领域。本发明离线获取边缘集群中各边缘计算节点算力参数，可提取每个计算节点的算力综合分数并做归一化处理得到总分，根据各个计算节点的总分形成打分表；同时离线统计深度学习模型各层计算量大小，通过统计参与推理的深度学习模型每一层计算量的大小情况并对其分区，根据不同边缘计算节点对不同计算量大小的计算能力差异，然后依据此分类对边缘计算节点打分表划分区间，从而合理的分配给计算能力充足的边缘计算节点，最终提高边缘集群中节点的资源利用率、降低计算时延。本发明可以降低整体时延的同时保证数据安全性和提高边缘节点资源的利用率。

Description

基于边缘计算节点打分表的深度学习模型分层卸载方法

技术领域

本发明属于边端协同计算技术领域，具体涉及一种基于边缘计算节点打分表的深度学习模型分层卸载方法。

背景技术

随着移动通信技术的发展和智能终端的普及,各种网络服务和应用不断涌现,用户对网络服务质量、请求时延等网络性能的要求越来越高。存在越来越多在短时间内处理计算密集型或时延敏感型计算任务的需求。

对于深度学习分层模型的推理过程，需要消耗大量的计算资源。传统的解决方案是将计算任务卸载到计算能力强大的云端，由云服务器处理完复杂的计算任务后将结果返回终端。但是该方法一方面会因为从终端到云之间网络带宽的不稳定性导致传输时延过大，另一方面由于从终端设备传输至云服务器需要经过多次的转发，导致数据安全性难以保证，此外大量拥有计算能力的边缘节点并不参与计算，节点的资源利用率难以提高。

于是另一种解决方案应运而生，终端计算任务不上云，而是直接将计算任务卸载到附近较为空闲的边缘节点，由边缘节点处理当前计算任务，最后将结果返回给终端设备。这样一来既克服了传输时延大的问题，又保证了数据的安全性，同时提高了边缘节点资源利用率。但是此方案有诸多不足之处，首先边缘节点的计算能力有限，只能处理复杂度低，计算量较小的深度学习模型，如果强行处理复杂的计算任务，计算时延将急剧增加；其次，即便是处理复杂度低，计算量较小的深度学习模型，在同一边缘集群中，能满足计算能力的边缘计算节点的数量仍然有限，因此资源利用率提升受边缘集群中满足计算能力的节点数量的限制；此外，对于复杂的深度学习模型，其对节点造成的负载过大，严重影响计算时延，因此也受限于深度学习模型计算量大小的限制。

发明内容

解决的技术问题：为了克服传输时延、计算时延、资源利用率和安全性之间的矛盾，本发明提出一种基于边缘计算节点打分表的深度学习模型分层卸载方法，通过对边缘计算节点打分，形成边缘计算节点打分表，依据深度学习模型各层数据量大小合理分配下一层计算任务至对应节点，降低整体时延的同时保证数据安全性和提高边缘节点资源的利用率。

技术方案：一种基于边缘计算节点打分表的深度学习模型分层卸载方法，包括步骤如下：

S1.通过边缘集群中距离终端设备最近的边缘计算节点

进行前期准备：

S1-1打分：在离线状态下，将深度计算模型通过每一边缘计算节点，获得各边缘计算节点的分值，再对分值进行归一化处理后得到归一化分数，形成边缘计算节点打分表，其中分值的计算公式如下：

上式中，

表示边缘计算节点CPU的算力，

表示边缘计算节点GPU的算力，算力单位是TOPS；

表示处理深度学习模型过程中CPU算力占用的百分比，

表示处理深度学习模型过程中GPU算力占用的百分比；

表示边缘计算节点对应的分值，其中最大的分值用

表示；下标

表示对应于边缘计算节点

；

S1-2.统计：计算每层深度学习模型的时延

，再分别进行归一化处理得到深度学习模型的各层计算量大小；

S1-3.分区：将边缘计算节点打分表和深度学习模型的各层计算量大小分布在0-1的十等份分区中获得分区情况；

S1-4.数据下发：将分区情况下发至边缘集群中的其他各边缘计算节点处；

S2.终端设备接收深度学习模型的计算任务，并将计算任务装载至边缘计算节点

；

S3.经当前的边缘计算节点确定深度学习模型下一层计算量所在分区，再结合分区情况和所有边缘计算节点的实时剩余进程选择下一层最优的边缘计算节点；

S4.下一层最优的边缘计算节点接收到上一边缘计算节点的计算任务并处理，同时将实时剩余进程+1并更新至所有边缘计算节点，处理完毕后将实时剩余进程-1并更新至所有边缘计算节点；

S5.判断深度学习模型的最后一层是否处理完毕，如处理完毕则将处理结果发送至终端设备；否则返回步骤S3。

优选的，所述边缘计算节点包括决策中心、决策收发中心和深度学习模型；

所述决策中心包括：

打分模块，用于获取CPU和GPU的算力并对其打分，以及向边缘计算节点

的打分模块发送分值；

数据中心模块，用于接收来自边缘计算节点

的打分模块的分区情况及所有边缘计算节点的实时剩余进程、以及存储分区情况及所有边缘计算节点的实时剩余进程；

决策模块，用于根据来自数据中心模块的分区情况和所有边缘计算节点的实时剩余进程，以及决策深度学习模型下一层计算量所在分区及下一层最优的边缘计算节点；

所述决策收发中心用于完成接收和发送任务；

所述深度学习模型为已训练完备并赋予智能应用程序的算法模型。

进一步的，在具备所有边缘计算节点功能的基础上，边缘计算节点

的打分模块还用于接收分值，计算深度学习模型的各层计算量大小，并将分值和计算量发送至边缘计算节点

的数据中心模块；边缘计算节点

的数据中心模块还用于形成边缘计算节点打分表并分区和对深度学习模型的各层计算量大小进行分区得到分区情况，向其他所有边缘计算节点的数据中心模块发送分区情况，以及接收、存储并向其他所有边缘计算节点的数据中心模块发送所有边缘计算节点的实时剩余进程。

优选的，所述步骤S1-1中，归一化处理的计算公式如下：

上式中，

表示归一化分数，

。

优选的，所述步骤S1-2中，归一化处理的计算公式如下：

上式中，下标

表示深度学习模型第

层，深度学习模型总层数记为

（

）；

表示第

层所需计算时延，其中最大的时延用

表示；

表示深度学习模型第

层计算量的大小。

优选的，所述步骤S1-2中深度学习模型的分层通过如下方式获得：将深度学习模型的输入层、隐藏层和输出层中单独成列的神经元划分为m+1列，以隐藏层中各列神经元为切割点进行分层卸载，得到m层深度学习模型，其中第j层包括第j列神经元、第j+1列神经元、第j列神经元与第j+1列神经元之间的网络结构，0＜j＜m+1。

优选的，所述步骤S3中由边缘计算节点

选择深度学习模型第一层最优的边缘计算节点。

优选的，所述步骤S3具体如下：

S3-1.根据分区情况确定深度学习模型下一层计算量属于第

个分区，其中

；

S3-2.调取边缘计算节点打分表中第

个分区的节点，以

表示第

个边缘计算节点的实时剩余进程，

表示第

个边缘计算节点进程数有无，则

S3-3. 当分区k中没有边缘计算节点或分区k中边缘计算节点的实时剩余进程均为0，则将k+1赋予k，并返回步骤S3-2；

S3-4.在当前分区中将第

个节点归一化分数乘以

得到当前分区中第

个节点的实际分数情况

；

S3-5.选择

≥1且

数值最大的边缘计算节点为下一层最优的边缘计算节点。

有益效果：本方法在离线获取边缘集群中各边缘计算节点算力参数的前提下展开，进一步的，本方法可提取每个计算节点的算力综合分数并做归一化处理得到总分，根据各个计算节点的总分形成打分表。

同时本方法是在离线统计深度学习模型各层计算量大小的前提下展开的，通过统计参与推理的深度学习模型每一层计算量的大小情况并对其分区，根据不同边缘计算节点对不同计算量大小的计算能力差异，然后依据此分类对边缘节点打分表划分区间，从而合理的分配给计算能力充足的边缘计算节点，最终提高边缘集群中节点的资源利用率、降低计算时延。

区别于依赖云中心或整体卸载至单一节点的深度学习模型处理框架，本方法将深度学习模型分层卸载至不同的边缘计算节点，充分挖掘边缘侧的计算潜力，实现计算任务时延最小化。

将深度学习模型分层卸载至终端设备对应边缘集群的边缘计算节点上，协同推理的方式可有效保证计算数据的安全性和缓解网络带宽的压力，同时提高边缘集群中节点资源利用率。

附图说明

图1为本发明前期准备流程图；

图2为本发明的深度学习模型分层卸载原理图；

图3为本发明的技术原理图；

图4为本发明的流程图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步描述。

实施例1

一种基于边缘计算节点打分表的深度学习模型分层卸载方法，包括步骤如下：

S1.如图1所示，通过边缘集群中距离终端设备最近的边缘计算节点

进行前期主要准备工作：

S1-1打分：在离线状态下，将深度计算模型通过每一计算能力不同的边缘计算节点，由边缘计算节点

感知其他各边缘计算节点在处理整个深度计算模型过程中的中央处理器CPU和图像处理器GPU算力占用的百分比，然后与各自算力相乘再求和得到对应的分值，再对分值进行归一化处理后得到归一化分数，形成边缘计算节点打分表，其中分值的计算公式如下：

上式中，

表示边缘计算节点CPU的算力，

表示边缘计算节点GPU的算力，算力单位是TOPS，1TOPS代表处理器每秒钟10^12操作；

表示处理深度学习模型过程中CPU算力占用的百分比，

表示处理深度学习模型过程中GPU算力占用的百分比；

表示边缘计算节点对应的分值，其中最大的分值用

表示；下标

表示对应于边缘计算节点；

归一化处理的计算公式如下：

上式中，

表示归一化分数，

。

边缘计算节点打分表按照边缘计算节点归一化分数

从小到大排序，形成基于边缘计算节点算力的打分表，边缘计算节点打分表部分示例如表1所示。本发明的表1中只展示一个深度学习模型，如有多个模型则每个模型通过离线测试后将形成该模型对应的打分表。

表1 边缘计算节点打分表

S1-2.统计：通过边缘计算节点

计算每层深度学习模型的时延

，再分别进行归一化处理得到深度学习模型的各层计算量大小；其中，归一化处理的计算公式如下：

上式中，下标

表示深度学习模型第

层，深度学习模型总层数记为

（

）；

表示第

层所需计算时延，其中最大的时延用

表示；

表示深度学习模型第

层计算量的大小。其中，如图2所示，深度学习模型为多层结构，其分层通过如下方式获得：将深度学习模型的输入层、隐藏层和输出层中单独成列的神经元划分为m+1列，以隐藏层中各列神经元为切割点进行分层卸载，得到m层深度学习模型，其中第j层包括第j列神经元、第j+1 列神经元、第j列神经元与第j+1列神经元之间的网络结构，0＜j＜m+1。

同样按从小到大排列深度学习模型的各层计算量大小。

S1-3.分区：由于在打分和统计阶段获得的边缘计算节点打分表和深度学习模型的各层计算量大小均为经过归一化处理所得，即其数值范围均在0-1区间内，因此将边缘计算节点打分表和深度学习模型的各层计算量大小分布在0-1的十等份（0.1宽度为一份）分区中获得分区情况；

S1-4.数据下发：由边缘计算节点

将分区情况下发至边缘集群中的其他各边缘计算节点处，为边缘计算节点的决策提供依据。

需要声明的是，同一个边缘集群内的边缘计算节点中的各个模块内的模型和数据信息都是共享的。参见图3，边缘集群包含多个边缘计算节点，各边缘计算节点部署在基站或是WIFI接入点中，各物理终端的通信范围内至少设有一个边缘计算节点

；

针对边缘集群中的边缘计算节点，都在一定的通信范围内，互相之间能保证即时的通信，一个边缘集群中边缘计算节点的总数记为

（

）；

同一局域网内存在多个物理终端和一个边缘计算节点

，与此边缘计算节点

物理距离小于

千米的其他边缘计算节点同边缘计算节点

一起组成边缘集群层；多个物理终端位于边缘集群层之下，组成终端设备层。

所述边缘计算节点包括决策中心、决策收发中心和深度学习模型；

所述决策中心包括：

的打分模块发送分值；

数据中心模块，用于接收来自边缘计算节点

所述决策收发中心用于完成接收和发送任务；

其中，在具备所有边缘计算节点功能的基础上，边缘计算节点

的数据中心模块；边缘计算节点

在前期准备工作完成之后，就可以正常使用边缘计算节点打分表对深度学习模型进行任务卸载计算，参见图4。

；

S3.经当前的边缘计算节点确定深度学习模型下一层计算量所在分区，再结合分区情况和所有边缘计算节点的实时剩余进程选择下一层最优的边缘计算节点；其中，深度学习模型第一层最优的边缘计算节点由边缘计算节点

选择。具体地：所述步骤S3包括步骤如下：

S3-1.根据分区情况确定深度学习模型下一层计算量属于第

个分区，其中

；

S3-2.调取边缘计算节点打分表中第

个分区的节点，以

表示第

个边缘计算节点的实时剩余进程，

表示第

个边缘计算节点进程数有无，则

S3-4.在当前分区中将第

个节点归一化分数乘以

得到当前分区中第

个节点的实际分数情况

；

S3-5.选择

≥1且

数值最大的边缘计算节点为下一层最优的边缘计算节点。

Claims

1.一种基于边缘计算节点打分表的深度学习模型分层卸载方法，其特征在于，包括步骤如下：

S1.通过边缘集群中距离终端设备最近的边缘计算节点

进行前期准备：

，

上式中，

表示边缘计算节点CPU的算力， />

表示边缘计算节点GPU的算力，算力单位是TOPS； />

表示处理深度学习模型过程中CPU算力占用的百分比，/>

表示处理深度学习模型过程中GPU算力占用的百分比；/>

表示边缘计算节点对应的分值，其中最大的分值用/>

表示；下标/>

表示对应于边缘计算节点；

S1-2.统计：计算每层深度学习模型的时延

；

S3.经当前的边缘计算节点确定深度学习模型下一层计算量所在分区，再结合分区情况和所有边缘计算节点的实时剩余进程选择下一层最优的边缘计算节点，具体如下：

S3-1.根据分区情况确定深度学习模型下一层计算量属于第

个分区，其中/>

；

S3-2.调取边缘计算节点打分表中第

个分区的节点，以/>

表示第/>

个边缘计算节点的实时剩余进程，/>

表示第/>

个边缘计算节点进程数有无，则 />

；

S3-4.在当前分区中将第

个节点归一化分数乘以/>

得到当前分区中第/>

个节点的实际分数情况/>

；

S3-5.选择

≥1且/>

数值最大的边缘计算节点为下一层最优的边缘计算节点；

2.根据权利要求1所述的基于边缘计算节点打分表的深度学习模型分层卸载方法，其特征在于，所述边缘计算节点包括决策中心、决策收发中心和深度学习模型；

所述决策中心包括：

的打分模块发送分值；

数据中心模块，用于接收来自边缘计算节点

所述决策收发中心用于完成接收和发送任务；

3.根据权利要求2所述的基于边缘计算节点打分表的深度学习模型分层卸载方法，其特征在于，在具备所有边缘计算节点功能的基础上，边缘计算节点

的打分模块还用于接收分值，计算深度学习模型的各层计算量大小，并将分值和计算量发送至边缘计算节点/>

的数据中心模块；边缘计算节点/>

4.根据权利要求1所述的基于边缘计算节点打分表的深度学习模型分层卸载方法，其特征在于，所述步骤S1-1中，归一化处理的计算公式如下：

，

上式中，

表示归一化分数，/>

。

5.根据权利要求1所述的基于边缘计算节点打分表的深度学习模型分层卸载方法，其特征在于，所述步骤S1-2中，归一化处理的计算公式如下：

，

上式中，下标

表示深度学习模型第/>

层，深度学习模型总层数记为/>

，/>

；/>

表示第/>

层所需计算时延，其中最大的时延用/>

表示；/>

表示深度学习模型第/>

层计算量的大小。

6.根据权利要求1所述的基于边缘计算节点打分表的深度学习模型分层卸载方法，其特征在于，所述步骤S1-2中深度学习模型的分层通过如下方式获得：将深度学习模型的输入层、隐藏层和输出层中单独成列的神经元划分为m+1列，以隐藏层中各列神经元为切割点进行分层卸载，得到m层深度学习模型，其中第j层包括第j列神经元、第j+1列神经元、第j列神经元与第j+1列神经元之间的网络结构，0＜j＜m+1。

7.根据权利要求1所述的基于边缘计算节点打分表的深度学习模型分层卸载方法，其特征在于，所述步骤S3中由边缘计算节点

选择深度学习模型第一层最优的边缘计算节点。/>