CN112287990B

CN112287990B - 一种基于在线学习的边云协同支持向量机的模型优化方法

Info

Publication number: CN112287990B
Application number: CN202011152761.0A
Authority: CN
Inventors: 杨树森; 赵鹏; 韩青; 张靖琪; 赵聪; 任雪斌; 王路辉; 王艺蒙
Original assignee: Hangzhou Cumulus Technology Co ltd
Current assignee: Hangzhou Cumulus Technology Co ltd
Priority date: 2020-10-23
Filing date: 2020-10-23
Publication date: 2023-06-30
Anticipated expiration: 2040-10-23
Also published as: CN112287990A

Abstract

本发明公开了一种基于在线学习的边云协同支持向量机的模型优化方法，该方法能够有效地利用边缘处有限的计算和通信资源以获取最佳的分布式SVM分类算法性能。提出“Learning to Learn”的框架，用于在具有资源约束的异构边缘端服务器上进行有效的边云协同SVM学习。各个边缘端服务器独立的从云端服务器读取当前时刻的全局模型参数至本地服务器，从本地数据集中随机抽取一个小批量数据并在此批上进行SVM分类的迭代训练，随后将局部参数上传至云端服务器完成全局参数的更新。将每个边缘端服务器在云端服务器的协同策略的动态确定建模为在线优化问题，并设计了基于预算受限的时变资源消耗的Multi‑MAB模型的在线学习算法。同时本发明支持异步的学习模式，可用于监督学习任务。

Description

一种基于在线学习的边云协同支持向量机的模型优化方法

技术领域

本发明属于边缘计算/机器学习领域，具体涉及一种基于在线学习的边云协同支持向量机的模型优化方法。

背景技术

SVM(Support Vector Machines，支持向量机)是一种按监督学习的方式对数据进行二分类的线性分类器，其分类边界是对学习样本求解的最大间隔超平面。SVM克服了很多传统分类模型的过学习、局部极值点和维数灾难等缺点，已成为当前国内外机器学习领域备受关注的研究热点。

随着物联网的快速发展和4G/5G无线网络的普及，边缘网络服务的智能设备和传感器的数量及产生的数据量急剧增加。而可用于SVM分类的数据通常分布在各边缘端服务器上，要将所有数据统一汇聚到云端服务器以用于集中式SVM分类会消耗大量网络带宽，同时也存在诸如响应不及时、功耗高等问题。为了克服上述挑战，移动边缘计算(MEC)范例被提出，利用分布式边缘节点/服务器(如笔记本电脑、智能手机)的计算能力基于本地数据进行机器学习迭代，再将本地的模型参数上传至云端服务器进行全局模型更新。与传统的云计算范例相比，虽然其在带宽，延迟和保护隐私方面表现出巨大优势，但边缘端服务器通常只有有限的计算和存储资源，且它们与云的通信延迟也不同，因此仍然缺乏可以部署在异构且资源受限的边云系统中的算法。要同时解决边缘异质性和资源约束问题具有重要意义，但也具有难度：1)同步算法对于异构边缘资源是低效的，而对于异步算法，则很难在数学上精确建立SVM模型准确性与边缘资源消耗之间的关系；2)在实时动态系统中，本地的训练数据和异构边缘资源都可能是时变的，这将对边云协同SVM的最优决策产生不可预测的影响。

发明内容

本发明的目的在于提供一种基于在线学习的边云协同支持向量机的模型优化方法，以解决上述问题。

为实现上述目的，本发明采用以下技术方案：

一种基于在线学习的边云协同支持向量机的模型优化方法，包括以下步骤：

步骤1，初始化学习参数：云端服务器初始化全局支持向量机SVM参数，作为决策边界的超平面的法向量和截距w(0)，本地迭代所用数据批量大小b，各边缘服务器总资源约束R，针对每个边缘服务器的MAB臂的个数K，每个臂对应的迭代次数p(K)；

步骤2，下发全局模型参数和迭代次数：云端服务器发送当前时刻t的全局模型参数w(t)和迭代次数p(K)至所有边缘端服务器N_i；

步骤3，迭代更新本地模型参数：边缘端服务器在本地数据集中随机抽取一个数据量为b的batch，基于这个batch使用随机梯度下降的方法，分别对超平面的法向量和截距求梯度，按它们的梯度负方向来对超平面的法向量和截距执行更新，进行p(K)次迭代训练，得到新的本地超平面参数w_i(t)；

步骤4，获取资源消耗量：记录边缘端服务器N_i本地迭代训练所消耗的时间c_i,1和边缘端服务器向云端服务器上传参数所消耗的时间c_i,2，更新各边缘端服务器的总资源约束R；

步骤5，更新全局参数：边缘端服务器N_i将局部超平面参数w_i(t)上传至云端服务器，云端服务器使用当前的全局超平面参数w(t)和w_i(t)来更新全局模型参数；

步骤6，更新臂对应的收益和支付成本：云端服务器为每一个边缘端服务器设置一个多臂老虎机，分别对每个边缘端服务器进行决策；根据全局超平面参数w(t)和云端服务器的测试数据得出全局模型的精度，作为MAB中当前臂p(K)的收益值，资源消耗量作为当前臂p(K)的支付成本值；

步骤7，更新迭代次数：云端服务器根据在线算法选择新的臂，作为新的迭代次数；

步骤8，发送新的初始值：云端服务器将w(t)和p(K)发送给当前边缘端服务器，作为进行本地SVM的初始值；

步骤9，迭代更新：当前边缘端服务器接收到新的w(t)和p(K)后，独立并行重复步骤3-8，不断迭代；

步骤10，停止学习：当云端服务器检测到所有边缘服务器的总资源都用完时结束学习，w(t)为最终SVM模型训练的结果，云端服务器将训练结果广播给各边缘端服务器，完成学习。

进一步的，步骤5中，具体包括：

全局参数更新方式采用的是异步更新；云端服务器仅请求一个/一组边缘端服务器

上传其本地模型参数w_i(t)并使用当前的全局参数w(t)和w_i(t)来更新全局模型参数，公式如下

其中，

进一步的，步骤6中，具体包括：

云服务器对每个边缘服务器i的动态协同策略都被建模成一个在线学习问题，其中使用二进制变量

和/>

分别代表在时隙t边缘服务器i是否本地迭代和全局更新，针对i在时隙t的更新决策为/>

进而协同决策为/>

基于上述内容，用S^t＝<D¹,D²,...,D^t>表示云端服务器的协同策略；

同时，定义学习效用值为u(D^t；B^t)，B^t表示云端服务器进行测试的batch数据，测试所用的全局模型参数是云端服务器接收到各边缘端服务器的局部模型参数后与当前全局模型参数加权聚合更新得到的；资源预算约束：对于边缘端服务器i，定义它在协同学习中的资源约束为R_i＝(r_i,1,r_i,2)，分别代表计算资源总量和通信资源总量，且将资源视为同类型时，R_i表示为标量；云端服务器的工作是针对每个边缘服务器来确定其最佳协同策略S^T，使得在消耗完所有i的资源R_i之前，在时隙T，最大化整个学习过程中的平均学习效用值；具体而言，每个边缘服务器都将建模为以下优化问题：

进一步的，步骤7中，具体包括：云服务器针对资源受限且异质的各个边缘端服务器都将上述在线优化问题建模为MAB问题，称为Multi-MAB模型；云端服务器针对各边缘端服务器确定其在给定资源预算约束的情况下寻找最佳决策的序列，即选择各边缘端服务器在下一时隙进行SVM训练的迭代次数，每个决策(的执行所消耗的资源是可变的；

在时变资源消耗的情况下，云端服务器需要自动识别和适应学习过程中每个决策的成本变化，该种情况下为每个决策保持一个时变置信度上限值

其中，

是云端服务器选择决策P_I后消耗的资源的平均值，然后云端服务器选择具有最大/>

值的决策，该决策对应的迭代次数将会下发给边缘端服务器i。

进一步的，步骤6中，还假设每次迭代消耗的资源是时变的，即一次本地迭代消耗的计算资源

的一次全局聚合消耗的通信资源/>

是服从某个概率分布的，进一步的，对于各个边缘服务器i，它们的计算和通信资源严重异质，即进行SVM迭代训练一次所消耗的资源相差悬殊。

与现有技术相比，本发明有以下技术效果：

本发明提供的在边缘服务器资源异构且受限的边云系统框架下基于在线学习的边云协同SVM算法，实现云端服务器采用基于带预算约束的多个多臂老虎机算法的在线学习方法对各个边缘端服务器上的学习任务独立进行动态智能决策，优化在边缘端服务器计算和通信资源异构且受限的边缘智能场景下的边云协同SVM算法准确度。基于Docker容器的真实网络测试场景和模拟环境的实验结果表明，随着边缘服务器资源异质度的增加，相较目前最先进的OL4EL-Sync和AC-Sync算法，可实现算法精度15％的提升，同时，在模拟环境中，当边缘端服务器个数达到100时，SVM分类准确度远优于同步算法。

附图说明

图1为边云系统框架下异步SVM算法的示意图；

图2为本发明所提方法的流程图；

图3为给定各边缘端服务器的资源约束下在不同异质度时算法运行的精度(真实网络边缘)。其中，基于SVM的晶圆故障(智能制造)分类作为性能评估的监督学习任务。

图4为给定各边缘端服务器的资源约束下本发明提出的算法的精度结果(模拟环境)。

具体实施方式

下面结合附图对本发明作进一步详细描述。

首先针对资源异构且受限的边缘系统，将每个边缘端服务器的边云协同动态学习策略(局部迭代/全局聚合)建模为一个在线优化问题，以实现SVM算法精确度与资源消耗之间的权衡；然后提出了基于预算受限的多个多臂老虎机(Multi-MAB)模型的在线算法的相应解决方案，还特别针对具有时变资源限制的场景开发了算法；同时该算法支持异步学习模式，可用于SVM线性分类等监督学习任务。该方法能够有效地利用边缘处有限的计算和通信资源以获取最佳的分布式SVM分类算法性能。提出了一种新的“Learning to Learn”的框架，用于在具有资源约束的异构边缘端服务器上进行有效的边云协同SVM学习。各个边缘端服务器独立的从云端服务器读取当前时刻的全局模型参数至本地服务器，从本地数据集中随机抽取一个小批量数据并在此批上进行SVM分类的迭代训练，随后将局部参数上传至云端服务器完成全局参数的更新。将每个边缘端服务器在云端服务器的协同策略的动态确定(即边缘端服务器上的本地迭代的分配以及协同学习过程消耗的资源量)建模为在线优化问题，并设计了基于预算受限的时变资源消耗的Multi-MAB模型的在线学习算法。同时本发明支持异步的学习模式，可用于监督学习任务。

参考图1，考虑到边缘端服务器上的本地晶圆故障图片数据上传至云端服务器需要高成本和隐私暴露风险，所以将原始数据存储在边缘端服务器，仅将局部模型参数上传到云端服务器。边缘端服务器采用完全异步的方式与云端服务器进行通信来完成边云协同SVM学习任务。

参考图1与图2，本发明提供了资源受限且异质的边云系统框架下基于在线学习的边云协同SVM算法，边缘端服务器从云端服务器读取全局模型参数(SVM超平面的法向量和截距)，并基于本地数据集进行SVM分类的迭代训练，随后将本地模型参数上传至云端服务器以完全异步的方式完成全局模型参数的更新。同时考虑到各边缘端服务器的计算和通信资源受限且异质，会导致同步算法低效，将云端服务器上协同策略的动态确定(即针对每个边缘端服务器上的本地迭代的分配以及协同学习过程消耗的资源量)建模为在线优化问题，并提出了基于预算受限的多个多臂老虎机(Multi-MAB)模型的在线学习算法求解上述问题。具体过程包括以下步骤：

1)初始化云端服务器学习参数：随机初始化全局模型参数w(0)，为每个边缘服务器设置其总资源约束；

2)云端服务器协同策略与学习效用值：参考图1，云服务器对每个边缘服务器i的动态协同策略都被建模成一个在线学习问题，其中使用二进制变量

和/>

分别代表在时隙t边缘服务器i是否本地迭代和全局更新，所以针对i在时隙t的更新决策为

进而协同决策为/>

基于上述内容，可用S^t＝<D¹,D²,...,D^t>表示云端服务器的协同策略。同时，定义学习效用值为u(D^t；B^t)，B^t表示云端服务器进行测试的batch数据，参考图2，测试所用的全局模型参数是云端服务器接收到各边缘端服务器的局部模型参数后与当前全局模型参数加权聚合更新得到的；

3)资源预算约束：参考图1，对于边缘端服务器i，定义它在协同学习中的资源约束为R_i＝(r_i,1,r_i,2)，分别代表计算资源总量和通信资源总量，且将资源视为同类型(如时间、金钱花费等)时，R_i可表示为标量。此外，还假设每次迭代消耗的资源是时变的，即一次本地迭代消耗的计算资源c^t _i,1的一次全局聚合消耗的通信资源c^t _i,2是服从某个概率分布的，进一步的，对于各个边缘服务器i，它们的计算和通信资源严重异质，即进行SVM迭代训练一次所消耗的资源相差悬殊；

4)在线优化问题：参考图1，云端服务器的工作是针对每个边缘服务器来确定其最佳协同策略S^T，使得在消耗完所有i的资源R_i之前(在时隙T)最大化整个学习过程中的平均学习效用值。具体而言，每个边缘服务器都将建模为以下优化问题；

显然，这是一个典型的在线优化问题，即在计算和通信资源限制下最大化平均模型效用。

5)在线优化问题建模成多个多臂老虎机(Multi-MAB，Multi Multi-armedbandit)问题：参考图1，对于边缘端服务器i，定义全局更新间隔为两个相邻全局更新之间的局部迭代次数。例如，边缘端服务器i在三个时隙的更新决策是<(1,0),(1,0),(1,0)>，那么它的全局更新间隔就为3，代表着边缘端服务器i要进行三次本地迭代在进行全局更新。用

表示边缘端服务器i在时隙t的全局更新间隔，进而定义云端服务器的选择集合为

其中p_max表示最大更新间隔，I是预定义的整数，用于将所有可能的间隔(≤p_max)划分为J。映射到MAB模型中，p_I∈P就对应一个手臂。因此，协同策略也可以映射为/>

这是一个确定的MAB手臂集合。

6)MAB问题的求解：云端服务器针对各边端服务器确定其在给定资源预算约束的情况下寻找最佳决策(拉臂)的序列，即选择各边缘端服务器在下一时隙进行SVM训练的迭代次数，每个决策(拉臂动作)的执行所消耗的资源是可变的。

其中，

参考图3，这幅图是SVM在真实网络测试平台系统上训练的结果，对比算法是本发明提出的OL4ESL-async算法、其相应的同步算法和两种已有分布式算法，其中边缘端服务器的资源是异构的且资源(时间)预算设置为5,000毫秒，这里，资源异质性被定义为最快边缘端服务器的处理速度与最慢边缘端服务器的处理速度的比率。通过这幅图可以发现边缘端服务器的异质性越高，OL4ESL-async的性能越好，OL4ESL-sync和两个比较算法的性能越差。具体来说，OL4ESL-async比AC-sync的算法精度高15％，且OL4ESL-sync也略微优于AC-sync。这是因为OL4EL-sync的所有计算都在云上执行，使得边缘资源消耗少于AC-sync算法。另外，请注意，如果允许更长的训练时间，则可以改善图3中所示的算法精度。

参考图4，这幅图是为了研究OL4ESL算法的可扩展性，使用Docker Compose进行了不同数量的边缘端服务器的模拟，边缘端服务器的个数从3到100，对比算法是本发明提出的OL4ESL-async在不同的资源异构性下和OL4ESL-sync的比较。通过这幅图可以发现，随着边缘端服务器数量的增加，OL4ESL-async的性能变得更好，OL4ESL-sync的效果在边缘端服务器资源同质的情况下表现很好。

Claims

1.一种基于在线学习的边云协同支持向量机的模型优化方法，其特征在于，包括以下步骤：

步骤10，停止学习：当云端服务器检测到所有边缘服务器的总资源都用完时结束学习，w(t)为最终SVM模型训练的结果，云端服务器将训练结果广播给各边缘端服务器，完成学习；

步骤7中，具体包括：云服务器针对资源受限且异质的各个边缘端服务器都将在线优化问题建模为MAB问题，称为Multi-MAB模型；云端服务器针对各边缘端服务器确定其在给定资源预算约束的情况下寻找最佳决策的序列，即选择各边缘端服务器在下一时隙进行SVM训练的迭代次数，每个决策的执行所消耗的资源是可变的；

其中，

2.根据权利要求1所述的一种基于在线学习的边云协同支持向量机的模型优化方法，其特征在于，步骤5中，具体包括：

其中，α₀＝0，

3.根据权利要求1所述的一种基于在线学习的边云协同支持向量机的模型优化方法，其特征在于，步骤6中，具体包括：

和/>

进而协同决策为/>

同时，定义学习效用值为u(D^t；B^t)，B^t表示云端服务器进行测试的batch数据，测试所用的全局模型参数是云端服务器接收到各边缘端服务器的局部模型参数后与当前全局模型参数加权聚合更新得到的；资源预算约束：对于边缘端服务器i，定义它在协同学习中的资源约束为R_i＝(r_i,1,r_i,2)，分别代表计算资源总量和通信资源总量，且将资源视为同类型时，且资源为时间时，R_i表示为标量；云端服务器的工作是针对每个边缘服务器来确定其最佳协同策略S^T，使得在消耗完所有i的资源R_i之前，在时隙T，最大化整个学习过程中的平均学习效用值；具体而言，每个边缘服务器都将建模为以下优化问题：

4.根据权利要求3所述的一种基于在线学习的边云协同支持向量机的模型优化方法，其特征在于，步骤6中，还假设每次迭代消耗的资源是时变的，即一次本地迭代消耗的计算资源c^t _i,1的一次全局聚合消耗的通信资源c^t _i,2是服从某个概率分布的，进一步的，对于各个边缘服务器i，它们的计算和通信资源严重异质，即进行SVM迭代训练一次所消耗的资源相差悬殊。