CN114800545B

CN114800545B - 一种基于联邦学习的机器人控制方法

Info

Publication number: CN114800545B
Application number: CN202210230205.3A
Authority: CN
Inventors: 苏德瑜; 张锴; 杨庚雨; 王平江; 黄瑞; 王乔羽; 何静; 张志旺
Original assignee: Quanzhou-Hust Intelligent Manufacturing Future; Huazhong University of Science and Technology
Current assignee: Quanzhou-Hust Intelligent Manufacturing Future; Huazhong University of Science and Technology
Priority date: 2022-01-18
Filing date: 2022-03-09
Publication date: 2023-10-27
Anticipated expiration: 2042-03-09
Also published as: CN114800545A

Abstract

本发明提供一种基于联邦学习的机器人控制方法，包括如下步骤：A、聚合节点向各本地节点发送训练请求；B、本地节点利用当前所积累的运行数据在本地模型进行训练，并将训练所得数据发送至聚合节点；C、若聚合计算次数n＝1，则计算全模型及对应于该全模型的全准确率，并进入步骤D；若n＞N+1，则进入步骤E；D、聚合节点将所有本地节点划分为重要节点和非重要节点，并进入步骤A；E、聚合节点根据重要节点的数据进行聚合计算，并进入步骤F；F、第二周期T₂后，需要时向聚合节点发送更新请求，进入步骤A。本发明能够保证机器人的工作精度始终保持在一个较高的水平，且能够在保证本地模型精度的前提下，减少聚合计算过程中计算资源的开销及通讯开销。

Description

一种基于联邦学习的机器人控制方法

技术领域

本发明涉及一种基于联邦学习的机器人控制方法。

背景技术

随着我国数字化技术发展的大潮来临，人工智能，大数据和智能机器人产业迎来了爆发式增长，技术革新速度不断加快，产业落地应用不断增多，将科学技术的进步引领到传统产业升级的方方面面。现有的工业互联网技术会把生产线上的各种机器人在雕刻、焊接、分拣、拼装等工序过程中的生产数据进行本地收集，并通过网络终端设备上传到云端大数据平台上，再由平台把相同工序和型号的机器人数据进行归集并采用传统机器学习算法进行训练。最后把训练不断优化得到的模型参数下发给各网络终端设备，再发送到末端机器人控制器进行本地控制算法优化，提高轨迹精度与工作效率。

但这存在如下问题：中小型企业受限于规模无法获得足够多的生产数据进行模型训练，如果由多个中小企业共享一个云端平台，则参与方会担心自己的上传到云端的工艺参数数据被同行窃取，进而导致行业内的恶性竞争(生产工艺被复制，产品被仿造，竞争者进行恶性价格竞争)。因此现有的大部分云端大数据训练平台，空有运行架构，却缺少真实数据，难以发挥其真正的作用。

将联邦学习应用于机器人控制方面，能够避免上述数据泄露的问题，但是现有的基于联邦学习的控制方案中，本地模型在经过一次聚合计算的更新后，就不会再更新，这样在运行一段时间后，若原有的机器人运行轨迹或者实际使用场景有了调整，本地模型与机器人的适配性会受到较大影响，导致机器人工作精度降低。

发明内容

本发明提出一种基于联邦学习的机器人控制方法，本地模型根据机器人实际运行情况进行更新，保证机器人的工作精度始终保持在一个较高的水平，且能够在保证本地模型精度的前提下，减少聚合计算过程中计算资源的开销及通讯开销。

本发明通过以下技术方案实现：

一种基于联邦学习的机器人控制方法，本地节点按照第一周期T₁不间断地周期性获取机器人的运行数据，并包括如下步骤：

A、云端聚合节点向各本地节点发送训练请求；

B、本地节点在接收到云端聚合节点发送的训练请求后，利用当前所积累的运行数据在本地模型进行训练，并将训练所得数据发送至聚合节点；

C、聚合节点判断聚合计算次数n，若聚合计算次数n＝1，则根据各本地节点的数据进行聚合计算，得到全模型及对应于该全模型的全准确率，并进入步骤D；若聚合计算次数n＞N+1，则进入步骤E，其中，N为本地节点

个数；

D、聚合节点分别进行N次聚合计算，每次聚合计算均剔除一个未被剔除过的本地节点的数据，得到N个局部模型及分别对应于N个局部模型的N个局部准确率，根据全准确率分别与N个局部准确率的差值，将所有本地节

点划分为重要节点和非重要节点，并进入步骤A；

E、聚合节点根据重要节点的数据进行聚合计算，将训练生成的新的模型参数发送至各节点，各节点根据该模型参数更新本地模型，机器人根据更新

后的本地模型所规划的运行参数运行，并进入步骤F；

F、第二周期T₂后，本地节点利用当前所积累的运行数据在本地模型进行训练，当训练所得数据与上一次训练所得数据之差超过设定的第一阈值时，向聚合节点发送更新请求，当发送聚合节点请求的本地节点比例超过设定的第二阈值时，进入步骤A。

进一步的，所述步骤E中，若机器人运行精度达不到预设值，则本地节点向聚合节点发送请求，聚合节点在下一轮聚合计算中将增加一个非重要节点的数据，若运行精度超过预设值一定值，则本地节点向聚合节点发送请求，聚合节点在下一轮聚合计算中将减少一个重要节点的数据。

进一步的，所述步骤D中，得到全准确率与N个局部准确率的差值后，将这N个差值由大至小排序，将前L个差值对应的本地节点划分为重要节点，其余本地节点划分为非重要节点。

进一步的，所述步骤C中，所述全准确率的获取过程为：聚合节点利用云端本身具有的测试数据对全模型进行测试，从而得到全准确率。

进一步的，所述步骤B中，本地节点将训练所得数据加密后再发送至聚合节点。

进一步的，所述步骤F中，第二阈值的取值范围为[1/3,2/3]。

进一步的，所述运行数据包括机器人运行状态参数、机器人所加工的产品数据以及加工数据。

进一步的，所述训练所得数据为梯度值。

本发明具有如下有益效果：

1、本发明的本地节点在机器人运行过程中，按照第一周期T₁不间断地周期性获取机器人的运行数据，积累的运行数据将越来越多，在第一次根据聚合计算数据更新本地模型后，本地节点会在第二周期T₂后，利用当前所积累的运行数据进行本地训练，当训练所得数据与上一次训练所得数据之差超过设定的第一阈值时，则向聚合节点发送更新请求，当大部分本地节点都需要更新请求时，则会进行新的一轮聚合计算，从而再次更新本地模型，并以此长期对本地模型进行更新，因机器人的运行轨迹和使用场景不可能是一成不变的，因此将新获取的运行数据加入训练，必然能够使本地模型与机器人的适配度一直保持高水平，从而保证机器人运行轨迹的高精度，且工作时间越长，机器人轨迹精度会越高；然而，积累的运行数据越来越多，必然导致聚合计算本就不小的计算和通讯开销变得更大，这显然不利于实际应用，联邦学习中不同的本地节点所收集到的数据是不一样的，而不同的数据在聚合计算过程中所起的作用也不相同，重要节点和非重要节点对训练结果的影响差距是非常大的，因此本发明通过将所有本地节点分为重要节点和非重要节点来减少聚合计算的数据，如此能够大大降低聚合节点训练的计算复杂度和时间复杂度，减少训练过程中计算资源的开销与通讯开销，同时又不会使本地模型精确度的损失很大，这在运行时间长后运行数据积累多的情况下能够起到非常好的效果。

2、在实际运行中，若机器人的运行精度达不到预设值，则在下一轮聚合计算中增加一个非重要节点的数据，直到运行精度达到预设值，而若运行精度过高，则减少一个重要节点的数据，如此能够进一步提高本地模型的精确度，且避免不必要的资源浪费。

附图说明

下面结合附图对本发明做进一步详细说明。

图1为本发明的流程图。

具体实施方式

如图1所示，基于联邦学习的机器人控制方法中，联邦学习模型包括一个聚合节点和若干本地节点，本地节点为服务器，服务器上运行有本地模型，本地节点按照第一周期T₁(在本实施中，T₁＝100ms)不间断地周期性获取机器人的运行数据，运行数据包括机器人运行状态参数、机器人所加工的产品数据以及加工数据等。

基于联邦学习的机器人控制方法包括如下步骤：

A、云端聚合节点向各本地节点发送训练请求的广播；

B、本地节点在接收到云端聚合节点发送的训练请求后，利用当前所积累的运行数据在本地模型进行训练，训练结束后调用加密函数的API接口，将训练所得的梯度值进行加密，再将加密后的梯度值发送至聚合节点；

C、聚合节点收到梯度值，调用解密函数的API接口，对梯度值进行解密后，判断聚合计算次数n，若聚合计算次数n＝1，则根据各本地节点的梯度值进行聚合计算，得到全模型及对应于该全模型的全准确率，并进入步骤D；若聚合计算次数n＞N+1，则进入步骤E，其中，N为本地节点个数；加密和解密的具体过程均为现有技术；

其中，判断聚合计算次数n的过程为现有技术；

得到全准确率的过程为：云端本身存有已知的测试数据，通过聚合计算得到全模型后，利用测试数据对全模型进行测试，即可得到全准确率；

D、聚合节点分别进行N次聚合计算，每次聚合计算均剔除一个未被剔除过的本地节点的数据，得到N个局部模型及分别对应于N个局部模型的N个局部准确率，根据全准确率分别与N个局部准确率的差值，将所有本地节点划分为重要节点和非重要节点，并进入步骤A，获取局部准确率的过程与全准确率的过程相同；全准确率相对各局部准确率，应该是最高的；

得到全准确率与N个局部准确率的差值后，将这N个差值由大至小排序，将前L个差值对应的本地节点划分为重要节点，其余本地节点划分为非重要节点；L的具体取值根据实际工况认为设定；

E、聚合节点根据重要节点的数据进行聚合计算，将训练生成的新的模型参数发送至各节点，各节点根据该模型参数更新本地模型，机器人根据更新后的本地模型所规划的运行参数运行，并进入步骤F；

其中，若机器人运行精度达不到预设值，则本地节点向聚合节点发送请求，聚合节点在下一轮聚合计算中将增加一个非重要节点的数据，依此规律，直至运行精度达到预设值，若运行精度超过预设值一定值，则本地节点向聚合节点发送请求，聚合节点在下一轮聚合计算中将减少一个重要节点的数据，依此规律，直至运行精度与预设值基本相同，以避免浪费运算资源；

F、第二周期T₂后，本地节点利用当前所积累的运行数据在本地模型进行训练，当训练所得梯度值与上一次训练所得梯度值之差超过设定的第一阈值时，向聚合节点发送更新请求，当发送聚合节点请求的本地节点比例超过设定的第二阈值时，进入步骤A，该第二周期T₂、第一阈值的具体取值均根据实际工况而认为设定，第二阈值的取值范围为[1/3,2/3]，在本实施例中，

第二阈值为1/3。

以上所述，仅为本发明的较佳实施例而已，故不能以此限定本发明实施的范围，即依本发明申请专利范围及说明书内容所作的等效变化与修饰，皆应仍属本发明专利涵盖的范围内。

Claims

1.一种基于联邦学习的机器人控制方法，其特征在于：本地节点按照第一周期T₁不间断地周期性获取机器人的运行数据，并包括如下步骤：

A、云端聚合节点向各本地节点发送训练请求；

C、聚合节点判断聚合计算次数n，若聚合计算次数n＝1，则根据各本地节点的数据进行聚合计算，得到全模型及对应于该全模型的全准确率，并进入步骤D；若聚合计算次数n＞N+1，则进入步骤E，其中，N为本地节点个数；

D、聚合节点分别进行N次聚合计算，每次聚合计算均剔除一个未被剔除过的本地节点的数据，得到N个局部模型及分别对应于N个局部模型的N个局部准确率，根据全准确率分别与N个局部准确率的差值，将所有本地节点划分为重要节点和非重要节点，并进入步骤A；

2.根据权利要求1所述的一种基于联邦学习的机器人控制方法，其特征在于：所述步骤E中，若机器人运行精度达不到预设值，则本地节点向聚合节点发送请求，聚合节点在下一轮聚合计算中将增加一个非重要节点的数据，若运行精度超过预设值一定值，则本地节点向聚合节点发送请求，聚合节点在下一轮聚合计算中将减少一个重要节点的数据。

3.根据权利要求2所述的一种基于联邦学习的机器人控制方法，其特征在于：所述步骤D中，得到全准确率与N个局部准确率的差值后，将这N个差值由大至小排序，将前L个差值对应的本地节点划分为重要节点，其余本地节点划分为非重要节点。

4.根据权利要求1或2或3所述的一种基于联邦学习的机器人控制方法，其特征在于：所述步骤C中，所述全准确率的获取过程为：聚合节点利用云端本身具有的测试数据对全模型进行测试，从而得到全准确率。

5.根据权利要求1或2或3所述的一种基于联邦学习的机器人控制方法，其特征在于：所述步骤B中，本地节点将训练所得数据加密后再发送至聚合节点。

6.根据权利要求1或2或3所述的一种基于联邦学习的机器人控制方法，其特征在于：所述步骤F中，第二阈值的取值范围为[1/3,2/3]。

7.根据权利要求1或2或3所述的一种基于联邦学习的机器人控制方法，其特征在于：所述运行数据包括机器人运行状态参数、机器人所加工的产品数据以及加工数据。

8.根据权利要求1或2或3所述的一种基于联邦学习的机器人控制方法，其特征在于：所述训练所得数据为梯度值。