CN115185189B - 带隐私保护的一致性最优控制方法、系统、设备和介质 - Google Patents
带隐私保护的一致性最优控制方法、系统、设备和介质 Download PDFInfo
- Publication number
- CN115185189B CN115185189B CN202211081802.0A CN202211081802A CN115185189B CN 115185189 B CN115185189 B CN 115185189B CN 202211081802 A CN202211081802 A CN 202211081802A CN 115185189 B CN115185189 B CN 115185189B
- Authority
- CN
- China
- Prior art keywords
- robot
- robots
- consistency
- control
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种带隐私保护的一致性最优控制方法,涉及控制领域和机器人领域,所述方法包括:建立所述机器人系统中所有机器人在运动时的动力学方程模型;在所述动力学方程模型中结合带输入约束的分布式一致性控制律,以获得所有机器人的控制输入;在所述动力学方程模型中结合Paillier同态加密算法;将带Paillier同态加密算法的所述动力学方程模型应用到所述机器人系统中所有机器人上,进而使得所有机器人保持运动时位置和速度上保持一致。本发明可以让所有机器人最终在位置和速度上保持一致,同时避免泄露私有信息。
Description
技术领域
本发明涉及控制领域和机器人领域,具体涉及一种带隐私保护的一致性最优控制方法、系统、设备和介质。
背景技术
多智能体系统的一致性控制作为协同控制和分布式计算一个重要的分支,因其鲁棒性和可伸缩性而广泛应用在各个领域,如编队控制,智能机器人系统,传感器网络和智能电网。所谓一致性,是指多智能体系统的个体基于邻居信息调节更新自己的行为,最终使得每个个体就某个状态达成一致,解决一致性问题的关键是为系统中的个体设计算法或控制律,一般而言是分布式算法或控制律,而传统的一致性算法往往都需要个体之间交换状态值以更新状态值,但如果个体状态值或者初始状态值是私有敏感数据,则存在隐私泄露的担忧。
发明内容
针对现有技术中的不足,本发明提供一种带隐私保护的一致性最优控制方法、系统、设备和介质,使得所有机器人最终在位置和速度上保持一致,同时避免泄露私有信息。
为实现上述目的,本发明可以采用如下技术方案:
一种带隐私保护的一致性最优控制方法,应用于机器人系统,其包括如下步骤:
建立所述机器人系统中所有机器人在运动时的动力学方程模型;
在所述动力学方程模型中结合带输入约束的分布式一致性控制律,以获得所有机器人的控制输入;
在所述动力学方程模型中结合Paillier同态加密算法;
将带Paillier同态加密算法的所述动力学方程模型应用到所述机器人系统中所有机器人上,进而使得所有机器人保持运动时位置和速度上保持一致。
如上所述的带隐私保护的一致性最优控制方法,进一步的,所述动力学方程模型具体为:
设无关质量因素的机器人在一维直线上运动,且每个机器人与系统中的部分或全部机器人通信,利用机器人的位置,速度,控制输入和控制输出建立机器人的双积分器动力学方程,具体的,
设机器人具有如下双积分器动力学方程:
其中分别表示机器人
们的状态向量,输入向量和输出向量,对于第个机器人可以分别代表其位
置,速度,控制输入和控制输出。
如上所述的带隐私保护的一致性最优控制方法,进一步的,设无关质量因素的机器人在二维平面上和三维空间上运动,且每个机器人与系统中的部分或全部机器人通信,利用机器人的位置,速度,控制输入和控制输出建立机器人的双积分器动力学方程,具体的,先分别计算各二维、三维坐标轴方向对应的控制输入值,然后矢量合成为一个方向的控制输入值,最终让每个机器人的位置达到一致。
如上所述的带隐私保护的一致性最优控制方法,进一步的,所述带输入约束的分布式一致性控制律,具体为:
借助如下积分型性能指标
其中是多智能体系统对应拓扑图的拉普拉斯矩阵,称为预测间隔,得到如下优
化问题
其中是一个关于输入的闭合凸集合,约定了输入的上下界。通过泰勒展开
代入上述优化问题,经过简化及省略与输入无关的部分,得到剩余
借助如下投影神经网络:
其中为被优化函数的梯度,λ是用于缩放投影神经网络收敛性的参数,且
将控制输入带入神经网络便得到了带输入约束的一致性控制律:
。
如上所述的带隐私保护的一致性最优控制方法,进一步的,具体到每个机器人的一致性控制律如下:
其中表示机器人的邻居节点集合。
如上所述的带隐私保护的一致性最优控制方法,进一步的,所述动力学方程模型中结合Paillier同态加密算法,具体为:
通过显式欧拉法将得到的所述一致性控制律进行离散化,从而得到离散态一致性控制律,离散态一致性控制律如下式;
,
其中, 是迭代次数,是步长,是机器人和机器人第次迭代时的耦
合权值,指机器人相互通信的邻居节点集合;
初始化:每个机器人初始化相同的系统参数,并利用Paillier加密算法
生成一个它的公钥和相应的私钥,广播公钥到其邻居们,同时保持私钥私
有;
迭代:在第k次迭代中,每个机器人首先使用其公钥加密状态值:
,
然后发送到每个邻居机器人;
每个邻居使用机器人的公钥加密:
机器人生成随机数,每个邻居生成随机数;
基于Paillier加密算法的加法同态性质,每个邻居按下式计算加密后
的状态差:
,
然后发送以上状态差至机器人;
机器人使用私钥解密收到的状态差值密文,从而得到用于更新自身状态值
的状态差值:
,
;
同理可获得。
一种带隐私保护的一致性最优控制的机器人系统,所述机器人系统的每个机器人均设有:
第一处理单元,其用于建立所述机器人系统中所有机器人在运动时的动力学方程模型;
第二处理单元,其用于在所述动力学方程模型中结合带输入约束的分布式一致性控制律,以获得所有机器人的控制输入;
第三处理单元,其用于在所述动力学方程模型中结合Paillier同态加密算法;以及,输出单元,其用于将带Paillier同态加密算法的所述动力学方程模型应用到所述机器人系统中所有机器人上,进而使得所有机器人保持运动时位置和速度上保持一致。
一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行,以实现如上所述的带隐私保护的一致性最优控制方法。
一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上所述的带隐私保护的一致性最优控制方法。
本发明与现有技术相比,其有益效果在于:本发明在一致性最优控制方法的基础上,嵌入隐私保护机制,所有机器人遵守隐私保护机制中的流程,在每次迭代中与其邻居交换加密后的状态信息,获得用于更新自身状态信息的状态差值,将状态差值代入离散化后的一致性控制律中便得到了控制输入,然后将得到的控制输入施加到机器人上,如此循环反复,最终令所有机器人在位置,速度上保持一致,同时保持私有信息不泄露。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图进行简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的带隐私保护的一致性最优控制方法的流程图;
图2为本发明实施例的带隐私保护的一致性最优控制的机器人系统的结构示意图;
图3为本发明实施例的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例:
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下文中所用的词语“示例性”的意思为“用作例子、实施例或说明性”。作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
为更好地理解本发明实施例提供的技术方案,下面对本发明实施例提供的技术方案的技术背景做一些简单介绍,以便更好理解本发明的技术构思。
传统的一致性算法往往都需要个体之间交换状态值以更新状态值,但如果个体状态值或者初始状态值是私有敏感数据,则存在隐私泄露的担忧。
基于此,本发明在一致性最优控制方法的基础上,嵌入隐私保护机制,所有机器人遵守隐私保护机制中的流程,在每次迭代中与其邻居交换加密后的状态信息,获得用于更新自身状态信息的状态差值,将状态差值代入离散化后的一致性控制律中便得到了控制输入,然后将得到的控制输入施加到机器人上,如此循环反复,最终令所有机器人在位置,速度上保持一致,同时保持私有信息不泄露。
参见图1,一种带隐私保护的一致性最优控制方法,其可以包括如下步骤:
步骤1:建立机器人运动时的动力学方程模型;
步骤2:基于步骤1的模型,设计带输入约束的分布式一致性控制律来求得所有机器人的控制输入;
步骤3:基于步骤2中的一致性控制律,结合Paillier同态加密算法,设计带隐私保护的机器人系统的一致性最优控制方法;
步骤4:在机器人上应用步骤3中的一致性最优控制方法的基础上,嵌入隐私保护机制,将得到的控制输入施加到机器人上,令所有机器人最终在位置,速度上保持一致。
作为一种可选的实施方式,在某些实施例中,所述步骤1中建立机器人运动时的动力学方程模型,在不考虑机器人实际对应的质量大小前提下,考虑机器人在一维直线上运动,且一个机器人与系统中的部分或全部机器人通信,通信拓扑图可以用一个无向连通图来表示,设机器人具有如下双积分器动力学方程:
其中分别表示
机器人们的状态向量,输入向量和输出向量,对于第个机器人可以分别代表
其位置,速度,控制输入和输出。需要设计一个一致性控制方法,来求得所有机器人的控制
输入,并使得最终每个机器人的位置达到一致,即对任意的两个机器人有。
进一步的,考虑二维平面上和三维空间中的机器人运动,可以分别计算各坐标轴方向对应的控制输入值,然后合成为一个方向的控制输入值,最终让每个机器人的位置达到一致。
作为一种可选的实施方式,在某些实施例中,所述步骤2中设计带输入约束的分布式一致性控制律来求得所有机器人的控制输入,一致性控制律具体如下:
借助如下积分型性能指标
其中是多智能体系统对应拓扑图的拉普拉斯矩阵,称为预测间隔,得到如下优
化问题
其中是一个关于输入的闭合凸集合,约定了输入的上下界。通过泰勒展开
代入上述优化问题,经过简化及省略与输入无关的部分,得到剩余
借助如下投影神经网络:
其中为被优化函数的梯度,λ是用于缩放投影神经网络收敛性的参数,且
将控制输入带入神经网络便得到了带输入约束的一致性控制律:
更进一步,具体到每个机器人的一致性控制律如下
其中表示机器人的邻居节点集合。
作为一种可选的实施方式,在某些实施例中,所述步骤3基于步骤2中的一致性控制律,通过显式欧拉法将得到的一致性控制律(1)进行离散化得到
其中, 是迭代次数,是步长,是机器人和机器人第次迭代时的耦
合权值,指机器人相互通信的邻居节点集合。从离散态一致性控制律(2)中可见,机
器人更新控制输入时需要和其邻居节点交换状态值,这引起隐私泄露的担忧,
结合Paillier同态加密算法,设计带隐私保护的机器人系统的一致性最优控制方法,以一
次状态交换过程为例,隐私保护方案具体如下:
步骤301、初始化:每个机器人初始化相同的系统参数,并利用Paillier
加密算法生成一个它的公钥和相应的私钥,广播公钥到其邻居们,同时保持
私钥私有。
步骤302、迭代:
().在第k次迭代中,每个机器人首先使用其公钥加密状态值:
,
然后发送到每个邻居机器人。(由于本质都是表示机器人的状态值,且都应该保证不泄露,故接下来仅具体
表明对的操作,但这些操作步骤应同时对实施。)
(2).每个邻居使用机器人的公钥加密:
(3).机器人生成随机数,每个邻居生成随机数。
(4).基于Paillier加密算法的加法同态性质,每个邻居按下式计算加密
后的状态差:
然后发送以上状态差至机器人。
(5).机器人使用私钥解密收到的状态差值密文,便得到了用于更新自身状
态值的状态差值(同理):
,
。
作为一种可选的实施方式,在某些实施例中,所述步骤4在机器人上应用步骤3中的带隐私保护的一致性最优控制方法,将得到的控制输入施加到机器人上,令所有机器人最终在位置,速度上保持一致,同时保证私有信息不泄露。
参见图2,基于同一发明构思,本发明实施例还提供一种带隐私保护的一致性最优控制的机器人系统,所述机器人系统的每个机器人均设有:第一处理单元、第二处理单元、第三处理单元和输出单元,其中,第一处理单元用于建立所述机器人系统中所有机器人在运动时的动力学方程模型;第二处理单元用于在所述动力学方程模型中结合带输入约束的分布式一致性控制律,以获得所有机器人的控制输入;第三处理单元用于在所述动力学方程模型中结合Paillier同态加密算法;输出单元用于将带Paillier同态加密算法的所述动力学方程模型应用到所述机器人系统中所有机器人上,进而使得所有机器人保持运动时位置和速度上保持一致。
作为一种可选的实施方式,第一处理单元用于处理以下过程数据:建立机器人运动时的动力学方程模型,在不考虑机器人实际对应的质量大小前提下,考虑机器人在一维直线上运动,且一个机器人与系统中的部分或全部机器人通信,通信拓扑图可以用一个无向连通图来表示,设机器人具有如下双积分器动力学方程:
其中分别表示
机器人们的状态向量,输入向量和输出向量,对于第个机器人可以分别代表
其位置,速度,控制输入和输出。需要设计一个一致性控制方法,来求得所有机器人的控制
输入,并使得最终每个机器人的位置达到一致,即对任意的两个机器人有。
进一步的,考虑二维平面上和三维空间中的机器人运动,可以分别计算各坐标轴方向对应的控制输入值,然后合成为一个方向的控制输入值,最终让每个机器人的位置达到一致。
作为一种可选的实施方式,第二处理单元用于处理以下过程数据:设计带输入约束的分布式一致性控制律来求得所有机器人的控制输入,一致性控制律具体如下:
借助如下积分型性能指标
其中是多智能体系统对应拓扑图的拉普拉斯矩阵,称为预测间隔,得到如下优
化问题
其中是一个关于输入的闭合凸集合,约定了输入的上下界。通过泰勒展开
代入上述优化问题,经过简化及省略与输入无关的部分,得到剩余
借助如下投影神经网络:
其中为被优化函数的梯度,λ是用于缩放投影神经网络收敛性的参数,且
将控制输入带入神经网络便得到了带输入约束的一致性控制律:
更进一步,具体到每个机器人的一致性控制律如下
其中表示机器人的邻居节点集合。
作为一种可选的实施方式,在第三处理单元用于处理以下过程数据:基于第二处理单元的一致性控制律,通过显式欧拉法将得到的一致性控制律(1)进行离散化得到
其中, 是迭代次数,是步长,是机器人和机器人第次迭代时的耦合
权值,指机器人相互通信的邻居节点集合。从离散态一致性控制律(2)中可见,机器
人更新控制输入时需要和其邻居节点交换状态值,这引起隐私泄露的担忧,结
合Paillier同态加密算法,设计带隐私保护的机器人系统的一致性最优控制方法,以一次
状态交换过程为例,隐私保护方案具体如下:
步骤301、初始化:每个机器人初始化相同的系统参数,并利用Paillier
加密算法生成一个它的公钥和相应的私钥,广播公钥到其邻居们,同时保持私
钥私有。
步骤302、迭代:
().在第k次迭代中,每个机器人首先使用其公钥加密状态值:
,
然后发送到每个邻居机器人。(由于本质都是表示机器人的状态值,且都应该保证不泄露,故接下来仅具
体表明对的操作,但这些操作步骤应同时对实施。)
(2).每个邻居使用机器人的公钥加密:
。
(3).机器人生成随机数,每个邻居生成随机数。
(4).基于Paillier加密算法的加法同态性质,每个邻居按下式计算加密
后的状态差:
,
然后发送以上状态差至机器人。
(5).机器人使用私钥解密收到的状态差值密文,便得到了用于更新自身状
态值的状态差值(同理):
,
。
作为一种可选的实施方式,输出单元用于处理以下过程数据:输出单元在机器人上应用第三处理单元中的带隐私保护的一致性最优控制方法,将得到的控制输入施加到机器人上,令所有机器人最终在位置,速度上保持一致,同时保证私有信息不泄露。
由于该系统是本发明实施例的带隐私保护的一致性最优控制方法对应的系统,并且该系统解决问题的原理与该方法相似,因此该系统的实施可以参见上述方法实施例的实施过程,重复之处不再赘述。
参见图3,基于同一发明构思,本发明实施例还提供一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行,以实现如上所述的带隐私保护的一致性最优控制方法。
可以理解的是,存储器可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选地,该存储器包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器可用于存储指令、程序、代码、代码集或指令集。存储器可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令、用于实现上述各个方法实施例的指令等;存储数据区可存储根据服务器的使用所创建的数据等。
处理器可以包括一个或者多个处理核心。处理器利用各种接口和线路连接整个服务器内的各个部分,通过运行或执行存储在存储器内的指令、程序、代码集或指令集,以及调用存储在存储器内的数据,执行服务器的各种功能和处理数据。可选地,处理器可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器可集成中央处理器(Central Processing Unit,CPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统和应用程序等;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器中,单独通过一块芯片进行实现。
由于该电子设备是本发明实施例的带隐私保护的一致性最优控制方法对应的电子设备,并且该电子设备解决问题的原理与该方法相似,因此该电子设备的实施可以参见上述方法实施例的实施过程,重复之处不再赘述。
基于同一发明构思,本发明实施例还提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上所述的带隐私保护的一致性最优控制方法。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
由于该存储介质是本发明实施例的带隐私保护的一致性最优控制方法对应的存储介质,并且该存储介质解决问题的原理与该方法相似,因此该存储介质的实施可以参见上述方法实施例的实施过程,重复之处不再赘述。
在一些可能的实施方式中,本发明实施例的方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的带隐私保护的一致性最优控制方法的步骤。其中,用于执行各个实施例的可执行的计算机程序代码或“ 代码”可以用诸如C、C++、C#、Smalltalk、Java、JavaScript、Visual Basic、结构化查询语言(例如,Transact-SQL)、Perl之类的高级编程语言或者用各种其它编程语言编写。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
上述实施例只是为了说明本发明的技术构思及特点,其目的是在于让本领域内的普通技术人员能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡是根据本发明内容的实质所做出的等效的变化或修饰,都应涵盖在本发明的保护范围内。
Claims (4)
1.一种带隐私保护的一致性最优控制方法,应用于机器人系统,其特征在于,包括如下步骤:
建立所述机器人系统中所有机器人在运动时的动力学方程模型;
在所述动力学方程模型中结合带输入约束的分布式一致性控制律,以获得所有机器人的控制输入;
在所述动力学方程模型中结合Paillier同态加密算法;
将带Paillier同态加密算法的所述动力学方程模型应用到所述机器人系统中所有机器人上,进而使得所有机器人保持运动时位置和速度上保持一致;
所述动力学方程模型具体为:
设无关质量因素的机器人在一维直线上运动,且每个机器人与系统中的部分或全部机器人通信,利用机器人的位置,速度,控制输入和控制输出建立机器人的双积分器动力学方程,具体的,
设机器人具有如下双积分器动力学方程:
其中x=[x1,x2…xn]T,v=[v1,v2…vn]T表示各个机器人们的状态向量,u=[u1,u2…un]T,y=[y1,y2…yn]T分别表示各个机器人的状态向量输入向量和输出向量,对于第i个机器人xi,vi,ui,yi分别代表其位置,速度,控制输入和控制输出;
设无关质量因素的机器人在二维平面上和三维空间上运动,且每个机器人与系统中的部分或全部机器人通信,利用机器人的位置,速度,控制输入和控制输出建立机器人的双积分器动力学方程,具体的,先分别计算各二维、三维坐标轴方向对应的控制输入值,然后矢量合成为一个方向的控制输入值,最终让每个机器人的位置达到一致;
所述带输入约束的分布式一致性控制律,具体为:
借助如下积分型性能指标
其中L是多智能体系统对应拓扑图的拉普拉斯矩阵,T称为预测间隔,得到如下优化问题
min Jd(t)
y=x
u∈Ω
其中Ω是一个关于输入的闭合凸集合,约定了输入的上下界,通过泰勒展开
代入上述优化问题,经过简化及省略与输入u无关的部分,得到剩余
借助如下投影神经网络:
其中F(·)为被优化函数的梯度,λ是用于缩放投影神经网络收敛性的参数,且
将控制输入带入神经网络便得到了带输入约束的一致性控制律:
具体到每个机器人的一致性控制律如下:
其中N(i)表示机器人i的邻居节点集合;
所述动力学方程模型中结合Paillier同态加密算法,具体为:
通过显式欧拉法将得到的所述一致性控制律进行离散化,从而得到离散态一致性控制律,离散态一致性控制律如下式;
其中,k是迭代次数,τ是步长,是机器人i和机器人j第k次迭代时的耦合权值,N(i)指机器人i的邻居节点集合;
初始化:每个机器人i初始化相同的系统参数τ,λ,T,并利用Paillier加密算法生成一个它的公钥pki和相应的私钥ski,广播公钥到其邻居节点集合N(i),同时保持私钥私有;
迭代:在第k次迭代中,每个机器人i首先使用其公钥pki加密状态值:
xi(k)→εi(xi(k))
vi(k)→εi(vi(k))
ui(k)→εi(ui(k)),
然后发送εi(xi(k)),εi(vi(k)),εi(ui(k))到每个邻居机器人j∈N(i);
每个邻居j∈N(i)使用机器人i的公钥pki加密-xj(k):
-xj(k)→εi(-xj(k))
机器人i生成随机数每个邻居j∈N(i)生成随机数/>
基于Paillier加密算法的加法同态性质,每个邻居j∈N(i)按下式计算加密后的状态差:
εi(xi(k))·εi(-xj(k))=εi(xi(k)-xj(k)),
然后发送以上状态差至机器人i;
机器人i使用私钥ski解密收到的状态差值密文,从而得到用于更新自身状态值的状态差值
同理可获得vi(k),ui(k)。
2.一种带隐私保护的一致性最优控制的机器人系统,其特征在于,所述机器人系统的每个机器人均设有:
第一处理单元,其用于建立所述机器人系统中所有机器人在运动时的动力学方程模型;
第二处理单元,其用于在所述动力学方程模型中结合带输入约束的分布式一致性控制律,以获得所有机器人的控制输入;
第三处理单元,其用于在所述动力学方程模型中结合Paillier同态加密算法;以及,
输出单元,其用于将带Paillier同态加密算法的所述动力学方程模型应用到所述机器人系统中所有机器人上,进而使得所有机器人保持运动时位置和速度上保持一致;
所述动力学方程模型具体为:
设无关质量因素的机器人在一维直线上运动,且每个机器人与系统中的部分或全部机器人通信,利用机器人的位置,速度,控制输入和控制输出建立机器人的双积分器动力学方程,具体的,
设机器人具有如下双积分器动力学方程:
其中x=[x1,x2…xn]T,v=[v1,v2…vn]T表示各个机器人们的状态向量,u=[u1,u2…un]T,y=[y1,y2…yn]T分别表示各个机器人的状态向量输入向量和输出向量,对于第i个机器人xi,vi,ui,yi分别代表其位置,速度,控制输入和控制输出;
设无关质量因素的机器人在二维平面上和三维空间上运动,且每个机器人与系统中的部分或全部机器人通信,利用机器人的位置,速度,控制输入和控制输出建立机器人的双积分器动力学方程,具体的,先分别计算各二维、三维坐标轴方向对应的控制输入值,然后矢量合成为一个方向的控制输入值,最终让每个机器人的位置达到一致;
所述带输入约束的分布式一致性控制律,具体为:
借助如下积分型性能指标
其中L是多智能体系统对应拓扑图的拉普拉斯矩阵,T称为预测间隔,得到如下优化问题
min Jd(t)
y=x
u∈Ω
其中Ω是一个关于输入的闭合凸集合,约定了输入的上下界,通过泰勒展开
代入上述优化问题,经过简化及省略与输入u无关的部分,得到剩余
借助如下投影神经网络:
其中F(·)为被优化函数的梯度,λ是用于缩放投影神经网络收敛性的参数,且
将控制输入带入神经网络便得到了带输入约束的一致性控制律:
具体到每个机器人的一致性控制律如下:
其中N(i)表示机器人i的邻居节点集合;
所述动力学方程模型中结合Paillier同态加密算法,具体为:
通过显式欧拉法将得到的所述一致性控制律进行离散化,从而得到离散态一致性控制律,离散态一致性控制律如下式;
其中,k是迭代次数,τ是步长,是机器人i和机器人j第k次迭代时的耦合权值,N(i)指机器人i的邻居节点集合;
初始化:每个机器人i初始化相同的系统参数τ,λ,T,并利用Paillier加密算法生成一个它的公钥pki和相应的私钥ski,广播公钥到其邻居节点集合N(i),同时保持私钥私有;
迭代:在第k次迭代中,每个机器人i首先使用其公钥pki加密状态值:
xi(k)→εi(xi(k))
vi(k)→εi(vi(k))
ui(k)→εi(ui(k)),
然后发送εi(xi(k)),εi(vi(k)),εi(ui(k))到每个邻居机器人j∈N(i);
每个邻居j∈N(i)使用机器人i的公钥pki加密-xj(k):
-xj(k)→εi(-xj(k))
机器人i生成随机数每个邻居j∈N(i)生成随机数/>
基于Paillier加密算法的加法同态性质,每个邻居j∈N(i)按下式计算加密后的状态差:
εi(xi(k))·εi(-xj(k))=εi(xi(k)-xj(k)),
然后发送以上状态差至机器人i;
机器人i使用私钥ski解密收到的状态差值密文,从而得到用于更新自身状态值的状态差值
同理可获得vi(k),ui(k)。
3.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行,以实现如权利要求1所述的带隐私保护的一致性最优控制方法。
4.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现权利要求1所述的带隐私保护的一致性最优控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211081802.0A CN115185189B (zh) | 2022-09-06 | 2022-09-06 | 带隐私保护的一致性最优控制方法、系统、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211081802.0A CN115185189B (zh) | 2022-09-06 | 2022-09-06 | 带隐私保护的一致性最优控制方法、系统、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115185189A CN115185189A (zh) | 2022-10-14 |
CN115185189B true CN115185189B (zh) | 2023-09-05 |
Family
ID=83524054
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211081802.0A Active CN115185189B (zh) | 2022-09-06 | 2022-09-06 | 带隐私保护的一致性最优控制方法、系统、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115185189B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108803349A (zh) * | 2018-08-13 | 2018-11-13 | 中国地质大学(武汉) | 非线性多智能体系统的最优一致性控制方法及系统 |
CN110782011A (zh) * | 2019-10-21 | 2020-02-11 | 辽宁石油化工大学 | 一种基于强化学习的网络化多智能体系统分布式优化控制方法 |
CN111781822A (zh) * | 2020-07-09 | 2020-10-16 | 重庆邮电大学 | 一种多智能体系统的隐私保护分组一致性控制方法 |
CN113312635A (zh) * | 2021-04-19 | 2021-08-27 | 浙江理工大学 | 一种基于状态隐私保护的多智能体容错一致性方法及系统 |
CN114510730A (zh) * | 2022-01-11 | 2022-05-17 | 暨南大学 | 位置隐私保护的多机器人分布式围捕方法、设备与介质 |
CN114545773A (zh) * | 2022-02-21 | 2022-05-27 | 山东新一代信息产业技术研究院有限公司 | 一种异构多智能机器人系统建模与分布式一致性控制方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10778410B2 (en) * | 2019-06-18 | 2020-09-15 | Alibaba Group Holding Limited | Homomorphic data encryption method and apparatus for implementing privacy protection |
-
2022
- 2022-09-06 CN CN202211081802.0A patent/CN115185189B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108803349A (zh) * | 2018-08-13 | 2018-11-13 | 中国地质大学(武汉) | 非线性多智能体系统的最优一致性控制方法及系统 |
CN110782011A (zh) * | 2019-10-21 | 2020-02-11 | 辽宁石油化工大学 | 一种基于强化学习的网络化多智能体系统分布式优化控制方法 |
CN111781822A (zh) * | 2020-07-09 | 2020-10-16 | 重庆邮电大学 | 一种多智能体系统的隐私保护分组一致性控制方法 |
CN113312635A (zh) * | 2021-04-19 | 2021-08-27 | 浙江理工大学 | 一种基于状态隐私保护的多智能体容错一致性方法及系统 |
CN114510730A (zh) * | 2022-01-11 | 2022-05-17 | 暨南大学 | 位置隐私保护的多机器人分布式围捕方法、设备与介质 |
CN114545773A (zh) * | 2022-02-21 | 2022-05-27 | 山东新一代信息产业技术研究院有限公司 | 一种异构多智能机器人系统建模与分布式一致性控制方法 |
Non-Patent Citations (1)
Title |
---|
Distributed Near-Optimal Consensus of Double-Integrator Multi-Agent Systems With Input Constraints;Qingyun Deng .etal;《2021 International Joint Conference on Neural Networks (IJCNN)》;20210920;第1-6页 * |
Also Published As
Publication number | Publication date |
---|---|
CN115185189A (zh) | 2022-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yuan et al. | Formation learning control of multiple autonomous underwater vehicles with heterogeneous nonlinear uncertain dynamics | |
Liu et al. | Generalized policy iteration adaptive dynamic programming for discrete-time nonlinear systems | |
Zhang et al. | Convergence and consistency analysis for a 3-D invariant-EKF SLAM | |
Marchesini et al. | Discrete deep reinforcement learning for mapless navigation | |
Vaidyanathan | Analysis, control and synchronisation of a six-term novel chaotic system with three quadratic nonlinearities | |
Sznaier et al. | Heuristically enhanced feedback control of constrained discrete-time linear systems | |
Chen et al. | Finite‐time cooperative‐tracking control for networked Euler–Lagrange systems | |
Bo et al. | A new nonlinear set membership filter based on guaranteed bounding ellipsoid algorithm | |
Ren et al. | Robust model‐free adaptive iterative learning formation for unknown heterogeneous non‐linear multi‐agent systems | |
Hao et al. | Adaptive dynamic surface control for cooperative path following of underactuated marine surface vehicles via fast learning | |
Beeching et al. | Learning to plan with uncertain topological maps | |
Gan et al. | Research on role modeling and behavior control of virtual reality animation interactive system in Internet of Things | |
Kim et al. | Informed RRT* with improved converging rate by adopting wrapping procedure | |
Zhang et al. | Distributed fixed‐time consensus tracking for high‐order uncertain non‐linear multi‐agent systems with switching topologies | |
Hu et al. | Distributed moving target fencing in a regular polygon formation | |
Yang et al. | Distributed observer‐based coordination for multiple Lagrangian systems using only position measurements | |
CN115185189B (zh) | 带隐私保护的一致性最优控制方法、系统、设备和介质 | |
Riviere et al. | Neural tree expansion for multi-robot planning in non-cooperative environments | |
Tsoulos et al. | Improving the PSO method for global optimization problems | |
Sun et al. | Prescribed performance control of constrained euler-language systems chasing unknown targets | |
Doi et al. | Exploration of finite 2d square grid by a metamorphic robotic system | |
Yang et al. | Planar affine formation stabilization via parameter estimations | |
Xi et al. | Gibbs sampler-based coordination of autonomous swarms | |
Singh et al. | Mobile robot navigation in cluttered environment using spider monkey optimization algorithm | |
Liu et al. | Reinforcement learning for robot navigation in nondeterministic environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |