CN112230618B - 一种从全局任务自动合成多机器人分布式控制器的方法 - Google Patents
一种从全局任务自动合成多机器人分布式控制器的方法 Download PDFInfo
- Publication number
- CN112230618B CN112230618B CN202011183863.9A CN202011183863A CN112230618B CN 112230618 B CN112230618 B CN 112230618B CN 202011183863 A CN202011183863 A CN 202011183863A CN 112230618 B CN112230618 B CN 112230618B
- Authority
- CN
- China
- Prior art keywords
- robot
- global
- strategy
- variables
- communication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000002194 synthesizing effect Effects 0.000 title claims abstract description 27
- 238000004891 communication Methods 0.000 claims abstract description 86
- 238000013508 migration Methods 0.000 claims abstract description 37
- 230000005012 migration Effects 0.000 claims abstract description 31
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 22
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 18
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 18
- 238000011217 control strategy Methods 0.000 claims description 30
- 230000007613 environmental effect Effects 0.000 claims description 20
- 230000014509 gene expression Effects 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 5
- 125000004432 carbon atom Chemical group C* 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 28
- 238000005516 engineering process Methods 0.000 description 7
- 238000011161 development Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 241000408659 Darpa Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 229920000915 polyvinyl chloride Polymers 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000013509 system migration Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/418—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
- G05B19/41875—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by quality surveillance of production
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/32—Operator till task planning
- G05B2219/32368—Quality control
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Manufacturing & Machinery (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Manipulator (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种从全局任务自动合成多机器人分布式控制器的方法,包括:获取合成多机器人控制器规约;提取合成多机器人控制器规约中的全局任务,并通过GR(1)综合算法合成关于全局任务的全局策略,将全局策略向每一个机器人节点的命题集合投影生成每一个机器人的局部框架;分别计算得到每一个机器人的通信命题集Ci,用通信命题集Ci补充对应局部框架迁移边上的命题得到每一个机器人的局部策略;每一个机器人根据局部策略得到可用的控制器,分别使用SAT求解器求解得到机器人的后继。本发明能够自动且高效的为机器人生成控制器和通信策略。
Description
技术领域
本发明涉及机器人控制领域,尤其涉及一种从全局任务自动合成多机器人分布式控制器的方法。
背景技术
“工业4.0”革命的高速发展,信息物理系统(Cyber-Physical Systems,CPS)领域无疑将是未来工业发展变革中尺寸必争的战略高地,尤其是无人系统,包括无人机(Unmanned Aerial Systems,UAS)和智能汽车(Smart Cars)等基于人工智能的CPS。其深度融合了环境感知、数据分析、身份验证和网络互联等技术。无人系统作为物理系统、异构网络和信息科技的高度融合体,集成了3C(Computation,Communication,Control)能力、实时感知和反馈控制等技术。无人系统具有一定自治能力和自主性的无人控制系统,它是人工智能与机器人技术以及实时控制决策系统的结合产物。其研究成果应用于农业、工业、医疗和军事各个领域,原因是无人系统能广泛替代人类于各种恶劣的、动态的环境下独立完成布置的任务,而不需要或者需要极少操控人员的控制,大大提高人类的感知范围,扩充人类的行为能力。机器人作为无人系统的重要元素,它的发展经历了三个阶段:从可编程、示教再现型机器人到具有视觉、听觉、触觉,具有一定适应能力的机器人,再到配备多种先进传感器,具有自适应、自学习功能的智能机器人。随着机器人相关技术的发展,机器人实现的功能越来越多,具有的能力也越来越大。但同时对机器人具有的能力进行开发和运用也是越来越难了。另外,单个机器人在信息获取、处理和控制等方面的能力都是有限的,对于重量大、复杂性大的任务和多变的工作环境,仅仅依靠单个机器人一般无法实现。于是,人们开始考虑用多机器人系统(Multi-robot System,MRS)来代替单个机器人。
多机器人系统往往面临的是复杂而多变的任务需求以及恶劣与不确定的外部环境,安全地控制多机器人系统在外部环境下完成任务是严峻而又急迫的研究内容。在传统方法上,设计者手工设计任务规划方案和运动规划方案,接着手工编写代码将设计者所设计的控制器实现并且部署到多机器人系统上对系统进行控制,这个流程是繁琐且非常容易出错的过程。所设计的控制器难以保证能够控制器无人系统安全地完成给定任务。在过去的几十年中,通过运动规划器和学习算法的发展,机器人控制诸如障碍物运动或抓紧物体等任务的技术水平已取得了显着进步。但是,让机器人执行诸如完成DARPA机器人挑战赛之类的复杂任务在很大程度上仍然是由一组训练有素的程序员手动完成的,这些程序员手动将不同的系统组件组合在一起。该手动过程非常耗时,容易出错,并且通常仅通过大量测试进行验证。
近年来,形式化方法综合理论和技术都有了很多突破。基于形式化方法的自动控制器合成技术也受到很多研究者的深入研究。形式化方法中模型验证是一项重要的理论,设计者将已有的系统控制行为抽象为模型,然后针对系统应当满足的性质用时序逻辑规约刻画。通过模型验证的方式验证该模型是否满足给定的规约。不同于模型验证,形式化综合是自动地构造控制策略,算法保证若系统控制器遵循该策略,那么无论环境如何变化,系统总是能够满足给定的规约,而不需要进行模型验证,综合生成的策略就可作为系统的高层控制行为。进一步将高层控制行为转换为系统控制代码,即自动地生成系统控制程序。机器人技术的形式综合提供了一种框架,该框架可以用数学上精确的语言指定复杂的机器人任务,并在可行的情况下自动将这些规范转换为按构造正确的机器人控制器。这种方法允许用户推理任务规范而不是实际实现,减少实现错误并为整体机器人行为提供保证。此外,对任务的形式描述使得能够提供有关规范本身的反馈,例如它们是否可以由物理机器人在可能未知的环境中实现。
一般来说,时序逻辑规约由命题、标准布尔运算和一些时序算子组成。从计算机程序到机器人运动控制,它们已经在多个领域用于表示系统的属性和要求。有几种不同的时序逻辑,例如计算树逻辑(CTL)、CTL*、实时时间逻辑和线性时序逻辑(Linear TemporalLogic,LTL),线性时序逻辑作为一种广泛用于描述反应式系统属性的形式规约,它可以很容易地刻画复杂的机器人行为。
在形式综合领域,Pnueli等人第一次将综合引入到用线性时序逻辑刻画的反应式模块。反应式的综合可以看作一场关于系统和环境的二人博弈,我们总是希望系统能够赢得环境,若赢得环境,算法就可给出赢的策略作为系统的高层控制行为。但是由于综合的复杂度达到了公式长度的双指数级别,使得综合难以运用到实际软件工程中。Nir Piterman等人提出了求解GR(1)的博弈综合的具体算法,GR(1)(Generalized-Streett with Rank(1))作为LTL的子集得到了研究人员的重点研究,因为用GR(1)刻画的性质可以用博弈结构上的μ演算在多项式时间合成系统策略。并且GR(1)公式格式简单,易于理解和书写。这使得GR(1)的综合在机器人领域开始了许多运用场景。
发明内容
本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种从全局任务自动合成多机器人分布式控制器的方法,能够自动且高效的为机器人生成控制器和通信策略。
为解决上述技术问题,本发明提出的技术方案为:
一种从全局任务自动合成多机器人分布式控制器的方法,包括以下步骤:
S1)获取合成多机器人控制器规约,所述合成多机器人控制器规约包括建模为机器人节点集合的多机器人模型以及由GR(1)规约刻画的全局任务;
S2)提取合成多机器人控制器规约中的全局任务,通过GR(1)综合算法合成关于全局任务的全局策略AG,根据每一个机器人节点中预设的传感器命题集Ii和预设的执行器命题集Oi生成命题集合<Ii,Oi>,将全局策略AG向每一个机器人节点的命题集合<Ii,Oi>投影生成每一个机器人的局部框架
S4)每一个机器人根据局部策略Ai得到可用的控制器,根据所有机器人的命题集合和多机器人模型生成通信策略M,根据通信策略M的强连通分量将所有机器人分组,从底部向上对每一个强联通分量中的机器人分别使用SAT求解器求解得到所有机器人的后继。
进一步的,步骤S1)中全局任务为根据GR(1)博弈结构综合得到的规约,函数表达式为:
进一步的,步骤S2)中通过GR(1)综合算法合成关于全局任务的全局策略具体包括:通过JTLV工具对全局任务求解GR(1)的博弈综合得到关于全局任务的全局策略AG。
上式中,i为机器人序号,为机器人i的环境控制器的传感器变量以及网络通讯变量的集合,为机器人i的系统控制的执行器变量的集合,是机器人i的初始状态,是机器人i的控制策略的状态集合,是的迁移函数,Ii为机器人i对应的机器人节点中预设的传感器命题集,Oi为机器人i对应的机器人节点中预设的执行器命题集,iniG为全局策略AG中的初始状态,SG为全局策略AG中所有机器人控制策略的状态集合,ρG是全局策略AG中的迁移函数,其中XG为全局策略AG中环境控制器的传感器变量以及网络通讯变量的集合,s为属于全局策略AG中所有机器人控制策略的状态集合SG以及迁移函数ρG的状态,sx为属于全局策略AG中迁移函数ρG的迁移边,t为s经过sx到达的状态。
进一步的,步骤S3)具体包括:针对机器人i的局部框架指定test函数和导致失败的集合F,通过Ddmin算法找到通信变量集,将通信变量集作为机器人i节点的通信命题集Ci,用局部框架向命题集合投影得到机器人i的局部策略Ai,函数表达式为:
进一步的,导致失败的集合F的函数表达式为:
进一步的,通过Ddmin算法找到通信变量集具体包括以下步骤:
S31)从集合F中选取一个子集F`;
进一步的,步骤S4)中使用SAT求解器求解得到机器人的后继具体步骤包括:
S41)对于当前强连通分量,当前环境输入为e,输入当前强连通分量中每一个机器人当前状态的所有后继集合S′i,S′i的函数表达式为:
上式中,i为机器人序号,si为机器人i的当前状态,e′i为机器人i的环境输入,s′i为下一个时刻状态,ρi是机器人i的局部策略Ai中的迁移函数,其中Si为机器人i的局部策略Ai中控制策略的状态集合,Xi为机器人i的局部策略Ai中环境控制器的传感器变量以及网络通讯变量的集合;
上式中,i为机器人序号,e为当前环境输入,Li为机器人i的局部策略Ai中的状态标签函数,其中Si为机器人i的局部策略Ai中控制策略的状态集合,Yi为机器人i的局部策略Ai中系统控制的执行器变量集合,s′ij为集合S′i中的元素。
与现有技术相比,本发明的优点在于:
(1)本发明中合成多机器人控制器规约包括建模为机器人节点集合的多机器人模型以及由GR(1)规约刻画的全局任务,相比于目前刻画多机器人这样的大规模性质规约,本发明中合成多机器人控制器规约更为简洁,解决了多机器人的规约书写问题;
(2)本发明针对多机器人系统中的每个机器人分布生成各自对应的控制器,相比于目前几乎都是面向单个机器人系统的已有规约语言和策略综合,本发明实现了机器人协同配合完成任务的需要;
(3)本发明通过计算生成通信策略,而不需要手工指定通信变量集合,自动地帮助设计者确定机器人之间交流的信息;
(4)本发明基于通信策略对机器人分组计算所有机器人的后继,减小了求解的规模,提高了计算效率。
附图说明
图1为本发明实施例的执行步骤流程图。
图2为本发明实施例的具体流程示意图。
图3为本发明实施例中根据通信策略的强联通分量对机器人分组的示意图。
具体实施方式
以下结合说明书附图和具体优选的实施例对本发明作进一步描述,但并不因此而限制本发明的保护范围。
如图1所示,本发明的从全局任务自动合成多机器人分布式控制器的方法包括以下步骤:
S1)获取合成多机器人控制器规约,所述合成多机器人控制器规约包括建模为机器人节点集合的多机器人模型以及由GR(1)规约刻画的全局任务;
S2)提取合成多机器人控制器规约中的全局任务,通过GR(1)综合算法合成关于全局任务的全局策略AG,根据每一个机器人节点中预设的传感器命题集Ii和预设的执行器命题集Oi生成命题集合<Ii,Oi>,将全局策略AG向每一个机器人节点的命题集合<Ii,Oi>投影生成每一个机器人的局部框架
S4)每一个机器人根据局部策略Ai得到可用的控制器,根据所有机器人的命题集合和多机器人模型生成通信策略M,根据通信策略M的强连通分量将所有机器人分组,从底部向上对每一个强联通分量中的机器人分别使用SAT求解器求解得到所有机器人的后继。
本实施例中为了自动化地合成多机器人分布式控制器,首先给定一份合成多机器人分布式控制器(Synthesizing Multi-robot Controllers,后文中简称为SynMRC控制器)规约,SynMRC控制器规约包括一份多机器人系统的全局任务(Global tasks)以及多机器人模型(MRS model),一份SynMRC控制器规约如下:
本实施例中,多机器人模型Δ建模为机器人节点Ni的集合,即Δ={Ni},其中一个机器人i对应的机器人节点Ni建模为由三个变量集合组成的结构,即Ni=<Ii,Oi,Ci>,其中:
Ii为传感器命题集(sensors),传感器命题是由机器人通过其传感器感知到的外部环境变量,也就是传感器命题是由环境控制的命题,比如外部的温度当高于某一个阈值的时候,传感器的值置为真;
Oi为执行器命题集(actuators),执行器命题是由机器人自身存在的执行器所控制的命题,比如机器人能够打开摄像头,关闭摄像头等;
Ci为通信命题集(communications),机器人之间为了能够合作完成任务,通信是难以避免的,机器人的通信命题就是机器人需要其他机器人告诉它的命题,本实施例中不需要设计者手工地指定通信变量集合,而是通过后续计算得到通信命题集。
本实施例中,所有的控制策略都是以迁移系统来呈现,形式定义如下:
A=<X,Y,S,ini,ρ,L> (2)
上式中,X是环境控制器的传感器变量以及网络通讯变量集合,Y是系统控制的执行器变量集合,S是控制策略的状态集合,ini是初始状态,ρ是S×2X→S的迁移函数,L是S→2Y的状态标签函数。
根据式(2)得到全局策略AG的函数表达式如下:
AG=<XG,YG,SG,iniG,ρG,LG> (3)
上式中,XG是所有机器人环境控制器的传感器变量以及网络通讯变量集合,YG是所有机器人系统控制的执行器变量集合,SG是所有机器人控制策略的状态集合,iniG是初始状态,ρG是的迁移函数,LG是的状态标签函数。
全局策略AG融合了所有机器人的命题,是一份控制所有机器人的集中式控制器,为了获得分布式的控制器,本实施例中,对于每一个机器人i对应的机器人节点Ni,通过将全局策略AG向每一个机器人节点的命题集合<Ii,Oi>做投影的方式为每一个机器人生成对应的局部框架函数表达式为:
上式中,AG为全局策略,Ii为机器人i的传感器命题集,Oi为机器人i的执行器命题集。
上式中,i为机器人序号,为机器人i的环境控制器的传感器变量以及网络通讯变量的集合,为机器人i的系统控制的执行器变量的集合,是机器人i的初始状态,是机器人i的控制策略的状态集合,是的迁移函数,Ii为机器人i对应的机器人节点中预设的传感器命题集,Oi为机器人i对应的机器人节点中预设的执行器命题集,iniG为全局策略AG中的初始状态,SG为全局策略AG中所有机器人控制策略的状态集合,ρG是全局策略AG中的迁移函数,其中XG为全局策略AG中环境控制器的传感器变量以及网络通讯变量的集合,s为属于全局策略AG中所有机器人控制策略的状态集合SG以及迁移函数ρG的状态,sx为属于全局策略AG中迁移函数ρG的迁移边,t为s经过sx到达的状态。
式(6)中,表示在状态s中移除不属于执行器命题集Oi的标签所形成的新的状态,表示迁移边上输入的命题集合中移除不属于传感器命题集Ii的变量所构成的新的迁移边输入,表示在s经过sx到达的状态中移除不属于执行器命题集Oi的标签所形成的新的状态。
经过式(4)至式(6)所得到的机器人i的局部框架由于为全局策略AG投影得到的结果,仅包含关于机器人i的命题,导致迁移边上的信息不足以区分不融洽的后继,使得局部框架不可用,即根据当前的环境输入不能确定当前某些系统执行器命题的指派,从而使得机器人i获得当前的环境输入不能确定怎么执行下一步。例如全局策略AG有两条迁移边其中e2不属于Ii,所以向命题集合<Ii,Oi>做投影后得到局部框架的两条迁移边(si,{e1},sj1)∧(si,{e1},sj2)。所以si输入e1后可以有后继sj1和sj2,若则局部框架不可用,因此需要对于局部框架进行完善。
如图2所示,得到每一个机器人i的局部框架后需要对于每一个机器人i的局部框架完善为可用的控制策略,得到能够根据环境输入来确定下一步应该怎么执行的控制器。即本实施例的步骤S3)的具体内容,为了达到该目的,局部框架需要更多额外的通信变量来补充迁移边上的命题。补充了足够的信息就可以使得机器人i的控制器能够根据外部环境输入和来自其他机器人的通信变量辅助来确定下一步应该怎么执行,步骤S3)具体包括:针对机器人i的局部框架指定test函数和导致失败的集合F,通过Ddmin算法找到通信变量集,Ddmin算法是经典的寻找程序极小BUG核心的算法,该算法是一个分治算法,能够帮助设计者自动找到极小的通信变量集,将通信变量集作为机器人i对应的机器人节点的通信命题集Ci,用局部框架向命题集合投影得到机器人i的局部策略Ai,函数表达式为:
根据式(2)得到局部策略Ai的函数表达式如下:
Ai=<Xi,Yi,Si,inii,ρi,Li> (8)
上式中,i为机器人序号,Xi是机器人i环境控制器的传感器变量以及网络通讯变量集合,Yi是机器人i系统控制的执行器变量集合,Si是机器人i控制策略的状态集合,inii是初始状态,ρi是的迁移函数,Li是的状态标签函数。
上式中,i为机器人序号,Xi为机器人i的环境控制器的传感器变量以及网络通讯变量的集合,Yi为机器人i的系统控制的执行器变量的集合,inii是机器人i的初始状态,Si是机器人i的控制策略的状态集合,ρi是的迁移函数,Ci为机器人i对应的机器人节点的通信命题集,为局部框架中环境控制器的传感器变量以及网络通讯变量的集合,为局部框架中系统控制的执行器变量集合,为局部框架中的初始状态,为局部框架中机器人i控制策略的状态集合,是局部框架中的迁移函数,s′为属于局部框架中机器人i控制策略的状态集合以及迁移函数的状态,s′x为属于局部框架中迁移函数的迁移边,t′为s′经过s′x到达的状态。
式(9)中,表示在状态s′中移除不属于局部框架中系统控制的执行器变量集合的标签所形成的新的状态,表示迁移边上输入的命题集合中移除不属于机器人i对应的机器人节点的通信命题集Ci以及局部框架中环境控制器的传感器变量以及网络通讯变量的集合的变量所构成的新的迁移边输入,表示在状态s′经过s′x到达的状态中移除不属于局部框架中系统控制的执行器变量集合的标签所形成的新的状态。
本实施例中导致失败的集合F的函数表达式为:
本实施例中通过Ddmin算法找到通信变量集具体包括以下步骤:
S31)从集合F中选取一个子集F`;
根据通信命题集Ci中的通信变量,机器人i可以询问通信变量的拥有者关于该变量的信息来辅助其确定下一步的执行,所以通信命题集Ci确定了一个多机器人之间的通信策略,即如图2所示,由每一个机器人i的局部框架完善的结果还可以得到通信策略,本实施例中通信策略M以迁移系统来呈现,形式定义如下:
M=<Σ,Δ,T> (10)
上式中,Σ为多机器人系统中所有机器人的命题的集合,Δ为多机器人模型,T为Δ×Σ→Δ的迁移关系,通信策略M的迁移边(i,σ,j)表示机器人i需要询问机器人j关于σ的信息。
局部策略Ai包含的命题包括关于机器人i和与机器人i交流的其他机器人的命题,至此得到分布式的控制每一个机器人的可用控制器,如图2所示,为了让机器人能够配合起来完成全局任务,也为了避免机器人之间相互通讯询问信息导致死锁,需要对环境输入进行同步迁移。
本实施例的步骤S4)即为对环境输入进行同步迁移的步骤,首先将机器人分组以减小后期计算量,本实施例中根据通信策略M的强连通分量(Strongly connectedcomponent,后文中简称为SCC)将多机器人系统中的机器人分成多个小组,如图3所示,针对多机器人系统中的机器人A到机器人I,根据步骤S1)至步骤S3)的过程得到每个机器人的通信命题集并确定通信策略,根据通信策略的SCC将机器人A和机器人B分成一组、将机器人C至机器人F分成一组、将机器人G至机器人I分成一组。
在同一个SCC中的机器人需要使用SAT求解器求解后继,对不在同一个SCC内的机器人i和机器人j,若二者有通信联系,由于它们不属于同一个SCC,通信只会是单向的,通信策略M的迁移边(i,σ,j)表示机器人i需要询问机器人j关于σ的信息,由于它们不属于同一个SCC,机器人j直接向机器人i发送σ的值即可。
对于同一个SCC中的机器人需要使用SAT求解器求解后继,本实施例中按照从底部向上的顺序从底部SCC开始依次对每个SCC使用sat求解器求解得到机器人的后继,使用sat求解器求解得到机器人的后继具体步骤包括:
S41)对于当前强连通分量,当前环境输入为e,输入当前强连通分量中每一个机器人当前状态的所有后继集合S′i,S′i的函数表达式为:
上式中,i为机器人序号,si为机器人i的当前状态,e′i为机器人i的环境输入,s′i为下一个时刻状态,ρi是机器人i的局部策略Ai中的迁移函数,其中Si为机器人i的局部策略Ai中控制策略的状态集合,Xi为机器人i的局部策略Ai中环境控制器的传感器变量以及网络通讯变量的集合;
上式中,i为机器人序号,e为当前环境输入,Li为机器人i的局部策略Ai中的状态标签函数,其中Si为机器人i的局部策略Ai中控制策略的状态集合,Yi为机器人i的局部策略Ai中系统控制的执行器变量集合,s′ij为集合S′i中的元素。
通过步骤S4)每一个机器人都能根据当前环境输入获得确定的后继,从而让机器人能够配合起来完成全局任务,也避免了机器人之间相互通讯询问信息导致死锁。
我们对多机器人系统按照步骤S1)至步骤S4)进行试验,试验数据如下表所示,第一列是多机器人系统所包含的所有命题;第二列是使用GR(1)算法综合全局策略AG的时间花费;第三列是从全局策略AG生成局部策略Ai的时间花费;第四列是全局策略AG的状态空间;第五列是每一个机器人局部策略Ai的状态空间;第六列是全局策略AG的输入命题数;第七列是每一个机器人局部策略Ai的输入命题数。
表1
随着命题数目的增加,综合时间不断上升。总体上讲使用GR(1)算法综合全局策略AG的时间是最主要的时间开销,综合局部策略Ai的时间开销相比较短。从状态空间上来讲,局部策略Ai的状态空间相比于全局策略AG的状态空间小得多。相比于全局策略AG的命题输入数目,局部策略Ai的输入命题数目也会更小。较小的命题输入数目意味着更少的通信量,从而提高了多机器人系统的工作效率。
上述只是本发明的较佳实施例,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。因此,凡是未脱离本发明技术方案的内容,依据本发明技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均应落在本发明技术方案保护的范围内。
Claims (8)
1.一种从全局任务自动合成多机器人分布式控制器的方法,其特征在于,包括以下步骤:
S1)获取合成多机器人控制器规约,所述合成多机器人控制器规约包括建模为机器人节点集合的多机器人模型以及由GR(1)规约刻画的全局任务;
S2)提取合成多机器人控制器规约中的全局任务,通过GR(1)综合算法合成关于全局任务的全局策略AG,根据每一个机器人节点中预设的传感器命题集Ii和预设的执行器命题集Oi生成命题集合<Ii,Oi>,将全局策略AG向每一个机器人节点的命题集合<Ii,Oi>投影生成每一个机器人的局部框架
S4)每一个机器人根据局部策略Ai得到可用的控制器,根据所有机器人的命题集合和多机器人模型生成通信策略M,根据通信策略M的强连通分量将所有机器人分组,从底部向上对每一个强联通分量中的机器人分别使用SAT求解器求解得到所有机器人的后继。
3.根据权利要求1所述的从全局任务自动合成多机器人分布式控制器的方法,其特征在于,步骤S2)中通过GR(1)综合算法合成关于全局任务的全局策略具体包括:通过JTLV工具对全局任务求解GR(1)的博弈综合得到关于全局任务的全局策略AG。
上式中,i为机器人序号,为机器人i的环境控制器的传感器变量以及网络通讯变量的集合,Yi P为机器人i的系统控制的执行器变量的集合,是机器人i的初始状态,是机器人i的控制策略的状态集合,是的迁移函数,Ii为机器人i对应的机器人节点中预设的传感器命题集,Oi为机器人i对应的机器人节点中预设的执行器命题集,iniG为全局策略AG中的初始状态,SG为全局策略AG中所有机器人控制策略的状态集合,ρG是全局策略AG中的迁移函数,其中XG为全局策略AG中环境控制器的传感器变量以及网络通讯变量的集合,s为属于全局策略AG中所有机器人控制策略的状态集合SG以及迁移函数ρG的状态,sx为属于全局策略AG中迁移函数ρG的迁移边t为s经过sx到达的状态。
8.根据权利要求1所述的从全局任务自动合成多机器人分布式控制器的方法,其特征在于,步骤S4)中使用SAT求解器求解得到机器人的后继具体步骤包括:
S41)对于当前强连通分量,当前环境输入为e,输入当前强连通分量中每一个机器人当前状态的所有后继集合S′i,S′i的函数表达式为:
上式中,i为机器人序号,si为机器人i的当前状态,e′i为机器人i的环境输入,s′i为下一个时刻状态,ρi是机器人i的局部策略Ai中的迁移函数,其中Si为机器人i的局部策略Ai中控制策略的状态集合,Xi为机器人i的局部策略Ai中环境控制器的传感器变量以及网络通讯变量的集合;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011183863.9A CN112230618B (zh) | 2020-10-29 | 2020-10-29 | 一种从全局任务自动合成多机器人分布式控制器的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011183863.9A CN112230618B (zh) | 2020-10-29 | 2020-10-29 | 一种从全局任务自动合成多机器人分布式控制器的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112230618A CN112230618A (zh) | 2021-01-15 |
CN112230618B true CN112230618B (zh) | 2021-10-15 |
Family
ID=74121858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011183863.9A Active CN112230618B (zh) | 2020-10-29 | 2020-10-29 | 一种从全局任务自动合成多机器人分布式控制器的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112230618B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114721839B (zh) * | 2022-06-09 | 2022-09-06 | 中国人民解放军国防科技大学 | 机器人群体任务分配死锁异常数据检测与优化方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102708228A (zh) * | 2012-04-20 | 2012-10-03 | 西安电子科技大学 | Tmsvl实时系统建模方法 |
CN104527944A (zh) * | 2014-11-17 | 2015-04-22 | 哈尔滨工程大学 | 一种基于综合减摇混沌系统的pid控制器优化控制方法 |
JP2015090708A (ja) * | 2013-11-06 | 2015-05-11 | 株式会社日立製作所 | 無線車両制御システム |
CN105095918A (zh) * | 2015-09-07 | 2015-11-25 | 上海交通大学 | 一种多机器人系统故障诊断方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2256019B1 (en) * | 2005-01-14 | 2013-06-05 | NSK Ltd. | Control apparatus for electric power steering apparatus |
CN101738195B (zh) * | 2009-12-24 | 2012-01-11 | 厦门大学 | 基于环境建模与自适应窗口的移动机器人路径规划方法 |
CN103729883B (zh) * | 2013-12-30 | 2016-08-24 | 浙江大学 | 一种三维环境信息采集与重构系统及方法 |
-
2020
- 2020-10-29 CN CN202011183863.9A patent/CN112230618B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102708228A (zh) * | 2012-04-20 | 2012-10-03 | 西安电子科技大学 | Tmsvl实时系统建模方法 |
JP2015090708A (ja) * | 2013-11-06 | 2015-05-11 | 株式会社日立製作所 | 無線車両制御システム |
CN104527944A (zh) * | 2014-11-17 | 2015-04-22 | 哈尔滨工程大学 | 一种基于综合减摇混沌系统的pid控制器优化控制方法 |
CN105095918A (zh) * | 2015-09-07 | 2015-11-25 | 上海交通大学 | 一种多机器人系统故障诊断方法 |
Non-Patent Citations (1)
Title |
---|
《基于概率模型检验的无人机不确定决策理论与方法研究》;纪晓婷;《中国博士学位论文全文数据库 工程科技Ⅱ辑》;20190215;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112230618A (zh) | 2021-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9015092B2 (en) | Dynamically reconfigurable stochastic learning apparatus and methods | |
US9104186B2 (en) | Stochastic apparatus and methods for implementing generalized learning rules | |
Lin et al. | Evolutionary digital twin: A new approach for intelligent industrial product development | |
Mayer et al. | Cognitive engineering of automated assembly processes | |
Knoll et al. | Neurorobotics: a strategic pillar of the human brain project | |
Xu et al. | Temporal logic inference with prior information: An application to robot arm movements | |
Tripakis | Data-driven and model-based design | |
Xia et al. | Virtual comissioning of manufacturing system intelligent control | |
CN112230618B (zh) | 一种从全局任务自动合成多机器人分布式控制器的方法 | |
Liu et al. | Petri nets-based modeling solution for cyber–physical product control considering scheduling, deployment, and data-driven monitoring | |
Fadeev et al. | Cyber-physical system prototype development for control of mobile robots group for general mission accomplishment | |
Braun et al. | Incorporation of expert knowledge for learning robotic assembly tasks | |
Rizzi et al. | Robust sampling-based control of mobile manipulators for interaction with articulated objects | |
Wong | Towards lifelong self-supervision: A deep learning direction for robotics | |
Gotlieb et al. | Testing Industrial Robotic Systems: A New Battlefield! | |
Mayoral et al. | Towards self-adaptable robots: from programming to training machines | |
Wang et al. | Probabilistic graph based spatial assembly relation inference for programming of assembly task by demonstration | |
Vasiliu et al. | Robobrain: A software architecture mapping the human brain | |
Koshelev et al. | Intelligent control of mobile robot with redundant manipulator & stereovision: quantum/soft computing toolkit | |
Ruud | Reinforcement learning with the TIAGo research robot: manipulator arm control with actor-critic reinforcement learning | |
US20210390377A1 (en) | Autonomous self-learning system | |
US20210397143A1 (en) | Autonomous self-learning system | |
Aiello | Robotic arm pick-and-place tasks: Implementation and comparison of approaches with and without machine learning (deep reinforcement learning) techniques | |
Takács et al. | Computational-Level Framework for Autonomous Systems: a Practical Approach | |
Mayoral et al. | Modular And Self-Adaptable (MASA) strategy for building robots |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |