CN108453746B - 自主与协商相结合的多机器人协同探索方法 - Google Patents

自主与协商相结合的多机器人协同探索方法 Download PDF

Info

Publication number
CN108453746B
CN108453746B CN201810228286.7A CN201810228286A CN108453746B CN 108453746 B CN108453746 B CN 108453746B CN 201810228286 A CN201810228286 A CN 201810228286A CN 108453746 B CN108453746 B CN 108453746B
Authority
CN
China
Prior art keywords
robot
edge
exploration
sector
robots
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810228286.7A
Other languages
English (en)
Other versions
CN108453746A (zh
Inventor
戴学丰
张辉
李大辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qiqihar University
Original Assignee
Qiqihar University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qiqihar University filed Critical Qiqihar University
Priority to CN201810228286.7A priority Critical patent/CN108453746B/zh
Publication of CN108453746A publication Critical patent/CN108453746A/zh
Application granted granted Critical
Publication of CN108453746B publication Critical patent/CN108453746B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/0005Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Manipulator (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种自主与协商相结合的多机器人协同探索方法,n个异构移动机器人R1,...,Rn通过结合自主与协商两种工作模式实现对未知环境的协同探索,最终实现对未知工作环境的完全覆盖。本发明首先降低了对多机器人系统中各个成员机器人硬件的要求,这样每个机器人的生产制造成本同时降低;另外,不同生产商、不同型号的机器人都可以加入到多机器人系统中,增加了机器人的通用性;自主模式的引入,避免了现有的所有多机器人都是工作在协商状态下的模式,使多机器人系统在不能保证不限距离、不限带宽通信的环境中得到了应用。

Description

自主与协商相结合的多机器人协同探索方法
技术领域
本发明涉及智能机器人领域,具体涉及一种自主与协商相结合的多机器人协同探索方法。
背景技术
相对于由一个昂贵的机器人构成的单机器人系统,由多个廉价机器人构成的多机器人系统具有多方面的优势,一是个别机器人的故障不影响系统作业的正常进行,也就是系统具有冗余性;二是多机器人系统能够完成单一机器人无法完成的任务,如搬运较大的物体,加速探索作业过程,等等。
由有限状态自动机描述的机器人监控器,在确定自动机状态时,常规的方法是对机器人工作空间进行划分,不同的空间位姿对应不同的集合元素,这样带来的弊端就是状态集合维数过大。具体的,存在以下缺点:
一是多机器人系统中的各个机器人在整个作业过程中完全依赖通信确定各个作业目标,一旦通信出现故障,机器人将无所适从;其次是现有的机器人之间的协调算法存在计算复杂性,它对各个机器人的计算资源的硬件要求过高;再次,现有的机器人导航目标点选择策略不合理;最后,就是现有的技术都是通过一个中央控制器进行协调,一旦该控制器出现故障,系统就会瘫痪。
发明内容
为解决上述问题,本发明提供了一种自主与协商相结合的多机器人协同探索方法,通过离散事件系统监督控制实现多机器人系统协同作业控制,设计了全新而高效的导航目标点选择策略、全新的探索工作模式。。
为实现上述目的,本发明采取的技术方案为:
自主与协商相结合的多机器人协同探索方法,n个异构移动机器人R1,...,Rn通过结合自主与协商两种工作模式实现多机器人协同探索,每个机器人在进行环境探索的同时分别创建一个局部占有栅格地图;该技术包括如下步骤:
S1、全体机器人根据探索能力的强弱依次选择探索方向,使机器人在环境内充分展开;
S2、通过极坐标形式的由机器人Ri(i=1,...,n)的几何中心出发的若干射线将工作空间划分成若干个动态的扇区,任意两条相邻直线所构成的楔形区间内的环境部分称之为扇区;
S3、机器人Ri对当前位置的四周环境进行扫描,然后根据扫描结果决定下一步的导航目标,分为三种情况:
(1)机器人Ri检测到边缘格,则更新自身保存的未完成任务列表;具体的,如果机器人在探索过程中,在某个方向的扇区能够检测到最大数目的边缘格,并且在机器人该方向的扇区内没有其它机器人在进行探索,则该机器人对该扇区保持自主探索模式;如果机器人在探索过程中,在各个方向检测到的边缘格数目都小于能够检测到的最大边缘格数量,则调用通信程序,与其它机器人协商后确定导航目标点;其中,
Ri在每移动一个单元格后都进行各个扇区的效益计算,如果在当前位置检测到扇区Sk(k=1,…,4)中存在nfi(nfi≥1)个边缘格,则由边缘格产生的Sk的效益
Figure GSB00001923795300000314
就是扇区内的边缘格数;
Figure GSB0000192379530000031
式中,Pj(·)是Ri到达
Figure GSB00001923795300000315
时边缘格fj(j=1,…,nfi)被覆盖的概率,
Figure GSB0000192379530000032
是Ri的移动目标点,
Figure GSB0000192379530000033
是边缘格j的位置,
Figure GSB0000192379530000034
是传感器检测范围;
(2)机器人Ri没有检测到边缘格,则调用通信程序,与其它机器人协商后确定导航目标点;
(3)机器人Ri检测到障碍物或其它机器人,调用避碰程序;
S4、机器人Ri(i=1,...,n)与其它机器人通信确定导航目标点;如果没有检测到边缘格,则判断各个扇区内是否存在边缘格簇,分为两种情况:
(1)如果扇区内存在边缘格簇,则进行以下操作:
S41、首先,通过下式计算各个边缘格簇的效益
Ri的扇区Sk的边缘格簇效益可以表示为
Figure GSB0000192379530000035
式中,
Figure GSB0000192379530000036
Figure GSB0000192379530000037
分别表示边缘格簇效益对机器人的吸引和排斥部分,ξ是加权系数;吸引部分
Figure GSB0000192379530000038
由Sk的边缘格簇(FCCk)中所有成员产生,可表示为
Figure GSB0000192379530000039
式中,
Figure GSB00001923795300000310
是欧几里德距离,
Figure GSB00001923795300000311
Figure GSB00001923795300000312
与(1)相同,nfi是边缘格簇的维数;
位于Sk内的已经分配的目标点对Ri有排斥作用;因此,式(2)中边缘格簇效益的排斥部分
Figure GSB00001923795300000313
的表达式为
Figure GSB0000192379530000041
式中,
Figure GSB0000192379530000042
Figure GSB0000192379530000043
的目标点位置,nri是相应的机器人数;
Figure GSB0000192379530000044
的作用是防止Ri无效率探索行为的发生,也就是防止更多的机器人向同一扇区移动;如果Rj(i≠j)的移动目标点位于Sk内,则Ri在进入Sk后能够探索的未知栅格数量减小的程度与Rj的检测半径
Figure GSB0000192379530000045
成正比,与Rj的当前位置到Rj目标点的距离成反比;如果有nri个目标位于Sk,则边缘格簇效益的排斥部分可以表示为
Figure GSB0000192379530000046
式中,
Figure GSB0000192379530000047
是从Ri当前位置到Rj目标位置的欧几里德距离;
S42、在合作探索阶段,Ri将选择一个具有最大边缘格簇效益的扇区进行探索,该扇区的标号由下式确定
Figure GSB0000192379530000048
S43、在确定目标扇区之后,再确定目标点坐标,通过以下方式实现
Figure GSB0000192379530000049
S44、计算从Sk的边缘格到Ri当前位置的最短距离
Figure GSB00001923795300000410
如果
Figure GSB00001923795300000411
式中
Figure GSB00001923795300000412
并且该边缘格不是Sk的边缘格簇(FCCk)的结尾,则式(7)表示的目标栅格应该被位置
Figure GSB00001923795300000413
替换,式中
Figure GSB00001923795300000414
S45、更新多机器人系统的未完成任务列表;
(2)如果扇区内不存在边缘格簇,则机器人Ri选择与其它机器人的目标点距离最远的独立的边缘格作为导航目标点;
S5、如果通信失败,则机器人Ri强制转入自主探索工作模式,也就是机器人Ri在选择目标点时不再考虑其它机器人的当前位置和当前的目标点;
S6、完成机器人Ri的逻辑层建模:
机器人Ri的探索进程用下面的有限状态自动机表示
Gi={Qi,∑i,δi,q0i} (10)
式中,Qi为Ri的状态集合,
Figure GSB0000192379530000051
为Ri的一个状态;∑i是一个字符表,它的元素如表1所示;δi:∑i×Qi→Qi代表部分转移函数,即σi发生后机器人的状态由qi转移到
Figure GSB0000192379530000052
用公式表示就是
Figure GSB0000192379530000053
q0i是初始状态;
S7、在机器人Ri的各个行为发生后,通过允许和禁止后续行为的发生,使机器人Ri按闭环系统行为运行,实现自主与协商相结合确定目标点的探索工作模式;
S8、更新机器人Ri的状态信息;
S9、整个环境是否探索完毕,如果未完成则转到S2;否则结束。
其中,每个机器人的协调体系的软件结构为分层结构,上层是前面描述的自动机和形式语言实现的离散事件监控系统,下层是运动控制系统。每个机器人的监控器具有相同的形式,这是一种完全分散的结构,没有中央控制器。
本发明提出的自主与协商相结合的多机器人协同探索方法首先降低了对多机器人系统中各个成员机器人硬件的要求,这样每个机器人的生产制造成本同时降低;另外,不同生产商、不同型号的机器人都可以加入到多机器人系统中,增加了机器人的通用性;自主模式的引入,避免了现有的所有多机器人都是工作在协商状态下的模式,使多机器人系统在不能保证不限距离、不限带宽通信的环境中得到了应用。
本发明将进一步拓宽多机器人系统的应用领域,有效替代人类在危险、有毒等环境中的作业,包括危险爆炸物的搜索与排除,地质灾害后生命的搜索与救援,月球及火星等外太空探索,放射性环境作业等。
附图说明
图1为本发明中边缘格与扇区划分示意图。
图2为本发明中基于边缘格簇效益的目标选择。
图3为机器人Ri的期望逻辑行为K。
具体实施方式
为了使本发明的目的及优点更加清楚明白,以下结合实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明具体实施提供一种自主与协商相结合的多机器人协同探索方法,其特征在于,n个异构移动机器人R1,...,Rn通过结合自主与协商两种工作模式实现多机器人协同探索,每个机器人在进行环境探索的同时分别创建一个局部占有栅格地图;该技术包括如下步骤:
S1、全体机器人根据探索能力的强弱依次选择探索方向,使机器人在环境内充分展开;
S2、通过极坐标形式的由机器人Ri的几何中心出发的若干射线将工作空间划分成若干个动态的扇区,任意两条相邻直线所构成的楔形区间内的环境部分称之为扇区,如图1所示,Ri的周围环境被划分为4个扇区,它们分别称为S1、S2、S3和S4。扇区内的环境信息可以是已知的、未知的或部分未知的。所有扇区的夹角都是相同的,但是大多数扇区没有规则的几何形状,在图1中只有扇区S1的形状是等边三角形。Ri的扇区是动态的,也就是它们根据相对于Ri的当前位置定义的。
S3、机器人Ri(i=1,...,n)对当前位置的四周环境进行扫描,然后根据扫描结果决定下一步的导航目标,分为三种情况:
(1)机器人Ri检测到边缘格,则更新自身保存的未完成任务列表;具体的,如果机器人在探索过程中,在某个方向能够检测到最大数目的边缘格,并且在机器人该方向的扇区内没有其它机器人在进行探索,则该机器人对该扇区保持自主探索模式;如果机器人在探索过程中,在各个方向检测到的边缘格数目都小于能够检测到的最大边缘格数量,则调用通信程序,与其它机器人协商后确定导航目标点;其中,
Ri在每移动一个单元格后都进行各个扇区的效益计算,如果在当前位置检测到扇区Sk(k=1,…,4)中存在nfi(nfi≥1)个边缘格,则由边缘格产生的Sk的效益
Figure GSB0000192379530000071
就是扇区内的边缘格数;
Figure GSB0000192379530000072
式中,Pj(·)是Ri到达
Figure GSB0000192379530000073
时边缘格fj(j=1,…,nfi)被覆盖的概率,
Figure GSB0000192379530000074
是Ri的移动目标点,
Figure GSB0000192379530000075
是边缘格j的位置,
Figure GSB0000192379530000076
是传感器检测范围;
(2)机器人Ri没有检测到边缘格,则调用通信程序,与其它机器人协商后确定导航目标点;
(3)机器人Ri检测到障碍物或其它机器人,调用避碰程序;
S4、机器人Ri(i=1,...,n)与其它机器人通信确定导航目标点;如果没有检测到边缘格,则判断各个扇区内是否存在边缘格簇(Frontier Cell Clusters,简称为FCC,它是彼此邻接的一系列边缘格,并且所有这些边缘格都位于Sk内),分为两种情况:
(1)如果扇区内存在边缘格簇,则进行以下操作:
S41、首先,通过下式计算各个边缘格簇的效益
Ri的扇区Sk的边缘格簇效益可以表示为
Figure GSB0000192379530000081
式中,
Figure GSB0000192379530000082
Figure GSB0000192379530000083
分别表示边缘格簇效益对机器人的吸引和排斥部分,ξ是加权系数;吸引部分
Figure GSB0000192379530000084
由Sk的边缘格簇(FCCk)中所有成员产生,可表示为
Figure GSB0000192379530000085
式中,
Figure GSB0000192379530000086
是欧几里德距离,
Figure GSB0000192379530000087
Figure GSB0000192379530000088
与(1)相同,nfi是边缘格簇的维数;
位于Sk内的已经分配的目标点对Ri有排斥作用;因此,式(2)中边缘格簇效益的排斥部分
Figure GSB0000192379530000089
的表达式为
Figure GSB00001923795300000810
式中,
Figure GSB00001923795300000811
Figure GSB00001923795300000812
的目标点位置,nri是相应的机器人数;
Figure GSB00001923795300000813
的作用是防止Ri无效率探索行为的发生,也就是防止更多的机器人向同一扇区移动;如果Rj的移动目标点位于Sk内,则Ri在进入Sk后能够探索的未知栅格数量减小的程度与Rj的检测半径
Figure GSB00001923795300000814
成正比,与Ri的当前位置到Rj目标点的距离成反比;如果有nri个目标位于Sk,则边缘格簇效益的排斥部分可以表示为
Figure GSB00001923795300000815
式中,
Figure GSB0000192379530000091
是从Ri当前位置到Rj目标位置的欧几里德距离;
S42、在合作探索阶段,Ri将选择一个具有最大边缘格簇效益的扇区进行探索,该扇区的标号由下式确定
Figure GSB0000192379530000092
S43、在确定目标扇区之后,再确定目标点坐标,通过以下方式实现
Figure GSB0000192379530000093
S44、计算从Sk的边缘格到Ri当前位置的最短距离
Figure GSB0000192379530000094
如果
Figure GSB0000192379530000095
式中
Figure GSB0000192379530000096
并且该边缘格不是Sk的边缘格簇(FCCk)的结尾,则式(7)表示的目标栅格应该被位置
Figure GSB0000192379530000097
替换,式中
Figure GSB0000192379530000098
S45、更新多机器人系统的未完成任务列表;
(2)如果扇区内不存在边缘格簇,则机器人Ri选择与其它机器人的目标点距离最远的独立的边缘格作为导航目标点;
S5、如果通信失败,则机器人Ri强制转入自主探索工作模式,也就是机器人Ri在选择目标点时不再考虑其它机器人的当前位置和当前的目标点;
S6、完成机器人Ri的逻辑层建模:
机器人Ri的探索进程用下面的有限状态自动机表示
Gi={Qi,∑i,δi,q0i} (10)
式中,Qi为Ri的状态集合,
Figure GSB0000192379530000101
为Ri的一个状态,例如,到达一个新的目标点,或者完成了与其它机器人队员的通信等;∑i是一个字符表,它的元素如表1所示;δi:∑i×Qi→Qi代表部分转移函数,即σi发生后机器人的状态由qi转移到
Figure GSB0000192379530000102
用公式表示就是
Figure GSB0000192379530000103
q0i是初始状态;
S7、在机器人Ri的各个行为发生后,通过允许和禁止后续行为的发生,使机器人Ri按照图3所示的期望闭环系统行为运行,实现自主与协商相结合确定目标点的探索工作模式;具体的,Ri实现协作探索时的期望行为K如图3显示,据此可以构造一个监督者来使闭环行为
L(S/Gi)=K (11)
在每个监控周期内,Ri的实际行为只是图3中所描述语言的一个子集。
由于每个机器人的探索模式和目标是一致的,所以能够开发一个通用和独立的监控器。为了描述Ri的行为,将机器人动作和动作结果分别定义为事件,如表1所示。
表1字符表
Figure GSB0000192379530000104
Figure GSB0000192379530000111
为了实现期望的行为,引入若干可控事件对不可控事件发生后的结果进行处理。
检测周围环境的动作(a0)是可控的,即它的发生可以被监督器允许或禁止。然而,检测结果是不可控的,即结果可能是以下之一,检测到边缘格(a1),未检测到边缘格(a2),检测到障碍物或其它机器人(a3)。换句话说,这些结果事件不能被禁止发生。另外,两个机器人之间的通信成功(η1)或通信失败(η2),取决于环境和通信子系统的软件、硬件,而不取决于监督器,这两个事件也是不可控的。
下面介绍完成协同功能的事件。τ是状态更新事件,即到达目标栅格后,Ri将当前状态更新这个目标栅格。因此,在式(10)中仅需要一个状态集合中的元素qi即可表示Ri的位置。β1通过使式(1)立即效益最大化选择一个扇区作为运动目标。类似地,β2根据(6)选择一个具有最大边缘格簇效益的扇区作为目标扇区。β3代表Ri根据有限的可用信息选择扇区的行为。必须说明的是,β1和β3从相邻栅格中选择目标点,β2根据未完成任务列表选择目标点。
在独立探索阶段,用形式语言描述的Ri的行为是(a0a2β1λ τ)*;在合作探索阶段,探索行为由两个字符串(a0a2η0η1β2λ τ)*和(a0a2η0η2β3λ τ)*组成,分别应对通信成功和通信失败的情况。
一般来讲,当Ri向由(7)或(9)生成的目标移动时,不能保证对障碍物和其它机器人的避碰能力,原因是在边缘格簇效益计算中,排斥部分与吸引部分是融合在一起的。为了使Ri能够可靠地躲避其它同伴机器人或障碍物,避碰行为(a0a3β4λ τ)*包含在了期望的行为中,这个避碰行为具有最高的优先级。
在协调算法实现时,每个机器人都有自己的监督器,所以多机器人系统没有中央监控器。中央就避免了构成描述所有机器人行为的由自动机构成的积系统带来的状态爆炸。换言之,多机器人系统的监控协调是以分布方式实现的。另外,对于所有机器人而言,在独立探索阶段于合作探索阶段都不需要采样时刻的同步。
S8、更新机器人Ri的状态信息;
S9、整个环境是否探索完毕,如果未完成则转到S2;否则结束。
本发明实施例中,每个机器人的协调体系的软件结构为分层结构,上层是前面描述的自动机和形式语言实现的离散事件监控系统,下层是运动控制系统。每个机器人的监控器具有相同的形式,这是一种完全分散的结构,没有中央控制器。图2说明了本发明中目标点选择策略的实施及其优越性,其中栅格的颜色含义与图1相同图中有25个边缘格和4个扇形区。在常规的方法中,这些边界栅格被认为是独立的任务,不论是基于距离的方法或基于时间的方法都将选择f4作为移动目标;虽然
Figure GSB0000192379530000123
是最短距离,但f4不是Ri的最优目标。显然,如果Ri向上移动2个栅格将探索到3个边缘格,而如果它向下移动一个栅格,将只探索到一个边缘格。根据本发明中FCC的定义和图中的扇区划分,FCC1=φ,FCC2={f1,…,f3},FCC3={f5,…,f9},和FCC4={f4}。根据式(5)可以计算出这4个扇区的边缘格簇效益
Figure GSB0000192379530000121
Figure GSB0000192379530000122
的结果分别为0,0.49,0.36和0.2。本发明提出的方法将根据式(6)和(8)分别选择S2和f2为目标扇区和目标点。
目标分配策略行为也包括禁止不希望的任务切换动作等,这是因为当机器人Ri能够检测到边缘格的情况下,只有该机器人探索它本身检测到的边缘格,才不会增加无效的移动;如果Ri投标并获得另外一个机器人Rj(i≠j)检测到的边缘格作为它的移动目标点,这样将增加同时降低Ri和Rj的探索效率。
如果在机器人Ri将要探索的区域存在另外的机器人,并且两个机器人的探索区域将重叠,Ri将被重新分配一个新的目标;否则,Ri在随后的探索中应该继续保持在自主探索情形。本项目所开发的监控器就是保持Ri在最大效益检测情形并实时进行目标选择策略的切换。
此外,系统的通信流量集中在每一个拍卖周期内,通过对图1的分析可知,当Ri在探索过程中能够实现最大效益检测时,用于选择任务的通信量是不需要的,因为Ri不需要参与协商。
每个机器人的探索过程在固定的采样周期上由上级自动机进行评估和控制,这类似于采样控制系统的相应概念;不同的是,采样数据是从机器人和环境中采集的,采用周期由机器人移动一个单元格的时间确定。每个机器人的探索过程都将在采样周期由监控器进行监督和调整,以实现整个系统具有期望的行为。Ri的行为模型用自动机(10)产生的形式语言表示为
Figure GSB0000192379530000131
L(Gi)代表Ri执行环境探索时的所有可能行为。为了实现期望的行为
Figure GSB0000192379530000132
监控器存在的充分必要条件是K是前缀封闭且可控的,也就是满足等条件
Figure GSB0000192379530000133
Figure GSB0000192379530000134
期望行为是根据赋予每个机器人的自主能力离线设计的。
每个机器人的协调探索是通过在每个采样时刻监控扇区效益或边缘格簇效益实现的,这样每个机器人的探索过程是若干自主探索阶段与若干协商探索阶段的相互交错构成。每个机器人根据传感器检测到的环境信息进行工作模式的切换,如果能够检测到未知区域就继续独立探索,否则就与其它机器人进行协商,进入合作探索模式。这里的采样周期小于协商周期。以上机器人的目标选择和移动模式的一个附带的优势是通信量在整个采用周期内分布。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (3)

1.自主与协商相结合的多机器人协同探索方法,其特征在于,n个异构移动机器人R1,...,Rn通过结合自主与协商两种工作模式实现多机器人协同探索,每个机器人在进行环境探索的同时分别创建一个局部占有栅格地图;该技术包括如下步骤:
S1、全体机器人根据探索能力的强弱依次选择探索方向,使机器人在环境内充分展开;
S2、通过极坐标形式的由机器人Ri(i=1,...,n)的几何中心出发的若干射线将工作空间划分成若干个动态的区域,任意两条相邻直线所构成的楔形区间内的环境部分称之为扇区;
S3、机器人Ri对当前位置的四周环境进行扫描,然后根据扫描结果决定下一步的导航目标,分为三种情况:
(1)机器人Ri检测到边缘格,则更新自身保存的未完成任务列表;具体步骤是,如果机器人在探索过程中,在某个方向的扇区能够检测到最大数目的边缘格,并且在机器人该方向的扇区内没有其它机器人在进行探索,则该机器人对该扇区保持自主探索模式;如果机器人在探索过程中,在各个方向检测到的边缘格数目都小于能够检测到的最大边缘格数量,则调用通信程序,与其它机器人协商后确定导航目标点;其中,
Ri在每移动一个单元格后都进行各个扇区的效益计算,如果在当前位置检测到扇区Sk(k=1,…,4)中存在nfi(nfi≥1)个边缘格,则由边缘格产生的Sk的效益
Figure FDA0003047324420000011
就是扇区内的边缘格数;
Figure FDA0003047324420000012
式中,Pj(·)是Ri到达pi r时边缘格fj(j=1,...,nfi)被覆盖的概率,
Figure FDA0003047324420000021
是Ri的移动目标点,
Figure FDA0003047324420000022
是边缘格j的位置,
Figure FDA0003047324420000023
是传感器检测范围;
(2)机器人Ri没有检测到边缘格,则调用通信程序,与其它机器人协商后确定导航目标点;
(3)机器人Ri检测到障碍物或其它机器人,调用避碰程序;
S4、机器人Ri(i=1,...,n)与其它机器人通信确定导航目标点;如果没有检测到边缘格,则判断各个扇区内是否存在边缘格簇(FCC),分为两种情况:
(1)如果扇区内存在至少一个边缘格簇,则进行以下操作:
S41、首先,通过下式计算各个边缘格簇的效益
Ri的扇区Sk的边缘格簇效益可以表示为
Figure FDA0003047324420000024
式中,
Figure FDA0003047324420000025
Figure FDA0003047324420000026
分别表示边缘格簇效益对机器人的吸引和排斥部分,ξ是加权系数;吸引部分
Figure FDA0003047324420000027
由Sk的边缘格簇(FCCk)中所有成员产生,可表示为
Figure FDA0003047324420000028
式中,
Figure FDA0003047324420000029
是欧几里德距离,
Figure FDA00030473244200000210
Figure FDA00030473244200000211
与(1)相同,nfi是边缘格簇的维数;
位于Sk内的已经分配的目标点对Ri有排斥作用;因此,式(2)中边缘格簇效益的排斥部分
Figure FDA00030473244200000212
的表达式为
Figure FDA00030473244200000213
式中,
Figure FDA00030473244200000214
Figure FDA00030473244200000215
的目标点位置,nri是相应的机器人数;
Figure FDA00030473244200000216
的作用是防止Ri无效率探索行为的发生,也就是防止更多的机器人向同一扇区移动;如果Rj(j≠i)的移动目标点位于Sk内,则Ri在进入Sk后能够探索的未知栅格数量减小的程度与Rj的检测半径
Figure FDA0003047324420000031
成正比,与Ri的当前位置到Rj目标点的距离成反比;如果有nri个目标点位于Sk内,则边缘格簇效益的排斥部分可以表示为
Figure FDA0003047324420000032
式中,
Figure FDA0003047324420000033
是从Ri当前位置到Rj目标位置的欧几里德距离;
S42、在合作探索阶段,Ri将选择一个具有最大边缘格簇效益的扇区进行探索,该扇区的标号由下式确定
Figure FDA0003047324420000034
S43、在确定目标扇区之后,再确定目标点坐标,通过以下方式实现
Figure FDA0003047324420000035
S44、计算从Sk的边缘格到Ri当前位置的最短距离
Figure FDA0003047324420000036
如果
Figure FDA0003047324420000037
式中
Figure FDA0003047324420000038
并且该边缘格不是Sk的边缘格簇(FCCk)的结尾,则式(7)表示的目标栅格应该被位置
Figure FDA0003047324420000039
替换,式中
Figure FDA00030473244200000310
S45、更新多机器人系统的未完成任务列表;
(2)如果扇区内不存在边缘格簇,则机器人Ri选择与其它机器人的目标点距离最远的独立的边缘格作为导航目标点;
S5、如果通信失败,则机器人Ri强制转入自主探索工作模式;
S6、完成机器人Ri的逻辑层建模:
机器人Ri的探索进程用下面的有限状态自动机表示
Gi={Qiii,q0i} (10)
式中,Qi为Ri的状态集合,
Figure FDA0003047324420000041
为Ri的一个状态;Σi是一个字符表,其中字符表如下表所示;
Figure FDA0003047324420000042
δii×Qi→Qi代表部分转移函数,即σi发生后机器人的状态由qi转移到q′i,用公式表示就是q′i=δii,qi),q0i是初始状态;
S7、在机器人Ri的各个行为发生后,通过允许和禁止后续行为的发生,使机器人Ri按期望闭环系统行为运行,实现自主与协商相结合确定目标点的探索工作模式;
S8、更新机器人Ri的状态信息;
S9、整个环境是否探索完毕,如果未完成则转到S2;否则结束。
2.如权利要求1所述的自主与协商相结合的多机器人协同探索方法,其特征在于,每个机器人的协调体系的软件结构为分层结构,上层是前面描述的自动机和形式语言实现的离散事件监控系统,下层是运动控制系统。
3.如权利要求1所述的自主与协商相结合的多机器人协同探索方法,其特征在于,每个机器人的监控器具有相同的形式,这是一种完全分散的结构,没有中央控制器。
CN201810228286.7A 2018-03-09 2018-03-09 自主与协商相结合的多机器人协同探索方法 Expired - Fee Related CN108453746B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810228286.7A CN108453746B (zh) 2018-03-09 2018-03-09 自主与协商相结合的多机器人协同探索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810228286.7A CN108453746B (zh) 2018-03-09 2018-03-09 自主与协商相结合的多机器人协同探索方法

Publications (2)

Publication Number Publication Date
CN108453746A CN108453746A (zh) 2018-08-28
CN108453746B true CN108453746B (zh) 2021-07-13

Family

ID=63236572

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810228286.7A Expired - Fee Related CN108453746B (zh) 2018-03-09 2018-03-09 自主与协商相结合的多机器人协同探索方法

Country Status (1)

Country Link
CN (1) CN108453746B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110398967B (zh) * 2019-07-24 2021-07-16 西安电子科技大学 一种采用离散化方法的多机器人协同轨迹信息处理方法
CN110587606B (zh) * 2019-09-18 2020-11-20 中国人民解放军国防科技大学 一种面向开放场景的多机器人自主协同搜救方法
CN110780651B (zh) * 2019-11-01 2022-07-08 四川长虹电器股份有限公司 Agv调度系统及方法
KR20210127558A (ko) * 2020-04-14 2021-10-22 한국전자통신연구원 멀티 에이전트 기반 유무인 협업 시스템 및 방법
CN111421564B (zh) * 2020-06-10 2020-11-06 北京云迹科技有限公司 一种基于机器人的消毒方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102023571A (zh) * 2010-09-30 2011-04-20 哈尔滨工程大学 探索任务下基于分簇的多机器人任务分配方法
CN103135117A (zh) * 2013-02-05 2013-06-05 中国人民解放军国防科学技术大学 一种分散式多机器人协同定位算法
KR101668078B1 (ko) * 2015-04-23 2016-10-19 국방과학연구소 자율적 로봇 협업 시스템과 그 방법
CN106441279A (zh) * 2016-12-08 2017-02-22 速感科技(北京)有限公司 基于自主定位和边缘探索的机器人定位方法、系统
CN106527433A (zh) * 2016-10-31 2017-03-22 江苏理工学院 多机器人搜救系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102023571A (zh) * 2010-09-30 2011-04-20 哈尔滨工程大学 探索任务下基于分簇的多机器人任务分配方法
CN103135117A (zh) * 2013-02-05 2013-06-05 中国人民解放军国防科学技术大学 一种分散式多机器人协同定位算法
KR101668078B1 (ko) * 2015-04-23 2016-10-19 국방과학연구소 자율적 로봇 협업 시스템과 그 방법
CN106527433A (zh) * 2016-10-31 2017-03-22 江苏理工学院 多机器人搜救系统
CN106441279A (zh) * 2016-12-08 2017-02-22 速感科技(北京)有限公司 基于自主定位和边缘探索的机器人定位方法、系统

Also Published As

Publication number Publication date
CN108453746A (zh) 2018-08-28

Similar Documents

Publication Publication Date Title
CN108453746B (zh) 自主与协商相结合的多机器人协同探索方法
CN110147101B (zh) 一种基于深度强化学习的端到端分布式多机器人编队导航方法
CN113900445A (zh) 基于多智能体强化学习的无人机协同控制训练方法及系统
Papatheodorou et al. Collaborative visual area coverage
CN110162035A (zh) 一种集群机器人在有障碍物场景中的协同运动方法
Venayagamoorthy et al. Navigation of mobile sensors using PSO and embedded PSO in a fuzzy logic controller
CN115033016B (zh) 一种异构无人集群编队避障方法及系统
CN108958202B (zh) 一种多机器人协同探索的方法
Wu et al. Consensus based formation control and trajectory tracing of multi-agent robot systems
CN110908384B (zh) 一种分布式多机器人协同过未知随机迷宫的编队导航方法
Hu et al. Vision-based multi-agent cooperative target search
de Carvalho et al. Q-learning based path planning method for uavs using priority shifting
Oliveira et al. A cellular automata-based path-planning for a cooperative and decentralized team of robots
Papatheodorou et al. Cooperative visual convex area coverage using a tessellation-free strategy
Kobayashi et al. Multi-Robot Patrol Algorithm with Distributed Coordination and Consciousness of the Base Station's Situation Awareness
Marino et al. A fault-tolerant modular control approach to multi-robot perimeter patrol
Elmokadem Distributed control for the flocking of multi nonholonomic agent systems with bounded inputs
CN114859940A (zh) 机器人移动控制方法、装置、设备以及存储介质
Li et al. Decentralized coordinated motion for a large team of robots preserving connectivity and avoiding collisions
Jyoti et al. Rogue agent identification and collision avoidance in formation flights using potential fields
Nametala et al. A new distance diffusion algorithm for a path-planning model based on cellular automata
Huang et al. E2coop: Energy efficient and cooperative obstacle detection and avoidance for uav swarms
Teymournezhad et al. Fuzzy logic-based trajectory planning for mobile robots in an uncertain and complex environment
Okumura et al. Amoeba exploration: Coordinated exploration with distributed robots
Wang et al. A Safe and Self-Recoverable Reinforcement Learning Framework for Autonomous Robots

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210713

CF01 Termination of patent right due to non-payment of annual fee