CN111476337A - 多级可变基因调控网络的群体机器人模式生成与转换方法 - Google Patents

多级可变基因调控网络的群体机器人模式生成与转换方法 Download PDF

Info

Publication number
CN111476337A
CN111476337A CN202010255107.6A CN202010255107A CN111476337A CN 111476337 A CN111476337 A CN 111476337A CN 202010255107 A CN202010255107 A CN 202010255107A CN 111476337 A CN111476337 A CN 111476337A
Authority
CN
China
Prior art keywords
robot
robots
target
group
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010255107.6A
Other languages
English (en)
Other versions
CN111476337B (zh
Inventor
包卫东
朱晓敏
马力
吴梦
袁宇彤
陶晶晶
张耀鸿
王吉
周文
张亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202010255107.6A priority Critical patent/CN111476337B/zh
Publication of CN111476337A publication Critical patent/CN111476337A/zh
Application granted granted Critical
Publication of CN111476337B publication Critical patent/CN111476337B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/008Artificial life, i.e. computing arrangements simulating life based on physical entities controlled by simulated intelligence so as to replicate intelligent life forms, e.g. based on robots replicating pets or humans in their appearance or behaviour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Robotics (AREA)
  • Manipulator (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提供了一种多级可变基因调控网络的群体机器人模式生成与转换方法,包括以下步骤:获取群体机器人工作场景信息,基于工作场景信息以及群体机器人的特征信息设计基因表达决策树;利用基因调控网络,根据基因表达决策树生成群体机器人的形态模式,形态功能包括群体机器人的模式生成和群体机器人的模式转换;采用分布式控制方法,利用反应扩散原理驱动群体机器人使群体机器人的形态模式趋于基因表达决策树生成群体机器人的形态模式。本发明能够在变化的环境中能够做出最优形态决策,并有效完成形态生成与转换。

Description

多级可变基因调控网络的群体机器人模式生成与转换方法
技术领域
本发明涉及群体机器人控制领域,具体公开了一种多级可变基因调控网络的群体机器人模式生成与转换方法。
背景技术
群体机器人技术是集体机器人技术的一种方法,它从社会动物的自组织行为中获取灵感。通过简单的规则和本地交互,群体机器人旨在设计稳健,可扩展和灵活的集体行为,以协调大量机器人。群体机器人系统的主要特征如下:机器人是自主的;机器人位于环境中,可以采取行动对其进行修改;机器人的传感和通信能力是具有限制的;机器人合作解决特定任务。近年来,随着5G通信、边缘云、人工智能等技术的飞速发展,机器人群已逐渐应用于真实场景中,如无人机集群表演、无人仓库、无人港口等。同时,世界各国大力支持LOCUST,OFFSET,GREMLINS,CODE等无人集群项目,重点解决集群协同作战、编队保持、功能转换等无人作战系统中的关键技术问题,而群体形态生成和转换机理是解决这些问题的关键。
利用基因调控网络来探索这一机理已经成为许多领域专家的选择。Jin等人引入了用于多机器人模式形成的两层GRN,以在动态环境中诱捕目标。oh和jin扩展了这种层次GRN结构,实现了区域覆盖而不是边界覆盖。机器人遵循蛋白质梯度来诱捕目标,在那里模式的形状与目标的位置相适应。此外,机器人自身也会扩散蛋白质,以便检测和跟踪彼此,避免碰撞。随后,Oh等人提出了一种改进的GRN框架,称为EH-GRN,障碍物作为环境输入源之一,与目标一起被引入,解决了H-GRN模式不能适应障碍物的弱点。孟和郭研究了一种进化的GRN,其中进化算法通过使用频繁重复的称为网络模体的调节模式来确定GRN的结构和系数。Yutong Yuan采用TH-GRN解决了在动态受限环境中的目标追踪问题,目标能够穿越障碍、但机器人不能穿越,验证了算法的有效性,Meng Wu采用CH-GRN加强智能体与周围伙伴、障碍的合作,并在网络下层添加自组织避障机制,缩短了围捕时间,提高了围捕质量。总而言之,群体机器人以不同的模式聚集能够产生不同的功能,适应不同的环境,完成不同的任务,而且形态的转换依赖于机器人与环境的局部交互,但当前研究并不能完全解决上述问题。尽管已知形态发生能够在生物中产生高度复杂的器官,但迄今为止,在形态发生机器人技术中可以实现的模式或多或少还是简单的。这就提出了以下问题:1)如何从使用形态发生的机器人群中产生更复杂的模式?2)在不断变化的环境中,多机器人系统如何在不同模式之间动态切换?3)群体如何在不失去其预定模式的情况下在环境中进行机动?为了回答这些问题,需要更先进的形态发生系统,其中许多形态发生相互作用,根据某些地方的相互作用规则和条例,基因之间的关系可以通过一个复杂的网络来表达,这个网络调节这些形态或基因关系。
发明内容
本发明目的在提供一种多级可变基因调控网络的群体机器人模式生成与转换方法,以解决现有技术中存在的技术缺陷。
为实现上述目的,本发明提供了一种多级可变基因调控网络的群体机器人模式生成与转换方法,包括以下步骤:
获取群体机器人工作场景信息,基于工作场景信息以及群体机器人的特征信息设计基因表达决策树;
利用基因调控网络,根据基因表达决策树生成群体机器人的形态模式,形态功能包括群体机器人的模式生成和群体机器人的模式转换;
采用分布式控制方法,利用反应扩散原理驱动群体机器人使群体机器人的形态模式趋于基因表达决策树生成群体机器人的形态模式。
进一步地,形态模式包括围捕模式、运输模式和搜索模式。
进一步地,生成或者转换为围捕模式的模型如下:
Figure BDA0002436993650000021
Figure BDA0002436993650000022
Figure BDA0002436993650000023
Figure BDA0002436993650000024
Figure BDA0002436993650000025
Figure BDA0002436993650000026
Figure BDA0002436993650000027
其中γj是目标j的位置,在一定范围内,机器人可以利用其板载传感器探测到目标位置或者接收到相邻机器人获取到的目标信息;pj表示由第j个目标产生的环境输入(γj)产生的蛋白质浓度;p表示由j=1到Nt的所有检测到的目标产生的当前机器人位置处的积分蛋白质浓度,其中Nt是检测到的目标的总数;
Figure BDA0002436993650000028
是拉普拉斯算子,它被定义为空间域中pj的二阶导数,可以作为生物系统中的扩散过程;g11,g12,g13和g14是蛋白质浓度,g13和g14是定义不同目标模式的不同形态发生素梯度;在该模型中,g13和g14都受g11和g12调节,g11,和g12均受pj调节;群体机器人系统可以轻松实现此设置,因为可以通过板载传感器检测目标;θ11,θ12,θ13和θ14是S形函数的阈值;整合的蛋白质浓度p将影响g11和g12至式(3)和式(4)的表达水平。
进一步地,生成或者转换为运输模式的模型如下:
Figure BDA0002436993650000031
Figure BDA0002436993650000032
Figure BDA0002436993650000033
Figure BDA0002436993650000034
其中δ是基地的位置;g23是定义flocking模式的形态发生素的浓度,并受g22,j的和与g21调节;g21受到q调节,g22,j是由机器人检测到的障碍物生成的虚拟机器人j,其个数为ntj
进一步地,生成或者转换为搜索模式的模型如下:
Figure BDA0002436993650000035
Figure BDA0002436993650000036
Figure BDA0002436993650000037
Figure BDA0002436993650000038
其中,g33是定义wandering模式的形态发生素的浓度,并受g32,j与g31调节。g31受到q调节,g32,j是由机器人检测到的障碍物生成的虚拟机器人j,其个数为ntj
进一步地,形态模式还包括群体机器人的个体移动速度,个体移动速度由行为蛋白驱动,模型如下:
Figure BDA0002436993650000039
Figure BDA00024369936500000310
Figure BDA00024369936500000311
Figure BDA00024369936500000312
Si,x和Si,y表示i-th机器人检测到目标的x和y位置,这两个位置对应于Pi,x和Pi,y细胞中两种S型蛋白质的浓度,这是机器人的两种内部状态;a、b、c、d和r是常数Di可以看作是机器人系统中从细胞中扩散的蛋白质S的浓度,这是一个表示附近机器人和障碍物“密度”的术语,即附近机器人和障碍物的数量邻域的大小是预先定义的,小于感测范围;
Figure BDA0002436993650000041
Figure BDA0002436993650000042
其中Ni代表机器人i附近的机器人数量,
Figure BDA0002436993650000043
Figure BDA0002436993650000044
代表沿机器人i所接收的机器人j在x轴和y轴扩散的蛋白浓度,其定义为:
Figure BDA0002436993650000045
Figure BDA0002436993650000046
这里,f(a)和f(c)定义为如下sigmoid函数:
Figure BDA0002436993650000047
Figure BDA0002436993650000048
行为蛋白主要驱动个体形态变化,在外界形态蛋白浓度高的地方形体缩小,反之增大;同时受到障碍和友邻的蛋白影响,离障碍和友邻越近,则外界浓度越大,形态缩小,反之增大,具体行为蛋白驱动公式如下:
Figure BDA0002436993650000049
Δd=d-ri-rj (27)
Figure BDA00024369936500000410
Figure BDA00024369936500000411
Figure BDA00024369936500000412
其中Ri是机器人i的半径;Δd是机器人i和机器人j轮廓之间的间距,d是机器人i和机器人j质心的距离;ri和rj分别表示机器人i和j的半径;M是机器人i周围的平均浓度;对于任何一个Ri,它都不能大到碰到其他个体,也不能小于最小半径;
Ri=min{Ri,d-rj} (31)
Ri=max{Ri,Rmin}。 (32)
进一步地,通过奖励函数对形态模式的参数进行优化,优化目标为:
Figure BDA00024369936500000413
进一步地,如果目标被包围5个时间步以上,则认为包围成功,每个机器人获得正奖励;围捕模式的奖励为:
Figure BDA0002436993650000051
Figure BDA0002436993650000052
其中
Figure BDA0002436993650000053
是全局间距平均值
Figure BDA0002436993650000054
Figure BDA0002436993650000055
是机器人i和周围个体之间距离最小的两个值,
Figure BDA0002436993650000056
是离目标距离在d1到d2之间的机器人数量。
进一步地,每个机器人成功将目标带回基地,补充基地能量并给予正回报,运输模式的回报为:
Figure BDA0002436993650000057
Figure BDA0002436993650000058
其中T是包围机器人转换为运输机器人之后成功带回目标的平均时间,A是flocking的聚集度,它代表每个机器人距离flocking质心的平均距离的大小,其中,
Figure BDA0002436993650000059
Figure BDA00024369936500000510
分别代表机器人j位置的横纵坐标,
Figure BDA00024369936500000511
Figure BDA00024369936500000512
分别代表flocking在时刻t的质心位置横纵坐标,NA代表flocking中机器人的数量。
进一步地,目标出现在机器人的检测范围内,机器人将被视为发现目标并给予正奖励,搜索模式的奖励为:
Figure BDA00024369936500000513
Figure BDA00024369936500000514
本发明具有以下有益效果:
本发明一种多级可变的基因调控网络,使群体机器人在不断变化的环境中自适应地完成模式生成和转换。本发明所提出模型的第一级负责处理环境信息,利用行为树决策基因表达;第二级负责基因表达,利用基因调控网络生成形态;第三级负责分布式行动控制,利用反应扩散原理驱动机器人到合适状态。本发明的模型能够在变化的环境中能够做出最优形态决策,并有效完成形态生成与转换。
下面将参照附图,对本发明作进一步详细的说明。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明优选实施例提供的群体机器人工作场景概念图;
图2为本发明优选实施例提供的一种多级可变基因调控网络的群体机器人模式生成与转换方法流程图;
图3为本发明优选实施例提供的MLV-GRN结构图;
图4为本发明优选实施例提供的机器人基因表达与环境、任务的关系示意图;
图5为本发明优选实施例提供的基于行为树设计的信息融合决策逻辑示意图;
图6为本发明优选实施例提供的可行性验证实验结果示意图;
图7为本发明优选实施例提供的适应性验证实验结果示意图;
图8为本发明优选实施例提供的可扩展性验证实验结果示意图。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
为了利用控制生物形态发生的遗传和细胞机制来进行多机器人模式的形成,有必要建立多细胞生物和MRSS之间的隐喻。生物体形态发育时,由受精卵通过分化、分裂、移动等细胞行为一步步发育成生物体,细胞群形成器官、组织,并最终形成复杂的完整个体。借鉴这个过程机理,每个机器人都是一个拥有完整遗传物质的细胞,称为“干机器人”,可通过基因选择性表达完成分化过程,形成具备特定功能的“组织机器人”。细胞中的蛋白质浓度与机器人的内部状态相对应,代表机器人状态信息的蛋白质可以从细胞中扩散出来,产生细胞与细胞的相互作用。借助“显式+隐式通信”形成“同质机器人簇”:借助“显示通信”可完成类似细胞分裂过程,状态信息可以从一个“组织机器人”完整复制到一个“干机器人”;借助“隐式通信”可完成多个“组织机器人”的自组织行为协作,例如,在MRSS系统中,这是一种基于距离的机制,可以改变机器人的运动动力学以避免碰撞。同时“同质机器人簇”之间有效协作,借助“显式通信”形成“异质机器人群”,进而形成“群体机器人系统”。最后,利用多细胞生物中的形态梯度来描述MRSS形成的目标模式。首先检测环境中目标的机器人称为组织机器人,负责建立目标模式。为了将MLV-GRN用于群体机器人形态生成,已经做出了一下假设:1)利用RTK、传感器和通信等多种手段融合,机器人可以准确定位自己、友邻、目标和障碍。2)机器人有多种功能形态,状态之间的切换有逻辑、触发条件和概率,受到任务、环境等信息的影响。3)有限的传感器感知范围,只能探测到感知范围内的目标、障碍和其他机器人。4)通信范围有限,任务、环境、位置、速度等信息可以在通信范围内的机器人之间相互传递。5)设置基站,且基站通信范围覆盖全场,但与机器人的通信可以被中断,这意味着群体机器人需要在局部信息条件下通过分布式协商达成一致性态势认知和决策。6)群体机器人的数量足够多,并分别来源于不同基站,可在基站进行补给,基站可以作为机器人信息交换中心。7)初始条件下每个机器人是有任务负载的,这意味着它们已经分好组并开始工作,可随环境改变而改变。
实施例1
本发明首先设计了群体机器人工作场景概念图,如图1所示,虚线椭圆框代表基地,无填充实线圆圈代表初始形态----“干细胞机器人”,图标含义如图所示。在概念场景中,“侦察组织机器人”形态小且采用游走形态对地图进行搜索,在遇到1型目标后,转变为形态小的“运输组织机器人”并将1型目标带回基地,在遇到2型目标后,转变为形态大的“攻击组织机器人”并呼叫支援,由中等形态的“通信组织机器人”将信息传回基地,基地在接到信息后全局广播2型目标,离目标最近的其他组织机器人响应任务,移动到目标附近并自动转变为“攻击组织机器人”,“攻击组织机器簇”形成包围形态,一段时间后目标死亡,转换为若干1型目标,同时这群机器人转变为“运输组织机器人”并以集群移动形态将目标带回基地。所有机器人一旦回到基地,便重新成为“侦察组织机器人”,以游走形态对基地附近地域进行侦察。
基于上述背景,本发明提供了一种多级可变基因调控网络的群体机器人模式生成与转换方法,参见图2,包括以下步骤:
S1:获取群体机器人工作场景信息,基于工作场景信息以及群体机器人的特征信息设计基因表达决策树。
为了适应这样的场景,本实施例将H-GRN(分层基因调控网络,Hierarchical generegulatory network)拓展为MLV-GRN(多级可变基因调控网络),如图3所示。其中,行动基因控制机器人的运动方向、速度大小,形态基因控制机器人的大小,功能基因控制机器人的功能模块选择,在图1以机器人的颜色为例来显示。三种基因都会根据环境输入选择性表达,最终形成机器人的综合动作输出,以完成相应的任务。
群体移动场景,多出现在机器人需要集体去完成某件任务的途中,和完成任务返回基站的途中。集群围捕,2型目标在基站附近有危险,或者集体运输死亡2型目标时。协同搜索多出现在要日常需要机器人单独外出寻找1型目标并将其运送回基站。形态基因赋予机器人伸缩大小的能力,可以在遇到狭窄地形时收缩,在围捕Ⅱ型目标时放大。功能基因赋予机器人侦察、攻击、通信中继、运输等能力,分别用浅灰、深灰、黑、中灰等来表示,分别用于协同搜索侦察目标、围捕目标、扩大群体通信范围、协同运输目标等等。具体关系如图4所示。
当机器人初始化时,每个都是“干细胞机器人”,具备三种基因,但是仍未表达出具体功能,开始执行任务后,机器人会被转化为“组织细胞机器人”,并与同类“组织细胞机器人”相互协作,每一类基因会产生相应的蛋白质,并且扩散到环境中,可以认为是一种信息素,个体依据信息素的浓度来决定下一步的基因表达。我们提出分簇广播式通信模型,来说明“同质机器人簇”内部相互之间的通信机制。簇间协作则以基地中心协商方式,其通信模型为单向广播响应式。
S2:利用基因调控网络,根据基因表达决策树生成群体机器人的形态模式,形态功能包括群体机器人的模式生成和群体机器人的模式转换。
DNA:信息融合决策层是设计的核心部分,它是群体机器人的行为逻辑,也决定了各类基因该如何表达以在复杂环境中有序完成各项任务。FSM及其扩展方法PFSM、HFSM等曾经被广泛应用到多种机器人集体行为,例如聚合,链形成和任务分配。但是,该方法面向复杂智能逻辑及其扩展问题时表现欠佳,因此本实施例采用行为树的方法以提高模型可扩展性、模块重用性、降低定义难度和耦合度,更好完成群体机器人行为逻辑设计工作。
如图4所示,问号表示选择节点,箭头表示顺序选择节点,叶节点中的虚拟线圈表示条件节点,叶节点中的实际线圈表示动作节点。每个机器人都可以通过遍历行为树来生成和变换其形状。环境及其自身状态是决策的关键因素。
在RNA层本实施例每次需要同时考虑三种基因的转录,以应对不同的功能需求。在围捕任务中,需要行动基因转录为enclosing队形,形态基因转录为enclosing合适大小,功能基因表现恒定。在协同运输任务中,需要行动基因转录为flocking队形,形态基因依据周围个体和障碍位置转录为合适大小,功能表现恒定。在协同搜索任务中,需要行动基因转录为wandering队形,形态基因表现恒定,功能基因依据环境障碍位置转录为合适强弱。其中,围捕任务下的基因转录具体公式如下:
Figure BDA0002436993650000081
Figure BDA0002436993650000082
Figure BDA0002436993650000083
Figure BDA0002436993650000084
Figure BDA0002436993650000085
Figure BDA0002436993650000086
Figure BDA0002436993650000087
其中γj是目标j的位置,在一定范围内,机器人可以利用其板载传感器探测到目标位置或者接收到相邻机器人获取到的目标信息;pj表示由第j个目标产生的环境输入(γj)产生的蛋白质浓度;p表示由j=1到Nt的所有检测到的目标产生的当前机器人位置处的积分蛋白质浓度,其中Nt是检测到的目标的总数;
Figure BDA0002436993650000091
是拉普拉斯算子,它被定义为空间域中pj的二阶导数,可以作为生物系统中的扩散过程;g11,g12,g13和g14是蛋白质浓度,g13和g14是定义不同目标模式的不同形态发生素梯度;在该模型中,g13和g14都受g11和g12调节,g11,和g12均受pj调节;群体机器人系统可以轻松实现此设置,因为可以通过板载传感器检测目标;θ11,θ12,θ13和θ14是S形函数的阈值;整合的蛋白质浓度p将影响g11和g12至式(3)和式(4)的表达水平。
运输任务下的基因转录具体公式如下:
Figure BDA0002436993650000092
Figure BDA0002436993650000093
Figure BDA0002436993650000094
Figure BDA0002436993650000095
其中δ是基地的位置;g23是定义flocking模式的形态发生素的浓度,并受g22,j的和与g21调节;g21受到q调节,g22,j是由机器人检测到的障碍物生成的虚拟机器人j,其个数为ntj
搜索任务下的基因转录具体公式如下:
Figure BDA0002436993650000096
Figure BDA0002436993650000097
Figure BDA0002436993650000098
Figure BDA0002436993650000099
其中,g33是定义wandering模式的形态发生素的浓度,并受g32,j与g31调节。g31受到q调节,g32,j是由机器人检测到的障碍物生成的虚拟机器人j,其个数为ntj
S3:采用分布式控制方法,利用反应扩散原理驱动群体机器人使群体机器人的形态模式趋于基因表达决策树生成群体机器人的形态模式。
行动蛋白主要驱动个体移动,影响个体速度更新,主要考虑周围行动蛋白浓度、密度、目标蛋白等因素的影响,具体公式如下:
Figure BDA0002436993650000101
Figure BDA0002436993650000102
Figure BDA0002436993650000103
Figure BDA0002436993650000104
Si,x和Si,y表示i-th机器人检测到目标的x和y位置,这两个位置对应于Pi,x和Pi,y细胞中两种S型蛋白质的浓度,这是机器人的两种内部状态;a、b、c、d和r是常数Di可以看作是机器人系统中从细胞中扩散的蛋白质S的浓度,这是一个表示附近机器人和障碍物“密度”的术语,即附近机器人和障碍物的数量邻域的大小是预先定义的,小于感测范围;
Figure BDA0002436993650000105
Figure BDA0002436993650000106
其中Ni代表机器人i附近的机器人数量,
Figure BDA0002436993650000107
Figure BDA0002436993650000108
代表沿机器人i所接收的机器人j在x轴和y轴扩散的蛋白浓度,其定义为:
Figure BDA0002436993650000109
Figure BDA00024369936500001010
这里,f(a)和f(c)定义为如下sigmoid函数:
Figure BDA00024369936500001011
Figure BDA00024369936500001012
行为蛋白主要驱动个体形态变化,在外界形态蛋白浓度高的地方形体缩小,反之增大;同时受到障碍和友邻的蛋白影响,离障碍和友邻越近,则外界浓度越大,形态缩小,反之增大,具体行为蛋白驱动公式如下:
Figure BDA00024369936500001013
Δd=d-ri-rj (27)
Figure BDA00024369936500001014
Figure BDA00024369936500001015
Figure BDA0002436993650000111
其中Ri是机器人i的半径;Δd是机器人i和机器人j轮廓之间的间距,d是机器人i和机器人j质心的距离。ri和rj分别表示机器人i和j的半径;M是机器人i周围的平均浓度;对于任何一个Ri,它都不能大到碰到其他个体,也不能小于最小半径;
Ri=min{Ri,d-rj} (31)
Ri=max{Ri,Rmin}。 (32)
为不断提升模型性能,本实施例通过设计奖励函数,利用单目标优化方法对模型中的参数进行优化,全局优化目标是:
Figure BDA0002436993650000112
进一步地,包围奖励(包围2类目标成功奖励):如果目标被包围5个时间步以上,则认为包围成功,每个机器人获得正奖励;围捕模式的奖励为:
Figure BDA0002436993650000113
Figure BDA0002436993650000114
其中
Figure BDA0002436993650000115
是全局间距平均值
Figure BDA0002436993650000116
Figure BDA0002436993650000117
是机器人i和周围个体之间距离最小的两个值,
Figure BDA0002436993650000118
是离目标距离在d1到d2之间的机器人数量。
进一步地,运输奖励(成功将1类目标带回基地):每个智能体成功将1类目标(包括从死亡2类目标转化为1类目标)带回基地,补充基地能量并给予正回报:
Figure BDA0002436993650000119
Figure BDA00024369936500001110
其中T是包围机器人转换为运输机器人之后成功带回目标的平均时间,A是flocking的聚集度,它代表每个机器人距离flocking质心的平均距离的大小,其中,
Figure BDA00024369936500001111
Figure BDA00024369936500001112
分别代表机器人j位置的横纵坐标,
Figure BDA00024369936500001113
Figure BDA00024369936500001114
分别代表flocking在时刻t的质心位置横纵坐标,NA代表flocking中机器人的数量。
进一步地,搜索奖励(这里只考虑1型目标):一旦1型目标出现在智能体的检测范围内,智能体将被视为发现目标并给予正奖励:
Figure BDA00024369936500001115
Figure BDA0002436993650000121
采用CMA-ES来优化参数a、b、c、d,r,θ11,θ12,θ13,θ14,θ21,θ22,θ23,θ31,θ32,θ33,k11,k12,k13,k14,k21,k22,k,k31,k32,世代数最大设置为50,种群大小设置为100,MLV-GRN模型的最佳参数设置取决于环境设置,例如机器人数量、目标数量及其位置。因此,本实施例测试了100个独立且不同的环境设置,其具有不同数量和位置的目标以及不同数量的机器人,用于评估每个人的适合度(候选解决方案)。在100个独立测试中平均的平均适合度值被设定为个体的最终适合度以供选择。根据特定的环境设置,可能存在更好的参数组合。但是,针对不同的环境设置为系统分配不同的参数是不现实的,因为环境设置事先是未知的。
实施例2
本实施例通过仿真实验,验证MLV-GRN模型的可行性、可扩展性和适应性。仿真环境设置为25mх25m方形区域,基地位于正中位置,环境中布有包括凸多边形、凹多边形、不规则窄道等复杂环境,1型目标和2型目标随机静止分布在环境中,机器人从基地出发,一次完整实验的时间步长为300,通过实施例1设计的F1,F2,F3及其总的适应度函数F,来分析群体性能表现,从而评价模型的性能。
关于可行性:
为了验证该模型的可行性,本实施例选取了10个机器人组成一组,2个2型和4个1型目标作为任务目标,5个不同的障碍物构成一个受限环境。机器人以2米/秒的恒定速度移动。如图6(a)所示,浅灰的小型机器人外出执行搜索任务,在找到2型目标后,变成中型大小的深灰机器人。对目标执行包围任务后,如图6(b)和图6(c)所示,深灰机器人变为黑,协同将目标运回基地。如图6(d)所示,在基地卸载目标后,机器人返回浅灰和最小尺寸,并开始从基地执行新的搜索任务。经过30个时间步,机器人群完成了6个目标的搜索任务。因此,仿真过程验证了模型的可行性。
关于适用性
为了验证模型的适应性,本实施例设计了几组比较实验。如图7(a),(b)和(c)所示,设置环境中有5个不同的障碍物和由10个机器人组成的群体。在1、2、3个2型目标的3组实验中,1型目标的数目不断增加,并统计指定时间内的组机器人的F1,F2,F3及其总的适应度函数F。从图中的结果可以看出,目标数目的增加对机器人的工作效率有着显著的影响。这四个适应度函数都非常稳定,且值很小,说明该群体机器人的性能很好。这证明了MLV-GRN模型对任务量的变化具有适应性。如图7(d)所示,机器人和目标的数量保持不变,环境中障碍物的数量也发生了变化。可以看出,随着障碍物数量的增加,适应度函数只略有增加,说明swarm的性能相对稳定,这证明MLV-GRN模型对环境也具有良好的适应性。
关于可扩展性
为了验证模型的可扩展性,本实施例在环境中设置了5个障碍物,2个2型和4个1型目标,并进行了26组实验。每组机器人增加了一个。如图8所示,当机器人数量太少时,群机器人的性能明显下降。不能满足任务要求。但当机器人数量达到5个以上时,群体的性能趋于稳定和良好。机器人群初始条件设置的随机性导致了数据的波动。证明了MLV-GRN的可扩展性。
其中,图7和图8横坐标为机器人数量,纵坐标为适应度函数。
综上所述,本发明提出了一种基于MLV-GRN的群体机器人模式生成与转换模型。该模型是以H-GRN、CH-GRN和TH-GRN为基础,基于群体机器人协作守卫基地这一场景,横向和纵向扩展原有框架,并且充分评估了机器人群的可行性、适应性、鲁棒性和可扩展性,从行动、形态和功能等多个方面提升群体机器人的能力。此外,在该框架基础上,可以继续拓展基因型、任务型、决策机制等,不断提升群体机器人能力。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种多级可变基因调控网络的群体机器人模式生成与转换方法,其特征在于,包括以下步骤:
获取群体机器人工作场景信息,基于所述工作场景信息以及所述群体机器人的特征信息设计基因表达决策树;
利用基因调控网络,根据所述基因表达决策树生成所述群体机器人的形态模式,所述形态功能包括所述群体机器人的模式生成和群体机器人的模式转换;
采用分布式控制方法,利用反应扩散原理驱动所述群体机器人使所述群体机器人的形态模式趋于所述基因表达决策树生成所述群体机器人的形态模式。
2.根据权利要求1所述的多级可变基因调控网络的群体机器人模式生成与转换方法,其特征在于,所述形态模式包括围捕模式、运输模式和搜索模式。
3.根据权利要求2所述的多级可变基因调控网络的群体机器人模式生成与转换方法,其特征在于,生成或者转换为所述围捕模式的模型如下:
Figure FDA0002436993640000011
Figure FDA0002436993640000012
Figure FDA0002436993640000013
Figure FDA0002436993640000014
Figure FDA0002436993640000015
Figure FDA0002436993640000016
Figure FDA0002436993640000017
其中γj是目标j的位置,在一定范围内,机器人可以利用其板载传感器探测到目标位置或者接收到相邻机器人获取到的目标信息;pj表示由第j个目标产生的环境输入(γj)产生的蛋白质浓度;p表示由j=1到Nt的所有检测到的目标产生的当前机器人位置处的积分蛋白质浓度,其中Nt是检测到的目标的总数;
Figure FDA0002436993640000018
是拉普拉斯算子,它被定义为空间域中pj的二阶导数,可以作为生物系统中的扩散过程;g11,g12,g13和g14是蛋白质浓度,g13和g14是定义不同目标模式的不同形态发生素梯度;在该模型中,g13和g14都受g11和g12调节,g11和g12均受pj调节;群体机器人系统可以轻松实现此设置,因为可以通过板载传感器检测目标;θ11,θ12,θ13和θ14是S形函数的阈值;整合的蛋白质浓度p将影响g11和g12至式(3)和式(4)的表达水平。
4.根据权利要求2所述的多级可变基因调控网络的群体机器人模式生成与转换方法,其特征在于,生成或者转换为所述运输模式的模型如下:
Figure FDA0002436993640000021
Figure FDA0002436993640000022
Figure FDA0002436993640000023
Figure FDA0002436993640000024
其中δ是基地的位置;g23是定义flocking模式的形态发生素的浓度,并受g22,j的和与g21调节;g21受到q调节,g22,j是由机器人检测到的障碍物生成的虚拟机器人j,其个数为ntj
5.根据权利要求2所述的多级可变基因调控网络的群体机器人模式生成与转换方法,其特征在于,生成或者转换为所述搜索模式的模型如下:
Figure FDA0002436993640000025
Figure FDA0002436993640000026
Figure FDA0002436993640000027
Figure FDA0002436993640000028
其中,g33是定义wandering模式的形态发生素的浓度,并受g32,j与g31调节;g31受到q调节,g32,j是由机器人检测到的障碍物生成的虚拟机器人j,其个数为ntj
6.根据权利要求1所述的多级可变基因调控网络的群体机器人模式生成与转换方法,其特征在于,所述形态模式还包括所述群体机器人的个体移动速度,所述个体移动速度由行为蛋白驱动,模型如下:
Figure FDA0002436993640000029
Figure FDA00024369936400000210
Figure FDA00024369936400000211
Figure FDA00024369936400000212
Si,x和Si,y表示i-th机器人检测到目标的x和y位置,这两个位置对应于Pi,x和Pi,y细胞中两种S型蛋白质的浓度,这是机器人的两种内部状态;a、b、c、d和r是常数Di可以看作是机器人系统中从细胞中扩散的蛋白质S的浓度,即附近机器人和障碍物的数量邻域的大小是预先定义的,小于感测范围;
Figure FDA0002436993640000031
Figure FDA0002436993640000032
其中Ni代表机器人i附近的机器人数量,
Figure FDA0002436993640000033
Figure FDA0002436993640000034
代表沿机器人i所接收的机器人j在x轴和y轴扩散的蛋白浓度,其定义为:
Figure FDA0002436993640000035
Figure FDA0002436993640000036
这里,f(a)和f(c)定义为如下sigmoid函数:
Figure FDA0002436993640000037
Figure FDA0002436993640000038
行为蛋白主要驱动个体形态变化,在外界形态蛋白浓度高的地方形体缩小,反之增大;同时受到障碍和友邻的蛋白影响,离障碍和友邻越近,则外界浓度越大,形态缩小,反之增大,具体行为蛋白驱动公式如下:
Figure FDA0002436993640000039
Δd=d-ri-rj (27)
Figure FDA00024369936400000310
Figure FDA00024369936400000311
Figure FDA00024369936400000312
其中Ri是机器人i的半径;Δd是机器人i和机器人j轮廓之间的间距,d是机器人i和机器人j质心的距离;ri和rj分别表示机器人i和j的半径;M是机器人i周围的平均浓度;对于任何一个Ri,它都不能大到碰到其他个体,也不能小于最小半径;
Ri=min{Ri,d-rj} (31)
Ri=max{Ri,Rmin}。 (32)
7.根据权利要求2-5任一所述的多级可变基因调控网络的群体机器人模式生成与转换方法,其特征在于,通过奖励函数对形态模式的参数进行优化,优化目标为:
Figure FDA0002436993640000041
8.根据权利要求7所述的多级可变基因调控网络的群体机器人模式生成与转换方法,其特征在于,如果目标被包围5个时间步以上,则认为包围成功,每个机器人获得正奖励;所述围捕模式的奖励为:
Figure FDA0002436993640000042
Figure FDA0002436993640000043
其中是全局间距平均值
Figure FDA0002436993640000045
Figure FDA0002436993640000046
是机器人i和周围个体之间距离最小的两个值,
Figure FDA0002436993640000047
是离目标距离在d1到d2之间的机器人数量。
9.根据权利要求7所述的多级可变基因调控网络的群体机器人模式生成与转换方法,其特征在于,每个机器人成功将目标带回基地,补充基地能量并给予正回报,所述所述运输模式的回报为:
Figure FDA0002436993640000048
Figure FDA0002436993640000049
其中T是包围机器人转换为运输机器人之后成功带回目标的平均时间,A是flocking的聚集度,它代表每个机器人距离flocking质心的平均距离的大小,其中,
Figure FDA00024369936400000410
Figure FDA00024369936400000411
分别代表机器人j位置的横纵坐标,
Figure FDA00024369936400000412
Figure FDA00024369936400000413
分别代表flocking在时刻t的质心位置横纵坐标,NA代表flocking中机器人的数量。
10.根据权利要求7所述的多级可变基因调控网络的群体机器人模式生成与转换方法,其特征在于,目标出现在机器人的检测范围内,机器人将被视为发现目标并给予正奖励,所述搜索模式的奖励为:
Figure FDA00024369936400000414
Figure FDA00024369936400000415
CN202010255107.6A 2020-04-02 2020-04-02 多级可变基因调控网络的群体机器人模式生成与转换方法 Active CN111476337B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010255107.6A CN111476337B (zh) 2020-04-02 2020-04-02 多级可变基因调控网络的群体机器人模式生成与转换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010255107.6A CN111476337B (zh) 2020-04-02 2020-04-02 多级可变基因调控网络的群体机器人模式生成与转换方法

Publications (2)

Publication Number Publication Date
CN111476337A true CN111476337A (zh) 2020-07-31
CN111476337B CN111476337B (zh) 2022-08-12

Family

ID=71750646

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010255107.6A Active CN111476337B (zh) 2020-04-02 2020-04-02 多级可变基因调控网络的群体机器人模式生成与转换方法

Country Status (1)

Country Link
CN (1) CN111476337B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110262566A (zh) * 2019-06-24 2019-09-20 中国人民解放军国防科技大学 基于合作的基因调控方法和网络
CN112235419A (zh) * 2020-12-09 2021-01-15 之江实验室 基于行为树的机器人云平台执行引擎和执行方法
CN112462779A (zh) * 2020-11-30 2021-03-09 汕头大学 基于基因调控网络的群体机器人动态围捕控制方法及系统
CN112527012A (zh) * 2020-11-30 2021-03-19 汕头大学 一种无中心机器人集群包围任务控制方法及系统
CN112684700A (zh) * 2020-11-30 2021-04-20 汕头大学 一种群体机器人的多目标搜索与围捕控制方法及系统
CN113485119A (zh) * 2021-07-29 2021-10-08 中国人民解放军国防科技大学 一种改进群机器人进化能力的异质同质群体协同进化方法
CN114792072A (zh) * 2022-05-18 2022-07-26 中国人民解放军国防科技大学 一种基于功能的装备决策行为仿真建模方法及系统
CN116339351A (zh) * 2023-05-29 2023-06-27 汕头大学 一种基于基因调控网络的智能体集群区域覆盖方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108415425A (zh) * 2018-02-08 2018-08-17 东华大学 一种基于改进基因调控网络的分布式群机器人协同集群算法
CN109086874A (zh) * 2018-08-07 2018-12-25 穆天机器人(杭州)有限公司 一种基于分形分维结构理论的泛神经网络模型
US20200061841A1 (en) * 2011-08-29 2020-02-27 Neil S. Davey Pharmacy automation using autonomous robot

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200061841A1 (en) * 2011-08-29 2020-02-27 Neil S. Davey Pharmacy automation using autonomous robot
CN108415425A (zh) * 2018-02-08 2018-08-17 东华大学 一种基于改进基因调控网络的分布式群机器人协同集群算法
CN109086874A (zh) * 2018-08-07 2018-12-25 穆天机器人(杭州)有限公司 一种基于分形分维结构理论的泛神经网络模型

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110262566A (zh) * 2019-06-24 2019-09-20 中国人民解放军国防科技大学 基于合作的基因调控方法和网络
CN112527012B (zh) * 2020-11-30 2023-06-27 汕头大学 一种无中心机器人集群包围任务控制方法及系统
CN112462779A (zh) * 2020-11-30 2021-03-09 汕头大学 基于基因调控网络的群体机器人动态围捕控制方法及系统
CN112527012A (zh) * 2020-11-30 2021-03-19 汕头大学 一种无中心机器人集群包围任务控制方法及系统
CN112684700A (zh) * 2020-11-30 2021-04-20 汕头大学 一种群体机器人的多目标搜索与围捕控制方法及系统
CN112462779B (zh) * 2020-11-30 2023-07-25 汕头大学 基于基因调控网络的群体机器人动态围捕控制方法及系统
CN112235419B (zh) * 2020-12-09 2021-03-09 之江实验室 基于行为树的机器人云平台执行引擎和执行方法
CN112235419A (zh) * 2020-12-09 2021-01-15 之江实验室 基于行为树的机器人云平台执行引擎和执行方法
CN113485119A (zh) * 2021-07-29 2021-10-08 中国人民解放军国防科技大学 一种改进群机器人进化能力的异质同质群体协同进化方法
CN113485119B (zh) * 2021-07-29 2022-05-10 中国人民解放军国防科技大学 一种改进群机器人进化能力的异质同质群体协同进化方法
CN114792072A (zh) * 2022-05-18 2022-07-26 中国人民解放军国防科技大学 一种基于功能的装备决策行为仿真建模方法及系统
CN114792072B (zh) * 2022-05-18 2024-01-16 中国人民解放军国防科技大学 一种基于功能的装备决策行为仿真建模方法及系统
CN116339351A (zh) * 2023-05-29 2023-06-27 汕头大学 一种基于基因调控网络的智能体集群区域覆盖方法及系统
CN116339351B (zh) * 2023-05-29 2023-09-01 汕头大学 一种基于基因调控网络的智能体集群区域覆盖方法及系统

Also Published As

Publication number Publication date
CN111476337B (zh) 2022-08-12

Similar Documents

Publication Publication Date Title
CN111476337B (zh) 多级可变基因调控网络的群体机器人模式生成与转换方法
Oh et al. Bio-inspired self-organising multi-robot pattern formation: A review
CN110083165B (zh) 一种机器人在复杂狭窄环境下路径规划方法
US7467115B2 (en) Mobile brain-based device having a simulated nervous system based on the hippocampus
Husbands et al. Artificial evolution: A new path for artificial intelligence?
CN112461247A (zh) 一种基于自适应麻雀搜索算法的机器人路径规划方法
CN110262566B (zh) 基于合作的基因调控方法和网络
Guo et al. Swarm robot pattern formation using a morphogenetic multi-cellular based self-organizing algorithm
CN113504798B (zh) 一种仿生物群体协商行为的无人机集群协同目标搜索方法
Tang et al. A GWO-based multi-robot cooperation method for target searching in unknown environments
CN110000781B (zh) 基于发育网络的移动机器人运动方向预先决策方法
Hou et al. Using deep reinforcement learning to speed up collective cell migration
Pan et al. Research on path planning algorithm of mobile robot based on reinforcement learning
Cao et al. Dynamic task assignment for multi-AUV cooperative hunting
CN114143882A (zh) 基于强化组织控制的多智体系统自组织方法及系统
Fan et al. Automated pattern generation for swarm robots using constrained multi-objective genetic programming
Wang et al. Predatory search strategy based on swarm intelligence for continuous optimization problems
CN115327926A (zh) 基于深度强化学习的多智能体动态覆盖控制方法及系统
Araghi et al. A novel modular Q-learning architecture to improve performance under incomplete learning in a grid soccer game
Li et al. Multirobot coverage path planning based on deep q-network in unknown environment
CN101477689A (zh) 一种基于自适应蚁群智能的空中机器人视觉分层匹配方法
Yang et al. Automatic synthesizing multi-robot cooperation strategies based on Brain Storm Robotics
Dote Soft computing (immune networks) in artificial intelligence
Mishra et al. A distributed epigenetic shape formation and regeneration algorithm for a swarm of robots
Hexmoor et al. Plan sharing: Showcasing coordinated UAV formation flight

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant