CN112465127B - 一种基于改进的生物启发神经网络的多智能体协同目标搜索方法 - Google Patents

一种基于改进的生物启发神经网络的多智能体协同目标搜索方法 Download PDF

Info

Publication number
CN112465127B
CN112465127B CN202011366198.7A CN202011366198A CN112465127B CN 112465127 B CN112465127 B CN 112465127B CN 202011366198 A CN202011366198 A CN 202011366198A CN 112465127 B CN112465127 B CN 112465127B
Authority
CN
China
Prior art keywords
neuron
neural network
grid
external input
agent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011366198.7A
Other languages
English (en)
Other versions
CN112465127A (zh
Inventor
刘明雍
李晓玉
牛云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202011366198.7A priority Critical patent/CN112465127B/zh
Publication of CN112465127A publication Critical patent/CN112465127A/zh
Application granted granted Critical
Publication of CN112465127B publication Critical patent/CN112465127B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/061Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using biological neurons, e.g. biological neurons connected to an integrated circuit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Neurology (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提出一种基于改进的生物启发神经网络的多智能体协同目标搜索方法,该方法通过“平均邻居输入激励耦合”,有效解决基于生物启发神经网络的目标搜索存在单个个体陷入“死锁”的问题;此外,加入“障碍物膨胀”的理论,即将障碍物所在栅格及其周围8个邻居栅格的神经激励输入均设为较大的负数值,从而有效解决多个体行径中碰撞的问题;最后,针对搜索的路径非最优的问题,采用基于“预测控制”的多步搜索策略,从而决策出最短路径。因此,基于改进的生物启发神经网络的多智能体协同目标搜索方法能够有效的提高搜索效率。

Description

一种基于改进的生物启发神经网络的多智能体协同目标搜索 方法
技术领域
本发明属于目标搜索技术领域,具体涉及一种基于改进的生物启发神经网络的多智能体协同目标搜索方法。
背景技术
多智能体目标搜索是指多个智能体通过协作,利用机载传感器对任务区域进行勘测,获取目标信息。目标搜索是实现救援、侦查、防御等任务的重要环节,是多智能体研究的重要内容之一。
生物启发神经网络方法是当前比较新颖的一种目标搜索方法,它比较适用于动态不确定环境,且计算复杂度小。但在目标搜索的过程中,总会出现搜索路径过长,无法避免搜索过程中的碰撞等问题,从而导致目标搜索的效率较低甚至无法搜索到目标。
发明内容
为了解决现有技术存在的问题,本发明提出一种基于改进的生物启发神经网络的多智能体协同目标搜索方法,通过加入”障碍物膨胀“理论,有效避免智能体之间的碰撞,同时使智能体尽量分散开,以搜索不同的区域;并采用基于预测控制的多步搜索算法,相较于原始生物启发神经网络的单步搜索算法,能够有效提高搜索的效率。
本发明的技术方案为:
一种基于改进的生物启发神经网络的多智能体协同目标搜索方法,包括以下步骤:
步骤1:将搜索区域栅格化:
将搜索区域分隔成大小相同,互不重叠的m×n个栅格,每个栅格都代表一个离散的神经元,每个神经元的初始活性值均为零;
步骤2:初始化神经元的外部输入激励:
在栅格地图中,将智能体没有到过的区域称为未覆盖区域,并且设置神经元的外部输入激励为+E;智能体到过的区域称为已覆盖区域,并且设置神经元的外部输入激励为0;将障碍物所在的区域称为障碍物区域,并且设置神经元的外部输入激励为-E;
步骤3:初始化神经网络的活性值:
根据步骤2中每个神经元的外部输入激励,按照神经网络活性值计算公式,计算整个搜索区域中各个神经元的活性值:
其中,xi为栅格i对应神经元的活性值,A,B和D为设定常数,-A反映了栅格i对应神经元的活性值xi的衰减速率,B和D分别为神经元活性值的上下限值;Ii表示栅格i对应神经元的外部输入激励信号,其中未覆盖区域神经元的外部输入激励为E,障碍物区域神经元的外部输入激励为-E,已覆盖区域神经元的外部输入激励为0,E为远大于B的正常数,[Ii]+=max{Ii,0},[Ii]-=max{-Ii,0};
代表了栅格i对应神经元受到来自其感知区域内的其他正活性神经元的输入总和,k是栅格i对应神经元可感知的神经元数量;wij表示栅格i对应神经元与栅格j对应神经元之间的连接权值,wij=f(dij),dij=|qi-qj|表示栅格i对应神经元所在位置向量qi和栅格j对应神经元所在位置向量qj之间的欧式距离,f为递减函数;
步骤4:基于障碍物膨胀原理,更新神经网络活性值:
步骤4.1:智能体i利用自身感器探测其感知范围内是否有智能体j存在,如果有,则将智能体j所在栅格及智能体j周围的8个邻居栅格的神经元的外部输入激励设置为-E,如果没有,则按照步骤2设置神经元的外部输入激励;
步骤4.2:按照步骤4.1的神经元外部输入激励,利用神经网络活性值计算公式,更新整个神经网络神经元的活性值;
步骤5:基于预测控制的多步搜索策略,决策智能体下一时刻的位置:
步骤5.1:基于智能体i当前时刻的状态,预测未来T时刻的状态,T为预测时域,得到智能体决策树的不同的候选路径;
步骤5.2:对于每条候选路径,均计算候选路径中的神经元活性值总和,选择活性值总和最大的路径作为下一时刻的移动位置;
步骤5.3:智能体移动到步骤5.2决策的位置,判断智能体探测范围内是否存在目标,若存在目标,则结束搜索;若不存在目标,设置智能体当前所在神经元的外部输入激励为0,并且返回步骤4更新神经网络的活性值,继续搜索目标。
有益效果
本发明提出一种基于改进的生物启发神经网络的多智能体协同目标搜索方法,该方法通过“平均邻居输入激励耦合”,有效解决基于生物启发神经网络的目标搜索存在单个个体陷入“死锁”的问题;此外,加入“障碍物膨胀”的理论,即将障碍物所在栅格及其周围8个邻居栅格的神经激励输入均设为较大的负数值,从而有效解决多个体行径中碰撞的问题;最后,针对搜索的路径非最优的问题,采用基于“预测控制”的多步搜索策略,从而决策出最短路径。因此,基于改进的生物启发神经网络的多智能体协同目标搜索方法能够有效的提高搜索效率。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1:栅格地图的图形化表示;
图2:神经元的感知区域;
图3:障碍物膨胀示意图;
图4:预测3T时刻的转向表示;
图5:个体与其他智能体的平均距离;
图6:平均搜索步数统计对比图。
具体实施方式
下面结合附图和实施例描述本发明:
本发明提出的一种基于改进的生物启发神经网络的多智能体协同目标搜索方法,包括以下步骤:
步骤1:将搜索区域栅格化:
将搜索区域分隔成大小相同,互不重叠的m×n个栅格,每个栅格都代表一个离散的神经元,每个神经元的初始活性值均为零。
步骤2:初始化神经元的外部输入激励:
在栅格地图中,如图1所示,黑色栅格表示环境中已知的静态障碍物,空白栅格表示智能体的可行区域;将智能体没有到过的区域称为未覆盖区域,并且设置神经元的外部输入激励为+E;将障碍物所在的区域称为障碍物区域,并且设置神经元的外部输入激励为-E;
步骤3:初始化神经网络的活性值,这里的神经网络即栅格化的搜索区域中各个栅格对应的神经元组成的网络;
根据步骤2中每个神经元的输入激励信号,按照如下神经网络活性值计算公式,计算整个搜索区域的活性值
其中,xi为栅格i对应神经元的活性值,A,B和D为设定常数,-A反映了栅格i对应神经元的活性值xi的衰减速率,B和D分别为神经元活性值的上下限值。Ii表示栅格i对应神经元的外部输入激励信号,其中未覆盖区域神经元的外部输入激励为E,障碍物区域神经元的外部输入激励为-E,已覆盖区域神经元的外部输入激励为0,E是一个远大于B的正常数,[Ii]+=max{Ii,0},[Ii]-=max{-Ii,0}。
代表了栅格i对应神经元受到来自其感知区域的其他正活性神经元的输入总和,k是栅格i对应神经元可感知的神经元数量。wij表示栅格i对应神经元与栅格j对应神经元之间的连接权值,wij=f(dij),dij=|qi-qj|表示栅格i对应神经元所在位置向量qi和栅格j对应神经元所在位置向量qj之间的欧式距离,f可以是任意递减函数,表达式如下:
式中u是非负数,r0是神经元的感知半径,如图2所示,每个神经元的最大神经元感知数量为8。
步骤4:基于障碍物膨胀原理,更新神经网络活性值
对于任意一个智能体i而言,邻居智能体相当于环境中的动态障碍物,由于在生物激励神经网络现有结构中,障碍物的刺激信息仅能在局部传递,因此无法将邻居机器人当作静态障碍物一样避掉,因此采用障碍物膨胀方法实现智能体之间的避障,具体如下:
步骤4.1:智能体i利用机载的传感器探测其感知范围内是否有智能体j存在,如果有,则将智能体j及智能体j周围的8个邻居栅格的神经元的外部输入激励设置为-E,如图3所示,如果没有,则按照步骤2设置神经元的外部输入激励;
步骤4.2:按照步骤4.1的神经元输入激励,利用神经网络活性值计算公式,更新整个神经网络神经元的活性值;
步骤5:基于预测控制的多步搜索策略,决策智能体下一时刻的位置
根据步骤4更新后的神经网络的活性值,基于预测控制的思想,决策智能体下一时刻的位置,具体操作如下:
步骤5.1:基于智能体i当前时刻的状态,预测未来T时刻的状态,T为预测时域;由于下一时刻智能体的移动方向是基于当前时刻运动方向直行、向左转45°、右转45°三种状态,如图4所示,则未来T时刻有3T个候选路径;
步骤5.2:智能体的决策树共有3T中不同的候选路径,计算每条候选路径中的神经元活性值总和,选择活性值总和最大的路径作为下一时刻的移动位置;
步骤5.3:智能体移动到步骤5.2决策的位置,判断智能体探测范围内是否存在目标,若是,搜索到目标,结束搜索;若不是,设置智能体当前所在神经元的外部输入激励为0,并且返回步骤4更新神经网络的活性值,继续搜索目标。
下面给出一个具体的实施例:
本实施例选取搜索区域的大小为20m×20m,划分为20×20个栅格,智能体的初始x坐标和y坐标均为[1m,16m]范围内的随机数,目标点位于栅格(19m,19m)。公式(1)中的参数给定A,B,D,u,r0和E。
在目标搜素的过程中,附图5以10个智能体为例,分别绘制在有无“障碍物膨胀”的条件下,智能体之间的最短距离变化趋势。附图5中蓝色折线表示没有障碍物膨胀情况,橙色折线表示有障碍物膨胀情况。由附图5橙色折线可以看出,多智能体个体之间的最短距离始终大于1,说明个体之间保持了安全的距离,从而避免个体之间的碰撞;附图5蓝色折线,智能体之间的最短距离可能为0,这就意味着个体之间发生了碰撞,由此说明基于障碍物膨胀的多智能体目标搜索能够实现个体间的避碰。
为了证明基于预测控制的多步搜索相比于单步搜索的优越性,设置100次蒙特卡洛仿真,预测时域为T=5。由平均搜索步数的统计对比图6可以看出,多步决策相比与单步搜索能够明显的减少平均搜索步数,表明采用“预测控制”能决策出最短路径,提高目标搜索的效率,验证了该发明的有效性。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (4)

1.一种基于改进的生物启发神经网络的多智能体协同目标搜索方法,其特征在于:
包括以下步骤:
步骤1:将搜索区域栅格化:
将搜索区域分隔成大小相同,互不重叠的m×n个栅格,每个栅格都代表一个离散的神经元,每个神经元的初始活性值均为零;
步骤2:初始化神经元的外部输入激励:
在栅格地图中,将智能体没有到过的区域称为未覆盖区域,并且设置神经元的外部输入激励为+E;智能体到过的区域称为已覆盖区域,并且设置神经元的外部输入激励为0;将障碍物所在的区域称为障碍物区域,并且设置神经元的外部输入激励为-E;
步骤3:初始化神经网络的活性值:
根据步骤2中每个神经元的外部输入激励,按照神经网络活性值计算公式,计算整个搜索区域中各个神经元的活性值:
其中,xi为栅格i对应神经元的活性值,A,B和D为设定常数,-A反映了栅格i对应神经元的活性值xi的衰减速率,B和D分别为神经元活性值的上下限值;Ii表示栅格i对应神经元的外部输入激励信号,其中未覆盖区域神经元的外部输入激励为E,障碍物区域神经元的外部输入激励为-E,已覆盖区域神经元的外部输入激励为0,E为远大于B的正常数,[Ii]+=max{Ii,0},[Ii]-=max{-Ii,0};
代表了栅格i对应神经元受到来自其感知区域内的其他正活性神经元的输入总和,k是栅格i对应神经元可感知的神经元数量;wij表示栅格i对应神经元与栅格j对应神经元之间的连接权值,wij=f(dij),dij=|qi-qj|表示栅格i对应神经元所在位置向量qi和栅格j对应神经元所在位置向量qj之间的欧式距离,f为递减函数;
步骤4:基于障碍物膨胀原理,更新神经网络活性值:
步骤4.1:智能体i利用自身感器探测其感知范围内是否有智能体j存在,如果有,则将智能体j所在栅格及智能体j周围的8个邻居栅格的神经元的外部输入激励设置为-E,如果没有,则按照步骤2设置神经元的外部输入激励;
步骤4.2:按照步骤4.1的神经元外部输入激励,利用神经网络活性值计算公式,更新整个神经网络神经元的活性值;
步骤5:基于预测控制的多步搜索策略,决策智能体下一时刻的位置:
步骤5.1:基于智能体i当前时刻的状态,预测未来T时刻的状态,T为预测时域,得到智能体决策树的不同的候选路径;
步骤5.2:对于每条候选路径,均计算候选路径中的神经元活性值总和,选择活性值总和最大的路径作为下一时刻的移动位置;
步骤5.3:智能体移动到步骤5.2决策的位置,判断智能体探测范围内是否存在目标,若存在目标,则结束搜索;若不存在目标,设置智能体当前所在神经元的外部输入激励为0,并且返回步骤4更新神经网络的活性值,继续搜索目标。
2.根据权利要求1所述一种基于改进的生物启发神经网络的多智能体协同目标搜索方法,其特征在于:步骤3中递减函数采用:
式中u是非负数,r0是神经元的感知半径。
3.根据权利要求2所述一种基于改进的生物启发神经网络的多智能体协同目标搜索方法,其特征在于:每个神经元的最大神经元感知数量为8。
4.根据权利要求1所述一种基于改进的生物启发神经网络的多智能体协同目标搜索方法,其特征在于:步骤5中,下一时刻智能体的移动方向是基于当前时刻运动方向直行、向左转45°、右转45°三种状态,则未来T时刻有3T个候选路径。
CN202011366198.7A 2020-11-29 2020-11-29 一种基于改进的生物启发神经网络的多智能体协同目标搜索方法 Active CN112465127B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011366198.7A CN112465127B (zh) 2020-11-29 2020-11-29 一种基于改进的生物启发神经网络的多智能体协同目标搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011366198.7A CN112465127B (zh) 2020-11-29 2020-11-29 一种基于改进的生物启发神经网络的多智能体协同目标搜索方法

Publications (2)

Publication Number Publication Date
CN112465127A CN112465127A (zh) 2021-03-09
CN112465127B true CN112465127B (zh) 2024-05-28

Family

ID=74809614

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011366198.7A Active CN112465127B (zh) 2020-11-29 2020-11-29 一种基于改进的生物启发神经网络的多智能体协同目标搜索方法

Country Status (1)

Country Link
CN (1) CN112465127B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113110517B (zh) * 2021-05-24 2022-11-29 郑州大学 未知环境下基于生物启发的多机器人协作搜索方法
CN113587931B (zh) * 2021-07-08 2024-07-09 中汽创智科技有限公司 一种路径规划方法、装置、设备及存储介质
CN116625378B (zh) * 2023-07-18 2023-10-31 上海仙工智能科技有限公司 一种跨区域路径规划方法及系统、存储介质
CN117762150B (zh) * 2024-02-22 2024-04-26 北京航空航天大学 多智能体分布式区域覆盖控制方法、智能体和程序产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045260A (zh) * 2015-05-25 2015-11-11 湖南大学 一种未知动态环境下的移动机器人路径规划方法
CN106843216A (zh) * 2017-02-15 2017-06-13 北京大学深圳研究生院 一种基于回溯搜索的生物激励机器人完全遍历路径规划方法
CN111487986A (zh) * 2020-05-15 2020-08-04 中国海洋大学 基于全局信息传递机制的水下机器人协同目标搜索方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI406181B (zh) * 2009-05-11 2013-08-21 Nat Univ Tsing Hua 一種建構和搜尋三維影像資料庫之方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045260A (zh) * 2015-05-25 2015-11-11 湖南大学 一种未知动态环境下的移动机器人路径规划方法
CN106843216A (zh) * 2017-02-15 2017-06-13 北京大学深圳研究生院 一种基于回溯搜索的生物激励机器人完全遍历路径规划方法
CN111487986A (zh) * 2020-05-15 2020-08-04 中国海洋大学 基于全局信息传递机制的水下机器人协同目标搜索方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于改进生物启发神经网络的机器人目标搜索方法;张智彤等;《计算机与现代化》;20180420;全文 *
基于生物启发神经网络的多AUV目标搜索;孙奥林等;《船舶电子工程》;20190320;全文 *

Also Published As

Publication number Publication date
CN112465127A (zh) 2021-03-09

Similar Documents

Publication Publication Date Title
CN112465127B (zh) 一种基于改进的生物启发神经网络的多智能体协同目标搜索方法
Zhen et al. An intelligent cooperative mission planning scheme of UAV swarm in uncertain dynamic environment
CN110514206B (zh) 一种基于深度学习的无人机飞行路径预测方法
US11480967B2 (en) Pass route planning method and apparatus, device and readable storage medium
CN110162035B (zh) 一种集群机器人在有障碍物场景中的协同运动方法
Botteghi et al. On reward shaping for mobile robot navigation: A reinforcement learning and SLAM based approach
CN110147101A (zh) 一种基于深度强化学习的端到端分布式多机器人编队导航方法
CN110389591A (zh) 一种基于dbq算法的路径规划方法
CN110381442B (zh) 一种基于隐式信息交互方式的群机器人目标搜索方法
Venayagamoorthy et al. Navigation of mobile sensors using PSO and embedded PSO in a fuzzy logic controller
Tang Coverage path planning of unmanned surface vehicle based on improved biological inspired neural network
CN110908384B (zh) 一种分布式多机器人协同过未知随机迷宫的编队导航方法
CN110412984B (zh) 一种群集安全一致性控制器及其控制方法
CN113467481B (zh) 一种基于改进Sarsa算法的路径规划方法
Fan et al. Hierarchical path planner for unknown space exploration using reinforcement learning-based intelligent frontier selection
Yang et al. Complete coverage path planning based on bioinspired neural network and pedestrian location prediction
Wang et al. An Enabling Decision-Making Scheme by Considering Trajectory Prediction and Motion Uncertainty
Tuba et al. Water cycle algorithm for robot path planning
Li et al. Improved artificial fish swarm algorithm approach to robot path planning problems
CN114200960A (zh) 基于禁忌表改进麻雀算法的无人机集群搜索控制优化方法
CN113487870A (zh) 一种基于cw攻击对智能单交叉口的对抗扰动生成方法
CN113344071A (zh) 一种基于深度策略梯度的入侵检测算法
Wang et al. Vision-based initial localization of AGV and path planning with PO-JPS algorithm
Yang et al. Adaptive Coordinated Motion Control for Swarm Robotics Based on Brain Storm Optimization
Qi et al. Optimal path planning for an unmanned aerial vehicle under navigation relayed by multiple stations to intercept a moving target

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant