CN110275549B - 一种多智能体自主式跟踪方法、装置及计算机可存储介质 - Google Patents

一种多智能体自主式跟踪方法、装置及计算机可存储介质 Download PDF

Info

Publication number
CN110275549B
CN110275549B CN201910499778.4A CN201910499778A CN110275549B CN 110275549 B CN110275549 B CN 110275549B CN 201910499778 A CN201910499778 A CN 201910499778A CN 110275549 B CN110275549 B CN 110275549B
Authority
CN
China
Prior art keywords
agent
collision avoidance
target
speed
order function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910499778.4A
Other languages
English (en)
Other versions
CN110275549A (zh
Inventor
刘瑜
李岩山
王海鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN201910499778.4A priority Critical patent/CN110275549B/zh
Publication of CN110275549A publication Critical patent/CN110275549A/zh
Application granted granted Critical
Publication of CN110275549B publication Critical patent/CN110275549B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/12Target-seeking control

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明涉及一种基于自适应避撞机制的多智能体自主式跟踪方法、装置及计算机可存储介质。本发明通过构建了智能体运动控制代价函数,引入了暴力优化匹配及动态权值策略,描述了一种新颖的动态自适应的多智能体避撞责任划分方法,可大幅降低目标跟踪过程中多智能体避撞速度解集出现空集的概率,并通过全局最优控制器同时兼顾多智能体连续探测性能与运动平稳性,从而有效保障多智能体自主式跟踪的连续性与稳定性。

Description

一种多智能体自主式跟踪方法、装置及计算机可存储介质
技术领域
本申请实施例涉及计算机技术领域,特别是涉及一种基于自适应避撞机制的多智能体自主式跟踪方法、装置及计算机可存储介质。
背景技术
目前,基于智能体的自动跟踪技术在机场、商店、剧院、交通路口等众多场景中具有广泛应用前景。通过多智能体的协同控制以及有效的信息交互反馈,基于视频传感器的自主式跟踪目的在于对感兴趣目标实施连续高精度定位,同时能够尽可能持续探测目标形状、大小等重要特征。然而,在移动视频传感器目标追踪过程中,智能体的移动受限于自身探测方式、观测区域及运动模式,且与目标实时运动特征密切关联,尤其当多个智能体在同一场景中执行任务且各自跟踪对应的目标时,若多目标的运动路径发生交叉,则很可能导致多智能体相互碰撞或目标丢失现象。
目前,大多数避撞方法通过智能体之间的相对速度来判决,为各智能体解算出安全的运动速度。其中,每个智能体独立计算得到与自身期望速度最为接近的安全速度。例如,某个智能体在运动过程中的单个时刻,若其他智能体没有以相同的方式和路径来执行移动控制,则此智能体能够以期望的速度实施自身运动。在此情况下,假如网络中每个智能体均可以感知到邻居智能体的位置,且预知其期望速度,则此类基于相对速度的避撞方法不需要邻居节点之间进行通信即可以顺利执行协同目标探测与跟踪任务。
然而,当环境中智能体或目标密集且交叉运动现象严重时,传统基于相对速度的避撞方法在计算多智能体运动路径的过程中将面临无解的情况,即无法得到能够同时满足所有智能体相互避撞且连续跟踪目标的速度解集。虽然,已有方法通过调整智能体两两之间的速度约束,以便在空集发生的情况下具有至少一个速度解。但是,这种方法虽然缓解了空集问题,但智能体的移动完全依赖于邻近的智能体状况,其运动稳定性难以保障。
发明内容
为了解决上述问题,本发明提供了一种基于自适应避撞机制的多智能体自主式跟踪方法、装置及计算机可存储介质,其能够有效保障多智能体自主式跟踪的连续性与稳定性。
本发明第一方面公开一种基于自适应避撞机制的多智能体自主式跟踪方法,该方法包括:
获取当前时刻目标智能体的期望速度;
根据所述期望速度计算所述目标智能体的动态自适应避撞权值;
根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集;
若所述目标智能体与参考智能体之间的避撞速度可行集为非空集,则根据所述避撞速度可行集计算所述目标智能体的最终速度可行集;
若所述最终速度可行集为非空集,则构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数,所述跟踪代阶函数用于控制观察目标始终在所述目标智能体的观测区域中心,所述运动平稳代阶函数用于控制所述目标智能体运动的平稳性;
根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集;
根据所述运动控制解集控制所述目标智能体跟踪所述观察目标。
作为一种可选的实施方式,所述方法还包括:
若所述避撞速度可行集是空集,则控制所述目标智能体停止运动并获取下一时刻目标智能体的期望速度,并执行所述根据所述期望速度计算所述目标智能体的动态自适应避撞权值、所述根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集,直至所述目标智能体与参考智能体之间的避撞速度可行集为非空集。
作为一种可选的实施方式,构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数,包括:
根据所述观察目标的当前位置与所述观测区域中心之间的位置偏差计算所述跟踪代阶函数;
根据所述目标智能体的实时速度变化状态及所述跟踪代阶函数计算所述运动平稳代阶函数。
作为一种可选的实施方式,所述根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集,包括:
基于所述跟踪代阶函数与所述运动平稳代阶函数,通过暴力匹配模型最小化计算智能体运动控制解集,其中,所述暴力匹配模型包括所述目标智能体的避撞责任权值。
作为一种可选的实施方式,所述根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集,包括:
根据所述目标智能体与参考智能体之间的相对期望速度,得到最短路径向量,所述最短路径向量表示在预设时间段内所述目标智能体与所述参考智能体能够实现避免碰撞的最小相对速度变化值;
根据所述最短路径向量计算所述目标智能体的预选避撞速度可行集;
根据所述最短路径向量计算所述参考智能体的预选避撞速度可行集;
根据所述目标智能体的预选避撞速度可行集、所述参考智能体的预选避撞速度可行集、所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集。
作为一种可选的实施方式,所述动态自适应避撞权值通过所述目标智能体的预选避撞速度可行集与所述参考智能体的预选避撞速度可行集的比率确定。
作为一种可选的实施方式,所述根据所述避撞速度可行集计算所述目标智能体的最终速度可行集,包括:
从所述避撞速度可行集中挑选出满足预设约束条件的元素,并得到所述最终速度可行集。
本发明第二方面公开了一种基于自适应避撞机制的多智能体自主式跟踪装置,所述装置包括获取模块、第一计算模块、第二计算模块、第三计算模块、第四计算模块、第一判断模块、第二判断模块、构建模块、控制模块,其中:
所述获取模块,用于获取当前时刻目标智能体的期望速度;
所述第一计算模块,用于根据所述期望速度计算所述目标智能体的动态自适应避撞权值;
所述第二计算模块,用于根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集;
所述第一判断模块,用于判断出所述目标智能体与参考智能体之间的避撞速度可行集是否是空集;
所述第三计算模块,用于当所述第一判断模块判断所述目标智能体与参考智能体之间的避撞速度可行集为非空集时,根据所述避撞速度可行集计算所述目标智能体的最终速度可行集;
所述第二判断模块,用于判断所述最终速度可行集是否为空集;
所述构建模块,用于当所述第二判断模块判断出所述最终速度可行集为非空集时,构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数,所述跟踪代阶函数用于控制观察目标始终在所述目标智能体的观测区域中心,所述运动平稳代阶函数用于控制所述目标智能体运动的平稳性;
所述第四计算模块,用于根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集;
所述控制模块,用于根据所述运动控制解集控制所述目标智能体跟踪所述观察目标。
本发明第三方面公开了另一种基于自适应避撞机制的多智能体自主式跟踪装置,该装置包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明第一方面所述的一种基于自适应避撞机制的多智能体自主式跟踪方法。
本发明第四方面公开一种计算机可存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本发明第一方面所述的一种基于自适应避撞机制的多智能体自主式跟踪方法。
与现有技术相比,本发明的有益效果为:
本发明通过构建了目标智能体的运动控制代价函数,引入了暴力优化匹配及动态权值策略,描述了一种新颖的动态自适应的多智能体避撞责任划分方法,可大幅降低智能体避撞速度解集出现空集的概率,并通过全局最优控制器同时兼顾多智能体连续探测性能与运动平稳性,从而有效保障多智能体自主式跟踪的连续性与稳定性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一公开的一种基于自适应避撞机制的多智能体自主式跟踪方法的流程示意图;
图2是本发明实施例二公开的一种基于自适应避撞机制的多智能体自主式跟踪装置的结构示意图;
图3是本发明实施例三公开的一种基于自适应避撞机制的多智能体自主式跟踪装置的结构示意图;
图4是本发明实施例的智能体目标探测示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
在本发明实施例中,为了便于描述,做以下约定:
设定场景中存在M个智能体{s1,s2,...si,...sM},跟踪M个目标,其中每个智能体自主跟踪一个目标。可以设置i为智能体的序号,n是目标的序号,t为时间步长。每个智能体的半径为r,并且在全局坐标系中具有位置参数pi(t)和速度参数vi(t)。可以设置智能体si与其监测的目标之间的距离为di(t)=||pn(t)-pi(t)||,智能体的朝向与目标之间的夹角为ψin(t)∈(-π,π]。设定每个智能体装载一个视频传感器,其探测区域为扇形,探测距离为ro,扇形角度为ψo,且传感器的朝向与智能体的朝向相同。对于网络中的某个智能体si,其主要任务就是通过与目标保持特定的距离来持续锁定目标,且同时要避免与其他智能体sj发生碰撞,即任意两个智能体之间的距离随时要满足条件
Figure BDA0002089835110000061
智能体目标探测示意如图4所示。
下面将结合具体的实施例方式对本发明进行详细说明。
实施例一
请参阅图1,图1是本发明实施例一所示的一种基于自适应避撞机制的多智能体自主式跟踪方法的流程示意图,其中,该方法包括如下步骤:
101、获取当前时刻目标智能体的期望速度;
在本发明实施例中,环境中的多个目标智能体能够基于周围邻居智能体以及自身对应目标的位置关系,且在单个时刻保持平稳运动的条件下计算自身的期望速度,以确保观察目标在自身观测区域内的最佳位置(例如观测区域的中心)。
102、根据所述期望速度计算所述目标智能体的动态自适应避撞权值。
103、根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集。
示例性地,假定目标智能体用si表示,参考智能体用sj表示,其中,目标智能体si和参考智能体sj的位置分别为pi和pj,且目标智能体、参考智能体的期望速度分别为
Figure BDA0002089835110000071
Figure BDA0002089835110000072
目标智能体与参考智能体的相对速度为v,则对于目标智能体si来说,在时间段τ内由参考智能体sj引起碰撞的速度集为:
Figure BDA0002089835110000073
由公式(1)可知,在时间段τ内由目标智能体si不与参考智能体sj不发生碰撞的速度集为:
Figure BDA0002089835110000074
即目标智能体si与参考智能体sj,若si选择运动速度
Figure BDA0002089835110000075
且sj选择运动速度为
Figure BDA0002089835110000076
则参考智能体与目标智能体不会发生碰撞。
104、若所述目标智能体与参考智能体之间的避撞速度可行集为非空集,则根据所述避撞速度可行集计算所述目标智能体的最终速度可行集。
105、若所述最终速度可行集为非空集,则构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数,所述跟踪代阶函数用于控制观察目标始终在所述目标智能体的观测区域中心,所述运动平稳代阶函数用于控制所述目标智能体运动的平稳性。
在本发明实施例中,采用类似于汽车的运动模型来描述目标智能体。目标智能体的运动控制Ci(t)由速度vi(t)和转向角
Figure BDA0002089835110000079
并且速度和转向角具有极限值|vi(t)|≤vmax
Figure BDA0002089835110000077
为了求算目标智能体运动控制解集Ci(t),首先构建目标跟踪代价函数Cost1(t)和智能体运动平稳代价函数Cost2(t),其功能分别是保持观察目标在智能体观测区域的中心以及保持智能体运动的平稳性。
为计算Cost1(t)、Cost2(t)的解集,先定义距离偏差与观测区域中心的比值为
Figure BDA0002089835110000078
定义角度偏差与观测区域中心的比值为
Figure BDA0002089835110000081
其中,在给定Ci(t)的条件下,基于观察目标的状态和目标智能体的状态,可以计算得到观察目标与目标智能体在t+1时刻的距离din(t+1)和角度ψin(t+1)。
具体地,基于距离偏差与观测区域中心的比值计算Cost1(t),即公式(3):
Figure BDA0002089835110000082
其中exp(·)是以自然常数e为底的指数函数。可见,Cost1(t)<exp(1)保证了观察目标位于对应的目标智能体探测区域内。若观察目标正好位于探测区域中心,则Cost1(t)取得其最小值,Cost1(t)=exp(0)=1。
具体地,基于公式(3)以及目标智能体的加速或减速情况,计算Cost2(t),即公式(4):
Figure BDA0002089835110000083
其中,vmax+||vi(t)||是目标智能体在两个连续时间步长之间运动速度的最大差值。若目标智能体在两个相邻时间步长内没有速度变化,则代价函数取得最小值,即Cost2(t)=1。
106、根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集;
107、根据所述运动控制解集控制所述目标智能体跟踪所述观察目标。
作为一种可选的实施方式,若所述避撞速度可行集是空集,则执行步骤108,即,控制所述目标智能体停止运动并获取下一时刻目标智能体的期望速度,并执行所述根据所述计算所述目标智能体的动态自适应避撞权值、所述根据所述计算所述目标智能体与参考智能体之间的避撞速度可行集,直至所述目标智能体与参考智能体之间的避撞速度可行集为非空集。
作为一种可选的的实施方式,步骤105包括:
根据所述观察目标的当前位置与所述观测区域中心之间的位置偏差计算所述跟踪代阶函数;
根据所述目标智能体的实时速度变化状态及所述跟踪代阶函数计算所述运动平稳代阶函数。
作为一种可选的实施方式,步骤106包括:
基于所述跟踪代阶函数与所述运动平稳代阶函数,通过暴力匹配模型最小化计算智能体运动控制解集,其中,所述暴力匹配模型包括所述目标智能体的避撞责任权值。
具体地,有公式(3)和公式(4)计算Ci(t),即公式(5):
Ci(t)=argminc(ωCost1(t)+(1-ω)Cost2(t))………………………(5);
其中,权值ω∈[0.5,1],在本发明实施例中,优选可以将ω设置为0.5。需要说明的是,可以根据观察目标是否在目标智能体观测区域内来调整ω的大小。比如,若是智能体已经丢失目标,则其主要任务是要尽可能重新捕获目标,此时不考虑运动是否平稳,将ω设置为1。而当目标位于智能体观测区域内,则智能体的主要任务是在保障运动平稳的条件下尽可能将目标位于探测中心,此时,可将ω设置为0.6,这样一来,就能够较好地保障两个代价函数之间的权衡。
作为一种可选的实施方式,步骤103包括:
根据所述目标智能体与参考智能体之间的相对期望速度,得到最短路径向量,所述最短路径向量表示在预设时间段内所述目标智能体与所述参考智能体能够实现避免碰撞的最小相对速度变化值;
根据所述最短路径向量计算所述目标智能体的预选避撞速度可行集;
根据所述最短路径向量计算所述参考智能体的预选避撞速度可行集;
根据所述目标智能体的预选避撞速度可行集、所述参考智能体的预选避撞速度可行集、所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集。
具体地,定义
Figure BDA0002089835110000091
为目标智能体si关于参考智能体sj的相对期望速度,ui,j
Figure BDA0002089835110000092
到速度集
Figure BDA0002089835110000093
边界的最短路径向量,其中,最短路径向量表示在时间段τ内智能体si与sj能够实现避免碰撞的最小相对速度变化值。再具体地,定义ni,j为向量
Figure BDA0002089835110000101
的外法线向量。另一方面,设定目标智能体和参考智能体在避撞过程中均分担部分责任,不防设置
Figure BDA0002089835110000102
Figure BDA0002089835110000103
分别为目标智能体si与sj在相互避撞过程中承担的责任权值,且有
Figure BDA0002089835110000104
其中,责任权值
Figure BDA0002089835110000105
用于表示避撞过程中对相对期望速度
Figure BDA0002089835110000106
的调整程度,目标智能体si通过补偿向量ui,j而实现
Figure BDA0002089835110000107
逃离碰撞圈。
具体地,所述目标智能体的预选避撞速度可行集为:
Figure BDA0002089835110000108
具体地,根据公式(6)同理可得所述参考智能体的预选避撞速度可行集为
Figure BDA0002089835110000109
具体地,假定
Figure BDA00020898351100001010
为满足智能体速度/加速度限制及非完整性约束条件下的运动速度集,其中,对于目标智能体si,其需要避免碰撞的智能体集合为
Figure BDA00020898351100001011
Figure BDA00020898351100001012
可计算得到其对应的
Figure BDA00020898351100001013
具体地,可根据公式(7)计算所述目标智能体与参考智能体之间的避撞速度可行集,即:
Figure BDA00020898351100001014
作为一种可选的实施方式,所述动态自适应避撞权值通过所述目标智能体的预选避撞速度可行集与所述参考智能体的预选避撞速度可行集的比率确定。
具体地,定义所述动态自适应避撞权值通过所述目标智能体的预选避撞速度可行集与所述参考智能体的预选避撞速度可行集的比率为:
Figure BDA00020898351100001015
其中,“|·|”表示集合的基数。考虑到目标智能体和参考智能体的公平性,通过计算最优相互避撞可行速度解的平均比率来获得目标智能体si为避撞参考智能体sj的动态自适应避撞权值,即:
Figure BDA0002089835110000111
其中:
Figure BDA0002089835110000112
同理,可计算得到参考智能体sj为避撞目标智能体si的自适应责任权值
Figure BDA0002089835110000113
其中,
Figure BDA0002089835110000114
Figure BDA0002089835110000115
Figure BDA0002089835110000116
可以为负数。
作为一种可选的实施方式,所述根据所述避撞速度可行集计算所述目标智能体的最终速度可行集,包括:
从所述避撞速度可行集中挑选出满足预设约束条件的元素,并得到所述最终速度可行集。
综上,本发明通过获知网络中多智能体与多目标的位置和速度状态,并得到各智能体的期望速度,进而计算动态自适应的避撞责任权值
Figure BDA0002089835110000117
进而计算目标智能体与参考智能体之间的避撞速度集
Figure BDA0002089835110000118
Figure BDA0002089835110000119
进而根据
Figure BDA00020898351100001110
Figure BDA00020898351100001111
得到约束条件下目标智能体的可行速度集
Figure BDA00020898351100001112
进而建立目标跟踪代价函数Cost1(t)和智能体运动平稳代价函数Cost2(t),进而通过暴力优化匹配方法实现目标智能体的运动控制解集,最终降低目标智能体的避撞速度可行集出现空集的几率,进而提高多智能体连续探测性能与运动平稳性,从而有效保障多智能体自主式跟踪的连续性与稳定性。
实施例二
请参阅图2,图2是本发明实施例二公开的一种基于自适应避撞机制的多智能体自主式跟踪装置的结构示意图。如图2所示,该装置可以包括获取模块201、第一计算模块202、第二计算模块203、第三计算模块204、第四计算模块205、第一判断模块206、第二判断模块207、构建模块208、控制模块209,其中:
所述获取模块201,用于获取当前时刻目标智能体的期望速度,需要说明的是获取模块201执行完毕后可触发第一计算模块202启动。
所述第一计算模块202,用于根据所述期望速度计算所述目标智能体的动态自适应避撞权值,要说明的是第一计算模块202执行完毕后可触发第二计算模块203启动。
所述第二计算模块203,用于根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集,需要说明的是,第二计算模块203可触发第一判断模块206启动。
所述第一判断模块206,用于判断出所述目标智能体与参考智能体之间的避撞速度可行集是否是空集。
所述第三计算模块204,用于当所述第一判断模块206判断所述目标智能体与参考智能体之间的避撞速度可行集为非空集时,根据所述避撞速度可行集计算所述目标智能体的最终速度可行集,需要说明的是,第一判断模块206执行完毕后,可触发第二判断模块207启动。
所述第二判断模块207,用于判断所述最终速度可行集是否为空集;
所述构建模块208,用于当所述第二判断模块207判断出所述最终速度可行集为非空集时,构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数,所述跟踪代阶函数用于控制观察目标始终在所述目标智能体的观测区域中心,所述运动平稳代阶函数用于控制所述目标智能体运动的平稳性,需要说明的是,构建模块208执行完毕后,可触发第四计算模块205启动。
所述第四计算模块205,用于根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集,需要说明的是,第四计算模块205执行完毕后,可触发控制模块209启动。
所述控制模块209,用于根据所述运动控制解集控制所述目标智能体跟踪所述观察目标。
在一些实施方式中,第一判断模块206还用于当判断出所述避撞速度可行集是空集,则触发控制模块209控制所述目标智能体停止运动,并触发获取模块201获取下一时刻目标智能体的期望速度,并触发第一计算模块202执行所述根据所述期望速度计算所述目标智能体的动态自适应避撞权值,并触发第二计算模块203执行所述根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集,直至所述目标智能体与参考智能体之间的避撞速度可行集为非空集。
在一些实施方式中,构建模块208执行所述目标智能体的跟踪代阶函数与运动平稳代阶函数的具体方式为:
根据所述观察目标的当前位置与所述观测区域中心之间的位置偏差计算所述跟踪代阶函数;
根据所述目标智能体的实时速度变化状态及所述跟踪代阶函数计算所述运动平稳代阶函数。
在一些实施方式中,第四计算模块205执行所述根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集的具体方式为:
基于所述跟踪代阶函数与所述运动平稳代阶函数,通过暴力匹配模型最小化计算智能体运动控制解集,其中,所述暴力匹配模型包括所述目标智能体的避撞责任权值。
在一些实施方式中,第二计算模块203执行所述根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集的具体方式为:
根据所述目标智能体与参考智能体之间的相对期望速度,得到最短路径向量,所述最短路径向量表示在预设时间段内所述目标智能体与所述参考智能体能够实现避免碰撞的最小相对速度变化值;
根据所述最短路径向量计算所述目标智能体的预选避撞速度可行集;
根据所述最短路径向量计算所述参考智能体的预选避撞速度可行集;
根据所述目标智能体的预选避撞速度可行集、所述参考智能体的预选避撞速度可行集、所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集。
在一些实施方式中,所述动态自适应避撞权值通过所述目标智能体的预选避撞速度可行集与所述参考智能体的预选避撞速度可行集的比率确定。
在一些实施方式中,第三计算模块204执行所述根据所述避撞速度可行集计算所述目标智能体的最终速度可行集的具体方式为:
从所述避撞速度可行集中挑选出满足预设约束条件的元素,并得到所述最终速度可行集。
本发明实施例的装置通过执行基于自适应避撞机制的多智能体自主式跟踪方法,能够降低目标智能体的避撞速度可行集出现空集的几率,进而提高智能体连续探测性能与运动平稳性,从而有效保障智能体自主式跟踪的连续性与稳定性。
实施例三
请参阅图3,图3是本发明实施例三公开的一种基于自适应避撞机制的多智能体自主式跟踪装置的结构示意图。如图3所示,该装置可以包括:
存储有可执行程序代码的存储器301;
与存储器301耦合的处理器302;
处理器302调用存储器301中存储的可执行程序代码,执行以下步骤:
获取当前时刻目标智能体的期望速度;
根据所述期望速度计算所述目标智能体的动态自适应避撞权值;
根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集;
若所述目标智能体与参考智能体之间的避撞速度可行集为非空集,则根据所述避撞速度可行集计算所述目标智能体的最终速度可行集;
若所述最终速度可行集为非空集,则构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数,所述跟踪代阶函数用于控制观察目标始终在所述目标智能体的观测区域中心,所述运动平稳代阶函数用于控制所述目标智能体运动的平稳性;
根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集;
根据所述运动控制解集控制所述目标智能体跟踪所述观察目标。
需要说明的是,处理器302调用存储器301中存储的可执行程序代码,执行如实施例一所描述的基于自适应避撞机制的多智能体自主式跟踪方法中的其他步骤。
本发明实施例的装置通过执行基于自适应避撞机制的多智能体自主式跟踪方法,能够降低多智能体的避撞速度可行集出现空集的几率,进而提高智能体连续探测性能与运动平稳性,从而有效保障多智能体自主式跟踪的连续性与稳定性。
实施例四
本发明实施例四公开了一种计算机可读存储介质,其存储用于电子数据交换的计算机程序,其中,该计算机程序使得计算机执行实施例一所描述的基于自适应避撞机制的多智能体自主式跟踪方法中的步骤。
本发明实施例的计算机可读存储介质通过执行基于自适应避撞机制的多智能体自主式跟踪方法,能够降低目标智能体的避撞速度可行集出现空集的几率,进而提高智能体连续探测性能与运动平稳性,从而有效保障智能体自主式跟踪的连续性与稳定性。
实施例五
本发明实施五公开了一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,且该计算机程序可操作来使计算机执行实施例一所描述的基于自适应避撞机制的多智能体自主式跟踪方法中的步骤。
本发明实施例的计算机程序产品通过执行基于自适应避撞机制的多智能体自主式跟踪方法,能够降低目标智能体的避撞速度可行集出现空集的几率,进而提高智能体连续探测性能与运动平稳性,从而有效保障智能体自主式跟踪的连续性与稳定性。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种基于自适应避撞机制的多智能体自主式跟踪方法,其特征在于,所述方法包括:获取当前时刻目标智能体的期望速度;根据所述期望速度计算所述目标智能体的动态自适应避撞权值;根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集;若所述目标智能体与参考智能体之间的避撞速度可行集为非空集,则根据所述避撞速度可行集计算所述目标智能体的最终速度可行集;若所述最终速度可行集为非空集,则构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数,所述跟踪代阶函数用于控制观察目标始终在所述目标智能体的观测区域中心,所述运动平稳代阶函数用于控制所述目标智能体运动的平稳性;根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集;根据所述运动控制解集控制所述目标智能体跟踪所述观察目标;
构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数,包括:根据所述观察目标的当前位置与所述观测区域中心之间的位置偏差计算所述跟踪代阶函数;根据所述目标智能体的实时速度变化状态及所述跟踪代阶函数计算所述运动平稳代阶函数;
所述根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集,包括:基于所述跟踪代阶函数与所述运动平稳代阶函数,通过暴力匹配模型最小化计算智能体运动控制解集,其中,所述暴力匹配模型包括所述目标智能体的避撞责任权值。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:若所述避撞速度可行集是空集,则控制所述目标智能体停止运动并获取下一时刻目标智能体的期望速度,并执行所述根据所述期望速度计算所述目标智能体的动态自适应避撞权值、所述根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集,直至所述目标智能体与参考智能体之间的避撞速度可行集为非空集。
3.如权利要求1所述的方法,其特征在于,所述根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集,包括:根据所述目标智能体与参考智能体之间的相对期望速度,得到最短路径向量,所述最短路径向量表示在预设时间段内所述目标智能体与所述参考智能体能够实现避免碰撞的最小相对速度变化值;根据所述最短路径向量计算所述目标智能体的预选避撞速度可行集;根据所述最短路径向量计算所述参考智能体的预选避撞速度可行集;根据所述目标智能体的预选避撞速度可行集、所述参考智能体的预选避撞速度可行集、所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集。
4.如权利要求3所述的方法,其特征在于,所述动态自适应避撞权值通过所述目标智能体的预选避撞速度可行集与所述参考智能体的预选避撞速度可行集的比率确定。
5.如权利要求3所述的方法,其特征在于,所述根据所述避撞速度可行集计算所述目标智能体的最终速度可行集,包括:从所述避撞速度可行集中挑选出满足预设约束条件的元素,并得到所述最终速度可行集。
6.一种基于自适应避撞机制的多智能体自主式跟踪装置,其特征在于:所述装置包括获取模块、第一计算模块、第二计算模块、第三计算模块、第四计算模块、第一判断模块、第二判断模块、构建模块、控制模块,其中:
所述获取模块,用于获取当前时刻目标智能体的期望速度;
所述第一计算模块,用于根据所述期望速度计算所述目标智能体的动态自适应避撞权值;
所述第二计算模块,用于根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集;
所述第一判断模块,用于判断出所述目标智能体与参考智能体之间的避撞速度可行集是否是空集;
所述第三计算模块,用于当所述第一判断模块判断所述目标智能体与参考智能体之间的避撞速度可行集为非空集时,根据所述避撞速度可行集计算所述目标智能体的最终速度可行集;
所述第二判断模块,用于判断所述最终速度可行集是否为空集;
所述构建模块,用于当所述第二判断模块判断出所述最终速度可行集为非空集时,构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数,所述跟踪代阶函数用于控制观察目标始终在所述目标智能体的观测区域中心,所述运动平稳代阶函数用于控制所述目标智能体运动的平稳性,其中,构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数,包括:根据所述观察目标的当前位置与所述观测区域中心之间的位置偏差计算所述跟踪代阶函数;根据所述目标智能体的实时速度变化状态及所述跟踪代阶函数计算所述运动平稳代阶函数;
所述第四计算模块,用于根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集,包括:基于所述跟踪代阶函数与所述运动平稳代阶函数,通过暴力匹配模型最小化计算智能体运动控制解集,其中,所述暴力匹配模型包括所述目标智能体的避撞责任权值
所述控制模块,用于根据所述运动控制解集控制所述目标智能体跟踪所述观察目标。
7.一种基于自适应避撞机制的多智能体自主式跟踪装置,其特征在于,所述装置包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1-5任一项所述的基于自适应避撞机制的多智能体自主式跟踪方法。
8.一种计算机可存储介质,其特征在于,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行如权利要求1-5任一项所述的基于自适应避撞机制的多智能体自主式跟踪方法。
CN201910499778.4A 2019-06-11 2019-06-11 一种多智能体自主式跟踪方法、装置及计算机可存储介质 Active CN110275549B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910499778.4A CN110275549B (zh) 2019-06-11 2019-06-11 一种多智能体自主式跟踪方法、装置及计算机可存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910499778.4A CN110275549B (zh) 2019-06-11 2019-06-11 一种多智能体自主式跟踪方法、装置及计算机可存储介质

Publications (2)

Publication Number Publication Date
CN110275549A CN110275549A (zh) 2019-09-24
CN110275549B true CN110275549B (zh) 2022-03-11

Family

ID=67960678

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910499778.4A Active CN110275549B (zh) 2019-06-11 2019-06-11 一种多智能体自主式跟踪方法、装置及计算机可存储介质

Country Status (1)

Country Link
CN (1) CN110275549B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113885317A (zh) * 2020-07-02 2022-01-04 苏州艾吉威机器人有限公司 一种路径跟踪控制方法、系统及计算机可读存储介质
CN112269396B (zh) * 2020-10-14 2021-09-28 北京航空航天大学 一种仿鹰鸽智能博弈的无人机集群协同对抗控制方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107703948A (zh) * 2017-11-14 2018-02-16 上海理工大学 基于自适应动态窗口的移动机器人局部动态路径规划方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9216745B2 (en) * 2013-09-16 2015-12-22 Disney Enterprises, Inc. Shared control of semi-autonomous vehicles including collision avoidance in multi-agent scenarios

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107703948A (zh) * 2017-11-14 2018-02-16 上海理工大学 基于自适应动态窗口的移动机器人局部动态路径规划方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Collision avoidance for aerial vehicles in multi-agent scenarios;Javier Alonso-Mora等;《Autonomous Robot》;SpringerLink;20150125;第39卷;第101–121页 *
三维环境中多机器人动态目标主动协作观测方法;谷丰等;《自动化学报》;20101015;第36卷(第10期);第1443-1453页 *
基于碰撞危险度的仿人机器人动态避碰博弈策略;李光日等;《长春理工大学学报(自然科学版)》;20121215;第35卷(第04期);第70-75页 *
基于速度障碍法和动态窗口法的无人水面艇动态避障;张洋洋等;《上海大学学报(自然科学版)》;20170228;第23卷(第01期);第1-16页 *
基于速度障碍的多船自动避碰控制方法;熊勇等;《中国航海》;中国航海学会;20150930;第38卷(第3期);第46-51页 *
无人艇应对主动威胁的智能规避方法研究;王宁佳;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;中国学术期刊(光盘版)电子杂志社;20180615(第06期);第1-83页 *

Also Published As

Publication number Publication date
CN110275549A (zh) 2019-09-24

Similar Documents

Publication Publication Date Title
US11377102B2 (en) Navigation based on sensed looking direction of a pedestrian
US10802494B2 (en) Method for motion planning for autonomous moving objects
CN112904842B (zh) 一种基于代价势场的移动机器人路径规划与优化方法
US20170322556A9 (en) Autonomous vehicle operation
US10011276B2 (en) Collision avoidance device
CN110275549B (zh) 一种多智能体自主式跟踪方法、装置及计算机可存储介质
US20190196474A1 (en) Control method, control apparatus, control device, and movable platform
US20100114633A1 (en) System and method for planning/replanning collision free flight plans in real or accelerated time
JP6827107B2 (ja) 車両制御装置
CN108176050B (zh) 寻路方法和装置
CN110488818A (zh) 一种基于激光雷达的机器人定位方法、装置和机器人
CN114894212A (zh) 一种基于自适应参数的改进路径规划方法
US10836486B2 (en) Controlling a drone through user movement
CN114594788A (zh) 一种未知环境下四旋翼无人飞行器航迹规划方法及系统
CN111265877A (zh) 游戏虚拟对象的控制方法及装置、电子设备、存储介质
CN116643572A (zh) 针对室内复杂环境的局部路径规划方法、电子设备及介质
CN112327917A (zh) 基于群体智能的无人机集群协同覆盖方法
CN111881580A (zh) 一种无人船规避障碍物的运动规划方法
CN109556609A (zh) 一种基于人工智能的避碰方法及装置
US20190317529A1 (en) Virtual force system for a drone
CN117870708A (zh) 一种路径规划方法、终端设备以及存储介质
CN115285149A (zh) 一种控制方法、装置及车辆
CN114475652A (zh) 一种车辆运动规划方法、装置、设备和介质
CN114019984A (zh) 一种无人艇及无人艇编队在线航迹规划方法及系统
CN112130110A (zh) 一种无人机无源定位航迹生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant