CN112203291A - 基于知识嵌入的区域覆盖和连通保持的集群控制方法 - Google Patents

基于知识嵌入的区域覆盖和连通保持的集群控制方法 Download PDF

Info

Publication number
CN112203291A
CN112203291A CN202011393769.6A CN202011393769A CN112203291A CN 112203291 A CN112203291 A CN 112203291A CN 202011393769 A CN202011393769 A CN 202011393769A CN 112203291 A CN112203291 A CN 112203291A
Authority
CN
China
Prior art keywords
agent
target
attention
cluster
connectivity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011393769.6A
Other languages
English (en)
Other versions
CN112203291B (zh
Inventor
丘腾海
吴士广
蒲志强
刘振
易建强
常红星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Automation of Chinese Academy of Science
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CN202011393769.6A priority Critical patent/CN112203291B/zh
Publication of CN112203291A publication Critical patent/CN112203291A/zh
Application granted granted Critical
Publication of CN112203291B publication Critical patent/CN112203291B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W16/00Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
    • H04W16/18Network planning tools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W16/00Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
    • H04W16/22Traffic simulation tools or models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于无人集群系统协同技术领域,具体涉及了一种基于知识嵌入的区域覆盖和连通保持的集群控制方法,旨在解决现有技术无法在实现目标覆盖最大化的同时有效保证集群中智能体之间的连通性,因而智能体控制效果不佳的问题。本发明包括:提取群体中各智能体和目标的状态信息的相对特征;提取邻居各智能体对目标的意图特征和交互信息,并扩展感受野;设计群体奖惩函数,计算智能体选择累计回报最大的动作;删除冗余重要连接边,获得目标覆盖最大化的重要连接图和重要性节点集合;计算保证通信拓扑图实时连通的智能体最大步长,对动作进行约束截断,输出到集群智能体。本发明将知识和数据方法相结合,能够快速实现集群连通保持下的目标覆盖最大化。

Description

基于知识嵌入的区域覆盖和连通保持的集群控制方法
技术领域
本发明属于无人集群系统协同技术领域,具体涉及了一种基于知识嵌入的区域覆盖和连通保持的集群控制方法。
背景技术
集群协同区域覆盖和连通保持是指在给定若干目标区域或目标点的情况下,一定个数的自组织无人集群通过协同配合,使其对所有目标形成最大面积覆盖,同时保证无人集群智能体间的通信拓扑连通性。其中,无人集群包括无人车、无人机或者其他无人系统,拓扑连通性是指集群中的智能体经过一定数量的通信跳数,所有无人系统均能连通。有时为了保证所有无人集群中各智能体的连通性,无法确保集群对所有目标都形成覆盖。
在大面积战场侦察、全覆盖式火力打击、全天候多节点式通信中继等军事领域以及灾后区域快速搜索、扫网式物品投递、森林防火等民用领域,无人集群协同区域覆盖和连通保持具有广泛的应用前景,通过自组织集群协同,能解决单一无人系统无法完成或解决的问题,极大提高任务完成的效率和范围,已有小规模集群协同系统应用于若干典型场景,实现了对场景的极大赋能,改变了传统单一个体的工作方式。
现有方法虽然可以实现集群智能体间的连通保持,但是难以设计有效的策略实现目标覆盖最大化或者只实现了目标覆盖最大化,但无法保证智能体间的连通性。而基于深度强化学习等数据驱动的方法虽然具有较大的探索性和智能性等优势,但由于存在难以收敛和安全性等问题,难以有效保证连通保持这一条件。因此仅考虑知识或者数据驱动的某种方法很难同时解决多智能体间的目标覆盖最大化和连通关系保持问题,从而导致智能体控制效果难以达到预期。
发明内容
为了解决现有技术中的上述问题,即现有技术无法在实现目标覆盖最大化的同时有效保证集群中智能体之间的连通性,因而智能体控制效果不佳的问题,本发明提供了一种基于知识嵌入的区域覆盖和连通保持的集群控制方法,该方法包括:
步骤S10,实时获取集群中各智能体和目标的状态信息,并通过全连接神经网络进行特 征编码,获得智能体特征
Figure 950723DEST_PATH_IMAGE001
和目标特征
Figure 979859DEST_PATH_IMAGE002
步骤S20,计算所述智能体特征
Figure 892451DEST_PATH_IMAGE001
和目标特征
Figure 639827DEST_PATH_IMAGE002
之间的注意力关注系数, 归一化并通 过观测多头注意力机制进行多头注意力特征提取,获得智能体与目标之间的观测注意力特 征
Figure 917139DEST_PATH_IMAGE003
步骤S30,基于所述智能体与目标之间的观测注意力特征
Figure 535202DEST_PATH_IMAGE003
,通过通信多头注意力机 制提取各邻居智能体的交互信息
Figure 884275DEST_PATH_IMAGE004
和查询目标特征、键目标特征和值目标特征映射
Figure 853368DEST_PATH_IMAGE005
Figure 680509DEST_PATH_IMAGE006
Figure 684237DEST_PATH_IMAGE007
,并通过多跳通信机制扩展智能体的感受野,获得智能体与目标之间的交互注意力特征
Figure 938632DEST_PATH_IMAGE008
步骤S40,分别基于代数连通度以及覆盖率和目标与智能体间的距离设计集群连通保 持和集群对目标覆盖的总的奖惩函数,并结合所述交互注意力特征
Figure 129442DEST_PATH_IMAGE008
,计算当前时刻各智 能体能够获得最大累计回报的动作
Figure 884909DEST_PATH_IMAGE009
步骤S50,将各智能体通过链式拓扑连接,并删除冗余重要连接边,获得目标覆盖大于 设定阈值的通信拓扑图以及重要性节点集合
Figure 618509DEST_PATH_IMAGE010
步骤S60,基于分布式连通保持策略、重要性节点集合
Figure 434019DEST_PATH_IMAGE010
以及设定的约束条件之间的 关系,计算各智能体保持连通的动作
Figure 987491DEST_PATH_IMAGE009
的最大步长
Figure 281069DEST_PATH_IMAGE011
步骤S70,基于所述最大步长
Figure 869176DEST_PATH_IMAGE011
进行动作
Figure 855587DEST_PATH_IMAGE009
的约束截断,并通过截断后的动作进行 集群中各智能体控制。
在一些优选的实施例中,步骤S20包括:
步骤S21,计算所述智能体特征
Figure 161934DEST_PATH_IMAGE001
和目标特征
Figure 993624DEST_PATH_IMAGE002
之间的注意力关系系数,并采用 softmax函数进行归一化,获得不同目标的归一化关注系数;
步骤S22,基于所述不同目标的归一化关注系数、智能体特征
Figure 560872DEST_PATH_IMAGE001
,采用观测多头注意力 机制进行多头注意力特征提取,获得智能体与目标之间的观测注意力特征
Figure 593550DEST_PATH_IMAGE003
在一些优选的实施例中,所述不同目标的归一化关注系数,其公式表示为:
Figure 511827DEST_PATH_IMAGE012
其中,
Figure 22574DEST_PATH_IMAGE013
为第j个目标对第i个智能体的归一化的关注系数,
Figure 709907DEST_PATH_IMAGE014
为一个 非线性激活函数,
Figure 647908DEST_PATH_IMAGE015
为线性可学习的权重,
Figure 787902DEST_PATH_IMAGE016
为单向前馈神经网络,
Figure 367919DEST_PATH_IMAGE017
为第
Figure 909759DEST_PATH_IMAGE018
个智能体观 测到的目标个数。
在一些优选的实施例中,所述智能体与目标之间的观测注意力特征
Figure 284239DEST_PATH_IMAGE003
,其公式表 示为:
Figure 645951DEST_PATH_IMAGE020
其中,
Figure 623134DEST_PATH_IMAGE021
表示所述观测多头注意力机制的探测头个数,
Figure 160426DEST_PATH_IMAGE022
表示第
Figure 830441DEST_PATH_IMAGE022
个探测头,
Figure 820394DEST_PATH_IMAGE023
表 示第
Figure 335689DEST_PATH_IMAGE022
个探测头的权重系数矩阵,
Figure 727487DEST_PATH_IMAGE024
为最优非线性函数,
Figure 568404DEST_PATH_IMAGE025
代表第
Figure 904708DEST_PATH_IMAGE022
个探测头对应的 第j个目标对第i个智能体的归一化的关注系数,
Figure 364639DEST_PATH_IMAGE017
为第
Figure 735578DEST_PATH_IMAGE018
个智能体观测到的目标个数,
Figure 622762DEST_PATH_IMAGE026
代 表拼接操作。
在一些优选的实施例中,所述查询目标特征、键目标特征和值目标特征映射
Figure 446362DEST_PATH_IMAGE005
Figure 444405DEST_PATH_IMAGE006
Figure 669850DEST_PATH_IMAGE007
,其公式表示为:
Figure 727935DEST_PATH_IMAGE028
Figure 304410DEST_PATH_IMAGE030
Figure 106144DEST_PATH_IMAGE032
其中,
Figure 920516DEST_PATH_IMAGE033
Figure 539717DEST_PATH_IMAGE034
Figure 213275DEST_PATH_IMAGE035
为设定的交互线性权重矩阵。
在一些优选的实施例中,所述各邻居智能体的交互信息
Figure 677754DEST_PATH_IMAGE004
,其公式表示为:
Figure 753157DEST_PATH_IMAGE037
其中,
Figure 277680DEST_PATH_IMAGE026
代表拼接操作,
Figure 172954DEST_PATH_IMAGE024
为最优非线性函数,m代表所述通信多头注意力机制的第
Figure 706704DEST_PATH_IMAGE022
个探测头,
Figure 495668DEST_PATH_IMAGE038
代表所述通信多头注意力机制的探测头个数,
Figure 66458DEST_PATH_IMAGE010
代表第
Figure 839242DEST_PATH_IMAGE018
个智能体通信范 围内的邻居智能体个数,
Figure 786469DEST_PATH_IMAGE039
代表第
Figure 695520DEST_PATH_IMAGE040
个智能体第
Figure 437211DEST_PATH_IMAGE022
个探测头提取到的值目标特征,
Figure 431711DEST_PATH_IMAGE041
代 表第
Figure 182630DEST_PATH_IMAGE018
个智能体对第
Figure 211766DEST_PATH_IMAGE040
个邻居智能体的归一化注意力权重:
Figure 983413DEST_PATH_IMAGE042
其中,
Figure 606155DEST_PATH_IMAGE043
代表键目标特征
Figure 19819DEST_PATH_IMAGE006
的维数。
在一些优选的实施例中,所述智能体与目标之间的交互注意力特征
Figure 778827DEST_PATH_IMAGE008
,其公式表 示为:
Figure 100002_DEST_PATH_IMAGE045
其中,
Figure 127900DEST_PATH_IMAGE046
为设定的权重系数矩阵,
Figure 96993DEST_PATH_IMAGE026
代表拼接操作。
在一些优选的实施例中,所述奖惩函数,其公式表示为:
Figure 189714DEST_PATH_IMAGE048
其中,
Figure 662284DEST_PATH_IMAGE049
代表总的奖惩函数,
Figure 306892DEST_PATH_IMAGE050
为集群连通保持的奖惩函数,
Figure 462866DEST_PATH_IMAGE051
代表集群对目标覆盖的奖惩函数,
Figure 218332DEST_PATH_IMAGE052
为设定的权重参数;
Figure 686354DEST_PATH_IMAGE053
Figure 501863DEST_PATH_IMAGE055
其中,
Figure 55335DEST_PATH_IMAGE056
代表通信拓扑图的代数连通数,
Figure 614493DEST_PATH_IMAGE057
代表通信拓 扑图的拉普拉斯矩阵,
Figure 202600DEST_PATH_IMAGE058
代表实数向量,
Figure 189011DEST_PATH_IMAGE059
代表
Figure 354413DEST_PATH_IMAGE059
个智能体,
Figure 327048DEST_PATH_IMAGE060
为目标的总数,
Figure 894295DEST_PATH_IMAGE061
为 被覆盖的目标数,
Figure 926973DEST_PATH_IMAGE062
为各智能体最大覆盖半径,
Figure 314092DEST_PATH_IMAGE063
为第j个目标的位置,
Figure 90419DEST_PATH_IMAGE064
为第i个智能体的 位置,
Figure 777752DEST_PATH_IMAGE065
代表使
Figure 981331DEST_PATH_IMAGE067
在范围
Figure 121326DEST_PATH_IMAGE068
以内的截断操作,
Figure 294818DEST_PATH_IMAGE069
代表求平均操作。
在一些优选的实施例中,步骤S50包括:
步骤S51,分别计算构成多边形拓扑的各智能体的速度向量与邻居拓扑形成的角度;
步骤S52,删除角度中最小角度对应的边之外的重要连接边,获得目标覆盖大于设定阈 值的通信拓扑图以及重要性节点集合
Figure 977603DEST_PATH_IMAGE010
Figure DEST_PATH_IMAGE071
Figure 617663DEST_PATH_IMAGE072
其中,
Figure DEST_PATH_IMAGE073
为第i个智能体和第
Figure 651478DEST_PATH_IMAGE074
个智能体的连接边,
Figure 894241DEST_PATH_IMAGE075
代表第i个智能体的邻居智能 体集合,
Figure 431532DEST_PATH_IMAGE076
代表第i个智能体速度向量与连接边
Figure 835969DEST_PATH_IMAGE073
之间的角度,
Figure 560342DEST_PATH_IMAGE077
代表第
Figure 606796DEST_PATH_IMAGE018
个智能 体和第
Figure 857649DEST_PATH_IMAGE074
个智能体都同意删除连接边的一致性信号。
在一些优选的实施例中,步骤S70中基于所述最大步长
Figure 573932DEST_PATH_IMAGE011
进行动作
Figure 910235DEST_PATH_IMAGE009
的约束 截断,其公式表示为:
Figure 370167DEST_PATH_IMAGE079
其中,
Figure 741105DEST_PATH_IMAGE080
代表使
Figure 362710DEST_PATH_IMAGE009
在范围
Figure 451889DEST_PATH_IMAGE081
以内的截断操作,
Figure 449932DEST_PATH_IMAGE011
表示各智能 体保持连通的动作
Figure 940956DEST_PATH_IMAGE009
的最大步长:
Figure 858097DEST_PATH_IMAGE082
Figure 44359DEST_PATH_IMAGE084
Figure 970726DEST_PATH_IMAGE086
其中,
Figure 191623DEST_PATH_IMAGE087
表示运行步长,
Figure 279665DEST_PATH_IMAGE088
代表第
Figure 953223DEST_PATH_IMAGE018
个智能体与第
Figure 683281DEST_PATH_IMAGE074
个智能体之间的距离,
Figure 758685DEST_PATH_IMAGE010
代表智 能体i的邻居重要性节点智能体,
Figure 283207DEST_PATH_IMAGE089
Figure 303116DEST_PATH_IMAGE062
分别为各智能体的最大覆盖半径和最大通信半径,
Figure 712231DEST_PATH_IMAGE090
代表空集。
本发明的有益效果:
本发明基于知识嵌入的区域覆盖和连通保持的集群控制方法,将数据驱动和知识过滤相结合,通过观测注意力网络提取目标点特征,实现智能体对不同目标关注度的信息提取,并基于图交互注意力网络提取邻居多智能体的意图特征和不同重要程度的信息,实现智能体间的意图传递和信息交互,然后基于代数连通度设计奖惩函数来引导数据驱动方法的训练,最后基于连通保持的知识模型进一步过滤优化数据驱动方法,从而实现连通保持下的目标覆盖最大化情况下的智能体精确控制。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本发明基于知识嵌入的区域覆盖和连通保持的集群控制方法的流程示意图;
图2是本发明基于知识嵌入的区域覆盖和连通保持的集群控制方法的整个网络示意图;
图3是本发明基于知识嵌入的区域覆盖和连通保持的集群控制方法一种实施例的观测注意力网络的多头注意力机制示意图;
图4是本发明基于知识嵌入的区域覆盖和连通保持的集群控制方法一种实施例的图交互注意力网络示意图;
图5是本发明基于知识嵌入的区域覆盖和连通保持的集群控制方法一种实施例的仿真效果图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
本发明提供一种基于知识嵌入的区域覆盖和连通保持的集群控制方法,充分发挥知识过滤约束和数据驱动的自学习探索等优势,通过双层注意力网络提取目标和邻居智能体的信息特征,并基于代数连通度设计奖惩函数来引导模型训练,快速实现无人集群连通保持下的目标覆盖最大化。
本发明的一种基于知识嵌入的区域覆盖和连通保持的集群控制方法,该方法包括:
步骤S10,实时获取集群中各智能体和目标的状态信息,并通过全连接神经网络进行特 征编码,获得智能体特征
Figure 766775DEST_PATH_IMAGE001
和目标特征
Figure 337565DEST_PATH_IMAGE002
步骤S20,计算所述智能体特征
Figure 844770DEST_PATH_IMAGE001
和目标特征
Figure 791997DEST_PATH_IMAGE002
之间的注意力关注系数, 归一化并通 过观测多头注意力机制进行多头注意力特征提取,获得智能体与目标之间的观测注意力特 征
Figure 701047DEST_PATH_IMAGE003
步骤S30,基于所述智能体与目标之间的观测注意力特征
Figure 708317DEST_PATH_IMAGE003
,通过通信多头注意力机 制提取各邻居智能体的交互信息
Figure 702818DEST_PATH_IMAGE004
和查询目标特征、键目标特征和值目标特征映射
Figure 312791DEST_PATH_IMAGE005
Figure 951714DEST_PATH_IMAGE006
Figure 254519DEST_PATH_IMAGE007
,并通过多跳通信机制扩展智能体的感受野,获得智能体与目标之间的交互注意力特征
Figure 611682DEST_PATH_IMAGE008
步骤S40,分别基于代数连通度以及覆盖率和目标与智能体间的距离设计集群连通保 持和集群对目标覆盖的总的奖惩函数,并结合所述交互注意力特征
Figure 759767DEST_PATH_IMAGE008
,计算当前时刻各智 能体能够获得最大累计回报的动作
Figure 518776DEST_PATH_IMAGE009
步骤S50,将各智能体通过链式拓扑连接,并删除冗余重要连接边,获得目标覆盖大于 设定阈值的通信拓扑图以及重要性节点集合
Figure 992482DEST_PATH_IMAGE010
步骤S60,基于分布式连通保持策略、重要性节点集合
Figure 836942DEST_PATH_IMAGE010
以及设定的约束条件之间的 关系,计算各智能体保持连通的动作
Figure 54296DEST_PATH_IMAGE009
的最大步长
Figure 667811DEST_PATH_IMAGE011
步骤S70,基于所述最大步长
Figure 312419DEST_PATH_IMAGE011
进行动作
Figure 503229DEST_PATH_IMAGE009
的约束截断,并通过截断后的动作进行 集群中各智能体控制。
为了更清晰地对本发明基于知识嵌入的区域覆盖和连通保持的集群控制方法进行说明,下面结合图1和图2对本发明实施例中各步骤展开详述。
本发明第一实施例的基于知识嵌入的区域覆盖和连通保持的集群控制方法,包括步骤S10-步骤S70,各步骤详细描述如下:
步骤S10,实时获取集群中各智能体和目标的状态信息,并通过全连接神经网络进行特 征编码,获得智能体特征
Figure 134062DEST_PATH_IMAGE001
和目标特征
Figure 992296DEST_PATH_IMAGE002
步骤S20,计算所述智能体特征
Figure 417593DEST_PATH_IMAGE001
和目标特征
Figure 361278DEST_PATH_IMAGE002
之间的注意力关注系数, 归一化 并通过观测多头注意力机制进行多头注意力特征提取,获得智能体与目标之间的观测注意 力特征
Figure 784083DEST_PATH_IMAGE003
步骤S21,计算所述智能体特征
Figure 231245DEST_PATH_IMAGE001
和目标特征
Figure 93021DEST_PATH_IMAGE002
之间的注意力关系系数,并采用 softmax函数进行归一化,获得不同目标的归一化关注系数。
计算所述智能体特征
Figure 258423DEST_PATH_IMAGE001
和目标特征
Figure 231059DEST_PATH_IMAGE002
之间的注意力关系系数,如式(1)所示:
Figure 63885DEST_PATH_IMAGE092
其中,
Figure 96563DEST_PATH_IMAGE093
为第j个目标对第i个智能体的归一化前的关注系数,
Figure 749262DEST_PATH_IMAGE015
为线性可学习的权 重,
Figure 384642DEST_PATH_IMAGE016
为单向前馈神经网络。本发明一个优选的实施例中,
Figure 947342DEST_PATH_IMAGE016
=256为一个神经元个数是128 个的单向前馈神经网络。
为了有效表征当前智能体对不同目标的关注程度,采用softmax函数对不同目标的关注系数进行归一化处理,如式(2)所示:
Figure 275555DEST_PATH_IMAGE095
其中,
Figure 290916DEST_PATH_IMAGE013
为第j个目标对第i个智能体的归一化的关注系数,
Figure 729987DEST_PATH_IMAGE014
为一个 非线性激活函数,
Figure 881614DEST_PATH_IMAGE017
为第
Figure 380728DEST_PATH_IMAGE018
个智能体观测到的目标个数。
结合式(1)和式(2)可获得式(3):
Figure 883385DEST_PATH_IMAGE096
步骤S22,基于所述不同目标的归一化关注系数、智能体特征
Figure 860568DEST_PATH_IMAGE001
,采用观测多头注意力 机制进行多头注意力特征提取,获得智能体与目标之间的观测注意力特征
Figure 256915DEST_PATH_IMAGE003
,如式(4)所 示:
Figure 802297DEST_PATH_IMAGE098
其中,
Figure 916883DEST_PATH_IMAGE021
表示所述观测多头注意力机制的探测头个数,
Figure 838703DEST_PATH_IMAGE022
表示第
Figure 89555DEST_PATH_IMAGE022
个探测头,
Figure 540259DEST_PATH_IMAGE023
表 示第
Figure 142142DEST_PATH_IMAGE022
个探测头的权重系数矩阵,
Figure 602073DEST_PATH_IMAGE024
为最优非线性函数,
Figure 973012DEST_PATH_IMAGE025
代表第
Figure 860196DEST_PATH_IMAGE022
个探测头对应的 第j个目标对第i个智能体的归一化的关注系数,
Figure 683796DEST_PATH_IMAGE017
为第
Figure 806473DEST_PATH_IMAGE018
个智能体观测到的目标个数,
Figure 907284DEST_PATH_IMAGE026
代 表拼接操作。
这里也可以通过单头注意力网络进行特征提取,但是单头注意力网络存在特征表征受限等问题,采用多头注意力机制实现对智能体特征和目标特征之间的关注关系的相对特征提取,其效果更好。
如图3所示,为本发明基于知识嵌入的区域覆盖和连通保持的集群控制方法一种 实施例的观测注意力网络的多头注意力机制示意图,
Figure 355583DEST_PATH_IMAGE001
代表智能体i
Figure 276265DEST_PATH_IMAGE099
代表智能体i周围的M个目标,
Figure 202633DEST_PATH_IMAGE100
分别 为智能体i与周围的M个目标以及自身的归一化关注系数,最终结合最优非线性函数获取智 能体与目标之间的观测注意力特征
Figure 423530DEST_PATH_IMAGE003
步骤S30,基于所述智能体与目标之间的观测注意力特征
Figure 511572DEST_PATH_IMAGE003
,通过通信多头注意力 机制提取各邻居智能体的交互信息
Figure 309763DEST_PATH_IMAGE004
和查询目标特征、键目标特征和值目标特征映射
Figure 915188DEST_PATH_IMAGE005
Figure 115225DEST_PATH_IMAGE006
Figure 515114DEST_PATH_IMAGE007
,并通过多跳通信机制扩展智能体的感受野,获得智能体与目标之间的交互注意力 特征
Figure 535023DEST_PATH_IMAGE008
查询目标特征、键目标特征和值目标特征映射
Figure 678559DEST_PATH_IMAGE005
Figure 733103DEST_PATH_IMAGE006
Figure 569472DEST_PATH_IMAGE007
,分别如式(5)-式(7)所 示:
Figure 76676DEST_PATH_IMAGE102
Figure 882958DEST_PATH_IMAGE104
Figure 932954DEST_PATH_IMAGE106
其中,
Figure 533700DEST_PATH_IMAGE033
Figure 669146DEST_PATH_IMAGE034
Figure 279119DEST_PATH_IMAGE035
为设定的交互线性权重矩阵。本发明一个实施例中,这3个矩阵 均为
Figure 183621DEST_PATH_IMAGE107
的矩阵,其中R表示实数。
Figure 220847DEST_PATH_IMAGE018
个智能体对第
Figure 702644DEST_PATH_IMAGE040
个邻居智能体的注意力权重如式(8)所示:
Figure 991674DEST_PATH_IMAGE109
其中,
Figure 875316DEST_PATH_IMAGE043
代表键目标特征
Figure 224389DEST_PATH_IMAGE006
的维数。
进行归一化操作,获得第
Figure 927903DEST_PATH_IMAGE018
个智能体对第
Figure 755045DEST_PATH_IMAGE040
个邻居智能体的归一化注意力权重,如 式(9)所示:
Figure DEST_PATH_IMAGE111
其中,
Figure 24352DEST_PATH_IMAGE010
代表第个智能体通信范围内的邻居智能体个数。
结合式(8)和式(9)可获得式(10):
Figure DEST_PATH_IMAGE113
各邻居智能体的交互信息
Figure 407240DEST_PATH_IMAGE004
,其公式表示如式(11)所示:
Figure DEST_PATH_IMAGE115
其中,
Figure 303652DEST_PATH_IMAGE026
代表拼接操作,
Figure 896307DEST_PATH_IMAGE024
为最优非线性函数,m代表所述通信多头注意力机制的第
Figure 587183DEST_PATH_IMAGE022
个探测头,
Figure 530868DEST_PATH_IMAGE038
代表所述通信多头注意力机制的探测头个数,
Figure 824446DEST_PATH_IMAGE039
代表第
Figure 412553DEST_PATH_IMAGE040
个智能体第
Figure 133385DEST_PATH_IMAGE022
个探测头提取到的值目标特征。
通过多跳通信机制扩展智能体的感受野,获得智能体与目标之间的交互注意力特 征
Figure 174153DEST_PATH_IMAGE008
,如式(12)所示:
Figure DEST_PATH_IMAGE117
其中,
Figure 689665DEST_PATH_IMAGE046
为设定的权重系数矩阵,
Figure 522492DEST_PATH_IMAGE026
代表拼接操作。
Figure 289591DEST_PATH_IMAGE118
为表示智能体通信结构的无向通信图,
Figure DEST_PATH_IMAGE119
为智能 体的序列节点,本发明一个实施例中N=3,
Figure 473448DEST_PATH_IMAGE120
表示智能体节点组成的边,并考虑 到智能体的通信范围受限,
Figure 249774DEST_PATH_IMAGE121
表示智能体的邻居。
如图4所示,为本发明基于知识嵌入的区域覆盖和连通保持的集群控制方法一种 实施例的图交互注意力网络示意图,以智能体1与3个观测注意力特征
Figure 671528DEST_PATH_IMAGE122
Figure 875107DEST_PATH_IMAGE123
Figure 15101DEST_PATH_IMAGE124
进行说 明,
Figure 595119DEST_PATH_IMAGE125
Figure 871379DEST_PATH_IMAGE126
Figure 245860DEST_PATH_IMAGE127
分别为查询目标特征、键目标特征和值目标特征映射,
Figure 873150DEST_PATH_IMAGE128
Figure 991279DEST_PATH_IMAGE129
Figure 387625DEST_PATH_IMAGE130
分别为智能体1、2、3对邻居智能体1的归一化注意力权重,通过图 交互注意力网络结合
Figure 933007DEST_PATH_IMAGE123
获取智能体与目标之间的交互注意力特征
Figure 782014DEST_PATH_IMAGE008
步骤S40,分别基于代数连通度以及覆盖率和目标与智能体间的距离设计集群连 通保持和集群对目标覆盖的总的奖惩函数,并结合所述交互注意力特征
Figure 562889DEST_PATH_IMAGE008
,计算当前时刻 各智能体能够获得最大累计回报的动作
Figure 954687DEST_PATH_IMAGE009
总的奖励函数如式(13)所示:
Figure 795604DEST_PATH_IMAGE132
其中,
Figure 272853DEST_PATH_IMAGE049
代表总的奖惩函数,
Figure 857418DEST_PATH_IMAGE050
为集群连通保持的奖惩函数,
Figure 103723DEST_PATH_IMAGE051
代表集群对目标覆盖的奖惩函数,
Figure 849962DEST_PATH_IMAGE052
为设定的权重参数。本发明一个实施例中,
Figure 548927DEST_PATH_IMAGE133
集群连通保持的奖惩函数
Figure 937183DEST_PATH_IMAGE050
和集群对目标覆盖的奖惩函数
Figure 37995DEST_PATH_IMAGE051
分别如式(14)和式(15)所示:
Figure 627239DEST_PATH_IMAGE134
Figure 203714DEST_PATH_IMAGE136
其中,
Figure 5448DEST_PATH_IMAGE056
代表通信拓扑图的代数连通数,
Figure 819820DEST_PATH_IMAGE057
代表通信拓 扑图的拉普拉斯矩阵,
Figure 439020DEST_PATH_IMAGE058
代表实数向量,
Figure 112578DEST_PATH_IMAGE059
代表
Figure 577057DEST_PATH_IMAGE059
个智能体,
Figure 386882DEST_PATH_IMAGE060
为目标的总数,
Figure 176983DEST_PATH_IMAGE061
为 被覆盖的目标数,
Figure 337837DEST_PATH_IMAGE062
为各智能体最大覆盖半径,
Figure 340428DEST_PATH_IMAGE063
为第j个目标的位置,
Figure 394972DEST_PATH_IMAGE064
为第i个智能体的 位置,
Figure 231341DEST_PATH_IMAGE065
代表使
Figure 738545DEST_PATH_IMAGE066
在范围
Figure 685773DEST_PATH_IMAGE068
以内的截断操作,
Figure 594823DEST_PATH_IMAGE069
代表求平均操作。
步骤S50,将各智能体通过链式拓扑连接,并删除冗余重要连接边,获得目标覆盖 大于设定阈值的通信拓扑图以及重要性节点集合
Figure 336514DEST_PATH_IMAGE010
步骤S51,分别计算构成多边形拓扑的各智能体的速度向量与邻居拓扑形成的角度。
步骤S52,删除角度中最小角度对应的边之外的重要连接边,获得目标覆盖大于设 定阈值的通信拓扑图以及重要性节点集合
Figure 596594DEST_PATH_IMAGE010
,如式(16)和式(17)所示:
Figure 81933DEST_PATH_IMAGE138
Figure 111069DEST_PATH_IMAGE140
其中,
Figure 882716DEST_PATH_IMAGE073
为第i个智能体和第
Figure 505458DEST_PATH_IMAGE074
个智能体的连接边,
Figure 919122DEST_PATH_IMAGE075
代表第i个智能体的邻居智能 体集合,
Figure 678131DEST_PATH_IMAGE076
代表第i个智能体速度向量与连接边
Figure 151837DEST_PATH_IMAGE073
之间的角度,
Figure 996297DEST_PATH_IMAGE077
代表第
Figure 682493DEST_PATH_IMAGE018
个智能 体和第
Figure 561587DEST_PATH_IMAGE074
个智能体都同意删除连接边的一致性信号。
如图5所示,为本发明基于知识嵌入的区域覆盖和连通保持的集群控制方法一种 实施例的仿真效果图,直线代表智能体连通拓扑,圆圈代表智能体覆盖范围,通过直线相连 的三个点代表智能体
Figure 940616DEST_PATH_IMAGE018
,其余点代表目标
Figure 272371DEST_PATH_IMAGE141
,从图中可以看出,本发明方法可以通过最少的智 能体实现最大的目标覆盖,并且能够保证智能体集群之间的连通关系,因此,本发明方法进 行智能体控制的精度、准确度和实时性均优于现有方法。
步骤S60,基于分布式连通保持策略、重要性节点集合
Figure 762259DEST_PATH_IMAGE010
以及设定的约束条件之 间的关系,计算各智能体保持连通的动作
Figure 620493DEST_PATH_IMAGE009
的最大步长
Figure 311369DEST_PATH_IMAGE011
步骤S70,基于所述最大步长
Figure 255054DEST_PATH_IMAGE011
进行动作
Figure 423998DEST_PATH_IMAGE009
的约束截断,并通过截断后的动作 进行集群中各智能体控制。
基于所述最大步长
Figure 871160DEST_PATH_IMAGE011
进行动作
Figure 732937DEST_PATH_IMAGE009
的约束截断,如式(18)所示:
Figure 163918DEST_PATH_IMAGE143
其中,
Figure 136553DEST_PATH_IMAGE080
代表使
Figure 703801DEST_PATH_IMAGE009
在范围
Figure 736479DEST_PATH_IMAGE081
以内的截断操作,
Figure 389177DEST_PATH_IMAGE011
表示各智能 体保持连通的动作
Figure 24558DEST_PATH_IMAGE009
的最大步长,如式(19)-式(21)所示:
Figure 575539DEST_PATH_IMAGE144
Figure 903752DEST_PATH_IMAGE146
Figure 919112DEST_PATH_IMAGE147
其中,
Figure 623763DEST_PATH_IMAGE087
表示运行步长,
Figure 775390DEST_PATH_IMAGE088
代表第
Figure 274504DEST_PATH_IMAGE018
个智能体与第
Figure 777161DEST_PATH_IMAGE074
个智能体之间的距离,
Figure 754344DEST_PATH_IMAGE010
代表智 能体i的邻居重要性节点智能体,
Figure 291636DEST_PATH_IMAGE089
Figure 961652DEST_PATH_IMAGE062
分别为各智能体的最大覆盖半径和最大通信半径,
Figure 951604DEST_PATH_IMAGE090
代表空集。
非重要节点表示如式(22):
Figure 732479DEST_PATH_IMAGE149
Figure 983331DEST_PATH_IMAGE018
个智能体的重要连接边和非重要连接边分别如式(23)和式(24)所示:
Figure 699615DEST_PATH_IMAGE151
Figure 301497DEST_PATH_IMAGE153
多边形拓扑表示为:当且仅当
Figure 761429DEST_PATH_IMAGE154
或者
Figure 866788DEST_PATH_IMAGE155
,而且
Figure 753972DEST_PATH_IMAGE156
,智能体i 和邻居对(j,k)形成一个多边形拓扑,其中,
Figure 577572DEST_PATH_IMAGE157
表示为jk的链路;当且仅当
Figure 841194DEST_PATH_IMAGE158
,一个 多边形拓扑成为三角拓扑。链式拓扑的定义为:当且仅当
Figure 66639DEST_PATH_IMAGE159
,智能体i和邻居j 形成链式拓扑。
本发明第二实施例的基于知识嵌入的区域覆盖和连通保持的集群控制系统,该系统包括以下模块:
信息获取模块,配置为实时获取集群中各智能体和目标的状态信息;
第一特征提取模块,配置为通过全连接神经网络进行集群中各智能体和目标的状态信 息的特征编码,获得智能体特征
Figure 983780DEST_PATH_IMAGE001
和目标特征
Figure 435621DEST_PATH_IMAGE002
第二特征提取模块,配置计算所述智能体特征
Figure 361988DEST_PATH_IMAGE001
和目标特征
Figure 317306DEST_PATH_IMAGE002
之间的注意力关注系 数, 归一化并通过观测多头注意力机制进行多头注意力特征提取,获得智能体与目标之间 的观测注意力特征
Figure 936506DEST_PATH_IMAGE003
第三特征提取模块,配置为基于所述智能体与目标之间的观测注意力特征
Figure 610064DEST_PATH_IMAGE003
,通过通 信多头注意力机制提取各邻居智能体的交互信息
Figure 808964DEST_PATH_IMAGE004
和查询目标特征、键目标特征和值目标 特征映射
Figure 884368DEST_PATH_IMAGE005
Figure 674469DEST_PATH_IMAGE006
Figure 569744DEST_PATH_IMAGE007
,并通过多跳通信机制扩展智能体的感受野,获得智能体与目标之间的 交互注意力特征
Figure 103493DEST_PATH_IMAGE008
奖惩设计及智能体动作获取模块,配置为分别基于代数连通度以及覆盖率和目标与智 能体间的距离设计集群连通保持和集群对目标覆盖的总的奖惩函数,并结合所述交互注意 力特征
Figure 33403DEST_PATH_IMAGE008
,计算当前时刻各智能体能够获得最大累计回报的动作
Figure 463248DEST_PATH_IMAGE009
冗余连接边删除模块,配置为将各智能体通过链式拓扑连接,并删除冗余重要连接边, 获得目标覆盖大于设定阈值的通信拓扑图以及重要性节点集合
Figure 236032DEST_PATH_IMAGE010
动作步长约束模块,配置为基于分布式连通保持策略、重要性节点集合
Figure 855363DEST_PATH_IMAGE010
以及设定 的约束条件之间的关系,计算各智能体保持连通的动作
Figure 764413DEST_PATH_IMAGE009
的最大步长
Figure 771683DEST_PATH_IMAGE011
智能体控制模块,配置为基于所述最大步长
Figure 500605DEST_PATH_IMAGE011
进行动作
Figure 376157DEST_PATH_IMAGE009
的约束截断,并通过截 断后的动作进行集群中各智能体控制。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
需要说明的是,上述实施例提供的基于知识嵌入的区域覆盖和连通保持的集群控制系统,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。
本发明第三实施例的一种存储装置,其中存储有多条程序,所述程序适于由处理器加载并执行以实现上述的基于知识嵌入的区域覆盖和连通保持的集群控制方法。
本发明第四实施例的一种处理装置,包括处理器、存储装置;处理器,适于执行各条程序;存储装置,适于存储多条程序;所述程序适于由处理器加载并执行以实现上述的基于知识嵌入的区域覆盖和连通保持的集群控制方法。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的模块、方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,软件模块、方法步骤对应的程序可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
术语“第一”、“第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims (10)

1.一种基于知识嵌入的区域覆盖和连通保持的集群控制方法,其特征在于,该方法包括:
步骤S10,实时获取集群中各智能体和目标的状态信息,并通过全连接神经网络进行特 征编码,获得智能体特征
Figure 525395DEST_PATH_IMAGE001
和目标特征
Figure 562621DEST_PATH_IMAGE002
步骤S20,计算所述智能体特征
Figure 185363DEST_PATH_IMAGE001
和目标特征
Figure 864606DEST_PATH_IMAGE002
之间的注意力关注系数, 归一化并通 过观测多头注意力机制进行多头注意力特征提取,获得智能体与目标之间的观测注意力特 征
Figure 623615DEST_PATH_IMAGE003
步骤S30,基于所述智能体与目标之间的观测注意力特征
Figure 831742DEST_PATH_IMAGE003
,通过通信多头注意力机制 提取各邻居智能体的交互信息
Figure 676202DEST_PATH_IMAGE004
和查询目标特征、键目标特征和值目标特征映射
Figure 893556DEST_PATH_IMAGE005
Figure 834968DEST_PATH_IMAGE006
Figure 151679DEST_PATH_IMAGE007
,并通过多跳通信机制扩展智能体的感受野,获得智能体与目标之间的交互注意力特征
Figure 483435DEST_PATH_IMAGE008
步骤S40,分别基于代数连通度以及覆盖率和目标与智能体间的距离设计集群连通保 持和集群对目标覆盖的总的奖惩函数,并结合所述交互注意力特征
Figure 442163DEST_PATH_IMAGE008
,计算当前时刻各智 能体能够获得最大累计回报的动作
Figure 300398DEST_PATH_IMAGE009
步骤S50,将各智能体通过链式拓扑连接,并删除冗余重要连接边,获得目标覆盖大于 设定阈值的通信拓扑图以及重要性节点集合
Figure 991274DEST_PATH_IMAGE010
步骤S60,基于分布式连通保持策略、重要性节点集合
Figure 669380DEST_PATH_IMAGE010
以及设定的约束条件之间的 关系,计算各智能体保持连通的动作
Figure 369482DEST_PATH_IMAGE009
的最大步长
Figure 82223DEST_PATH_IMAGE011
步骤S70,基于所述最大步长
Figure 944000DEST_PATH_IMAGE011
进行动作
Figure 374981DEST_PATH_IMAGE009
的约束截断,并通过截断后的动作进行 集群中各智能体控制。
2.根据权利要求1所述的基于知识嵌入的区域覆盖和连通保持的集群控制方法,其特征在于,步骤S20包括:
步骤S21,计算所述智能体特征
Figure 347617DEST_PATH_IMAGE001
和目标特征
Figure 118127DEST_PATH_IMAGE002
之间的注意力关系系数,并采用 softmax函数进行归一化,获得不同目标的归一化关注系数;
步骤S22,基于所述不同目标的归一化关注系数、智能体特征
Figure 275438DEST_PATH_IMAGE001
,采用观测多头注意力 机制进行多头注意力特征提取,获得智能体与目标之间的观测注意力特征
Figure 791784DEST_PATH_IMAGE003
3.根据权利要求2所述的基于知识嵌入的区域覆盖和连通保持的集群控制方法,其特征在于,所述不同目标的归一化关注系数,其公式表示为:
Figure 692744DEST_PATH_IMAGE012
其中,
Figure 521023DEST_PATH_IMAGE013
为第j个目标对第i个智能体的归一化的关注系数,
Figure 849236DEST_PATH_IMAGE014
为一个非 线性激活函数,
Figure 864596DEST_PATH_IMAGE015
为线性可学习的权重,
Figure 506930DEST_PATH_IMAGE016
为单向前馈神经网络,
Figure 48770DEST_PATH_IMAGE017
为第
Figure 423251DEST_PATH_IMAGE018
个智能体观测 到的目标个数。
4.根据权利要求2所述的基于知识嵌入的区域覆盖和连通保持的集群控制方法,其特 征在于,所述智能体与目标之间的观测注意力特征
Figure 50541DEST_PATH_IMAGE003
,其公式表示为:
Figure 168670DEST_PATH_IMAGE020
其中,
Figure 830595DEST_PATH_IMAGE021
表示所述观测多头注意力机制的探测头个数,
Figure 641557DEST_PATH_IMAGE022
表示第
Figure 490564DEST_PATH_IMAGE022
个探测头,
Figure 412384DEST_PATH_IMAGE023
表 示第
Figure 928816DEST_PATH_IMAGE022
个探测头的权重系数矩阵,
Figure 972995DEST_PATH_IMAGE024
为最优非线性函数,
Figure 184665DEST_PATH_IMAGE025
代表第
Figure 769230DEST_PATH_IMAGE022
个探测头对应的 第j个目标对第i个智能体的归一化的关注系数,
Figure 15534DEST_PATH_IMAGE017
为第
Figure 27353DEST_PATH_IMAGE018
个智能体观测到的目标个数,
Figure 257477DEST_PATH_IMAGE026
代 表拼接操作。
5.根据权利要求1所述的基于知识嵌入的区域覆盖和连通保持的集群控制方法,其特 征在于,所述查询目标特征、键目标特征和值目标特征映射
Figure 380154DEST_PATH_IMAGE005
Figure 746544DEST_PATH_IMAGE006
Figure 929264DEST_PATH_IMAGE007
,其公式表示为:
Figure DEST_PATH_IMAGE027
Figure 849946DEST_PATH_IMAGE028
Figure DEST_PATH_IMAGE029
其中,
Figure 182839DEST_PATH_IMAGE030
Figure DEST_PATH_IMAGE031
Figure 200473DEST_PATH_IMAGE032
为设定的交互线性权重矩阵。
6.根据权利要求5所述的基于知识嵌入的区域覆盖和连通保持的集群控制方法,其特 征在于,所述各邻居智能体的交互信息
Figure 554094DEST_PATH_IMAGE004
,其公式表示为:
Figure 227652DEST_PATH_IMAGE033
其中,
Figure 160973DEST_PATH_IMAGE026
代表拼接操作,
Figure 361010DEST_PATH_IMAGE024
为最优非线性函数,m代表所述通信多头注意力机制的第
Figure 760899DEST_PATH_IMAGE022
个探测头,
Figure 311966DEST_PATH_IMAGE034
代表所述通信多头注意力机制的探测头个数,
Figure 721081DEST_PATH_IMAGE010
代表第
Figure 775625DEST_PATH_IMAGE018
个智能体通信范围 内的邻居智能体个数,
Figure 346415DEST_PATH_IMAGE035
代表第
Figure 322461DEST_PATH_IMAGE036
个智能体第
Figure 394322DEST_PATH_IMAGE022
个探测头提取到的值目标特征,
Figure 178739DEST_PATH_IMAGE037
代表 第
Figure 576222DEST_PATH_IMAGE018
个智能体对第
Figure 446089DEST_PATH_IMAGE036
个邻居智能体的归一化注意力权重:
Figure 321641DEST_PATH_IMAGE038
其中,
Figure 960564DEST_PATH_IMAGE039
代表键目标特征
Figure 466632DEST_PATH_IMAGE006
的维数。
7.根据权利要求1所述的基于知识嵌入的区域覆盖和连通保持的集群控制方法,其特 征在于,所述智能体与目标之间的交互注意力特征
Figure 948429DEST_PATH_IMAGE008
,其公式表示为:
Figure 237459DEST_PATH_IMAGE040
其中,
Figure 121101DEST_PATH_IMAGE041
为设定的权重系数矩阵,
Figure 470174DEST_PATH_IMAGE026
代表拼接操作。
8.根据权利要求1所述的基于知识嵌入的区域覆盖和连通保持的集群控制方法,其特征在于,所述奖惩函数,其公式表示为:
Figure 439267DEST_PATH_IMAGE042
其中,
Figure 797567DEST_PATH_IMAGE043
代表总的奖惩函数,
Figure 535716DEST_PATH_IMAGE044
为集群连通保持的奖惩函数,
Figure DEST_PATH_IMAGE045
代表集群对目标覆盖的奖惩函数,
Figure 586849DEST_PATH_IMAGE046
为设定的权重参数;
Figure 246500DEST_PATH_IMAGE047
Figure 877333DEST_PATH_IMAGE048
其中,
Figure 735567DEST_PATH_IMAGE049
代表通信拓扑图的代数连通数,
Figure 160864DEST_PATH_IMAGE050
代表通信拓 扑图的拉普拉斯矩阵,
Figure 370128DEST_PATH_IMAGE051
代表实数向量,
Figure 804651DEST_PATH_IMAGE052
代表
Figure 517393DEST_PATH_IMAGE052
个智能体,
Figure 379169DEST_PATH_IMAGE053
为目标的总数,
Figure 747834DEST_PATH_IMAGE054
为 被覆盖的目标数,
Figure 845103DEST_PATH_IMAGE055
为各智能体最大覆盖半径,
Figure 553296DEST_PATH_IMAGE056
为第j个目标的位置,
Figure DEST_PATH_IMAGE057
为第i个智能体的 位置,
Figure 117132DEST_PATH_IMAGE058
代表使
Figure 35410DEST_PATH_IMAGE059
在范围
Figure 811736DEST_PATH_IMAGE060
以内的截断操作,
Figure 499069DEST_PATH_IMAGE061
代表求平均操作。
9.根据权利要求1所述的基于知识嵌入的区域覆盖和连通保持的集群控制方法,其特征在于,步骤S50包括:
步骤S51,分别计算构成多边形拓扑的各智能体的速度向量与邻居拓扑形成的角度;
步骤S52,删除角度中最小角度对应的边之外的重要连接边,获得目标覆盖大于设定阈 值的通信拓扑图以及重要性节点集合
Figure 30545DEST_PATH_IMAGE010
Figure 57624DEST_PATH_IMAGE062
Figure 496696DEST_PATH_IMAGE063
其中,
Figure 913902DEST_PATH_IMAGE064
为第i个智能体和第
Figure 678595DEST_PATH_IMAGE065
个智能体的连接边,
Figure 181252DEST_PATH_IMAGE066
代表第i个智能体的邻居智能体 集合,
Figure 424014DEST_PATH_IMAGE067
代表第i个智能体速度向量与连接边
Figure 695727DEST_PATH_IMAGE064
之间的角度,
Figure 569005DEST_PATH_IMAGE068
代表第
Figure 683591DEST_PATH_IMAGE018
个智能体 和第
Figure 605411DEST_PATH_IMAGE065
个智能体都同意删除连接边的一致性信号。
10.根据权利要求1所述的基于知识嵌入的区域覆盖和连通保持的集群控制方法,其特 征在于,步骤S70中基于所述最大步长
Figure 528368DEST_PATH_IMAGE011
进行动作
Figure 103706DEST_PATH_IMAGE009
的约束截断,其公式表示为:
Figure 846534DEST_PATH_IMAGE069
其中,
Figure 431099DEST_PATH_IMAGE070
代表使
Figure 677403DEST_PATH_IMAGE009
在范围
Figure 892484DEST_PATH_IMAGE071
以内的截断操作,
Figure 981663DEST_PATH_IMAGE011
表示各智能体 保持连通的动作
Figure 979706DEST_PATH_IMAGE009
的最大步长:
Figure 205151DEST_PATH_IMAGE072
Figure 528816DEST_PATH_IMAGE073
Figure 105291DEST_PATH_IMAGE074
其中,
Figure 907025DEST_PATH_IMAGE075
表示运行步长,
Figure 252555DEST_PATH_IMAGE076
代表第
Figure 481542DEST_PATH_IMAGE018
个智能体与第
Figure 279734DEST_PATH_IMAGE065
个智能体之间的距离,
Figure 885159DEST_PATH_IMAGE010
代表智能 体i的邻居重要性节点智能体,
Figure 288459DEST_PATH_IMAGE077
Figure 812981DEST_PATH_IMAGE055
分别为各智能体的最大覆盖半径和最大通信半径,
Figure 973835DEST_PATH_IMAGE078
代表空集。
CN202011393769.6A 2020-12-03 2020-12-03 基于知识嵌入的区域覆盖和连通保持的集群控制方法 Active CN112203291B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011393769.6A CN112203291B (zh) 2020-12-03 2020-12-03 基于知识嵌入的区域覆盖和连通保持的集群控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011393769.6A CN112203291B (zh) 2020-12-03 2020-12-03 基于知识嵌入的区域覆盖和连通保持的集群控制方法

Publications (2)

Publication Number Publication Date
CN112203291A true CN112203291A (zh) 2021-01-08
CN112203291B CN112203291B (zh) 2021-02-23

Family

ID=74033686

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011393769.6A Active CN112203291B (zh) 2020-12-03 2020-12-03 基于知识嵌入的区域覆盖和连通保持的集群控制方法

Country Status (1)

Country Link
CN (1) CN112203291B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254580A (zh) * 2021-05-24 2021-08-13 厦门大学 一种特殊群体搜索方法及系统
CN115278699A (zh) * 2022-06-17 2022-11-01 深圳市人工智能与机器人研究院 通信连通保持约束下的多智能体覆盖控制方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080120292A1 (en) * 2006-11-20 2008-05-22 Neelakantan Sundaresan Search clustering
CN107818367A (zh) * 2017-10-30 2018-03-20 中国科学院计算技术研究所 用于神经网络的处理系统和处理方法
CN109086134A (zh) * 2018-07-19 2018-12-25 郑州云海信息技术有限公司 一种深度学习作业的运行方法和装置
CN109144099A (zh) * 2018-08-28 2019-01-04 北京航空航天大学 基于卷积神经网络的无人机群行动方案快速评估方法
CN111738372A (zh) * 2020-08-26 2020-10-02 中国科学院自动化研究所 分布式多智能体时空特征提取方法、行为决策方法
CN111814915A (zh) * 2020-08-26 2020-10-23 中国科学院自动化研究所 多智能体时空特征提取方法及系统、行为决策方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080120292A1 (en) * 2006-11-20 2008-05-22 Neelakantan Sundaresan Search clustering
CN107818367A (zh) * 2017-10-30 2018-03-20 中国科学院计算技术研究所 用于神经网络的处理系统和处理方法
CN109086134A (zh) * 2018-07-19 2018-12-25 郑州云海信息技术有限公司 一种深度学习作业的运行方法和装置
CN109144099A (zh) * 2018-08-28 2019-01-04 北京航空航天大学 基于卷积神经网络的无人机群行动方案快速评估方法
CN111738372A (zh) * 2020-08-26 2020-10-02 中国科学院自动化研究所 分布式多智能体时空特征提取方法、行为决策方法
CN111814915A (zh) * 2020-08-26 2020-10-23 中国科学院自动化研究所 多智能体时空特征提取方法及系统、行为决策方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254580A (zh) * 2021-05-24 2021-08-13 厦门大学 一种特殊群体搜索方法及系统
CN113254580B (zh) * 2021-05-24 2023-10-03 厦门大学 一种特殊群体搜索方法及系统
CN115278699A (zh) * 2022-06-17 2022-11-01 深圳市人工智能与机器人研究院 通信连通保持约束下的多智能体覆盖控制方法和装置
CN115278699B (zh) * 2022-06-17 2024-01-16 深圳市人工智能与机器人研究院 通信连通保持约束下的多智能体覆盖控制方法和装置

Also Published As

Publication number Publication date
CN112203291B (zh) 2021-02-23

Similar Documents

Publication Publication Date Title
Singh et al. An intelligent WSN-UAV-based IoT framework for precision agriculture application
CN113495578B (zh) 一种基于数字孪生式训练的集群航迹规划强化学习方法
Dutta et al. Application of agricultural drones and IoT to understand food supply chain during post COVID‐19
CN112203291B (zh) 基于知识嵌入的区域覆盖和连通保持的集群控制方法
CN106406346A (zh) 一种多无人机协同快速覆盖搜索航迹规划方法
Keerthana et al. An ensemble algorithm for crop yield prediction
Faryadi et al. A reinforcement learning‐based approach for modeling and coverage of an unknown field using a team of autonomous ground vehicles
CN107065859A (zh) 多移动机器人的轨迹预测方法
Dutta et al. Multi-robot information gathering for precision agriculture: Current state, scope, and challenges
CN113612528B (zh) 一种无人机集群数字孪生仿真系统网络连通性修复方法
CN101893441A (zh) 基于离差最大化及灰色关联分析的无人机航迹优选方法
Arjoune et al. Soybean cyst nematode detection and management: a review
CN114485665A (zh) 一种基于麻雀搜索算法的无人机航迹规划方法
Sandamurthy et al. A hybrid weed optimized coverage path planning technique for autonomous harvesting in cashew orchards
CN114265913A (zh) 工业物联网边缘设备上基于联邦学习的空时预测算法
CN116560406A (zh) 一种无人机集群协同规划与自主调度方法
Li et al. Multi-mechanism swarm optimization for multi-UAV task assignment and path planning in transmission line inspection under multi-wind field
Jiang et al. Learning space-time crop yield patterns with zigzag persistence-based lstm: Toward more reliable digital agriculture insurance
Ding et al. Improved GWO algorithm for UAV path planning on crop pest monitoring
Masud et al. Monitoring and predicting landuse/landcover change using an integrated markov chain & multilayer perceptron models: A case study of sahiwal tehsil
CN113342029A (zh) 基于无人机群的最大传感器数据采集路径规划方法及系统
CN103049757A (zh) 一种基于蜂群智能的遥感影像分类方法
CN116400737A (zh) 一种基于蚁群算法的安全路径规划系统
Qiannan et al. Path planning of UAVs formation based on improved ant colony optimization algorithm
Goel et al. Machine learning-based remote monitoring and predictive analytics system for crop and livestock

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant