CN115390458A - 一种面向信息交互的智能体双层解耦状态控制方法及系统 - Google Patents

一种面向信息交互的智能体双层解耦状态控制方法及系统 Download PDF

Info

Publication number
CN115390458A
CN115390458A CN202211330462.0A CN202211330462A CN115390458A CN 115390458 A CN115390458 A CN 115390458A CN 202211330462 A CN202211330462 A CN 202211330462A CN 115390458 A CN115390458 A CN 115390458A
Authority
CN
China
Prior art keywords
target
information
state
target sequence
intelligent agent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211330462.0A
Other languages
English (en)
Other versions
CN115390458B (zh
Inventor
沈宇婷
杜楚
陈路路
张学军
李宝莲
孟新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 54 Research Institute
National Space Science Center of CAS
Original Assignee
CETC 54 Research Institute
National Space Science Center of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 54 Research Institute, National Space Science Center of CAS filed Critical CETC 54 Research Institute
Priority to CN202211330462.0A priority Critical patent/CN115390458B/zh
Publication of CN115390458A publication Critical patent/CN115390458A/zh
Application granted granted Critical
Publication of CN115390458B publication Critical patent/CN115390458B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于数据控制技术领域,涉及一种面向信息交互的智能体双层解耦状态控制方法及系统。所述方法包括:建立UAU‑F O*智能体模型,其对应表征无人集群任一一个智能体节点,其具备双层的信息交互状态表征层次:交互决策层与时空分布层;基于UAU‑F O*智能体模型对智能体节点进行状态控制。本发明提供的方法和系统均衡无人集群信息交互的时效性、鲁棒性和动态适应性等实用化目标的优势,同时兼具解耦的匹配性和分层的可扩展性,可为无人集群系统的实用化系统模型设计提供新型架构设计的思路。

Description

一种面向信息交互的智能体双层解耦状态控制方法及系统
技术领域
本发明涉及一种面向信息交互的智能体双层解耦状态控制方法及系统,属于数据控制技术领域。
背景技术
无人集群作为面向未来战场侦察监视、目标打击等任务需求的重要力量和作战样式,须具备有人/无人一体化的自主运行、动态调整、聚合解聚与平滑过渡能力。这要求无人集群能够以个体自主规划决策为基准,实现个体对环境的及时感知、来源的有效甄别、信息的融合采信和决策的多场景适应,并支持无人自主和有人/无人编配的多模式快速匹配。尽管各式集群规划与控制算法发展了线性规划、遗传算法、粒子群算法、强化学习和深度强化学习等多类型方法,促进了有关无人系统协同作业能力的发展。但场景训练数据稀疏、仿真数据与实际数据的偏差,对算法模型能够具备差异化场景迁移能力提出了极大的挑战。同时,效用和复杂度难以平衡等多方面实用化考虑往往聚焦在特定场景和特定任务问题上,并未对无人集群系统构建形成面向实战和实用化的体系性支撑。
发明内容
本发明所要解决的技术问题是提供一种面向信息交互的智能体双层解耦状态控制方法及系统,均衡无人集群信息交互的时效性、鲁棒性和动态适应性等实用化目标的优势,同时兼具解耦的匹配性和分层的可扩展性,可为无人集群系统的实用化系统模型设计提供新型架构设计的思路。
为实现本发明目的,本发明采用的技术方案为:
一种面向信息交互的智能体双层解耦状态控制方法,所述方法基于UAU-F O*智能体模型实现,UAU-F O*智能体模型对应表征无人集群任意一个智能体节点,包括时空分布层与交互决策层,时空分布层设置有FO*模型、观测感知模块、通信接收模块、邻域剪裁筛选模块和信息融合模块,交互决策层设置有UAU模型、收益-代价评估模块和目标拣选与更新模块;具体实现过程如下:
时空分布层的处理过程为:
FO*模型对智能体节点进行行为状态控制,包括F态和O*态,F态表征智能体节点处于自由状态,O*态表征智能体节点处于观测目标的状态,时空分布层FO*状态控制变更的具体触发条件与交互决策层UAU状态控制变更的具体触发条件耦合联动;
通过观测感知模块观察环境内的目标,将观测的目标信息记为第一目标信息,若智能体节点为F态,则第一目标信息为空,若智能体节点为O*态,则第一目标信息为观测数据,并将第一目标信息发送至信息融合模块;同时通过通信接收模块接收1跳邻域及2跳邻域智能体节点集合发送的第二目标序列信息,若智能体节点集合中某一智能体节点为F态,则第二目标信息为空,若智能体节点集合中某一智能体节点为O*态,则第二目标信息为观测数据,并将第二目标信息发送至邻域剪裁模块;
通过邻域剪裁模块对第二目标序列信息进行1跳邻域及2跳邻域计算及剪裁,筛选出待融合的目标序列信息,发送至信息融合模块;
通过信息融合模块对观测感知模块发送的第一目标信息和邻域剪裁模块发送的 待融合的目标序列信息进行各目标信息级联拓扑关联度评估,生成待拣选的可观测目标序 列
Figure 978179DEST_PATH_IMAGE001
,将可观测目标序列发送给交互决策层的收益-代价评估 模块;式中,
Figure 48903DEST_PATH_IMAGE002
为任一可观测目标,
Figure 164627DEST_PATH_IMAGE003
Figure 4407DEST_PATH_IMAGE004
为可观测目标数量;
交互决策层的处理过程为:
UAU模型包括两种基本状态U态和A态,所述U态表征智能体节点无观测目标状态,U 态下交互决策层不对时空分布层的信息交换加以限制,A态表征智能体节点有观测目标状 态,A态下交互决策层对时空分布层的信息交换进行限制约束;UAU状态控制变更的具体触 发条件为:待拣选可观测目标序列
Figure 485067DEST_PATH_IMAGE001
是否为空,若
Figure 839825DEST_PATH_IMAGE005
为空,则 智能体节点变更为U态,若
Figure 696922DEST_PATH_IMAGE005
不为空,则智能体节点变更为A态;
通过收益-代价评估模块对可观测目标序列进行基于信息交互评价的收益-代价评估;
通过目标拣选与更新模块根据评估结果拣选观测目标和更新,若智能体节点为A态,则对拟观测目标拣选结果与原关注目标比对,若不同则更新关注目标,若智能体节点为U态,则使智能体节点保持无观测自由漫游;
当拣选了观测目标后,交互决策层根据观测目标是否由无变为有而触发时空分布层FO*状态是否由F态向O*变迁;或交互决策层根据是否更替观测目标,而触发时空分布层观测目标状态不变的情况下进行观测目标的切换。
其中,所述1跳邻域为t时刻某一智能体节点
Figure 391209DEST_PATH_IMAGE006
有直接通信连接的智能体节点的智 能体节点集合;2跳邻域为与智能体节点平台集合中的每一智能体节点有通信连接的智能 体节点集合。
其中,信息融合模块对观测感知模块发送的第一目标信息和邻域剪裁模块发送的待融合的目标序列信息进行各目标信息级联拓扑关联度评估,生成待拣选的可观测目标序列,具体包括以下过程:
S3.1计算智能体节点
Figure 108017DEST_PATH_IMAGE006
与1跳邻域集合
Figure 153333DEST_PATH_IMAGE007
内节点
Figure 548542DEST_PATH_IMAGE008
的综合信息聚集能力评估值
Figure 159652DEST_PATH_IMAGE009
,所述集合
Figure 247694DEST_PATH_IMAGE007
为t刻智能体节点
Figure 514727DEST_PATH_IMAGE006
有直接通信连接的智能体节点的智能体节点集合 中去除有回流的节点集合;
Figure 510365DEST_PATH_IMAGE010
其中,
Figure 179244DEST_PATH_IMAGE011
Figure 438187DEST_PATH_IMAGE012
式中,
Figure 989254DEST_PATH_IMAGE013
表示节点
Figure 991845DEST_PATH_IMAGE008
的度,
Figure 515230DEST_PATH_IMAGE014
用于调节扩展邻域度中心性评估对级联评估的影响;
Figure 741812DEST_PATH_IMAGE015
为2跳邻域集合
Figure 983438DEST_PATH_IMAGE016
中的节点
Figure 524140DEST_PATH_IMAGE017
的度,集合
Figure 964349DEST_PATH_IMAGE018
为t时刻与
Figure 565095DEST_PATH_IMAGE007
中的每一智能体节点有通 信连接的智能体节点集合去除有回流的节点集合;
S3.2计算智能体节点
Figure 28437DEST_PATH_IMAGE006
与集合
Figure 435148DEST_PATH_IMAGE007
内节点
Figure 933125DEST_PATH_IMAGE008
基于拓扑与交互行为的密切度评估
Figure 439193DEST_PATH_IMAGE019
Figure 655410DEST_PATH_IMAGE020
式中,
Figure 600233DEST_PATH_IMAGE021
Figure 952717DEST_PATH_IMAGE006
Figure 629686DEST_PATH_IMAGE008
之间的拓扑关系密切度,
Figure 132867DEST_PATH_IMAGE022
Figure 819063DEST_PATH_IMAGE006
Figure 26053DEST_PATH_IMAGE008
之间的交互频 次密切度,
Figure 201820DEST_PATH_IMAGE023
Figure 127050DEST_PATH_IMAGE024
为调节系数;
Figure 351358DEST_PATH_IMAGE025
Figure 740751DEST_PATH_IMAGE026
式中,
Figure 25102DEST_PATH_IMAGE027
Figure 172050DEST_PATH_IMAGE006
Figure 262366DEST_PATH_IMAGE008
之间在当前时刻t前的信息交互总次数,
Figure 443948DEST_PATH_IMAGE028
为第
Figure 899200DEST_PATH_IMAGE029
次信息交互 时的时间;
Figure 861340DEST_PATH_IMAGE030
为第n-1次信息交互时的时间;
S3.3计算智能体节点
Figure 427451DEST_PATH_IMAGE006
与集合
Figure 463540DEST_PATH_IMAGE007
内节点
Figure 152010DEST_PATH_IMAGE008
的级联拓扑关联度评估
Figure 273550DEST_PATH_IMAGE031
Figure 643351DEST_PATH_IMAGE032
式中,
Figure 861843DEST_PATH_IMAGE033
Figure 658898DEST_PATH_IMAGE034
为调节系数;
S3.4对待融合的第二目标序列信息进行融合,生成待拣选可观测目标序列
Figure 267734DEST_PATH_IMAGE035
式中,
Figure 237964DEST_PATH_IMAGE036
表示邻居节点
Figure 248645DEST_PATH_IMAGE008
传递的目标序列信息;
S3.5根据
Figure 216601DEST_PATH_IMAGE037
结果进行第一目标信息遍历修订,若第一目标序列和第二目标序列 融合结果
Figure 377980DEST_PATH_IMAGE037
存在相同目标,且目标在两个序列中信息差处于预设的误差阈值范围内,则 以第一目标序列观测值更新修订对应目标的
Figure 89584DEST_PATH_IMAGE037
目标序列信息融合结果,否则不进行修订 操作;
S3.6根据遍历修订后的
Figure 220351DEST_PATH_IMAGE037
的排序得到
Figure 421525DEST_PATH_IMAGE038
个目标的可观测目标序列,即为待拣选 的可观测目标序列
Figure 739374DEST_PATH_IMAGE001
Figure 254669DEST_PATH_IMAGE002
为任一可观测目标,
Figure 302259DEST_PATH_IMAGE003
Figure 612018DEST_PATH_IMAGE004
为 可观测目标数量。
其中,收益-代价评估模块对可观测目标序列进行基于信息交互评价的收益-代价评估,具体计算过程为:
根据下式计算智能体节点
Figure 417163DEST_PATH_IMAGE006
的1跳邻域及2跳邻域智能体节点获取的可观测目标 序列中各目标距节点
Figure 532886DEST_PATH_IMAGE006
的距离代价:
Figure 372666DEST_PATH_IMAGE039
式中,
Figure 853326DEST_PATH_IMAGE040
为可观测目标序列
Figure 473663DEST_PATH_IMAGE005
中任一目标在t时刻距离节点
Figure 65182DEST_PATH_IMAGE006
的距离,
Figure 25047DEST_PATH_IMAGE041
为 可观测目标序列
Figure 738926DEST_PATH_IMAGE005
中所有目标在时刻t距离节点
Figure 518663DEST_PATH_IMAGE006
的距离之和;
根据下式计算级联邻域内当前时刻t获取的信息,可观测目标序列中各目标在1跳和2跳邻域的交互传播密度:
Figure 913872DEST_PATH_IMAGE042
式中,
Figure 790561DEST_PATH_IMAGE043
为计数函数,
Figure 613024DEST_PATH_IMAGE044
为1跳邻域传播信息中目标
Figure 880057DEST_PATH_IMAGE002
出现的计数 次数,
Figure 141274DEST_PATH_IMAGE045
为2跳邻域传播信息中目标
Figure 810153DEST_PATH_IMAGE002
出现的计数次数,
Figure 803517DEST_PATH_IMAGE046
为1 跳邻域传播信息中各目标出现的总计数次数,
Figure 823425DEST_PATH_IMAGE047
为2跳邻域传播信息中各目 标出现的总计数次数,
Figure 826016DEST_PATH_IMAGE048
Figure 349401DEST_PATH_IMAGE049
分别为1跳邻域与2跳邻域的权重;
根据下式计算可观测目标序列中各目标在时刻t信息持久度
Figure 363932DEST_PATH_IMAGE050
Figure 605558DEST_PATH_IMAGE051
Figure 146260DEST_PATH_IMAGE052
Figure 586469DEST_PATH_IMAGE053
式中,
Figure 187214DEST_PATH_IMAGE054
求和函数,
Figure 650557DEST_PATH_IMAGE055
表示基于历史交互记录的目标
Figure 57267DEST_PATH_IMAGE002
的目标信息存续度, 即从首次出现时间
Figure 289666DEST_PATH_IMAGE056
到当前时刻t的总时长,
Figure 61313DEST_PATH_IMAGE057
为基于历史交互记录的目标
Figure 11951DEST_PATH_IMAGE058
的目标 信息新鲜度,即从上次出现时间
Figure 956773DEST_PATH_IMAGE059
到当前时刻
Figure 309257DEST_PATH_IMAGE060
Figure 251805DEST_PATH_IMAGE061
的时长,
Figure 955319DEST_PATH_IMAGE062
为可观测目标序列中 所有目标存续度之和,
Figure 641515DEST_PATH_IMAGE063
可观测目标序列中所有目标新鲜度之和,
Figure 848506DEST_PATH_IMAGE064
为目标信息 存续度调节系数,
Figure 821010DEST_PATH_IMAGE065
为目标信息新鲜度调节系数;
根据下式计算任务匹配收益度:
Figure 746241DEST_PATH_IMAGE066
式中,
Figure 970549DEST_PATH_IMAGE054
为求和函数,
Figure 359942DEST_PATH_IMAGE067
为目标序列中目标
Figure 378713DEST_PATH_IMAGE002
的目标优先级值;
Figure 791240DEST_PATH_IMAGE068
为目 标序列中目标
Figure 84818DEST_PATH_IMAGE002
的目标偏好值;
Figure 266401DEST_PATH_IMAGE069
为可观测目标序列中所有目标优先级值之和,
Figure 721653DEST_PATH_IMAGE070
为可观测目标序列中所有目标偏好值之和,
Figure 217881DEST_PATH_IMAGE071
为目标信息优先级调节系数,
Figure 783991DEST_PATH_IMAGE072
为目标信息偏好调节系数;
根据下式计算目标更替抑制因子:
Figure 85660DEST_PATH_IMAGE073
式中,
Figure 977392DEST_PATH_IMAGE002
表示可观测目标序列中的一个目标,
Figure 98932DEST_PATH_IMAGE074
为按设定策略设计的抑制 因子的策略函数,当目标已为关注目标,即
Figure 468734DEST_PATH_IMAGE075
为1时,则抑制因子失效;
根据下式计算收益-代价评估值:
Figure 483963DEST_PATH_IMAGE076
式中
Figure 281018DEST_PATH_IMAGE077
Figure 889854DEST_PATH_IMAGE078
Figure 797767DEST_PATH_IMAGE079
Figure 870765DEST_PATH_IMAGE080
均为可调权重值;
节点
Figure 838721DEST_PATH_IMAGE006
对s个待拣选目标序列生成相应的收益-代价评估结果序列为:
Figure 934853DEST_PATH_IMAGE081
,则拣选结果为
Figure 912036DEST_PATH_IMAGE082
,即收益-代价评 估后最优目标。
为实现所述发明目的,本发明还提供一面向信息交互的智能体双层解耦状态控制系统,包括存储器和一个或者多个处理器,所述存储器用于存储计算机程序,所述处理器调用计算机程序以执行上述方法。
与现有技术相比,本发明提供的面向信息交互的智能体双层解耦状态控制方法及系统,基于复杂网络相关理论,对无人集群中任一智能体节点的信息交互与状态控制,设计双层解耦的基本控制架构,将任务协商与协同信息和底层通信交互信息进行逻辑层面的控制解耦,能够从行为决策和通信保障等不同维度进行逻辑的分离,具备在自主化前提下,均衡无人集群信息交互的时效性、鲁棒性和动态适应性等实用化目标的优势,同时兼具解耦的匹配性和分层的可扩展性,可为无人集群系统的实用化系统模型设计提供新型架构设计的思路。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明提供的无人集群系统的结构示意图;
图2为本发明提供的面向信息交互的智能体双层解耦状态控制方法的流程图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
无人集群系统在实际作业过程中,及其自主协同关系稳定运行的过程中,应重点考虑信息交互行为中存在的具体问题。本发明从结合中心式和分布式的目标出发,将系统从网络动态运行过程角度,看作时空和信息域的可变弱中心或多中心决策场景,为解决自底向上的系统设计和自顶向下的系统需求之间难以匹配的问题,提供一种分层解耦的节点信息交换与状态控制思路,抽象成为面向弱连接条件的局部交互场景,将无人节点抽象为智能体节点,通过横向与纵向的双向解耦,构建层次化信息交互解耦的状态控制方法,实现群体面向目标的自主分配行为涌现,具备成为供按需装填专有决策控制算法模型的底层机制的基础,在实现时效、鲁棒性和动态适应等实用化目标的均衡方面提供了新思路。
第一实施例
图1为本发明提供的无人集群系统的结构示意图,图2为本发明提供的面向信息交互的智能体双层解耦状态控制方法的流程图。如图1、图2所示,无人集群系统包括多个智能体节点。本发明第一实施例提供的面向信息交互的智能体双层解耦状态控制方法,所述方法包括:
所述方法基于UAU-F O*智能体模型实现,UAU-F O*智能体模型对应表征无人集群任意一个智能体节点,包括时空分布层与交互决策层,时空分布层设置有FO*模型、观测感知模块、通信接收模块、邻域剪裁筛选模块和信息融合模块,交互决策层设置有UAU模型、收益-代价评估模块和目标拣选与更新模块;具体实现过程如下:
时空分布层的处理过程为:
FO*模型对智能体节点进行行为状态控制,包括F态和O*态,F态表征智能体节点处于自由状态,O*态表征智能体节点处于观测目标的状态,时空分布层FO*状态控制变更的具体触发条件与交互决策层UAU状态控制变更的具体触发条件耦合联动;
通过观测感知模块观察环境内的目标,将观测的目标信息记为第一目标信息,若 智能体节点为F态,则第一目标信息为空,若智能体节点为O*态,则第一目标信息为观测数 据,并将第一目标信息发送至信息融合模块;同时通过通信接收模块接收1跳邻域及2跳邻 域智能体节点集合发送的第二目标序列信息,若智能体节点集合中某一智能体节点为F态, 则第二目标信息为空,若智能体节点集合中某一智能体节点为O*态,则第二目标信息为观 测数据,并将第二目标信息发送至邻域剪裁模块;其中,所述1跳邻域为t时刻某一智能体节 点
Figure 777224DEST_PATH_IMAGE083
有直接通信连接的智能体节点的智能体节点集合;2跳邻域为与智能体节点平台集合 中的每一智能体节点有通信连接的智能体节点集合。
通过邻域剪裁模块对第二目标序列信息进行1跳邻域及2跳邻域计算及剪裁,筛选出待融合的目标序列信息,发送至信息融合模块;
通过信息融合模块对观测感知模块发送的第一目标信息和邻域剪裁模块发送的 待融合的目标序列信息进行各目标信息级联拓扑关联度评估,生成待拣选的可观测目标序 列
Figure 916081DEST_PATH_IMAGE084
,将可观测目标序列发送给交互决策层的收益-代价评估 模块;式中,
Figure 358564DEST_PATH_IMAGE085
为任一可观测目标,
Figure 873859DEST_PATH_IMAGE086
Figure 593553DEST_PATH_IMAGE087
为可观测目标数量;具体包括以下过程:
S3.1计算智能体节点
Figure 168891DEST_PATH_IMAGE083
与1跳邻域集合
Figure 239615DEST_PATH_IMAGE088
内节点
Figure 293022DEST_PATH_IMAGE089
的综合信息聚集能力评估值
Figure 195119DEST_PATH_IMAGE090
,所述集合
Figure 675779DEST_PATH_IMAGE088
为t刻智能体节点
Figure 95783DEST_PATH_IMAGE083
有直接通信连接的智能体节点的智能体节点集合 中去除有回流的节点集合;
Figure 687302DEST_PATH_IMAGE091
其中,
Figure 381588DEST_PATH_IMAGE092
Figure 564308DEST_PATH_IMAGE093
式中,
Figure 344045DEST_PATH_IMAGE094
表示节点
Figure 739254DEST_PATH_IMAGE089
的度,
Figure 553626DEST_PATH_IMAGE095
用于调节扩展邻域度中心性评估对级联评估的影响;
Figure 235144DEST_PATH_IMAGE096
为2跳邻域集合
Figure 767756DEST_PATH_IMAGE097
中的节点
Figure 966656DEST_PATH_IMAGE098
的度,集合
Figure 697852DEST_PATH_IMAGE099
为t时刻与
Figure 691216DEST_PATH_IMAGE088
中的每一智能体节点有通 信连接的智能体节点集合去除有回流的节点集合;
S3.2计算智能体节点
Figure 445545DEST_PATH_IMAGE006
与集合
Figure 41611DEST_PATH_IMAGE007
内节点
Figure 564997DEST_PATH_IMAGE008
基于拓扑与交互行为的密切度评估
Figure 994841DEST_PATH_IMAGE019
Figure 502046DEST_PATH_IMAGE020
式中,
Figure 777169DEST_PATH_IMAGE021
Figure 420640DEST_PATH_IMAGE006
Figure 755807DEST_PATH_IMAGE008
之间的拓扑关系密切度,
Figure 547045DEST_PATH_IMAGE022
Figure 625859DEST_PATH_IMAGE006
Figure 123837DEST_PATH_IMAGE008
之间的交互频 次密切度,
Figure 960730DEST_PATH_IMAGE023
Figure 911369DEST_PATH_IMAGE024
为调节系数;
Figure 793874DEST_PATH_IMAGE025
Figure 208675DEST_PATH_IMAGE026
式中,
Figure 151223DEST_PATH_IMAGE027
Figure 589158DEST_PATH_IMAGE006
Figure 868829DEST_PATH_IMAGE008
之间在当前时刻t前的信息交互总次数,
Figure 341399DEST_PATH_IMAGE028
为第
Figure 454849DEST_PATH_IMAGE029
次信息交互 时的时间;
Figure 645659DEST_PATH_IMAGE030
为第n-1次信息交互时的时间;
S3.3计算智能体节点
Figure 869967DEST_PATH_IMAGE006
与集合
Figure 993780DEST_PATH_IMAGE007
内节点
Figure 278131DEST_PATH_IMAGE008
的级联拓扑关联度评估
Figure 690658DEST_PATH_IMAGE031
Figure 780974DEST_PATH_IMAGE032
式中,
Figure 962556DEST_PATH_IMAGE033
Figure 152229DEST_PATH_IMAGE034
为调节系数;
S3.4对待融合的第二目标序列信息进行融合,生成待拣选可观测目标序列
Figure 52052DEST_PATH_IMAGE035
式中,
Figure 680480DEST_PATH_IMAGE036
表示邻居节点
Figure 982148DEST_PATH_IMAGE008
传递的目标序列信息;
S3.5根据
Figure 342722DEST_PATH_IMAGE100
结果进行第一目标信息遍历修订,若第一目标序列和第二目标序列 融合结果
Figure 792158DEST_PATH_IMAGE100
存在相同目标,且目标在两个序列中信息差处于预设的误差阈值范围内,则 以第一目标序列观测值更新修订对应目标的
Figure 161959DEST_PATH_IMAGE100
目标序列信息融合结果,否则不进行修订 操作;
S3.6根据遍历修订后的
Figure 129520DEST_PATH_IMAGE100
的排序得到
Figure 926575DEST_PATH_IMAGE101
个目标的可观测目标序列,即为待拣选 的可观测目标序列
Figure 535411DEST_PATH_IMAGE084
Figure 771220DEST_PATH_IMAGE085
为任一可观测目标,
Figure 781902DEST_PATH_IMAGE086
Figure 749858DEST_PATH_IMAGE087
为可观测目标数量。
交互决策层的处理过程为:
UAU模型包括两种基本状态U态和A态,所述U态表征智能体节点无观测目标状态,U 态下交互决策层不对时空分布层的信息交换加以限制,A态表征智能体节点有观测目标状 态,A态下交互决策层对时空分布层的信息交换进行限制约束;UAU状态控制变更的具体触 发条件为:待拣选可观测目标序列
Figure 845990DEST_PATH_IMAGE084
是否为空,若
Figure 619910DEST_PATH_IMAGE102
为空, 则智能体节点变更为U态,若
Figure 485098DEST_PATH_IMAGE102
不为空,则智能体节点变更为A态;
通过收益-代价评估模块对可观测目标序列进行基于信息交互评价的收益-代价评估;具体计算过程为:
根据下式计算智能体节点
Figure 686273DEST_PATH_IMAGE006
的1跳邻域及2跳邻域智能体节点获取的可观测目标 序列中各目标距节点
Figure 269701DEST_PATH_IMAGE006
的距离代价:
Figure 519416DEST_PATH_IMAGE039
式中,
Figure 504690DEST_PATH_IMAGE040
为可观测目标序列
Figure 876765DEST_PATH_IMAGE005
中任一目标在t时刻距离节点
Figure 947490DEST_PATH_IMAGE006
的距离,
Figure 896DEST_PATH_IMAGE041
为 可观测目标序列
Figure 902993DEST_PATH_IMAGE005
中所有目标在时刻t距离节点
Figure 383653DEST_PATH_IMAGE006
的距离之和;
根据下式计算级联邻域内当前时刻t获取的信息,可观测目标序列中各目标在1跳和2跳邻域的交互传播密度:
Figure 676094DEST_PATH_IMAGE042
式中,
Figure 595509DEST_PATH_IMAGE043
为计数函数,
Figure 289795DEST_PATH_IMAGE044
为1跳邻域传播信息中目标
Figure 941356DEST_PATH_IMAGE002
出现的计数 次数,
Figure 48990DEST_PATH_IMAGE045
为2跳邻域传播信息中目标
Figure 444199DEST_PATH_IMAGE002
出现的计数次数,
Figure 992992DEST_PATH_IMAGE046
为1 跳邻域传播信息中各目标出现的总计数次数,
Figure 146280DEST_PATH_IMAGE047
为2跳邻域传播信息中各目 标出现的总计数次数,
Figure 413313DEST_PATH_IMAGE048
Figure 612214DEST_PATH_IMAGE049
分别为1跳邻域与2跳邻域的权重;
根据下式计算可观测目标序列中各目标在时刻t信息持久度
Figure 15513DEST_PATH_IMAGE050
Figure 336773DEST_PATH_IMAGE051
Figure 91102DEST_PATH_IMAGE052
Figure 828114DEST_PATH_IMAGE053
式中,
Figure 413816DEST_PATH_IMAGE054
求和函数,
Figure 843661DEST_PATH_IMAGE055
表示基于历史交互记录的目标
Figure 819707DEST_PATH_IMAGE002
的目标信息存续度, 即从首次出现时间
Figure 422727DEST_PATH_IMAGE056
到当前时刻t的总时长,
Figure 66198DEST_PATH_IMAGE057
为基于历史交互记录的目标
Figure 401364DEST_PATH_IMAGE058
的目标 信息新鲜度,即从上次出现时间
Figure 192602DEST_PATH_IMAGE059
到当前时刻
Figure 271417DEST_PATH_IMAGE060
Figure 769394DEST_PATH_IMAGE061
的时长,
Figure 337779DEST_PATH_IMAGE062
为可观测目标序列中 所有目标存续度之和,
Figure 553997DEST_PATH_IMAGE063
可观测目标序列中所有目标新鲜度之和,
Figure 436502DEST_PATH_IMAGE064
为目标信息 存续度调节系数,
Figure 851303DEST_PATH_IMAGE065
为目标信息新鲜度调节系数;
根据下式计算任务匹配收益度:
Figure 793851DEST_PATH_IMAGE066
式中,
Figure 231786DEST_PATH_IMAGE054
为求和函数,
Figure 714720DEST_PATH_IMAGE067
为目标序列中目标
Figure 187289DEST_PATH_IMAGE002
的目标优先级值;
Figure 35159DEST_PATH_IMAGE068
为目 标序列中目标
Figure 25637DEST_PATH_IMAGE002
的目标偏好值;
Figure 249945DEST_PATH_IMAGE069
为可观测目标序列中所有目标优先级值之和,
Figure 577021DEST_PATH_IMAGE070
为可观测目标序列中所有目标偏好值之和,
Figure 923689DEST_PATH_IMAGE071
为目标信息优先级调节系数,
Figure 336215DEST_PATH_IMAGE072
为目标信息偏好调节系数;
根据下式计算目标更替抑制因子:
Figure 98635DEST_PATH_IMAGE073
式中,
Figure 342534DEST_PATH_IMAGE002
表示可观测目标序列中的一个目标,
Figure 797787DEST_PATH_IMAGE074
为按设定策略设计的抑制 因子的策略函数,当目标已为关注目标,即
Figure 697609DEST_PATH_IMAGE075
为1时,则抑制因子失效;
根据下式计算收益-代价评估值:
Figure 326037DEST_PATH_IMAGE076
式中
Figure 362126DEST_PATH_IMAGE077
Figure 988279DEST_PATH_IMAGE078
Figure 375398DEST_PATH_IMAGE079
Figure 541938DEST_PATH_IMAGE080
均为可调权重值;
节点
Figure 698112DEST_PATH_IMAGE006
对s个待拣选目标序列生成相应的收益-代价评估结果序列为:
Figure 495167DEST_PATH_IMAGE081
,则拣选结果为
Figure 166320DEST_PATH_IMAGE082
,即收益-代价评 估后最优目标。
通过目标拣选与更新模块根据评估结果拣选观测目标和更新,若智能体节点为A态,则对拟观测目标拣选结果与原关注目标比对,若不同则更新关注目标,若智能体节点为U态,则使智能体节点保持无观测自由漫游;
当拣选了观测目标后,交互决策层根据观测目标是否由无变为有而触发时空分布层FO*状态是否由F态向O*变迁;或交互决策层根据是否更替观测目标,而触发时空分布层观测目标状态不变的情况下进行观测目标的切换。
本发明中,时空分布层根据FO*状态,确定是否对通信接收模块接收的信息进行过 滤操作,若智能体节点
Figure 339812DEST_PATH_IMAGE103
处于O*态的有序态(ORD),则对所有通信接收模块接收的非关注目 标信息全部过滤排除,若智能体节点
Figure 350494DEST_PATH_IMAGE103
处于F态或O*态的观测态(OBS),则不进行过滤操作。
本发明中,交互决策层根据拣选后目标是否更替或由无关注变为有关注,进行UAU状态切换,并联动切换时空分布层的FO*状态,切换FO*状态时,若拣选目标还不在感知范围内,即还需一段时空运动才能达到开始实际观测的情况,则将O*态设为有序态(ORD),若拣选后,可立即开始观测感知,则将O*态设为观测态(OBS),同步启动通信接收的目标信息过滤抑制操作。若ORD态且在运动过程中未更替观测目标情况下到达可观测感知范围,则将O*态设为OBS态,并且同步启动通信接收的目标信息过滤抑制操作。
第二实施例
本发明第二实施例还提供一面向信息交互的智能体双层解耦状态控制系统,其包括存储器和一个或者多个处理器,所述存储器用于存储计算机程序,所述处理器调用计算机程序以执行第一实施例任一所述的方法。
本发明提供的面向信息交互的智能体双层解耦状态控制方法及系统,对无人集群中任一智能体节点的信息交互与状态控制,设计双层解耦的基本控制架构,将任务协商与协同信息和底层通信交互信息进行逻辑层面的控制解耦,能够从行为决策和通信保障等不同维度进行逻辑的分离,具备在自主化前提下,均衡无人集群信息交互的时效性、鲁棒性和动态适应性等实用化目标的优势,同时兼具解耦的匹配性和分层的可扩展性,可为无人集群系统的实用化系统模型设计提供新型架构设计的思路。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (5)

1.一种面向信息交互的智能体双层解耦状态控制方法,其特征在于,所述方法基于UAU-F O*智能体模型实现,UAU-F O*智能体模型对应表征无人集群任意一个智能体节点,包括时空分布层与交互决策层,时空分布层设置有FO*模型、观测感知模块、通信接收模块、邻域剪裁筛选模块和信息融合模块,交互决策层设置有UAU模型、收益-代价评估模块和目标拣选与更新模块;具体实现过程如下:
时空分布层的处理过程为:
FO*模型对智能体节点进行行为状态控制,包括F态和O*态,F态表征智能体节点处于自由状态,O*态表征智能体节点处于观测目标的状态,时空分布层FO*状态控制变更的具体触发条件与交互决策层UAU状态控制变更的具体触发条件耦合联动;
通过观测感知模块观察环境内的目标,将观测的目标信息记为第一目标信息,若智能体节点为F态,则第一目标信息为空,若智能体节点为O*态,则第一目标信息为观测数据,并将第一目标信息发送至信息融合模块;同时通过通信接收模块接收1跳邻域及2跳邻域智能体节点集合发送的第二目标序列信息,若智能体节点集合中某一智能体节点为F态,则第二目标信息为空,若智能体节点集合中某一智能体节点为O*态,则第二目标信息为观测数据,并将第二目标信息发送至邻域剪裁模块;
通过邻域剪裁模块对第二目标序列信息进行1跳邻域及2跳邻域计算及剪裁,筛选出待融合的目标序列信息,发送至信息融合模块;
通过信息融合模块对观测感知模块发送的第一目标信息和邻域剪裁模块发送的待融 合的目标序列信息进行各目标信息级联拓扑关联度评估,生成待拣选的可观测目标序列
Figure 739636DEST_PATH_IMAGE001
,将可观测目标序列发送给交互决策层的收益-代价评估模 块;式中,
Figure 656776DEST_PATH_IMAGE002
为任一可观测目标,
Figure 764409DEST_PATH_IMAGE003
Figure 159619DEST_PATH_IMAGE004
为可观测目标数量;
交互决策层的处理过程为:
UAU模型包括两种基本状态U态和A态,所述U态表征智能体节点无观测目标状态,U态下 交互决策层不对时空分布层的信息交换加以限制,A态表征智能体节点有观测目标状态,A 态下交互决策层对时空分布层的信息交换进行限制约束;UAU状态控制变更的具体触发条 件为:待拣选可观测目标序列
Figure 36308DEST_PATH_IMAGE001
是否为空,若
Figure 858770DEST_PATH_IMAGE005
为空,则智能 体节点变更为U态,若
Figure 125804DEST_PATH_IMAGE005
不为空,则智能体节点变更为A态;
通过收益-代价评估模块对可观测目标序列进行基于信息交互评价的收益-代价评估;
通过目标拣选与更新模块根据评估结果拣选观测目标和更新,若智能体节点为A态,则对拟观测目标拣选结果与原关注目标比对,若不同则更新关注目标,若智能体节点为U态,则使智能体节点保持无观测自由漫游;
当拣选了观测目标后,交互决策层根据观测目标是否由无变为有而触发时空分布层FO*状态是否由F态向O*变迁;或交互决策层根据是否更替观测目标,而触发时空分布层观测目标状态不变的情况下进行观测目标的切换。
2.根据权利要求1所述的一种面向信息交互的智能体双层解耦状态控制方法,其特征 在于,所述1跳邻域为t时刻某一智能体节点
Figure 324704DEST_PATH_IMAGE006
有直接通信连接的智能体节点的智能体节点 集合;2跳邻域为与智能体节点平台集合中的每一智能体节点有通信连接的智能体节点集 合。
3.根据权利要求1所述的一种面向信息交互的智能体双层解耦状态控制方法,其特征在于,信息融合模块对观测感知模块发送的第一目标信息和邻域剪裁模块发送的待融合的目标序列信息进行各目标信息级联拓扑关联度评估,生成待拣选的可观测目标序列,具体包括以下过程:
S3.1计算智能体节点
Figure 790320DEST_PATH_IMAGE006
与1跳邻域集合
Figure 783684DEST_PATH_IMAGE007
内节点
Figure 865909DEST_PATH_IMAGE008
的综合信息聚集能力评估值
Figure 602921DEST_PATH_IMAGE009
,所述集合
Figure 923044DEST_PATH_IMAGE007
为t刻智能体节点
Figure 352888DEST_PATH_IMAGE006
有直接通信连接的智能体节点的智能体节点集合中去 除有回流的节点集合;
Figure 594514DEST_PATH_IMAGE010
其中,
Figure 869637DEST_PATH_IMAGE011
Figure 841005DEST_PATH_IMAGE012
式中,
Figure 176171DEST_PATH_IMAGE013
表示节点
Figure 967409DEST_PATH_IMAGE008
的度,
Figure 46224DEST_PATH_IMAGE014
用于调节扩展邻域度中心性评估对级联评估的影响;
Figure 343869DEST_PATH_IMAGE015
为2 跳邻域集合
Figure 115516DEST_PATH_IMAGE016
中的节点
Figure 66154DEST_PATH_IMAGE017
的度,集合
Figure 276556DEST_PATH_IMAGE018
为t时刻与
Figure 629039DEST_PATH_IMAGE007
中的每一智能体节点有通信连 接的智能体节点集合去除有回流的节点集合;
S3.2计算智能体节点
Figure 571588DEST_PATH_IMAGE006
与集合
Figure 71839DEST_PATH_IMAGE007
内节点
Figure 492456DEST_PATH_IMAGE008
基于拓扑与交互行为的密切度评估
Figure 27343DEST_PATH_IMAGE019
Figure 140792DEST_PATH_IMAGE020
式中,
Figure 66023DEST_PATH_IMAGE021
Figure 352648DEST_PATH_IMAGE006
Figure 414145DEST_PATH_IMAGE008
之间的拓扑关系密切度,
Figure 698496DEST_PATH_IMAGE022
Figure 907760DEST_PATH_IMAGE006
Figure 935759DEST_PATH_IMAGE008
之间的交互频次密 切度,
Figure 117341DEST_PATH_IMAGE023
Figure 634910DEST_PATH_IMAGE024
为调节系数;
Figure 534733DEST_PATH_IMAGE025
Figure 100844DEST_PATH_IMAGE026
式中,
Figure 464829DEST_PATH_IMAGE027
Figure 825403DEST_PATH_IMAGE006
Figure 212522DEST_PATH_IMAGE008
之间在当前时刻t前的信息交互总次数,
Figure 647570DEST_PATH_IMAGE028
为第
Figure 538166DEST_PATH_IMAGE029
次信息交互时的 时间;
Figure 335221DEST_PATH_IMAGE030
为第n-1次信息交互时的时间;
S3.3计算智能体节点
Figure 6373DEST_PATH_IMAGE006
与集合
Figure 179866DEST_PATH_IMAGE007
内节点
Figure 190547DEST_PATH_IMAGE008
的级联拓扑关联度评估
Figure 220820DEST_PATH_IMAGE031
Figure 316952DEST_PATH_IMAGE032
式中,
Figure 28556DEST_PATH_IMAGE033
Figure 956061DEST_PATH_IMAGE034
为调节系数;
S3.4对待融合的第二目标序列信息进行融合,生成待拣选可观测目标序列
Figure 94918DEST_PATH_IMAGE035
式中,
Figure 740663DEST_PATH_IMAGE036
表示邻居节点
Figure 990379DEST_PATH_IMAGE008
传递的目标序列信息;
S3.5根据
Figure 975652DEST_PATH_IMAGE037
结果进行第一目标信息遍历修订,若第一目标序列和第二目标序列融合 结果
Figure 285411DEST_PATH_IMAGE037
存在相同目标,且目标在两个序列中信息差处于预设的误差阈值范围内,则以第 一目标序列观测值更新修订对应目标的
Figure 418452DEST_PATH_IMAGE037
目标序列信息融合结果,否则不进行修订操 作;
S3.6根据遍历修订后的
Figure 471859DEST_PATH_IMAGE037
的排序得到
Figure 373956DEST_PATH_IMAGE038
个目标的可观测目标序列,即为待拣选的可 观测目标序列
Figure 854616DEST_PATH_IMAGE001
Figure 209374DEST_PATH_IMAGE002
为任一可观测目标,
Figure 66471DEST_PATH_IMAGE003
Figure 760758DEST_PATH_IMAGE004
为可观 测目标数量。
4.根据权利要求1所述的一种面向信息交互的智能体双层解耦状态控制方法法,其特征在于,收益-代价评估模块对可观测目标序列进行基于信息交互评价的收益-代价评估,具体计算过程为:
根据下式计算智能体节点
Figure 489284DEST_PATH_IMAGE006
的1跳邻域及2跳邻域智能体节点获取的可观测目标序列 中各目标距节点
Figure 534601DEST_PATH_IMAGE006
的距离代价:
Figure 929810DEST_PATH_IMAGE039
式中,
Figure 540920DEST_PATH_IMAGE040
为可观测目标序列
Figure 628961DEST_PATH_IMAGE005
中任一目标在t时刻距离节点
Figure 958312DEST_PATH_IMAGE006
的距离,
Figure 157212DEST_PATH_IMAGE041
为可观 测目标序列
Figure 560511DEST_PATH_IMAGE005
中所有目标在时刻t距离节点
Figure 881771DEST_PATH_IMAGE006
的距离之和;
根据下式计算级联邻域内当前时刻t获取的信息,可观测目标序列中各目标在1跳和2跳邻域的交互传播密度:
Figure 636101DEST_PATH_IMAGE042
式中,
Figure 435429DEST_PATH_IMAGE043
为计数函数,
Figure 958815DEST_PATH_IMAGE044
为1跳邻域传播信息中目标
Figure 388659DEST_PATH_IMAGE002
出现的计数次数,
Figure 427022DEST_PATH_IMAGE045
为2跳邻域传播信息中目标
Figure 967725DEST_PATH_IMAGE002
出现的计数次数,
Figure 611196DEST_PATH_IMAGE046
为1跳邻域 传播信息中各目标出现的总计数次数,
Figure 8679DEST_PATH_IMAGE047
为2跳邻域传播信息中各目标出现 的总计数次数,
Figure 737601DEST_PATH_IMAGE048
Figure 816415DEST_PATH_IMAGE049
分别为1跳邻域与2跳邻域的权重;
根据下式计算可观测目标序列中各目标在时刻t信息持久度
Figure 376709DEST_PATH_IMAGE050
Figure 882777DEST_PATH_IMAGE051
Figure 164241DEST_PATH_IMAGE052
Figure 46747DEST_PATH_IMAGE053
式中,
Figure 399231DEST_PATH_IMAGE054
求和函数,
Figure 404096DEST_PATH_IMAGE055
表示基于历史交互记录的目标
Figure 842030DEST_PATH_IMAGE002
的目标信息存续度,即从 首次出现时间
Figure 262647DEST_PATH_IMAGE056
到当前时刻t的总时长,
Figure 797534DEST_PATH_IMAGE057
为基于历史交互记录的目标
Figure 645404DEST_PATH_IMAGE058
的目标信息 新鲜度,即从上次出现时间
Figure 570635DEST_PATH_IMAGE059
到当前时刻
Figure 794943DEST_PATH_IMAGE060
的时长,
Figure 184336DEST_PATH_IMAGE061
为可观测目标序列中所有目 标存续度之和,
Figure 468687DEST_PATH_IMAGE062
可观测目标序列中所有目标新鲜度之和,
Figure 943530DEST_PATH_IMAGE063
为目标信息存续度 调节系数,
Figure 705950DEST_PATH_IMAGE064
为目标信息新鲜度调节系数;
根据下式计算任务匹配收益度:
Figure 887533DEST_PATH_IMAGE065
式中,
Figure 405102DEST_PATH_IMAGE054
为求和函数,
Figure DEST_PATH_IMAGE066
为目标序列中目标
Figure 304925DEST_PATH_IMAGE002
的目标优先级值;
Figure 933352DEST_PATH_IMAGE067
为目标序 列中目标
Figure 969441DEST_PATH_IMAGE002
的目标偏好值;
Figure 657911DEST_PATH_IMAGE068
为可观测目标序列中所有目标优先级值之和,
Figure 45030DEST_PATH_IMAGE069
为可观测目标序列中所有目标偏好值之和,
Figure 149253DEST_PATH_IMAGE070
为目标信息优先级调节系数,
Figure 370674DEST_PATH_IMAGE071
为目标信息偏好调节系数;
根据下式计算目标更替抑制因子:
Figure 167729DEST_PATH_IMAGE072
式中,
Figure 776565DEST_PATH_IMAGE002
表示可观测目标序列中的一个目标,
Figure 12374DEST_PATH_IMAGE073
为按设定策略设计的抑制因子 的策略函数,当目标已为关注目标,即
Figure 23055DEST_PATH_IMAGE074
为1时,则抑制因子失效;
根据下式计算收益-代价评估值:
Figure 991011DEST_PATH_IMAGE075
式中
Figure 149460DEST_PATH_IMAGE076
Figure 595485DEST_PATH_IMAGE077
Figure 726252DEST_PATH_IMAGE078
Figure 927426DEST_PATH_IMAGE079
均为可调权重值;
节点
Figure 510854DEST_PATH_IMAGE006
对s个待拣选目标序列生成相应的收益-代价评估结果序列为:
Figure 760570DEST_PATH_IMAGE080
,则拣选结果为
Figure 808160DEST_PATH_IMAGE081
,即收益-代价评估后最 优目标。
5.一面向信息交互的智能体双层解耦状态控制系统,其特征在于,包括存储器和一个或者多个处理器,所述存储器用于存储计算机程序,所述处理器调用计算机程序以执行权利要求1-4任一所述的方法。
CN202211330462.0A 2022-10-28 2022-10-28 一种面向信息交互的智能体双层解耦状态控制方法及系统 Active CN115390458B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211330462.0A CN115390458B (zh) 2022-10-28 2022-10-28 一种面向信息交互的智能体双层解耦状态控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211330462.0A CN115390458B (zh) 2022-10-28 2022-10-28 一种面向信息交互的智能体双层解耦状态控制方法及系统

Publications (2)

Publication Number Publication Date
CN115390458A true CN115390458A (zh) 2022-11-25
CN115390458B CN115390458B (zh) 2023-01-24

Family

ID=84115063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211330462.0A Active CN115390458B (zh) 2022-10-28 2022-10-28 一种面向信息交互的智能体双层解耦状态控制方法及系统

Country Status (1)

Country Link
CN (1) CN115390458B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930944A (zh) * 2016-07-12 2016-09-07 中国人民解放军空军装备研究院雷达与电子对抗研究所 一种基于dec-pomdp的多卫星协同优化决策方法及装置
CN113316118A (zh) * 2021-05-31 2021-08-27 中国人民解放军国防科技大学 基于任务认知的无人机集群网络自组织系统及方法
CN114567888A (zh) * 2022-03-04 2022-05-31 重庆邮电大学 一种多无人机动态部署方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930944A (zh) * 2016-07-12 2016-09-07 中国人民解放军空军装备研究院雷达与电子对抗研究所 一种基于dec-pomdp的多卫星协同优化决策方法及装置
CN113316118A (zh) * 2021-05-31 2021-08-27 中国人民解放军国防科技大学 基于任务认知的无人机集群网络自组织系统及方法
CN114567888A (zh) * 2022-03-04 2022-05-31 重庆邮电大学 一种多无人机动态部署方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
INMO JANG等: "An Integrated Decision-making Framework of a Heterogeneous Aerial Robotic Swarm for Cooperative Tasks with Minimum Requirements", 《PROCEEDINGS OF THE INSTITUTION OF MECHANICAL ENGINEERS》 *
张广政 等: "非确定环境下基于分层理论多无人机动态协同设计", 《系统工程理论与实践》 *
沈宇婷 等: "面向集群目标分配的层次化信息传播方法", 《兵工学报》 *
王祥科 等: "大规模固定翼无人机集群编队控制方法", 《控制与决策》 *

Also Published As

Publication number Publication date
CN115390458B (zh) 2023-01-24

Similar Documents

Publication Publication Date Title
CN112202672B (zh) 一种基于业务服务质量需求的网络路由转发方法和系统
Zavlanos et al. Graph-theoretic connectivity control of mobile robot networks
Zhang et al. Collective behavior coordination with predictive mechanisms
Yao et al. RDAM: A reinforcement learning based dynamic attribute matrix representation for virtual network embedding
US8605092B2 (en) Method and apparatus of animation planning for a dynamic graph
CN108075975B (zh) 一种物联网环境中的路由传输路径的确定方法及确定系统
Liao et al. Genetic algorithms with particle swarm optimization based mutation for distributed controller placement in SDNs
CN104836711B (zh) 一种指挥控制网络生成模型的构建方法
CN108595533A (zh) 一种基于协同过滤的物品推荐方法、存储介质及服务器
CN106685745B (zh) 一种网络拓扑构建方法及装置
Al Ridhawi et al. Design guidelines for cooperative UAV-supported services and applications
CN108650011A (zh) 多无人机与地面网络高效协作性数据中继方法及系统
Rahbari et al. Fast and fair computation offloading management in a swarm of drones using a rating-based federated learning approach
Tuyishimire et al. Modelling and analysis of interference diffusion in the internet of things: An epidemic model
Hans et al. Controller placement in software defined Internet of Things using optimization algorithm
CN114936307A (zh) 一种范式化图模型构建方法
Nguyen et al. Efficient virtual network embedding with node ranking and intelligent link mapping
Han et al. Smart optimization solution for channel access attack defense under UAV-aided heterogeneous network
CN115390458B (zh) 一种面向信息交互的智能体双层解耦状态控制方法及系统
Zhan et al. Flocking of discrete-time multi-agent systems with predictive mechanisms
CN112770256B (zh) 一种无人机自组织网络中的节点轨迹预测方法
Eriksson et al. Evolution of meta-parameters in reinforcement learning algorithm
Meng et al. Intelligent routing orchestration for ultra-low latency transport networks
Haught et al. A Kalman filter-based prediction system for better network context-awareness
CN115497012A (zh) 一种无人集群系统目标融合拣选方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant