CN113156803A - 一种面向任务的无人机集群资源管理及容错控制方法 - Google Patents

一种面向任务的无人机集群资源管理及容错控制方法 Download PDF

Info

Publication number
CN113156803A
CN113156803A CN202110146341.XA CN202110146341A CN113156803A CN 113156803 A CN113156803 A CN 113156803A CN 202110146341 A CN202110146341 A CN 202110146341A CN 113156803 A CN113156803 A CN 113156803A
Authority
CN
China
Prior art keywords
node
nodes
master
main
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110146341.XA
Other languages
English (en)
Inventor
王汇彬
陈鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Huayao Information Technology Co ltd
Original Assignee
Nanjing Huayao Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Huayao Information Technology Co ltd filed Critical Nanjing Huayao Information Technology Co ltd
Priority to CN202110146341.XA priority Critical patent/CN113156803A/zh
Publication of CN113156803A publication Critical patent/CN113156803A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B9/00Safety arrangements
    • G05B9/02Safety arrangements electric
    • G05B9/03Safety arrangements electric with multiple-channel loop, i.e. redundant control systems

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提出了一种面向任务的无人机集群资源管理及容错控制方法。在该方法中,首先包括一种适用于无人机集群的集中式决策与分布式执行相结合的管理方法,为优化集群应用的集中决策提供环境支撑。根据无人机资源的动态性,通过轮询与Trap通知相结合的方法,减少轮询频率,降低资源状态感知开销。其次,包括一种基于策略的优先级计算方法,满足无人机集群面向任务的特性,适应不同任务的需求。第三,包括一种策略优先的分布式容错方法,解决在不确定环境下无人机节点的高故障率所导致的单点故障问题。通过主节点的热备份机制降低主节点失效后选举新的主节点的时延;通过同步机制保证主备节点间数据的一致性,减少任务执行所必须的过程性数据的丢失概率;通过子网合并算法消除网络中冗余主节点。

Description

一种面向任务的无人机集群资源管理及容错控制方法
技术领域
本发明属于无人机应用领域,具体地说是提出一种面向任务的无人机集群(swarm)资 源管理及容错控制方法,通过全局资源状态感知为无人机集群应用的集中式优化决策提供环 境支撑,同时通过分布式容错机制减轻无人机的高故障率及恶劣运行环境带来的影响。
背景技术
无人机集群通常由一组无人机节点和地面控制站组成,无人机节点之间采用宽带通信技 术,而无人机节点与地面控制站之间采用窄带数据链进行通信。无人机集群具有节点能力受 限、资源多维异构、可靠性较低和受控移动等限制。无人机集群是个面向任务的系统,系统 需要为特定的任务而定制,即系统中的节点数量及其所携带的资源量都应当根据任务需要而 优化。此外,面向任务特性通常需要系统资源根据任务的需求在空间和时间上进行相应部署, 例如让搜索集群的前方中心的节点充当系统管控的中心节点,可以使系统管理更为有效。因 此设计无人机集群时应当面向应用,需要根据任务需求在节点数量、节点之间的关系和节点 上的应用资源配置等方面进行优化设计,需要对网络技术、无人机等都具有特定要求。
无人机决策及任务规划必须建立在及时获取系统状态的基础上,但目前缺乏无人机集群 资源状态感知、管理的技术。无人机集群的协同决策方式可分为集中式决策和分布式决策两 类,由于分布式决策只有少量的全局协调信息,其性能通常劣于集中式决策方式。大部分的 任务规划和控制算法都假定系统采用集中式决策方式。有些技术要求无人机集群以分布式方 式处理信息,但要求其结果传输到地面控制站进行数据融合,考虑到无人机与地面控制站间 的通信采用的是窄带数据链,这种管理方式无法满足许多无人机集群应用所需的实时性。本 发明采用了一种集中式决策与分布式执行相结合的高效管理模型,空中的集群系统在执行任 务时,选举出一个主节点进行数据聚合和集中式决策,再将决策结果下发至其从节点进行分 布式执行。此外,现有无人机集群资源管理方法较少考虑无人机集群面向任务、节点计算能 力和资源受限等特性,且无人机节点的高故障率和恶劣的运行环境会加剧集中式管理的单点 故障问题。
为解决上述问题,本发明提出了一种面向任务的无人机集群资源管理及容错控制方法, 节点自治管理本节点的资源并执行全局决策,主节点高效地感知全局资源与状态并为优化集 群应用的集中决策提供环境支撑;通过容错机制应对高故障率的无人机及恶劣的运行环境导 致的系统脆弱性。
发明内容
[发明目的]:本发明提供了一种面向任务的无人机集群资源管理及容错控制方法。通过 一个或多个选举策略的组合来确定节点成为主节点的优先级,从而适应不同任务的需求。主 节点及时感知全局资源与状态,建立全局资源视图,高效地支持系统决策的优化;从节点自 治管理本地资源并分布式协同执行决策。采用策略优先的容错选举方法解决在不确定环境下 无人机节点的高故障率所导致的单点故障问题,通过主节点的热备份机制降低主节点失效后 选举新的主节点的时延,通过同步机制保证主备节点间数据的一致性,减少任务执行所必须 的过程性数据的丢失概率。
[技术方案]:
1.一种适用于无人机集群的集中式决策与分布式执行相结合的管理方法,其特征在于:
A.针对面向任务的无人机集群,在节点注册阶段,根据任务需要集中式优化系统中的节 点数量及其所携带的资源量;
B.在任务分发阶段,地面控制站将控制权移交至选举出的主节点;
C.在任务执行阶段,主节点基于任务需求获取系统宏观信息和特定的微观状态,建立全 局资源视图,为集群应用的集中式高效决策提供支撑,从节点自治管理本节点的资源并执行 全局决策。
2.一种基于策略的优先级计算方法,其特征在于:
A.采用选举策略来反映无人机集群应用对无人机集群节点在承担执行任务的角色、布局 位置等方面的要求;
B.根据复合策略确定节点成为主节点的优先级,复合策略通过在选举策略集上定义的
Figure BDA0002930680340000021
运算和
Figure BDA0002930680340000022
运算来组合多个选举策略。
3.一种策略优先的分布式容错方法,其特征在于:
A.根据策略优先的优先级计算方法确定节点的优先级,将优先级最高的节点选为主节点, 优先级次高的节点选为备用主节点,通过主节点的热备份机制降低主节点失效后的选举新的 主节点的时延;通过同步机制保证主备节点间的数据一致性;
B.针对主节点和备用主节点同时失效的情况,使用分布式选举算法选举出子网的主节点 和备用主节点,若网络被分割成若干个互不连通子网,则每个子网均会选举出各自的主节点 和备用主节点;
C.若因无人机节点移动等因素而导致互不连通的两个子网恢复连通性时,使用子网合并 算法消除冗余的主节点。
其具体实施步骤如下:
步骤1:节点注册过程。参与特定任务的无人机必须向地面控制站注册,并由地面控制 站对它们的身份及其资源认证后才能成为系统节点。具体包括以下三个子步骤:
步骤1.1地面控制站与参与任务的n个无人机节点具有安全认证所需的非对称密钥对 {PKi,SKi|i=1,2,…,n};
步骤1.2所有节点向地面控制站发送注册报文。节点使用自己的私钥对报文进行签名并 用地面控制站的公钥PK0加密。注册报文中包含节点自身的信息(包括本节点的ID、MAC 地址、IP地址、能量、应用资源等)、不重数(防止重放攻击)、和签名信息(保护报文完整性);
步骤1.3地面控制站一旦用自己的私钥SK0解密并用对方公钥鉴别后,就认证了对方身 份,此后就将此次任务所使用的对称密码的秘钥KEYm传输给对方。在此次任务进行中,所 有通信过程都采用KEYm为秘钥保护通信报文的机密性。
步骤2:任务分发过程。地面控制站根据任务目标及其系统资源,调用优化算法分解任务, 为每个节点分配任务角色及其资源,并将任务分发给各节点。具体包括以下三个子步骤:
步骤2.1主节点选举。节点的优先级由所执行的任务对应的选举策略确定。地面控制站 从注册的节点中选举出优先级最高的节点作为主节点,优先级次高的节点作为备份主节点, 其它节点为自主执行主节点分配的任务的从节点;
步骤2.2任务分配。地面控制站根据执行的任务、参与的节点及其拥有的资源,调用优 化算法将任务分解成子任务集合T={ti|i=1,2,…,n},节点或节点集合所对应的子任务为tk。 tk中包含任务ID、节点子集Vk、编队F、航迹FT等信息;
步骤2.3任务交付。采用二阶段提交协议将任务tk、及全局资源信息分别提交给各个节 点。提交完成后,地面控制站将控制权移交给主节点,主节点成为无人机集群的管控中心。
步骤3:任务执行过程。系统主节点使用轮询和Trap通知两种方式感知系统的全局状态 及任务进程,维护系统的正常运行,为无人机集群应用提供信息和环境支撑。主节点会周期 性的与备用节点同步,此外,主节点接收到Trap通知会立即触发同步操作。当主节点故障时, 系统运行容错选举算法,由备份主节点代替主节点,然后主节点再根据策略选举出它的备份 主节点。当系统主节点和备份主节点同时故障时,系统运行分布式选举算法。若因无人机节 点移动等因素而导致互不连通的两个子网恢复连通性时,运行子网合并算法消除冗余的主节 点。
其中,在步骤2.1中所述的“节点的优先级由所执行的任务对应的选举策略确定”,其作法 如下:
(1)选举策略用来反映上层应用对无人机集群节点在承担执行任务的角色、布局位置等方 面的要求,根据一个或多个选举策略的组合来确定节点成为主节点的优先级;
(2)设P={p1,p2,…,pm}表示执行某种任务的选举策略集合,pi(x)表示节点x使用选举策 略pi时的优先级。选举策略集上定义了两种运算:
Figure BDA0002930680340000041
运算和
Figure BDA0002930680340000042
运算。
Figure BDA0002930680340000043
运算的定义:策略
Figure BDA0002930680340000049
权重α∈[0,1],复合策略
Figure BDA0002930680340000044
的定义如下:
pc=pipj≡pc(x)=α×pi(x)*+(1-α)×pj(x)*
其中,*运算符表示min-max标准化运算。
Figure BDA0002930680340000045
运算的定义:策略
Figure BDA0002930680340000046
复合策略
Figure BDA0002930680340000047
的定义如下:
pc(x)>pc(y)≡(pi(x)>pi(y))∪((pi(x)=pi(y))∩(pj(x)>pj(y)))
(3)默认的选举策略pd根据节点ID的大小排序,即pd(x)>pd(y)≡id(x)>id(y);当存 在其它的选举策略pc时,
Figure BDA0002930680340000048
其中,在步骤3中所述的“系统主节点使用轮询和Trap通知两种方式感知系统的全局状态 及任务进程”,其作法如下:
(1)无人机集群资源被分为动态、半动态、稳态三类。动态资源(如节点可用性等)是系 统最为关切的,轮询周期最小;半动态资源(如位置、能量等)对应用优化影响较大,轮询 周期中等;而稳态资源(如摄像机、传感设备等)通常变动不大,轮询周期大;
(2)轮询全局资源的基本流程是:主节点周期性地向无人机集群中所有其他节点发送 HELLO报文,HELLO报文中包含当前连通域信息和主节点ID;从节点接收到主节点的HELLO报文后,使用KEYm对报文进行解密,将当前节点所设置的主节点ID与报文中的值 进行比较,若主节点ID不同,则表示需要删除冗余的主节点;然后将当前节点状态信息通过HELLOACK报文发送至主节点;主节点接收到节点返回的HELLOACK报文后,更新本地缓 存的节点的状态信息。时间段τ内未与主节点发生交互的从节点的状态将被置为断开连接, 且主节点不再轮询这些节点。
(3)Trap通知过程的基本流程是:当从节点发生异常或半动态资源状态发生改变时,从节 点会主动发送TRAP报文至主节点,使得主节点可以即时获取更新后的从节点状态;主节点 接收到从节点的TRAP报文后,使用KEYm对报文进行解密,更新从节点的状态信息并发送 TRAPACK报文至从节点。
其中,在步骤3中所述的“当主节点故障时,系统运行容错选举算法”,容错选举算法的作 法如下:
(1)当主节点工作正常而备份主节点失效时,主节点重新选举它的备份主节点,并启动轮 询过程,利用HELLO报文告知所有节点新的备份主节点;
(2)当任何从节点检测出主节点故障,则发送REVOTE报文至备份主节点,备份主节点接 收到REVOTE报文后,则进一步探测确定主节点的可用性。若主节点失效,则备份主节点宣 告自己为新的主节点并选举出新的备份主节点,通过向所有节点发送SWITCH报文更新主、 备节点的信息。
其中,在步骤3中所述的“当系统主节点和备份主节点同时故障时,系统运行分布式选举 算法。”,分布式选举算法的基本过程如下:
(1)当某节点检测出主节点和备份主节点失效时,首先获取优先级最高的有效节点,如果 该节点是自身,则选举出新的备份主节点并通知所有其他节点;否则,该节点向优先级最高 的节点发送DIST_ELECTION报文;
(2)接收到DIST_ELECTION报文的节点,向发送该报文的节点发送 DIST_ELECTION_ACK响应报文,并执行步骤(1)。
(3)若在特定时间内未收到DIST_ELECTION_ACK响应报文,则置该节点状态为断开连 接,并重新执行步骤(1)。若收到响应报文,则本节点退出选举过程。
当出现许多节点故障时,无人机集群将被分割成若干个互不连通子网。每个子网将会执 行分布式选举算法,选举出各自的主节点和备份主节点。
其中,在步骤3中所述的“若因无人机节点移动等因素而导致互不连通的两个子网恢复 连通性时,运行子网合并算法消除冗余的主节点”,子网合并算法的基本过程如下:
(1)主节点周期性地更新与其他节点间的可达性,HELLO报文中携带了当前连通域的主 备节点信息;
(2)当两个连通域合并时,若连通域Di的主节点masteri接收到来自于另一个连通域Dj的 主节点masterj发送的HELLO报文,则比较masteri和masterj的优先级(策略相关);若 masteri的优先级较高,则发送DELMULMASTER报文至masterj,masterj接收到DELMULMASTER消息后,切换状态为从节点并设置主节点和备份主节点为masteri,backupi。若masteri的优先级低于masterj,则masteri的状态切换为从节点并设置主备节点为masterj,backupj
(3)若从节点接收到另一个连通域的主节点的HELLO报文,则比较当前连通域的主节 点与另一连通域的主节点的优先级,选择优先级高的主节点及对应的备份主节点作为本节点 的主节点、备份主节点。
[有益效果]:本发明提出了一种面向任务的无人机集群资源管理及容错控制方法,具有以 下四个优点:
(1)本发明提出的集中式决策与分布式执行相结合的资源管理模型,能够高效地构建全 局资源视图,为无人机集群的上层应用的优化决策提供环境支撑;
(2)本发明提出的轮询+Trap通知相结合的资源状态感知方法,结合基于动态性的资源分 类方法,能够以较低的通信开销感知系统资源状态;
(3)本发明提出的基于策略的优先级计算方法,能够满足无人机集群面向任务的特性,适 应不同任务的需求;
(4)本发明提出的策略优先的容错机制,能够减轻无人机节点的高故障率和恶劣运行环 境带来的影响;同时能够适应集群系统的分裂或合并等状况,保证系统数据一致性。
[附图说明]
图1无人机集群的组成结构
图2策略优先的分布式容错模型的工作过程
图3子网合并过程示例
图4无人机集群仿真系统架构
图5无人机集群编队结构
图6注册过程的时延分析
图7安全认证在注册过程中的影响
图8每次轮询过程的时间和通信开销
图9同步时间
图10平均故障处理时延
图11子网分割/合并时的选举时间
[具体实施方式]
下面结合附图和实施例对本发明作进一步的说明。
无人机集群的组成结构如图1所示。构成无人机集群的组件中包括一个地面控制站 (GroundControlStation,GCS)和n个无人机(UnmannedAerialVehicle,UAV)节点。地面控制站与无人机节点间使用窄带数据链进行通信,无人机节点间的通信使用宽带链路。每个 节点都携带移动、通信和计算以及应用等类型的资源,无人机为节点提供了移动能力。每个 节点应当满足系统的空间约束,即节点能够位于任务要求的空间位置上,能够根据任务需要 而主动移动,也会因风力、电磁干扰等而被动漂移。节点之间采用自组织网络技术保持相互 连通,所有节点应当满足系统的时间约束,即在特定的时间间隔内节点之间能够进行信息交 互。
策略优先的分布式容错模型的工作过程如图2所示。具体工作过程如下:
(1)当系统初始化时,地面控制站经过节点注册获取了所有节点的信息,由地面控制站自 行独立完成离线选举过程。当地面控制站检测到存在相应的选举策略时,则根据选举策略确 定所有注册节点的优先级,优先级最高的为主节点,优先级次高的为备份主节点。当检测不 到相关策略时,根据节点ID的大小对优先级进行排序;
(2)当地面控制站完成选举后,首先为节点分别确定了主节点、备份主节点和从节点的 角色,接下来根据任务来为各角色分配子任务。其次,地面控制站通知各节点它们分配的角 色和子任务以及系统信息。此后,节点进行初始化,由主节点接管系统的控制权,系统随后 进入正常工作模式;
(3)当主节点故障时,系统运行容错选举算法,由备份主节点代替主节点,然后主节点 再根据策略选举出它的备份主节点。当系统主节点和备份主节点同时故障时,系统运行分布 式选举算法。
图3给出了两个子网合并过程的示例。该示例中的无人机集群系统包含Di和Dj两个子网, Di的主节点为A,备份主节点为B;Dj的主节点为D,备用主节点为E,如图3(a)所示。假定 节点D的优先级高于节点A。节点A和节点D分别向各自子网内的其他节点发送HELLO报文。 当节点B收到来自节点D发送的HELLO报文时,其处理过程如图3(b)所示。节点B检测到HELLO报文中的主节点ID与当前设置的主节点ID不一致,则节点B选择加入优先级较高的主节点所处的子网。同时,收到HELLO报文的节点向主节点发送包含节点当前邻节点信息Nb的HELLOACK报文。节点A收到节点B发送的HELLOACK报文后,将之前不连通的节点D 的状态设置为CONNECTED,并向节点D发送HELLO报文(如图3(c)所示)。由于节点D 的优先级高于节点A,因此节点D收到节点A的HELLO报文后,向节点A发送DELMULMASTER报文,删除多余的主节点,同时重新轮询执行本次任务的所有节点,探测 全网节点的可用性。节点A收到DELMULMASTER报文后设置自身为节点D的从节点,至此 完成了子网Di和Dj的合并,如图3(d)所示。
实施例
本实施例无人机集群仿真系统对本发明提出的方法进行了分析。
基于OMNeT++平台构建无人机集群仿真系统,其架构如图4所示。仿真系统基于INET 库进行设计,利用了INET库提供的因特网协议栈、链路层协议、移动框架、MANET协议等 多种功能模块。节点间的通信通过一种可靠的UDP机制进行,而节点中同层次功能模块间的 通信则经进程间消息交换进行。无人机集群仿真系统实现了网络拓扑控制模型、通信协议、 移动模型及无人机节点模型等。其中拓扑控制模型能够生成所需的拓扑结构;通信协议实现 了节点之间交互的安全通信接口;移动模型定义了节点的移动模式,如在某一区域内随机移 动、跟随指定Leader运动等方式;无人机模型定义了无人机节点、地面站、网络等的组成模 型及接口。上层应用程序实现了节点选举、系统资源管理、节点鉴别等功能。
仿真参数如表1所示。为消除无人机集群拓扑对测试结果的影响,集群采用图5所示网 格结构。实心圆点代表无人机节点,节点位于正方形网格的顶点,相邻节点间的距离为D, 对角线距离
Figure BDA0002930680340000081
无人机的通信半径为R,D<R<L,邻节点数目的范围为[1,4]。试验中 选举策略定义为
Figure BDA0002930680340000082
Xk表示节点k的三维坐标,
Figure BDA0002930680340000083
表示所有节点的均值 中心。即越靠近集群均值中心的节点的优先级越高,若两个节点与均值中心的距离相等,则ID 较大的节点的优先级较高。
表1仿真参数列表
Figure BDA0002930680340000084
首先测试节点注册过程所需的时延。图6(a)给出了在不同节点数目下,仿真试验中地面 控制站完成节点注册和任务提交所需要耗费的时间。其中,注册时间定义为地面控制站接收 到所有节点的注册报文的时间与地面控制站接收到第一个注册报文的时间之差,任务提交时 间定义为地面控制站完成任务提交的时间与地面控制站启动提交过程的时间之差。显然,任 务提交时间随着节点数目的增加而呈线性增长趋势,而注册时间随着节点数目的增加(例如 节点数大于50时)而趋近于指数增长。图6(b)给出了每个节点所耗费的注册时间的箱线图, 可见虽然整体分布较为接近,但随着节点数目的增加,箱线图的离群值随之增多。这是由于 当节点数目增加时,节点间通过无线信道发送注册报文的碰撞机率增加,导致部分报文出现 了超时重传的现象。不过,整体来看,当节点数量不太大(如不大于80个)时,所有节点可 以在较短时间(3秒)内完成注册过程。当节点数量较大时,我们可通过将节点注册过程的 随机竞争协议修改为轮询协议来解决。
在注册过程中,试验使用了RSA-2048非对称加密算法和SHA-256摘要算法实现REGISTER及REGISTERACK报文的加密及签名,使用AES-128对称加密算法下发任务相关 信息至各节点。采用加密认证和未采用加密认证时地面控制站发送和接收的报文数据量如图7 所示。整体来看,加密认证技术所带来的通信开销较小,当n=80时,采用加密认证技术的总通信开销约为800KB,而未采用加密认证技术的总通信开销约为700KB。随着报文长度的增加,加密报文与加密前报文的长度的比值逐渐减小,即加密开销占报文的比例逐渐减小。地面控制站发送的数据量随着节点数目的增加呈指数增长趋势,而地面控制站接收的数据量 随着节点数目的增加呈线性增长趋势。这是由于随着节点数目的增加,下发给各节点的任务 信息的报文长度不断增长。考虑到无人机集群采用的是无线宽带通信技术,总体来说,注册 过程中所产生的通信开销对网络负载的影响并不大。
接下来针对全局资源状态感知过程进行测试,图8给出了不同节点数目下主节点轮询所 有节点状态信息所需要的时间及其开销。从图8(a)中可以看出随着节点数目的增加,每次轮 询所花费的时间呈线性增长趋势,但可以在很短时间内完成轮询操作;图8(b)给出了每次轮 询操作所需发送及接收的报文的字节数,二者均呈线性增长趋势,当节点数n=80时,总开 销不到150KB。
主备节点间同步的频次越高,丢失任务关键数据的概率越低。试验中采用了两种操作方 式结合的模式:主节点定时触发同步操作,当发生了任务相关的关键事件时主节点会立即触 发同步操作。图9给出了试验中不同节点数时轮询操作及Trap操作所触发同步所需要的时间。 从图9可见,周期性的同步操作能够使主备节点的信息一致,但同步时间会随着节点数的增 长而呈缓慢线性增长,这是由于节点越多,需要同步的信息量越大。而由关键事件触发的非 周期性同步操作的信息量与节点数目无关,且只需与备用节点同步,因此非周期性同步的同 步时间基本保持平稳。
接下来测试策略优先的容错选举过程,验证通过备用主节点降低主节点发生故障后的处 理时延的可行性。故障处理时延主要包括三种情况:(a)当备用主节点发生故障而主节点正 常工作时,主节点重新选举备用主节点,将新的备用节点信息下发至其他所有节点的时延;(b) 当主节点发生故障而备用主节点正常工作时,备用主节点将自身选举为主节点并选举出新的 备用主节点,并将选举结果下发至其他所有节点的时延。(c)当主节点发生故障,备用主节点 在当选为新的主节点前发生故障时,其他节点发起分布式选举过程至选举完成的时延。
图10给出了三种不同情况下的平均故障处理时延。主节点重新指定备份主节点及备份 主节点当选为主节点的时延随着节点数目的增长而呈线性增长趋势。当备份主节点失效时, 无人机集群系统仍然可以正常工作,主节点只需重新选举出备份主节点并下发至其他节点, 网络中的其他节点不会主动发出选举报文。而当主节点失效时,集群系统不能够正常工作, 备份主节点会宣告当选为新的主节点,此时,网络中除了备份主节点发送的报文,其他检测 出主节点失效的节点也可能会向备份主节点发送报文,因此,可能会发生报文的碰撞。因此 备份主节点当选为主节点的时延略高于重新指定备份主节点的时延。此外,随着节点数目的 增多,选举结果下发至所有节点的时延也将随之增长。分布式选举过程采用了改进型的Bully 算法,所有检测出故障的节点需要向优先级最高的节点发出选举请求,从图中可以看出,分 布式选举过程的时延大于其他两种情况的时延,特别是在节点数目较多的情况下,分布式选 举过程的时延远高于其他两种情况。当节点数n≤30时,分布式选举过程的时延呈线性增长 趋势,而当n≥40时,分布式选举过程的时延陡然上升,这种变化与图6所示的注册时长的 变化较为相似,原因是随着节点数的增多,越来越多的节点向优先级最高的节点发出选举请 求,导致碰撞机率随之增加,使得分布式选举过程的时延急剧上升,该问题的解决方案与节 点注册过程的解决方案类似。
在仿真试验中,我们还重点研究验证了因节点/链路的失效或恢复而导致的网络分割或合 并问题。我们通过移动节点的位置来形成子网的分割或合并过程。设定节点数目n=40,仿 真时间ts=18秒时,整体平移子网中的节点使之与网络分离,此时子网需选举出新的主节点。 仿真时间ts=34秒时,整体平移子网中的节点使之与原网络合并成统一网络,此时需要消除 冗余的主节点。图11给出了子网分割与合并后选举出新的主节点或消除冗余的主节点所需要 花费的时间。横坐标是脱离或合并至网络的子网节点数目。从图11可以看出,子网规模的改 变几乎不会影响到选举新的主节点或消除冗余主节点的时间。子网合并时消除冗余主节点的 时间略低于子网分割时选举出新的主节点的时间。
本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。

Claims (3)

1.一种适用于无人机集群的集中式决策与分布式执行相结合的管理方法,其特征在于:
A.针对面向任务的无人机集群,在节点注册阶段,根据任务需要集中式优化系统中的节点数量及其所携带的资源量;
B.在任务分发阶段,地面控制站将控制权移交至选举出的主节点;
C.在任务执行阶段,主节点基于任务需求获取系统宏观信息和特定的微观状态,建立全局资源视图,为集群应用的集中式高效决策提供支撑,从节点自治管理本节点的资源并执行全局决策。
2.一种基于策略的优先级计算方法,其特征在于:
A.采用选举策略来反映无人机集群应用对无人机集群节点在承担执行任务的角色、布局位置等方面的要求;
B.根据复合策略确定节点成为主节点的优先级,复合策略通过在选举策略集上定义的
Figure FDA0002930680330000011
运算和>运算来组合多个选举策略。
3.一种策略优先的分布式容错方法,其特征在于:
A.根据策略优先的优先级计算方法确定节点的优先级,将优先级最高的节点选为主节点,优先级次高的节点选为备用主节点,通过主节点的热备份机制降低主节点失效后的选举新的主节点的时延;通过同步机制保证主备节点间的数据一致性;
B.针对主节点和备用主节点同时失效的情况,使用分布式选举算法选举出子网的主节点和备用主节点,若网络被分割成若干个互不连通子网,则每个子网均会选举出各自的主节点和备用主节点;
C.若因无人机节点移动等因素而导致互不连通的两个子网恢复连通性时,使用子网合并算法消除冗余的主节点。
其具体实施步骤如下:
步骤1:节点注册过程。参与特定任务的无人机必须向地面控制站注册,并由地面控制站对它们的身份及其资源认证后才能成为系统节点。具体包括以下三个子步骤:
步骤1.1地面控制站与参与任务的n个无人机节点具有安全认证所需的非对称密钥对{PKi,SKi|i=1,2,...,n};
步骤1.2所有节点向地面控制站发送注册报文。节点使用自己的私钥对报文进行签名并用地面控制站的公钥PK0加密。注册报文中包含节点自身的信息(包括本节点的ID、MAC地址、IP地址、能量、应用资源等)、不重数(防止重放攻击)、和签名信息(保护报文完整性);
步骤1.3地面控制站一旦用自已的私钥SK0解密并用对方公钥鉴别后,就认证了对方身份,此后就将此次任务所使用的对称密码的秘钥KEYm传输给对方。在此次任务进行中,所有通信过程都采用KEYm为秘钥保护通信报文的机密性。
步骤2:任务分发过程。地面控制站根据任务目标及其系统资源,调用优化算法分解任务,为每个节点分配任务角色及其资源,并将任务分发给各节点。具体包括以下三个子步骤:
步骤2.1主节点选举。节点的优先级由所执行的任务对应的选举策略确定。地面控制站从注册的节点中选举出优先级最高的节点作为主节点,优先级次高的节点作为备份主节点,其它节点为自主执行主节点分配的任务的从节点;
步骤2.2任务分配。地面控制站根据执行的任务、参与的节点及其拥有的资源,调用优化算法将任务分解成子任务集合T={ti|i=1,2,...,n},节点或节点集合所对应的子任务为tk。tk中包含任务ID、节点子集Vk、编队F、航迹FT等信息;
步骤2.3任务交付。采用二阶段提交协议将任务tk、及全局资源信息分别提交给各个节点。提交完成后,地面控制站将控制权移交给主节点,主节点成为无人机集群的管控中心。
步骤3:任务执行过程。系统主节点使用轮询和Trap通知两种方式感知系统的全局状态及任务进程,维护系统的正常运行,为无人机集群应用提供信息和环境支撑。主节点会周期性的与备用节点同步,此外,主节点接收到Trap通知会立即触发同步操作。当主节点故障时,系统运行容错选举算法,由备份主节点代替主节点,然后主节点再根据策略选举出它的备份主节点。当系统主节点和备份主节点同时故障时,系统运行分布式选举算法。若因无人机节点移动等因素而导致互不连通的两个子网恢复连通性时,运行子网合并算法消除冗余的主节点。
其中,在步骤2.1中所述的“节点的优先级由所执行的任务对应的选举策略确定”,其作法如下:
(1)选举策略用来反映上层应用对无人机集群节点在承担执行任务的角色、布局位置等方面的要求,根据一个或多个选举策略的组合来确定节点成为主节点的优先级;
(2)设P={p1,p2,…,pm}表示执行某种任务的选举策略集合,pi(x)表示节点x使用选举策略pi时的优先级。选举策略集上定义了两种运算:
Figure FDA0002930680330000021
运算和>运算。
Figure FDA0002930680330000022
运算的定义:策略
Figure FDA0002930680330000024
权重α∈[0,1],复合策略
Figure FDA0002930680330000023
的定义如下:
pc=pipj≡pc(x)=α×pi(x)*+(1-α)×pj(x)*
其中,*运算符表示min-max标准化运算。
>运算的定义:策略
Figure FDA0002930680330000031
复合策略pc=pi>pj的定义如下:
pc(x)>pc(y)≡(pi(x)>pi(y))∪((pi(x)=pi(y))∩(pj(x)>pj(y)))
(3)默认的选举策略pd根据节点ID的大小排序,即pd(x)>pd(y)≡id(x)>id(y);当存在其它的选举策略pc时,pc>pd
其中,在步骤3中所述的“系统主节点使用轮询和Trap通知两种方式感知系统的全局状态及任务进程”,其作法如下:
(1)无人机集群资源被分为动态、半动态、稳态三类。动态资源(如节点可用性等)是系统最为关切的,轮询周期最小;半动态资源(如位置、能量等)对应用优化影响较大,轮询周期中等;而稳态资源(如摄像机、传感设备等)通常变动不大,轮询周期大;
(2)轮询全局资源的基本流程是:主节点周期性地向无人机集群中所有其他节点发送HELLO报文,HELLO报文中包含当前连通域信息和主节点ID;从节点接收到主节点的HELLO报文后,使用KEYm对报文进行解密,将当前节点所设置的主节点ID与报文中的值进行比较,若主节点ID不同,则表示需要删除冗余的主节点;然后将当前节点状态信息通过HELLOACK报文发送至主节点;主节点接收到节点返回的HELLOACK报文后,更新本地缓存的节点的状态信息。时间段τ内未与主节点发生交互的从节点的状态将被置为断开连接,且主节点不再轮询这些节点。
(3)Trap通知过程的基本流程是:当从节点发生异常或半动态资源状态发生改变时,从节点会主动发送TRAP报文至主节点,使得主节点可以即时获取更新后的从节点状态;主节点接收到从节点的TRAP报文后,使用KEYm对报文进行解密,更新从节点的状态信息并发送TRAPACK报文至从节点。
其中,在步骤3中所述的“当主节点故障时,系统运行容错选举算法”,容错选举算法的作法如下:
(1)当主节点工作正常而备份主节点失效时,主节点重新选举它的备份主节点,并启动轮询过程,利用HELLO报文告知所有节点新的备份主节点;
(2)当任何从节点检测出主节点故障,则发送REVOTE报文至备份主节点,备份主节点接收到REVOTE报文后,则进一步探测确定主节点的可用性。若主节点失效,则备份主节点宣告自己为新的主节点并选举出新的备份主节点,通过向所有节点发送SWITCH报文更新主、备节点的信息。
其中,在步骤3中所述的“当系统主节点和备份主节点同时故障时,系统运行分布式选举算法。”,分布式选举算法的基本过程如下:
(1)当某节点检测出主节点和备份主节点失效时,首先获取优先级最高的有效节点,如果该节点是自身,则选举出新的备份主节点并通知所有其他节点;否则,该节点向优先级最高的节点发送DIST_ELECTION报文;
(2)接收到DIST_ELECTION报文的节点,向发送该报文的节点发送DIST_ELECTION_ACK响应报文,并执行步骤(1)。
(3)若在特定时间内未收到DIST_ELECTION_ACK响应报文,则置该节点状态为断开连接,并重新执行步骤(1)。若收到响应报文,则本节点退出选举过程。
当出现许多节点故障时,无人机集群将被分割成若干个互不连通子网。每个子网将会执行分布式选举算法,选举出各自的主节点和备份主节点。
其中,在步骤3中所述的“若因无人机节点移动等因素而导致互不连通的两个子网恢复连通性时,运行子网合并算法消除冗余的主节点”,子网合并算法的基本过程如下:
(1)主节点周期性地更新与其他节点间的可达性,HELLO报文中携带了当前连通域的主备节点信息;
(2)当两个连通域合并时,若连通域Di的主节点masteri接收到来自于另一个连通域Dj的主节点masterj发送的HELLO报文,则比较masteri和masterj的优先级(策略相关);若masteri的优先级较高,则发送DELMULMASTER报文至masterj,masterj接收到DELMULMASTER消息后,切换状态为从节点并设置主节点和备份主节点为masteri,backupi。若masteri的优先级低于masterj,则masteri的状态切换为从节点并设置主备节点为masterj,backupj
(3)若从节点接收到另一个连通域的主节点的HELLO报文,则比较当前连通域的主节点与另一连通域的主节点的优先级,选择优先级高的主节点及对应的备份主节点作为本节点的主节点、备份主节点。
CN202110146341.XA 2021-02-03 2021-02-03 一种面向任务的无人机集群资源管理及容错控制方法 Pending CN113156803A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110146341.XA CN113156803A (zh) 2021-02-03 2021-02-03 一种面向任务的无人机集群资源管理及容错控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110146341.XA CN113156803A (zh) 2021-02-03 2021-02-03 一种面向任务的无人机集群资源管理及容错控制方法

Publications (1)

Publication Number Publication Date
CN113156803A true CN113156803A (zh) 2021-07-23

Family

ID=76882656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110146341.XA Pending CN113156803A (zh) 2021-02-03 2021-02-03 一种面向任务的无人机集群资源管理及容错控制方法

Country Status (1)

Country Link
CN (1) CN113156803A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115208578A (zh) * 2022-07-07 2022-10-18 西安电子科技大学 一种基于区块链的无人机集群信息一致性共享方法
WO2023082800A1 (zh) * 2021-11-11 2023-05-19 中兴通讯股份有限公司 主节点选择方法、分布式数据库及存储介质
CN117130987A (zh) * 2023-10-27 2023-11-28 北京卓翼智能科技有限公司 一种大规模无人机集群的飞控管理方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512376A (zh) * 2002-12-31 2004-07-14 联想(北京)有限公司 大型机群系统的集中控制方法
CN101217402A (zh) * 2008-01-15 2008-07-09 杭州华三通信技术有限公司 一种提高集群可靠性的方法和一种高可靠性通信节点
CN104283948A (zh) * 2014-09-26 2015-01-14 东软集团股份有限公司 服务器集群系统及其负载均衡实现方法
CN107728643A (zh) * 2017-11-10 2018-02-23 西安电子科技大学 一种动态环境下的无人机群分布式任务调度方法
CN108830450A (zh) * 2018-04-28 2018-11-16 广州亿航智能技术有限公司 无人机集群调度方法及系统
CN111669228A (zh) * 2020-05-29 2020-09-15 中国科学院声学研究所东海研究站 一种基于水声通信的uuv集群自组网方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512376A (zh) * 2002-12-31 2004-07-14 联想(北京)有限公司 大型机群系统的集中控制方法
CN101217402A (zh) * 2008-01-15 2008-07-09 杭州华三通信技术有限公司 一种提高集群可靠性的方法和一种高可靠性通信节点
CN104283948A (zh) * 2014-09-26 2015-01-14 东软集团股份有限公司 服务器集群系统及其负载均衡实现方法
CN107728643A (zh) * 2017-11-10 2018-02-23 西安电子科技大学 一种动态环境下的无人机群分布式任务调度方法
CN108830450A (zh) * 2018-04-28 2018-11-16 广州亿航智能技术有限公司 无人机集群调度方法及系统
CN111669228A (zh) * 2020-05-29 2020-09-15 中国科学院声学研究所东海研究站 一种基于水声通信的uuv集群自组网方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MING CHEN ETC.: "DFM:A Distributed Flocking Model for UAV Swarm Networks", 《IEEE ACCESS》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023082800A1 (zh) * 2021-11-11 2023-05-19 中兴通讯股份有限公司 主节点选择方法、分布式数据库及存储介质
CN115208578A (zh) * 2022-07-07 2022-10-18 西安电子科技大学 一种基于区块链的无人机集群信息一致性共享方法
CN117130987A (zh) * 2023-10-27 2023-11-28 北京卓翼智能科技有限公司 一种大规模无人机集群的飞控管理方法
CN117130987B (zh) * 2023-10-27 2024-02-23 北京卓翼智能科技有限公司 一种大规模无人机集群的飞控管理方法

Similar Documents

Publication Publication Date Title
Hu et al. Building agile and resilient UAV networks based on SDN and blockchain
CN105491564B (zh) 用于多无人机环境下建立安全通信链路的方法
Younis et al. Topology management techniques for tolerating node failures in wireless sensor networks: A survey
CN113156803A (zh) 一种面向任务的无人机集群资源管理及容错控制方法
CN101426294B (zh) 一种能够局部按需建簇的无线传感器网络路由方法
Silvestri et al. MobiBar: An autonomous deployment algorithm for barrier coverage with mobile sensors
Stojmenovic et al. Toward scalable cut vertex and link detection with applications in wireless ad hoc networks
WO2020258967A1 (zh) 工业应用服务处理方法和系统
Yang et al. Dispersed computing for tactical edge in future wars: vision, architecture, and challenges
Fu et al. Resource allocation for blockchain-enabled distributed network function virtualization (NFV) with mobile edge cloud (MEC)
Fogli et al. Software-Defined Networking in wireless ad hoc scenarios: Objectives and control architectures
Wang et al. Deep reinforcement learning for securing software-defined industrial networks with distributed control plane
Choumas et al. On using Raft over Networks: Improving Leader Election
Wang et al. A distributed fault‐tolerant mechanism for mission‐oriented unmanned aerial vehicle swarms
Germanus et al. Increasing the resilience of critical scada systems using peer-to-peer overlays
Sharma et al. Secure and reliable resource allocation and caching in aerial-terrestrial cloud networks (ATCNs)
Babu et al. A novel framework for resource discovery and self-configuration in software defined wireless mesh networks
Elzain et al. Decentralizing software-defined wireless mesh networking (D-SDWMN) control plane
CN110166364A (zh) 一种基于实用拜占庭容错算法的软件定义机会网络流表更新方法
Akl et al. An investigation of self-organization in ad-hoc networks
Kazmi et al. SLFL: A Server-Less Federated Learning Framework in Software Defined UAV Networks
Wu et al. Software Defined Edge Computing for Distributed Management and Scalable Control in IoT Multinetworks
Martignon et al. DSA‐Mesh: a distributed security architecture for wireless mesh networks
Lakhani et al. Coordinator controller election algorithm to provide failsafe through load balancing in Distributed SDN control plane
Zhang et al. Reputation-based Raft-Poa layered consensus protocol converging UAV network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210723