CN112561395A - 无人机协同方法、系统、装置、电子设备及存储介质 - Google Patents
无人机协同方法、系统、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112561395A CN112561395A CN202011565407.0A CN202011565407A CN112561395A CN 112561395 A CN112561395 A CN 112561395A CN 202011565407 A CN202011565407 A CN 202011565407A CN 112561395 A CN112561395 A CN 112561395A
- Authority
- CN
- China
- Prior art keywords
- task
- executed
- unmanned aerial
- aerial vehicle
- tasks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000002787 reinforcement Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 description 24
- 230000009471 action Effects 0.000 description 20
- 230000008569 process Effects 0.000 description 8
- 238000005457 optimization Methods 0.000 description 6
- 238000007689 inspection Methods 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000001483 mobilizing effect Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06316—Sequencing of tasks or work
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
- G06Q10/047—Optimisation of routes or paths, e.g. travelling salesman problem
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06313—Resource planning in a project environment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Traffic Control Systems (AREA)
Abstract
本公开提供了一种无人机协同方法、系统、装置、电子设备及存储介质,涉及无人机协同领域。该方法包括:获取待执行任务和待执行任务的特征;将待执行任务基于特征分配至多个无人机,基于每个无人机需要执行的待执行任务的特征,确定每个无人机执行待执行任务的顺序,并下发任务执行指令。本公开实施例基于待执行任务的特征对待执行任务进行分配,并对每个无人机执行的任务进行再次分配,确定每个无人机执行任务的顺序,分层的分布式方法能够灵活处理高度动态的任务,满足动态任务的需求,提高系统鲁棒性,并且对现有任务进行再分配,提高任务的完成度和完成效率,同时将复杂的多任务协同问题转化为相对简单的路径规划问题,提高无人机的协同效率。
Description
技术领域
本公开涉及无人机协同技术领域,具体而言,本公开涉及一种无人机协同方法、系统、装置、电子设备及存储介质。
背景技术
近年来,无人机由于其成本低廉、灵活性强、效率较高、部署方便、机动智能等优点在各个领域得到了广泛的应用,尤其适用于某些特殊场景或危险场所的任务。当任务逐渐复杂时,单无人机完成任务也逐渐向多无人机协同完成任务转变。为了进一步满足复杂度更高,规模更大的任务需求,多无人机将进行多任务协同,并且由单一平台扩展到多平台。
然而,由于无人机的高动态型、任务需求变化的不确定性,现有的多无人机多任务协同方法如蚁群算法、粒子群算法偏向于集中式协同,系统鲁棒性较低,不能适应动态任务的需求。并且在进行多任务协同时,每个无人机按照接收到的任务列表执行任务,不能灵活地按照任务变化的特征动态调整任务的执行,导致任务完成度以及任务完成效率较低。
由此可见,现有技术中对于无人机协同还存在每个无人机按照接收到的任务列表执行任务,不能灵活地按照任务变化的特征动态调整任务的执行,导致任务完成度以及任务完成效率较低的技术问题,急需解决。
发明内容
本公开的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中对于无人机协同还存在每个无人机按照接收到的任务列表执行任务,不能灵活地按照任务变化的特征动态调整任务的执行,导致任务完成度以及任务完成效率较低的技术问题。
第一方面,提供了一种无人机协同方法,该方法包括:
获取待执行任务和所述待执行任务的特征;
将所述待执行任务基于所述特征分配至多个无人机,其中,一个无人机至少被分配一个所述待执行任务;
基于每个无人机需要执行的所述待执行任务的特征,确定每个无人机执行所述待执行任务的顺序,并下发任务执行指令。
第二方面,提供了一种无人机协同系统,该系统包括:
控制中心,用于基于用户需求生成待执行任务,并确定所述待执行任务的特征;
任务预分配模块,用于所述待执行任务的特征将所述待执行任务分配至多个无人机,其中,一个无人机至少被分配一个所述待执行任务;
任务再分配模块,用于基于每个无人机需要执行的所述待执行任务的特征,确定每个无人机执行所述待执行任务的顺序。
第三方面,提供了一种无人机协同装置,该装置包括:
任务获取单元,用于获取待执行任务和所述待执行任务的特征;
任务分配单元,用于将所述待执行任务基于所述特征分配至多个无人机,其中,一个无人机至少被分配一个所述待执行任务;
协同单元,用于基于每个无人机需要执行的所述待执行任务的特征,确定每个无人机执行所述待执行任务的顺序,并下发任务执行指令。
第四方面,提供了一种电子设备,该电子设备包括:
处理器、存储器和总线;
所述总线,用于连接所述处理器和所述存储器;
所述存储器,用于存储操作指令;
所述处理器,用于通过调用所述操作指令,执行上述的无人机协同方法。
第五方面,提供了一种存储介质,所述存储介质存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述的无人机协同方法。
本公开实施例通过基于待执行任务的特征对待执行任务进行分配,并对每个无人机执行的任务进行再次分配,确定每个无人机执行任务的顺序,分层的分布式方法能够灵活处理高度动态的任务,满足动态任务的需求,提高系统鲁棒性,并且对现有任务进行再分配,提高任务的完成度和完成效率,同时将复杂的多任务协同问题转化为相对简单的路径规划问题,提高无人机的协同效率。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对本公开实施例描述中所需要使用的附图作简单地介绍。
图1为本公开实施例提供的一种无人机协同方法的流程示意图;
图2为本公开实施例提供的一种任务分配方法的流程示意图;
图3为本公开实施例提供的一种无人机协同系统的结构意图;
图4为本公开实施例提供的一种无人机协同装置的结构示意图;
图5为本公开实施例提供的一种电子设备的结构示意图。
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本公开,而不能解释为对本公开的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本公开的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。
本公开提供的无人机协同方法、系统、装置、电子设备和存储介质,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本公开的技术方案以及本公开的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本公开的实施例进行描述。
本公开实施例中提供了一种无人机协同方法,如图1所示,该方法包括:
步骤S101,获取待执行任务和所述待执行任务的特征;
步骤S102,将所述待执行任务基于所述特征分配至多个无人机,其中,一个无人机至少被分配一个所述待执行任务;
步骤S103,基于每个无人机需要执行的所述待执行任务的特征,确定每个无人机执行所述待执行任务的顺序,并下发任务执行指令。
在本公开实施例中,提供的无人机协同方法用于对多无人机多任务系统进行协同,其中,待执行任务是指无人机需要执行的飞行任务以及其它操作任务等,如无人机的飞行路径,无人机的悬停位置、悬停时间,以及目标跟踪、巡检、搜索、检查、攻击、通信信号覆盖、森林救火等任务,待执行任务的特征包括:任务的位置坐标、任务的执行区域、任务的开始时间、任务的截止时间、任务完成需要的时间以及任务的优先级。在获取到待执行任务之后,基于待执行任务的特征将待执行任务分配至多个无人机,每个无人机都会被分配至少一个待执行任务,对于每一个无人机,都会根据任务的执行时间以及该无人机执行任务时需要飞行的路径等对该无人机需要执行的任务进行排序,以使无人机按照顺序执行任务。
对于本公开实施例,为方便说明,以一个具体实施例为例,获取待执行任务,其中,待执行任务包括无人机需要出现的位置、无人机的飞行路径、悬停时间、目标跟踪、巡检、搜索、检查、攻击、通信信号覆盖、森林救火等任务等,并获取待执行任务的特征,如任务的位置坐标、任务的执行区域、任务的开始时间、任务的截止时间、任务完成需要的时间以及任务的优先级,基于待执行任务的特征,按照路径最短、路径长度相对平衡的优化目标,通过改进的遗传算法对任务进行划分,划分成若干个子任务,并将其分配给不同的无人机。作为本公开一个实施例,如选择50个任务点,该任务点标识无人机需要到达的位置,对每一个任务点进行编号,随机生成50个组合排序的独立样本,每一个样本代表执行任务的一条飞行路径,如[32,14,22,47,4,2,6,7,11,…]。同时随机生成若干中断点,如[3,11,23],将独立样本分为4个独立的小样本,[32,14]、 [22,47,4…]…,每一个独立的小样本都代表将要分配给不同无人机的独立的子任务,即每个无人机在这个大任务下需要飞行的任务路径。然后计算每个独立样本的适应度函数。此算法的目标优化函数是满足路径最短、每条路径长度相对均衡,将目标优化函数转化为适应度函数。函数如下:
其中,α、β分别是总飞行路径和路径方差的权重系数。Di表示每个子任务的总体飞行路径,定义为:
其中,dj为每个子任务中,没两个任务点p和q之间的距离,定义为:
其中,xp、xq、yp以及yq为任务点p和q在同一平面中的坐标值。s2是指每个子任务执行距离的方差:
其中,M是子任务执行距离的平均值:
通过适应度函数的比较,选择最优独立样本作为父代。选择时有轮盘赌策略、最佳个体保留策略等方法。轮盘赌策略能保证部分目前非优个体的存在,即保证个体的多样性,也可以防止算法陷入局部最优。但是却可能忽略最佳个体的存在。最佳个体保留策略能保证最优个体的存活,但可能陷入局部最优。因此采取结合轮盘赌策略和最佳个体策略的混合选择策略。通过适应度函数的排序,选出2个最佳个体作为一半父代。通过轮盘赌策略选出2个独立样本作为另一半父代。轮盘赌策略中,首先计算出所有个体的适应度函数的和,再根据个体的适应度计与前面的和的占比:
通过每个占比组成轮盘的方式,随机得出选择的个体。然后,通过对父代进行交叉、变异等遗传操作,生成50个新的独立的子代,并重复上述步骤,算出子代的适应度。如果子代的适应度高于父代,则此子代作为新的父代。如果子代的适应度还低于父代,则原本的父代依旧作为父代。以此不断循环迭代,直到达到迭代次数,或达到适应度函数收敛。则得到最优子任务划分结果,并将其随机分配给相应的无人机。然后对于每一个无人机,都会根据任务的执行时间以及该无人机执行任务时需要飞行的路径等对该无人机需要执行的任务进行排序,以使无人机按照顺序执行任务。
本公开实施例通过基于待执行任务的特征对待执行任务进行分配,并对每个无人机执行的任务进行再次分配,确定每个无人机执行任务的顺序,分层的分布式方法能够灵活处理高度动态的任务,满足动态任务的需求,提高系统鲁棒性,并且对现有任务进行再分配,提高任务的完成度和完成效率,同时将复杂的多任务协同问题转化为相对简单的路径规划问题,提高无人机的协同效率。
本公开实施例提供了一种可能的实现方式,在该实现方式中,所述获取待执行任务和所述待执行任务的特征,包括:
基于用户需求生成待执行任务,并确定所述待执行任务的特征,其中,所述待执行任务的特征包括:任务的位置坐标、任务的执行区域、任务的开始时间、任务的截止时间、任务完成需要的时间以及任务的优先级。
在本公开实施例中,对于待执行任务的获取,可以是根据用户需求生成的,如用户直接输入需要完成的任务,然后基于待执行任务,获取任务特征,所述待执行任务的特征包括:任务的位置坐标、任务的执行区域、任务的开始时间、任务的截止时间、任务完成需要的时间以及任务的优先级等。其中,任务的位置坐标是指无人机执行该任务时需要到达的坐标位置,任务的执行区域是指无人机执行该任务时的飞行区域,任务的开始、截止时间是指无人机开始执行任务和执行完毕任务的时间点,任务的优先级是指任务被执行的顺序,以一个无人机任务为例,该无人机接收到多个子任务,可选的,该多个子任务可以是同一类型的子任务,如该无人机接收到4个搜索的子任务,基于该4个搜索子任务的地理位置或者紧急情况确定该4个子任务的优先级,例如,按照4个搜索子任务的地理位置距离该无人机起飞地点的距离,确定4个搜索子任务的优先级,按照距离最近的子任务优先级最高的方式,则该无人机会优先到距离起飞地点最近的区域去执行搜索任务。
本公开实施例通过基于用户需求生成待执行任务,并获取任务特征,方便无人机执行任务。
本公开实施例提供了一种可能的实现方式,在该实现方式中,如图2 所示,所述将所述待执行任务基于所述特征分配至多个无人机,包括:
步骤S201,基于所述特征按照预设的规则将所述待执行任务划分为多个子任务;
步骤S202,将所述多个子任务分别分配至多个不同的无人机。
在本公开实施例中国,对于基于所述特征按照预设的规则将所述待执行任务划分为多个子任务的具体实施方案,在前述实施例中已经进行说明,在此不再赘述,在将任务进行划分之后,可以随机的将多个子任务分别分配至多个不同的无人机,其中,一个无人机可以被分配一个或多个子任务,但是,一个子任务只能被分配至一个无人机,即不同的无人机执行的任务不会重复。
本公开实施例通过对任务进行划分形成多个子任务,并将多个子任务分别分配至多个无人机,保证任务不会被重复执行。
本公开实施例提供了一种可能的实现方式,在该实现方式中,所述基于所述特征按照预设的规则将所述待执行任务划分为多个子任务,包括:
基于无人机完成所述待执行任务所需要的飞行路径最短和路径相对均衡的原则,将所述任务划分为多个子任务。
所述基于每个无人机需要执行的所述待执行任务的特征,确定每个无人机执行所述待执行任务的顺序,包括:
对于一个无人机,通过深度强化学习,基于所述无人机需要执行的待执行任务的时间、任务的位置坐标、任务的执行区域、任务的完成度以及所述无人机的坐标,对所述待执行任务进行排序。
在本公开实施例中,为方便说明,以一个具体实施例为例,强化学习是通过Agent不断地在现实或者模拟环境进行交互,然后获得相应的奖励。然后不断地学习环境的规律,去获得策略的最优解。强化学习的重要四元组(State,Observation,Action,Reward)描述如下:State,表示无人机当前的状态,即坐标信息L。Action,表示当前无人机的飞行方向,东南西北,一共4个动作。Reward,表示执行动作后,由状态s转换为s’时获得的直接奖励,是环境对于动作的反馈。Policy,agent根据状态进行下一步动作的函数。
在t时刻,Agent,即无人机从环境中接收各任务的状态及子无人机的坐标St,利用策略选择自身的动作。一旦该行为被无人机执行,环境转变到r+1时刻的状态,以及奖励rt+1形式的反馈。Agent利用状态转化的知识来不断学习获得策略的最优。
为了使用强化学习解决任务再分配的决策问题,需要将任务再分配问题建模为马尔科夫决策过程。
P(St+1|St)=P(St+1|St,St-1,…S1,S0)
假设无人机在执行任务的过程中匀速飞行,因此要确定无人机飞行的路径只用确定无人机飞行的方向,设动作集A={东,南,西,北},即无人机在飞行时只朝四个方向飞行。
为了促进agent的学习,训练阶段中的agent在当前状态下选择一个飞行动作后会得到相应的奖励。奖励函数是对无人机在每个坐标处执行动作的量化评估。由于本算法的最终目的是提高整体任务的完成度η,并基于此减少飞行距离d。并且在飞行过程中,还应该考虑任务的优先级p,且尽量避免无人机飞到任务执行范围之外的区域,综上所述,奖励函数 R(s,a,s′)应设置为:
所以为了能够尽量提高整体任务地完成度且减少无人机的飞行距离,需要最大化累计期望奖励,用Rt=R(s,a,s′)表示在t时刻的奖励。
进一步用价值函数来量化一个状态在t时刻的累计奖励,考虑折扣因子γ:
定义vπ为在策略π下的状态价值函数,这是累积奖励从状态s开始在当前策略下的期望值:
vπ(s)=Eπ(Gt|St=s)
动作价值函数直接衡量s状态下各动作的价值,即指在状态s下执行动作a所获得的累计奖励:
Qπ(s,a)=Eπ(Gt|St=s,At=a)
强化学习的目的是寻找能使价值最大化的策略,因此需要求解最优动作价值函数,最优动作价值函数存在且唯一:
由于直接求解最优动作价值函数非常困难,因此采取Q-learning方法,用值迭代算法求出Q值,通过选择下一状态s′中Q值最大的动作对应的Q 值来更新Q函数:
但是由于本场景状态空间巨大,Q-learning本质是查表法,容易出现维数灾难。因此引入神经网络来拟合Q函数,即DQN,可降低输出维数,DQN通过差分学习的方式来更新Q值,Loss表示的是Target Q值与当前 Q值的偏差大小,DQN的优化目标就是最小化损失函数。损失函数的定义如下:
同时使用随机梯度下降(SGD)等方法更新网络参数θ:
并且加入经验池存储训练过程中的样本,可在训练中提供随机样本,打破马尔科夫链的强关联性。
由此将任务完成度最大作为优化目标,通过最大化累计函数及算法收敛得到无人机最佳下一步动作。无人机在飞行过程中不断地与环境进行交互,与其他无人机进行交互,不断更新自己的感知信息,从而依据任务及自身的实时情况更新策略或者动作,达到动态地、灵活地处理任务。由于每个动作直接作用使无人机到达地图上某个点。因此将每个动作连起来则是无人机的一条完整的飞行路径,即最后输出的是每个无人机的完整路径。这也实现了将复杂的多无人机多任务协同工作转化为相对简单的路径规划工作。
本公开实施例通过基于待执行任务的特征对待执行任务进行分配,并对每个无人机执行的任务进行再次分配,确定每个无人机执行任务的顺序,分层的分布式方法能够灵活处理高度动态的任务,满足动态任务的需求,提高系统鲁棒性,并且对现有任务进行再分配,提高任务的完成度和完成效率,同时将复杂的多任务协同问题转化为相对简单的路径规划问题,提高无人机的协同效率。
本公开实施例提供了一种无人机协同系统,如图3所示,该无人机协同系统包括:
控制中心,301用于基于用户需求生成待执行任务,并确定所述待执行任务的特征;
任务预分配模块302,用于所述待执行任务的特征将所述待执行任务分配至多个无人机,其中,一个无人机至少被分配一个所述待执行任务;
任务再分配模块303,用于基于每个无人机需要执行的所述待执行任务的特征,确定每个无人机执行所述待执行任务的顺序;
任务执行模块304,用于基于所述任务执行指令执行所述待执行任务。
在本公开实施例中,控制中心可以是具有计算能力的服务器、计算机等,用于基于用户需求生成待执行任务,并确定所述待执行任务的特征;任务预分配模块可以是该控制中心的模块,任务再分配模块可以是无人机上的一个模块,用于执行任务的分配,并下发任务执行指令,任务执行模块可以是无人机,用于基于该任务执行指令执行待执行任务。对于本公开实施例,提供的无人机协同系统对无人机进行调动的具体方法与本公开前述实施例提供的无人机协同方法相同,此处不再赘述。
本公开实施例通过基于待执行任务的特征对待执行任务进行分配,并对每个无人机执行的任务进行再次分配,确定每个无人机执行任务的顺序,分层的分布式方法能够灵活处理高度动态的任务,满足动态任务的需求,提高系统鲁棒性,并且对现有任务进行再分配,提高任务的完成度和完成效率,同时将复杂的多任务协同问题转化为相对简单的路径规划问题,提高无人机的协同效率。
本公开实施例提供了一种无人机协同装置,如图4所示,该无人机协同装置40包括任务获取单元410,、任务分配单元420以及协同单元430,其中:
任务获取单元410,用于获取待执行任务和所述待执行任务的特征;
任务分配单元420,用于将所述待执行任务基于所述特征分配至多个无人机,其中,一个无人机至少被分配一个所述待执行任务;
协同单元430,用于基于每个无人机需要执行的所述待执行任务的特征,确定每个无人机执行所述待执行任务的顺序,并下发任务执行指令。
本公开实施例的无人机协同装置可执行本公开上述实施例所示的无人机协同方法,其实现原理相类似,此处不再赘述。
本公开实施例中提供了一种电子设备,该电子设备包括:处理器、存储器和总线;所述总线,用于连接所述处理器和所述存储器;所述存储器,用于存储操作指令;所述处理器,用于通过调用所述操作指令,执行上述的无人机协同方法。与现有技术相比,本公开实施例通过基于待执行任务的特征对待执行任务进行分配,并对每个无人机执行的任务进行再次分配,确定每个无人机执行任务的顺序,分层的分布式方法能够灵活处理高度动态的任务,满足动态任务的需求,提高系统鲁棒性,并且对现有任务进行再分配,提高任务的完成度和完成效率,同时将复杂的多任务协同问题转化为相对简单的路径规划问题,提高无人机的协同效率。
在一个可选实施例中提供了一种电子设备,如图5所示,图5所示的电子设备5000包括:处理器5001和存储器5003。其中,处理器5001和存储器5003相连,如通过总线5002相连。可选地,电子设备5000还可以包括收发器5004。需要说明的是,实际应用中收发器5004不限于一个,该电子设备5000的结构并不构成对本公开实施例的限定。
处理器5001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC (Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本公开公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器5001 也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP 和微处理器的组合等。
总线5002可包括一通路,在上述组件之间传送信息。总线5002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或 EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线5002可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器5003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器5003用于存储执行本公开方案的应用程序代码,并由处理器 5001来控制执行。处理器5001用于执行存储器5003中存储的应用程序代码,以实现前述方法实施例所示的内容。
其中,电子设备可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。
本公开实施例提供了一种存储介质,该存储介质上存储有计算机程序,当其在计算机上运行时,使得计算机可以执行前述方法实施例中相应内容。与现有技术相比,本公开实施例通过基于待执行任务的特征对待执行任务进行分配,并对每个无人机执行的任务进行再次分配,确定每个无人机执行任务的顺序,分层的分布式方法能够灵活处理高度动态的任务,满足动态任务的需求,提高系统鲁棒性,并且对现有任务进行再分配,提高任务的完成度和完成效率,同时将复杂的多任务协同问题转化为相对简单的路径规划问题,提高无人机的协同效率。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本公开的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本公开原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本公开的保护范围。
Claims (9)
1.一种无人机协同方法,其特征在于,包括:
获取待执行任务和所述待执行任务的特征;
将所述待执行任务基于所述特征分配至多个无人机,其中,一个无人机至少被分配一个所述待执行任务;
基于每个无人机需要执行的所述待执行任务的特征,确定每个无人机执行所述待执行任务的顺序,并下发任务执行指令。
2.根据权利要求1所述的无人机协同方法,其特征在于,所述获取待执行任务和所述待执行任务的特征,包括:
基于用户需求生成待执行任务,并确定所述待执行任务的特征,其中,所述待执行任务的特征包括:任务的位置坐标、任务的执行区域、任务的开始时间、任务的截止时间、任务完成需要的时间以及任务的优先级。
3.根据权利要求1所述的无人机协同方法,其特征在于,所述将所述待执行任务基于所述特征分配至多个无人机,包括:
基于所述特征按照预设的规则将所述待执行任务划分为多个子任务;
将所述多个子任务分别分配至多个不同的无人机。
4.根据权利要求3所述的无人机协同方法,其特征在于,所述基于所述特征按照预设的规则将所述待执行任务划分为多个子任务,包括:
基于无人机完成所述待执行任务所需要的飞行路径最短原则,将所述任务划分为多个子任务。
5.根据权利要求1所述的无人机协同方法,其特征在于,所述基于每个无人机需要执行的所述待执行任务的特征,确定每个无人机执行所述待执行任务的顺序,包括:
对于一个无人机,通过深度强化学习,基于所述无人机需要执行的待执行任务的时间、任务的位置坐标、任务的执行区域、任务的完成度以及所述无人机的坐标,对所述待执行任务进行排序。
6.一种无人机协同系统,其特征在于,包括:
控制中心,用于基于用户需求生成待执行任务,并确定所述待执行任务的特征;
任务预分配模块,用于所述待执行任务的特征将所述待执行任务分配至多个无人机,其中,一个无人机至少被分配一个所述待执行任务;
任务再分配模块,用于基于每个无人机需要执行的所述待执行任务的特征,确定每个无人机执行所述待执行任务的顺序,并下发任务执行指令;
任务执行模块,用于基于所述任务执行指令执行所述待执行任务。
7.一种无人机协同装置,其特征在于,包括:
任务获取单元,用于获取待执行任务和所述待执行任务的特征;
任务分配单元,用于将所述待执行任务基于所述特征分配至多个无人机,其中,一个无人机至少被分配一个所述待执行任务;
协同单元,用于基于每个无人机需要执行的所述待执行任务的特征,确定每个无人机执行所述待执行任务的顺序,并下发任务执行指令。
8.一种电子设备,其特征在于,其包括:
处理器、存储器和总线;
所述总线,用于连接所述处理器和所述存储器;
所述存储器,用于存储操作指令;
所述处理器,用于通过调用所述操作指令,执行上述权利要求1-5中任一项所述的无人机协同方法。
9.一种存储介质,其特征在于,所述存储介质存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1~5任一所述的无人机协同方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011565407.0A CN112561395A (zh) | 2020-12-25 | 2020-12-25 | 无人机协同方法、系统、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011565407.0A CN112561395A (zh) | 2020-12-25 | 2020-12-25 | 无人机协同方法、系统、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112561395A true CN112561395A (zh) | 2021-03-26 |
Family
ID=75033036
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011565407.0A Pending CN112561395A (zh) | 2020-12-25 | 2020-12-25 | 无人机协同方法、系统、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112561395A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113286275A (zh) * | 2021-04-23 | 2021-08-20 | 南京大学 | 一种基于多智能体强化学习的无人机集群高效通信方法 |
CN113625779A (zh) * | 2021-10-11 | 2021-11-09 | 北京邮电大学 | 一种无人机控制系统以及地面控制系统 |
CN113635302A (zh) * | 2021-07-29 | 2021-11-12 | 深圳墨影科技有限公司 | 基于现场总线的一体化移动协作机器人控制系统 |
CN113869598A (zh) * | 2021-10-13 | 2021-12-31 | 深圳联和智慧科技有限公司 | 基于智慧城市的无人机智能远程管理方法、系统及云平台 |
CN114003062A (zh) * | 2021-12-30 | 2022-02-01 | 拓普思(常州)智能科技有限公司 | 一种输电线路的无人机智能图像采集方法及系统 |
CN114040438A (zh) * | 2021-10-29 | 2022-02-11 | 润联软件系统(深圳)有限公司 | 协同网络的组网方法、终端设备及计算机可读存储介质 |
CN114091807A (zh) * | 2021-10-12 | 2022-02-25 | 广西综合交通大数据研究院 | 多无人机任务分配及调度方法、装置、系统及存储介质 |
CN114200963A (zh) * | 2022-02-17 | 2022-03-18 | 佛山科学技术学院 | 动态环境下无人机自主任务规划方法、设备及存储介质 |
CN115810293A (zh) * | 2022-11-28 | 2023-03-17 | 亿航智能设备(广州)有限公司 | 一种多台无人驾驶航空器的联动控制方法、系统和介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106200678A (zh) * | 2016-09-18 | 2016-12-07 | 中国空气动力研究与发展中心高速空气动力研究所 | 一种无人机作业自动编队系统及方法 |
CN106600147A (zh) * | 2016-12-15 | 2017-04-26 | 合肥工业大学 | 面向可分解任务的多无人机任务分配方法和装置 |
US20180246758A1 (en) * | 2017-02-27 | 2018-08-30 | International Business Machines Corporation | Automated generation of scheduling algorithms based on task relevance assessment |
CN109976909A (zh) * | 2019-03-18 | 2019-07-05 | 中南大学 | 边缘计算网络中基于学习的低延时任务调度方法 |
CN110264026A (zh) * | 2019-04-22 | 2019-09-20 | 北京邮电大学 | 地震救援中基于两级规划的救援飞机在线任务分配方法 |
CN110489217A (zh) * | 2019-07-11 | 2019-11-22 | 新华三大数据技术有限公司 | 一种任务调度方法及系统 |
CN110766254A (zh) * | 2018-07-27 | 2020-02-07 | 深圳市白麓嵩天科技有限责任公司 | 一种基于改进遗传算法的多无人机协同任务分配方法 |
-
2020
- 2020-12-25 CN CN202011565407.0A patent/CN112561395A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106200678A (zh) * | 2016-09-18 | 2016-12-07 | 中国空气动力研究与发展中心高速空气动力研究所 | 一种无人机作业自动编队系统及方法 |
CN106600147A (zh) * | 2016-12-15 | 2017-04-26 | 合肥工业大学 | 面向可分解任务的多无人机任务分配方法和装置 |
US20180246758A1 (en) * | 2017-02-27 | 2018-08-30 | International Business Machines Corporation | Automated generation of scheduling algorithms based on task relevance assessment |
CN110766254A (zh) * | 2018-07-27 | 2020-02-07 | 深圳市白麓嵩天科技有限责任公司 | 一种基于改进遗传算法的多无人机协同任务分配方法 |
CN109976909A (zh) * | 2019-03-18 | 2019-07-05 | 中南大学 | 边缘计算网络中基于学习的低延时任务调度方法 |
CN110264026A (zh) * | 2019-04-22 | 2019-09-20 | 北京邮电大学 | 地震救援中基于两级规划的救援飞机在线任务分配方法 |
CN110489217A (zh) * | 2019-07-11 | 2019-11-22 | 新华三大数据技术有限公司 | 一种任务调度方法及系统 |
Non-Patent Citations (1)
Title |
---|
姜栋;徐欣;: "基于帕累托改进的多机器人动态任务分配算法", 计算机应用, no. 12, pages 3620 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113286275A (zh) * | 2021-04-23 | 2021-08-20 | 南京大学 | 一种基于多智能体强化学习的无人机集群高效通信方法 |
CN113635302B (zh) * | 2021-07-29 | 2022-11-15 | 深圳墨影科技有限公司 | 基于现场总线的一体化移动协作机器人控制系统 |
CN113635302A (zh) * | 2021-07-29 | 2021-11-12 | 深圳墨影科技有限公司 | 基于现场总线的一体化移动协作机器人控制系统 |
CN113625779A (zh) * | 2021-10-11 | 2021-11-09 | 北京邮电大学 | 一种无人机控制系统以及地面控制系统 |
CN113625779B (zh) * | 2021-10-11 | 2022-02-01 | 北京邮电大学 | 一种无人机控制系统以及地面控制系统 |
CN114091807A (zh) * | 2021-10-12 | 2022-02-25 | 广西综合交通大数据研究院 | 多无人机任务分配及调度方法、装置、系统及存储介质 |
CN113869598A (zh) * | 2021-10-13 | 2021-12-31 | 深圳联和智慧科技有限公司 | 基于智慧城市的无人机智能远程管理方法、系统及云平台 |
CN113869598B (zh) * | 2021-10-13 | 2024-05-28 | 深圳联和智慧科技有限公司 | 基于智慧城市的无人机智能远程管理方法、系统及云平台 |
CN114040438A (zh) * | 2021-10-29 | 2022-02-11 | 润联软件系统(深圳)有限公司 | 协同网络的组网方法、终端设备及计算机可读存储介质 |
CN114003062A (zh) * | 2021-12-30 | 2022-02-01 | 拓普思(常州)智能科技有限公司 | 一种输电线路的无人机智能图像采集方法及系统 |
CN114200963B (zh) * | 2022-02-17 | 2022-05-10 | 佛山科学技术学院 | 动态环境下无人机自主任务规划方法、设备及存储介质 |
CN114200963A (zh) * | 2022-02-17 | 2022-03-18 | 佛山科学技术学院 | 动态环境下无人机自主任务规划方法、设备及存储介质 |
CN115810293A (zh) * | 2022-11-28 | 2023-03-17 | 亿航智能设备(广州)有限公司 | 一种多台无人驾驶航空器的联动控制方法、系统和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112561395A (zh) | 无人机协同方法、系统、装置、电子设备及存储介质 | |
AU2020202068A1 (en) | Systems and methods for providing information for on-demand services | |
KR102055119B1 (ko) | 카풀링을 위한 방법들 및 시스템들 | |
CN112465151A (zh) | 一种基于深度强化学习的多智能体联邦协作方法 | |
CN109884897B (zh) | 一种基于深度强化学习的无人机任务匹配与计算迁移方法 | |
Liu et al. | An iterative two-phase optimization method based on divide and conquer framework for integrated scheduling of multiple UAVs | |
US11580451B2 (en) | Systems and methods for determining estimated time of arrival | |
CN113505431B (zh) | 基于st-dqn海上无人机目标搜寻方法、装置、设备和介质 | |
Huang et al. | Multi-type UAVs cooperative task allocation under resource constraints | |
CN112784362A (zh) | 一种用于无人机辅助边缘计算的混合优化方法及系统 | |
EP3635706A1 (en) | Methods and systems for estimating time of arrival | |
CN116451934B (zh) | 多无人机边缘计算路径优化与依赖任务调度优化方法及系统 | |
CN109242290B (zh) | 一种无人机群行动方案自动生成方法 | |
CN114326827B (zh) | 一种无人机集群多任务动态分配方法及系统 | |
CN109961130A (zh) | 一种基于粒子群算法确定目标对象位置的方法和装置 | |
CN113128839A (zh) | 面向高端装备分布式制造与多模式运输的协同调度方法 | |
CN114740899A (zh) | 一种网格化空域分配与协同搜索规划方法 | |
CN114007231A (zh) | 异构无人机数据卸载方法、装置、电子设备及存储介质 | |
CN116625376A (zh) | 基于禁忌蜂群算法的无人机海上搜救路径规划方法 | |
Ou et al. | Hybrid path planning based on adaptive visibility graph initialization and edge computing for mobile robots | |
CN116185035B (zh) | 基于改进仿生狼群的无人集群动态任务分配方法及系统 | |
CN113657718B (zh) | 一种多机器人动态联盟任务分配方法及相关装置 | |
Zu et al. | Research on UAV path planning method based on improved HPO algorithm in multi-task environment | |
Xun et al. | Distributed tasks-platforms scheduling method to holonic-C2 organization | |
CN116449864A (zh) | 一种无人机集群的最优路径选择方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |