CN116300985A - 控制方法、装置、计算机设备和存储介质 - Google Patents

控制方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN116300985A
CN116300985A CN202310589074.2A CN202310589074A CN116300985A CN 116300985 A CN116300985 A CN 116300985A CN 202310589074 A CN202310589074 A CN 202310589074A CN 116300985 A CN116300985 A CN 116300985A
Authority
CN
China
Prior art keywords
target
track
aircraft
cluster
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310589074.2A
Other languages
English (en)
Other versions
CN116300985B (zh
Inventor
任勇
魏维
杜军
王景璟
侯向往
方政儒
夏照越
张泽楷
王子源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202310589074.2A priority Critical patent/CN116300985B/zh
Publication of CN116300985A publication Critical patent/CN116300985A/zh
Application granted granted Critical
Publication of CN116300985B publication Critical patent/CN116300985B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Traffic Control Systems (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本申请涉及一种控制方法、装置、计算机设备和存储介质,所述控制方法根据协同一致性原则,确定航行器集群的第一控制参量和目标的第二控制参量,其中协同一致性原则用于指示航行器集群中每个航行器在围捕目标的过程中均转向目标,然后将第一控制参量输入至航行器集群对应的运动模型进行轨迹预测,以及将第二控制参量输入至目标对应的运动模型中进行轨迹预测,进而得到航行器集群围捕目标的目标轨迹,最终根据目标轨迹控制航行器集群中各航行器进行移动。在该方法中,控制设备基于协同一致性原则,实时获取的第一控制参量和第二控制参量较为准确,因此进行目标围捕时,提高了围捕的准确性。

Description

控制方法、装置、计算机设备和存储介质
技术领域
本申请涉及无人水下航行器技术领域,特别是涉及一种控制方法、装置、计算机设备和存储介质。
背景技术
目前,微分对策将博弈论与现代控制理论相结合,是一种解决集群无人水下航行器(Unmanned Underwater Vehicle,UUV)与动态目标之间冲突、对抗、竞争问题的有效工具和科学方法。
但是,如何基于微分对策理论实现水下航行器集群的准确控制成为当下亟待解决的技术问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够实现水下航行器集群的准确控制的控制方法、装置、计算机设备和存储介质。
第一方面,本申请提供了一种控制方法。该控制方法包括:
根据协同一致性原则,确定航行器集群的第一控制参量和目标的第二控制参量;协同一致性原则用于指示航行器集群中每个航行器在围捕目标的过程中均转向目标;
将第一控制参量输入至航行器集群对应的运动模型进行轨迹预测,以及将第二控制参量输入至目标对应的运动模型中进行轨迹预测,得到航行器集群围捕目标的目标轨迹;
根据目标轨迹控制航行器集群中各航行器进行移动。
第二方面,本申请还提供了一种控制装置。该控制装置包括:
第一确定模块,用于根据协同一致性原则,确定航行器集群的第一控制参量和目标的第二控制参量;协同一致性原则用于指示航行器集群中每个航行器在围捕目标的过程中均转向目标;
第二确定模块,用于将第一控制参量输入至航行器集群对应的运动模型进行轨迹预测,以及将第二控制参量输入至目标对应的运动模型中进行轨迹预测,得到航行器集群围捕目标的目标轨迹;
控制模块,用于根据目标轨迹控制航行器集群中各航行器进行移动。
第三方面,本申请还提供了一种计算机设备。该计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
根据协同一致性原则,确定航行器集群的第一控制参量和目标的第二控制参量;协同一致性原则用于指示航行器集群中每个航行器在围捕目标的过程中均转向目标;
将第一控制参量输入至航行器集群对应的运动模型进行轨迹预测,以及将第二控制参量输入至目标对应的运动模型中进行轨迹预测,得到航行器集群围捕目标的目标轨迹;
根据目标轨迹控制航行器集群中各航行器进行移动。
第四方面,本申请还提供了一种计算机可读存储介质。该计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
根据协同一致性原则,确定航行器集群的第一控制参量和目标的第二控制参量;协同一致性原则用于指示航行器集群中每个航行器在围捕目标的过程中均转向目标;
将第一控制参量输入至航行器集群对应的运动模型进行轨迹预测,以及将第二控制参量输入至目标对应的运动模型中进行轨迹预测,得到航行器集群围捕目标的目标轨迹;
根据目标轨迹控制航行器集群中各航行器进行移动。
第五方面,本申请还提供了一种计算机程序产品。该计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
根据协同一致性原则,确定航行器集群的第一控制参量和目标的第二控制参量;协同一致性原则用于指示航行器集群中每个航行器在围捕目标的过程中均转向目标;
将第一控制参量输入至航行器集群对应的运动模型进行轨迹预测,以及将第二控制参量输入至目标对应的运动模型中进行轨迹预测,得到航行器集群围捕目标的目标轨迹;
根据目标轨迹控制航行器集群中各航行器进行移动。
上述控制方法、装置、计算机设备和存储介质通过根据协同一致性原则,确定航行器集群的第一控制参量和目标的第二控制参量,并将第一控制参量输入至航行器集群对应的运动模型进行轨迹预测,以及将第二控制参量输入至目标对应的运动模型中进行轨迹预测,进而得到航行器集群围捕目标的目标轨迹,最终根据目标轨迹控制航行器集群中各航行器进行移动,其中协同一致性原则用于指示航行器集群中每个航行器在围捕目标的过程中均转向目标。在该方法中,由于第一控制参量和第二控制参量是基于协同一致性原则获取得到,且该协同一致性原则可以使最终航行器集群中的所有航行器从初始位置均一致转向目标进行围捕,可以在一定程度上避免航行器集群中存在背离目标的航行器,所以后期基于第一控制参量和第二控制参量控制航行器集群围捕目标,即可达到准确控制航行器集群中所有航行器都一致围捕目标的效果,从而提高围捕效率。
附图说明
图1为一个实施例中控制方法的应用环境图;
图2为一个实施例中控制方法的流程示意图;
图2A为一个实施例中水下航行器围捕目标的对策模型;
图3为另一个实施例中控制方法的流程示意图;
图4为另一个实施例中控制方法的流程示意图;
图4A为另一个实施例中控制方法的流程示意图;
图4B为另一个实施例中最优控制参量控制器示意图;
图5为另一个实施例中控制方法的流程示意图;
图5A为另一个实施例中控制方法的流程示意图;
图6为另一个实施例中控制方法的流程示意图;
图7为一个实施例中控制装置的结构框图;
图8为另一个实施例中控制装置的结构框图;
图9为另一个实施例中控制装置的结构框图;
图10为一个实施例中计算机设备的内部结构图;
图11为另一个实施例中控制装置的结构框图;
图12为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
迄今为止,水下移动目标追踪算法存在无定位或定位精度较低、水下动力学环境复杂、水下信道环境复杂、目标智能性较高的关键瓶颈。微分对策将博弈论与现代控制理论相结合,是一种解决集群无人水下航行器(Unmanned Underwater Vehicle,UUV)与动态目标之间冲突、对抗、竞争问题的有效工具和科学方法,并能够根据具体的水下集群任务进行建模分析。
在已有的研究中,微分对策模型中没有针对海流、风等对UUV行进过程中的影响,没有考虑UUV集群团队之间的协作能力和UUV与目标之间的对抗行为。在真实且复杂的水下环境中,如何基于微分对策理论实现水下航行器集群的准确控制成为当下亟待解决的技术问题。本申请提供了一种控制方法,旨在解决上述技术问题,下面实施例将具体说明本申请所述的控制方法。
本申请实施例提供的控制方法,可以应用于如图1所示的应用环境中,其中,控制设备101分别与航行器集群102和目标103之间进行无线通信连接。其中,航行器集群102包括多个航行器1020,目标103可以为航行器集群102围捕或追踪的任一类型对象,比如,目标可以具体为航行器、水雷、无人机等中任一种。控制设备101用于控制航行器集群102中的所有航行器对目标103进行围捕或追踪。控制设备101可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。
本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的应用环境的限定,具体的应用环境可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,如图2所示,提供了一种控制方法,以该方法应用于图1中的控制设备为例进行说明,包括以下步骤:
S201,根据协同一致性原则,确定航行器集群的第一控制参量和目标的第二控制参量;协同一致性原则用于指示航行器集群中每个航行器在围捕目标的过程中均转向目标。
其中,航行器可以为水下航行器、空中航行器、无人机等中任一种。目标可以为水下航行器、水雷、无人机等中任一种。航行器集群的第一控制参量用于控制航行器集群中每个航行器按照预设航行轨迹对目标进行围捕,使每个航行器在围捕目标的过程中从初始位置都一致转向目标进行围捕。目标的第二控制参量用于在航行器集群中每个航行器围捕目标时,控制目标逃避围捕。
本申请实施例中, 控制设备在控制航行器集群围捕目标的过程中,可以实时获取航行器集群中每个航行器的状态信息,以及实时获取目标的状态信息,其中航行器的状态信息可以包括但不限于航行器的位置、移动速度;目标的状态信息可以包括但不限于目标的位置、移动速度。当控制设备实时获取到每个航行器的位置和目标的位置时,可以进一步的根据每个航行器的位置和目标的位置确定各航行器与目标之间的距离,并再根据各航行器与目标之间的距离、每个航行器的移动速度和目标的移动速度,且以每个航行器在围捕目标的过程中均转向的目标的协同一致性原则,预测各航行器围捕目标的轨迹,最终根据该轨迹确定航行器集群中各航行器的第一控制参量和目标的第二控制参量,使航行器集群中每个航行器在围捕目标的过程中均一致转向目标。
S202,将第一控制参量输入至航行器集群对应的运动模型进行轨迹预测,以及将第二控制参量输入至目标对应的运动模型中进行轨迹预测,得到航行器集群围捕目标的目标轨迹。
其中,航行器集群对应的运动模型包括航行器集群中各航行器对应的运动模型。每个航行器对应的运动模型用于根据第一控制参量对航行器的轨迹进行预测。目标对应的运动模型用于根据第二控制参量对目标进行轨迹预测。
各航行器对应的运动模型可以是提前构建好的运动学和动力学模型,也可以是提前训练好的神经网络模型。目标对应的运动模型可以是提前构建好的运动学和动力学模型,也可以是提前训练好的神经网络模型。各航行器对应的运动模型的构建方法与目标对应的运动模型可以相同,也可以不同。
示例性说明上述各航行器对应的运动模型和目标对应的运动模型。假设进行水下目标围捕或追踪,则对应的航行器集群可以为无人水下航行器集群(Unmanned UnderwaterVehicle,UUV),目标可以为水下航行器或水雷。通过建立水下航行器围捕目标的对策模型(参见图2A所示的水下航行器围捕目标的对策模型),该对策模型包括各航行器对应的运动模型和目标对应的模型,该对策模型进一步的描述多艘航行器之间的合作对策和各航行器与单个目标之间的非合作对策。假设进行水下目标围捕或追踪过程中,认为航行器集群与目标相互具有完全信息(速度、位置等),那么目标围捕任务是一个完全信息微分博弈过程。如图2A所示,航行器集群U在初始状态时分散在起点
Figure SMS_2
附近,各航行器在围捕目标的过程中,它们的坐标可以定义为
Figure SMS_4
,目标
Figure SMS_9
的坐标可以定义为
Figure SMS_1
,其中,d表示距离水面的深度,M表示航行器集群中的航行器总数。航行器在围捕目标时,采用三自由度欠驱动航行器模型,其坐标系为体固定的速度向量
Figure SMS_5
和地球基准坐标系确定的位置向量
Figure SMS_8
,其中,
Figure SMS_10
表示纵荡速度,
Figure SMS_3
表示横漂速度,
Figure SMS_6
表示偏航角速度,
Figure SMS_7
表示艏向角。
水下航行器围捕目标的对策模型模型由各航行器对应的运动模型和目标对应的运动模型构建得到,各航行器对应的运动模型由环境信息、各航行器的位置信息、各航行器的速度信息和各航行器的控制信息构建得到,目标对应的运动模型由环境信息、目标的位置信息、目标的速度信息和目标的控制信息构建得到。
例如,各航行器对应的运动模型可以通过如下关系式(1)表示:
Figure SMS_11
此外,
Figure SMS_12
可以通过如下关系式(2)表示:
Figure SMS_13
其中,
Figure SMS_14
表示各航行器的速度,满足条件
Figure SMS_18
Figure SMS_20
表示各航行器的最大速度,M表示惯性质量矩阵,
Figure SMS_16
表示科里奥利向心力矩阵,
Figure SMS_19
表示阻尼矩阵,
Figure SMS_21
表示重力与浮力的合成矩阵,
Figure SMS_22
表示变换矩阵,
Figure SMS_15
表示集群航行器中各航行器的第一控制参量,
Figure SMS_17
表示环境干扰。
目标对应的运动模型可以通过如下关系式(3)表示:
Figure SMS_23
其中,
Figure SMS_24
表示目标的速度,满足条件
Figure SMS_25
Figure SMS_26
表示目标的最大速度,q表示目标的第二控制参量。
本申请实施例中,控制设备可以预先基于上述方法构建得到各航行器对应的运动模型和目标对应的运动模型。并将上述步骤得到航行器集群中各航行器的第一控制参量输入至各航行器对应的运动模型进行轨迹预测,以及将第二控制参量输入至目标对应的运动模型中进行轨迹预测,得到航行器集群中每个航行器在围捕目标时可能执行的若干轨迹,再根据围捕需求从若干轨迹中筛选出一条最优轨迹,从而得到航行器集群围捕目标的目标轨迹。需要说明的是,上述围捕需求可以是使航行器集群的围捕效率最高的需求,也可以是准确控制航行器集群中各航行器进行有效围捕的需求。
S203,根据目标轨迹控制航行器集群中各航行器进行移动。
本申请实施例中,当控制设备基于上述步骤得到的航行器集群围捕目标的目标轨迹后,根据航行器集群围捕目标的目标轨迹确定当下航行器集群中每个航行器的移动信息,该移动信息包括移动速度、移动目标位置、移动方向等中的至少一种。再相应的根据各航行器的移动信息向各航行器发送控制指令,以指示各航行器在接收到控制指令时,按照该控制指令中的移动信息向目标进行移动,从而实现围捕目标。可选的,控制设备可以为图1应用环境中独立于各航行器的控制设备,也可以为设置在各航行器上的控制设备。当控制设备为各航行器上的控制设备时,该控制设备在得到目标轨迹后,即可控制所在的航行器根据对应的目标轨迹进行移动,实现了航行器集群中的各航行器都根据自身的控制设备控制实现围捕目标。
上述实施例的控制方法,通过根据协同一致性原则,确定航行器集群的第一控制参量和目标的第二控制参量,并将第一控制参量输入至航行器集群对应的运动模型进行轨迹预测,以及将第二控制参量输入至目标对应的运动模型中进行轨迹预测,进而得到航行器集群围捕目标的目标轨迹,最终根据目标轨迹控制航行器集群中各航行器进行移动,其中协同一致性原则用于指示航行器集群中每个航行器在围捕目标的过程中均转向目标。在该方法中,由于第一控制参量和第二控制参量是基于协同一致性原则获取得到,且该协同一致性原则可以使最终航行器集群中的所有航行器从初始位置均一致转向目标进行围捕,可以在一定程度上避免航行器集群中存在背离目标的航行器,所以后期基于第一控制参量和第二控制参量控制航行器集群围捕目标,即可达到准确控制航行器集群中所有航行器都一致围捕目标的效果,从而提高围捕效率。
在一个实施例中,还提供了一种根据协同一致性原则确定上述第一控制参量和第二控制参量的实现方式,如图3所示,即上述步骤S201“根据协同一致性原则,确定航行器集群的第一控制参量和目标的第二控制参量”,包括:
S301,确定航行器集群和目标组成系统的系统支付函数。
其中,系统支付函数可以表示航行器集群中多个航行器之间的协作能力,以及多个航行器与目标之间的对抗行为。
本申请实施例中,控制设备可以实时获取航行器集群中各航行器的状态信息,以及目标的状态信息,再基于这些状态信息确定多个航行器之间的协作能力、多个航行器与目标之间的对抗行为和博弈关系。之后,控制设备可以通过分析多个航行器之间的协作能力、多个航行器与目标之间的对抗行为和博弈关系等来确定各航行器与目标构成的系统的系统支付函数。需要说明是,控制设备可以分别确定航行器集群中每个航行器的对应的支付函数和目标对应的支付函数,再结合每个航行器对应的支付函数和目标对应的支付函数进行计算得到系统支付函数。
S302,根据协同一致性原则和系统支付函数,确定航行器集群的第一控制参量和目标的第二控制参量。
本申请实施例中,控制设备基于上述步骤得到系统支付函数后,以协同一致性原则为约束条件,对系统支付函数进行解算,从而解算得到第一控制参量和目标的第二控制参量。
上述实施例的控制方法中,由于系统支付函数可以表示航行器集群中多个航行器之间的协作能力,以及多个航行器与目标之间的对抗行为,因此通过系统支付函数求解得到第一控制参量和第二控制参量,考虑到了多个航行器之间的协作能力,以及多个航行器与目标之间的对抗行为等这些因素对航行器集群准确和高效围捕目标的影响,进而可以提高控制航行器集群中所有航行器围捕目标的准确性和效率。
在一个实施例中,还提供了一种确定上述系统支付函数的实现方式,如图4所示,即上述步骤S301“确定航行器集群和目标组成系统的系统支付函数”,包括:
S401,确定航行器集群对应的第一支付函数。
其中,第一支付函数可以表示航行器集群中多个航行器之间的协作能力。
本申请实施例中,控制设备基于获取到的航行器集群中各航行器之间的协作能力,通过分析多个航行器之间的协作能力,确定各航行器对应的第一支付函数。
可选的,上述确定第一支付函数的方法,如图4A所示,包括:
S4010,获取航行器集群对应的约束函数;约束函数包括避碰约束函数、通信约束函数和终止约束函数;
S4011,根据避碰约束函数、通信约束函数和终止约束函数,确定第一支付函数。
S402,确定目标对应的第二支付函数。
其中,第二支付函数可以表示航行器集群中多个航行器与目标之间的对抗行为。
本申请实施例中,控制设备基于获取到的航行器集群中多个航行器与目标之间的对抗行为和博弈关系,通过分析航行器集群中多个航行器与目标之间的对抗行为和博弈关系确定目标对应的第二支付函数。
可选的,可以以此为目标来确定第二支付函数:目标远离航行器集群(即最大化与各航行器之间的距离)、避免被捕获、减少自身的控制消耗、使航行器集群的控制消耗最大化(即使航行器集群花费更多的努力来围捕目标,对目标的逃跑更有利)。
S403,根据第一支付函数和第二支付函数,确定系统支付函数。
本申请实施例中,控制设备基于上获取到的第一支付函数和第二支付函数后,根据第一支付函数和第二支付函数,确定系统支付函数。具体的,在航行器集群围捕目标的过程中,可以将航行器集群的第一支付函数与目标的支付函数作差得到的结果作为系统支付函数。
上述实施例的控制方法中,在确定航行器集群中各航行器对应的第一支付函数时,考虑到了各航行器之间的避碰约束、通信约束和终止约束条件,以及确定目标对应的第二支付函数时考虑到了目标要远离航行器集群、避免被捕获、减少自身的控制消耗、使航行器集群的控制消耗最大化的约束条件,由于系统支付函数由第一支付函数和第二支付函数构成,所以最终的系统支付函数表示了多个航行器之间的协作能力,以及多个航行器与目标之间的对抗行为,因此通过系统支付函数求解得到第一控制参量和第二控制参量可以提高控制航行器集群中所有航行器围捕目标的准确性和效率。
示例性说明上述各航行器对应的第一支付函数、目标对应的第二支付函数和系统支付函数。
假设航行器集群中的每个航行器的搜索距离为R 1,攻击距离为R 2,第i个航行器与目标之间的距离为
Figure SMS_27
,当
Figure SMS_28
时,第i个航行器可以检测到目标,当
Figure SMS_29
时,可以捕获目标。那么,航行器集群围捕目标的问题可以转换为:确定每个航行器的位置向量
Figure SMS_30
和速度向量
Figure SMS_31
,以及确定目标的位置向量
Figure SMS_32
和速度向量
Figure SMS_33
,并使每个航行器从初始位置转向目标,同时避免各个航行器碰撞和避免远离其他航行器,从而保持集群团队的一致性。具体的,可以通过如下关系式(4)作为航行器集群围捕目标过程中的状态方程:
Figure SMS_34
其中,
Figure SMS_35
表示M艘航行器和目标在t时刻的位置,
Figure SMS_38
表示集群航行器中第i个航行器的第一控制参量,集群航行器的第一控制参量可以进一步地表示为
Figure SMS_43
目标的第二控制参量可以进一步地表示为
Figure SMS_37
,其中,
Figure SMS_40
表示最大围捕时间,
Figure SMS_42
表示初始状态,
Figure SMS_45
表示最终状态(
Figure SMS_36
或者
Figure SMS_39
Figure SMS_41
Figure SMS_44
为常数矩阵。
例如,第i个航行器对应的第一支付函数可以通过如下关系式(5)表示:
Figure SMS_46
其中,
Figure SMS_47
,常数满足
Figure SMS_48
表示第i个UUV接近其他UUV的避碰约束函数,
Figure SMS_49
表示航行器集群中每个航行器的通信约束函数,
Figure SMS_50
表示终止约束函数。
假设每个航行器都有一个避免与其他航行器碰撞的安全半径r(r>0),那么对于
Figure SMS_51
Figure SMS_52
,如果存在一个时刻t,使
Figure SMS_53
,则称第i个UUV与第j个UUV发生碰撞,假设第i个航行器UUV在t时的避障区域为
Figure SMS_54
,其中
Figure SMS_55
Figure SMS_56
表示第i个航行器和第j个航行器UUV之间的安全区域。因此,第i个航行器接近其他航行器的避碰约束函数
Figure SMS_57
可以通过如下关系式(6)表示:
Figure SMS_58
其中,
Figure SMS_59
并且
Figure SMS_60
通信是航行器集群中的每个航行器协同完成复杂围捕任务的关键技术,航行器实现一致性的条件定义为在任何初始条件下。因此,航行器集群中每个航行器的通信约束函数
Figure SMS_61
可以通过如下关系式(7)表示:
Figure SMS_62
其中,初始条件为:
Figure SMS_63
当目标进入航行器集群的攻击范围(攻击范围半径为R 2)或逃离航行器UUV的感知范围(感知范围半径为R 1),博弈对抗任务结束。因此,终止约束函数
Figure SMS_64
可以通过如下关系式(8)表示:
Figure SMS_65
其中,a和b是常数。
目标为了避免被捕获,有三个逃逸守则:①最大化与航行器之间的距离,避免被捕获;②减少自身的控制消耗;③使航行器的控制消耗最大化(使航行器花费更多的努力来围捕目标,对目标的逃跑更有利)。因此,与第i个航行器相关的目标对应的第二支付函数可以通过如下关系式(9)表示:
Figure SMS_66
基于上述得到各航行器对应的第一支付函数和目标对应的第二支付函数,水下目标围捕系统的系统支付函数可以通过如下关系式(10)表示:
Figure SMS_67
其中,M表示航行器集群中的航行器总数,
Figure SMS_68
表示最大围捕时间。
在一个实施例中,还提供了一种根据协同一致性原则和系统支付函数确定上述第一控制参量和第二控制参量的实现方式,即上述步骤S302“根据协同一致性原则和系统支付函数,确定航行器集群的第一控制参量和目标的第二控制参量”,包括:将系统支付函数转换为哈密顿方程,并以协同一致性原则为求解目标,求解哈密顿方程得到航行器集群的第一控制参量和目标的第二控制参量。
本申请实施例中,控制设备为了得到最优的第一控制参量和第二控制参量,可以将系统支付函数转换为哈密顿方程,以系统达到纳什均衡为目标进行哈密顿方程的求解。
示例性说明上述将系统支付函数转换为哈密顿方程,以系统达到纳什均衡为目标进行哈密顿方程的求解的过程。
例如,先确定微分对策,在给定初始状态下,每个参与者尝试最小化各自的支付函数,以及尝试最大化对方的支付函数,纳什均衡可以通过如下关系式(11)和关系式(12)表示:
Figure SMS_69
其中,
Figure SMS_70
表示航行器集群中各航行器对应的纳什均衡,
Figure SMS_71
表示目标对应的纳什均衡。
进一步地,系统的纳什均衡值
Figure SMS_72
满足以下纳什均衡条件,该纳什均衡条件可以通过如下关系式(13)表示:
Figure SMS_73
进一步地,在求解哈密顿方程时,需要基于纳什均衡条件确定符合一定条件的最优控制策略(即最优的第一控制参量
Figure SMS_74
和最优的第二控制参量
Figure SMS_75
)。此外,航行器总是在围捕目标时选择终止游戏,同时最小化它们各自的第一支付函数。与之相反,目标试图最大化航行器的第一支付函数。基于这一博弈过程,航行器集群围捕目标的任务可以通过如下关系式(14)表示:
Figure SMS_76
其中,
Figure SMS_77
表示从初始状态
Figure SMS_78
开始的博弈均衡值在最优的第一控制参量和最优的第二控制参量下,从初始状态
Figure SMS_79
开始的博弈均衡值,当第i个航行器UUV在围捕过程中满足
Figure SMS_80
Figure SMS_81
,围捕任务结束。
在求解哈密顿方程时,当航行器执行最优第一控制参量
Figure SMS_82
,以及目标执行最优第二控制参量
Figure SMS_83
时,
Figure SMS_84
Figure SMS_85
可以通过如下关系式(15)表示:
Figure SMS_86
(15);
另外,给定控制参量对(p,q),在时刻t,策略对的代价
Figure SMS_87
可以通过如下关系式(16)表示:
Figure SMS_88
由于策略对的代价值是有限的,利用莱布尼茨公式和微分可以找到一个等价函数,所以,哈密顿函数可以通过如下关系式(17)表示:
Figure SMS_89
其中,
Figure SMS_90
为哈密顿函数,
Figure SMS_91
通过对哈密顿函数进行适当的最大化或最小化,即可找到最优第一控制参量
Figure SMS_92
和最优第二控制参量
Figure SMS_93
,进一步地,纳什均衡条件的必要条件可以重新通过如下关系式(18)表示:
Figure SMS_94
对于每个控制参量对(p,q),当达到纳什均衡时,存在稳态条件,该稳态条件可以通过如下关系式(19)、(20)、(21)和(22)表示:
Figure SMS_95
Figure SMS_96
进一步地,最优第一控制参量
Figure SMS_97
和最优第二控制参量
Figure SMS_98
可以通过如下关系式(23)表示:
Figure SMS_99
假设
Figure SMS_100
,最优控制参量可以通过如下关系式(24)表示:
Figure SMS_101
Figure SMS_102
代入哈密顿方程,得到方程
Figure SMS_103
。将最优控制参量代入关系式(4)实施例中的状态方程中的得到,得到的黎卡提方程,具体来说,对于
Figure SMS_104
存在一个对称矩阵P,其终态函数
Figure SMS_105
满足,所述黎卡提方程可以通过如下关系式(25)表示:
Figure SMS_106
因此,可以基于上述原理可以确定最优控制参量的反馈控制率模型,进一步地表示为
Figure SMS_107
Figure SMS_108
,反馈约束为
Figure SMS_109
Figure SMS_110
,其中,该反馈控制律可以通过如下1关系式(26)表示:
Figure SMS_111
在具体应用中,参见如图4B所示的最优控制参量控制器示意图,其可以通过将航行器集群的状态信息
Figure SMS_112
输入至上述反馈控制率模型中,即可获得最优控制参量
Figure SMS_113
进一步,还提供了通过纳什均衡和稳定性条件来验证上述获取的最优控制参量
Figure SMS_114
的方法,具体的,上述哈密顿方程可以通过如下关系式(27)表示:
Figure SMS_115
引理1:对于任意可行的控制策略pq,存在:
Figure SMS_116
证明:
Figure SMS_117
进一步地:
Figure SMS_118
定理1:定义
Figure SMS_119
>0为哈密顿方程的光滑函数,存在:
(1)在求得的最优控制策略下,微分博弈系统是渐近稳定的。
(2)最优控制策略为水下微分对策提供了一个鞍点,在最优策略下系统处于纳什均衡状态。
证明:
(1)稳定性
选择
Figure SMS_120
为李雅普诺夫函数候选,当且仅当
Figure SMS_121
存在
Figure SMS_122
。因此,李雅普诺夫函数候选
Figure SMS_123
可以表示为:
Figure SMS_124
进一步地:
Figure SMS_125
进一步地:
Figure SMS_126
由于
Figure SMS_127
,在
Figure SMS_128
Figure SMS_129
情况下,上述式子可以写成:
Figure SMS_130
因此,
Figure SMS_131
s的李雅普诺夫函数,证明上述实施例所描述的系统是渐近稳定的。
(2)纳什均衡
由于系统是渐近稳定的,有
Figure SMS_132
。因此,系统支付函数可以改写为:
Figure SMS_133
进一步地,结合引理1:
Figure SMS_134
Figure SMS_135
Figure SMS_136
可以得出
Figure SMS_137
,满足纳什均衡条件。
在一个实施例中,还提供了一种获取目标轨迹的控制方法,如图5所示,该控制方法包括:
S501,将第一控制参量输入至航行器集群对应的运动模型进行轨迹预测,得到航行器集群的第一轨迹。
本申请实施例中,控制设备可以基于前述图3实施例得到航行器集群中各航行器对应的第一控制参量,以及基于前述图2实施例构建得到航行器集群对应的运动模型,然后即可将每个航行器对应的第一控制参量代入到各自的运动模型中进行计算,得到每个航行器进行围捕时的位置和移动速度,并根据该位置和移动速度,即可得到每个航行器的第一轨迹。可选的,控制设备还可以预先基于神经网络训练得到航行器集群对应的运动模型,再将预先前述获取到的航行器集群中各航行器对应的第一控制参量输入至训练好的运动模型进行轨迹预测,直接得到航行器集群中各航行器的第一轨迹。
S502,将第二控制参量输入至目标对应的运动模型中进行轨迹预测,得到目标的第二轨迹。
本申请实施例中,控制设备可以基于前述图3实施例得到目标对应的第二控制参量,以及基于前述图2实施例构建得到目标对应的运动模型,然后即可将目标对应的第二控制参量代入到运动模型中进行计算,得到目标逃避围捕时的位置和移动速度,并根据该位置和移动速度,即可得到目标的第而轨迹。可选的,控制设备还可以预先基于神经网络训练得到目标对应的运动模型,再将预先前述获取到的目标对应的第二控制参量输入至训练好的运动模型进行轨迹预测,直接得到目标的第二轨迹。
S503,根据第一轨迹和第二轨迹,确定目标轨迹。
本申请实施例中,当控制设备基于前述步骤确定了航行器集群中各航行器的第一轨迹和目标的第二轨迹时,可以通过结合围捕要求和环境信息,分析第一轨迹和第二轨迹,来确定航行器集群中各航行器围捕目标的一条最优轨迹,以得到目标轨迹;可选的,控制设备可以预先训练得到一个轨迹预测模型,该轨迹预测模型具备根据航行器集群中各航行器的第一轨迹和目标的第二轨迹预测最优围捕轨迹的能力。然后在得到实际的航行器集群中各航行器的第一轨迹和目标的第二轨迹时,即可将第一轨迹和第二轨迹输入至上述轨迹预测模型中进行轨迹预测,从而得到目标轨迹。
进一步的,上述S503,如图5A所示,包括步骤:
S5030,根据第二轨迹确定第一轨迹是否为最优轨迹,若是,则执行步骤S5031,若否,则执行步骤S5032。
S5031,将第一轨迹确定为目标轨迹;
S5032,根据第二轨迹对第一轨迹进行调整,并将调整后的第一轨迹确定为目标轨迹。
本申请实施例涉及根据第一轨迹和第二轨迹确定目标轨迹的一种具体实现方式,即通过分析第二轨迹确定各航行器的第一轨迹是否为最优,若是,则说明航行器按照该第一轨迹围捕目标时,可以达到高效和准确围捕目标的目的,此种情况下,则直接将各航行器的第一轨迹作为目标轨迹;若否,则说明航行器按照该第一轨迹围捕目标时,并不能达到高效和准确围捕目标的目的,需要进行调整,此种情况下,则可以通过分析第二轨迹来调整第一轨迹,并将调整后的第一轨迹确定为目标轨迹。需要说明的是,由于航行器集群中包括多个航行器,且每个航行器对应的第一轨迹不同,在确定各航行器对应的第一轨迹是否为最优轨迹时,可能存在部分航行器的第一轨迹为最优轨迹,而部分航行器的第一轨迹不是最优轨迹,此种情况下,则对应调整不是最优轨迹的航行器即可。可选的,由于航行器集群中多个航行器之间存在协作关系,因此当存在部分航行器的第一轨迹不是最优轨迹时,也可以对航行器集群中所有航行器的第一轨迹进行调整,直到所有航行器的第一轨迹均为最优轨迹为止。
综合上述所有实施例,还提供了一种控制方法,如图6所示,该控制方法包括:
S601,获取航行器集群对应的约束函数,约束函数包括避碰约束函数、通信约束函数和终止约束函数。
S602,根据避碰约束函数、通信约束函数和终止约束函数,确定第一支付函数。
S603, 确定目标对应的第二支付函数。
S604,根据第一支付函数和第二支付函数,确定航行器集群和目标组成系统的系统支付函数。
S605,将系统支付函数转换为哈密顿方程,并以协同一致性原则为求解目标,求解哈密顿方程得到航行器集群的第一控制参量和目标的第二控制参量。
S606,将第一控制参量输入至航行器集群对应的运动模型进行轨迹预测,得到航行器集群的第一轨迹,将第二控制参量输入至目标对应的运动模型中进行轨迹预测,得到目标的第二轨迹。
S607,根据第二轨迹对第一轨迹进行调整,并将调整后的第一轨迹确定为目标轨迹。
本申请实施例中,控制设备通过微分博弈与最优控制策略,并结合水下环境种各航行器的动力学与通信特点以及目标围捕任务对于编队一致性、避碰的需求,建立微分对策模型分析航行器集群团队与单目标之间的对抗行为,通过求解哈密顿方程得到最优控制参量,采用李雅普诺夫优化验证了集群系统的稳定性,同时证明在最优控制参量下系统处于纳什均衡状态。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的控制方法的控制装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个控制装置实施例中的具体限定可以参见上文中对于控制方法的限定,在此不再赘述。
在一个实施例中,如图7所示,提供了一种控制装置,包括:
第一确定模块10,用于根据协同一致性原则,确定航行器集群的第一控制参量和目标的第二控制参量;协同一致性原则用于指示航行器集群中每个航行器在围捕目标的过程中均转向目标。
第二确定模块11,用于将第一控制参量输入至航行器集群对应的运动模型进行轨迹预测,以及将第二控制参量输入至目标对应的运动模型中进行轨迹预测,得到航行器集群围捕目标的目标轨迹。
控制模块12,用于根据目标轨迹控制航行器集群中各航行器进行移动。
在一个实施例中,上述第一确定模块10,如图8所示,包括:
第一确定单元101,用于确定航行器集群和目标组成系统的系统支付函数。
第二确定单元102,用于根据协同一致性原则和系统支付函数,确定航行器集群的第一控制参量和目标的第二控制参量。
在一个实施例中,上述第一确定单元101,如图9所示,包括:
第一确定子单元1010,用于确定航行器集群对应的第一支付函数。
第二确定子单元1011,用于确定目标对应的第二支付函数。
第三确定子单元1012,用于根据第一支付函数和第二支付函数,确定系统支付函数。
在一个实施例中,上述第一确定子单元1010具体用于获取航行器集群对应的约束函数;约束函数包括避碰约束函数、通信约束函数和终止约束函数;根据避碰约束函数、通信约束函数和终止约束函数,确定第一支付函数。
在一个实施例中,上述第二确定单元102具体用于将系统支付函数转换为哈密顿方程,并以协同一致性原则为求解目标,求解哈密顿方程得到航行器集群的第一控制参量和目标的第二控制参量。
在一个实施例中,上述第二确定模块11,如图10所示,包括:
第一获取单元110,用于将第一控制参量输入至航行器集群对应的运动模型进行轨迹预测,得到航行器集群的第一轨迹。
第二获取单元111,用于将第二控制参量输入至目标对应的运动模型中进行轨迹预测,得到目标的第二轨迹。
第三确定单元112,用于根据第一轨迹和第二轨迹,确定目标轨迹。
在一个实施例中,上述第三确定单元112,如图11所示,包括:
判断子单元1120,用于根据第二轨迹确定第一轨迹是否为最优轨迹;
第四确定子单元1121,用于在第一轨迹是最优轨迹的情况下,将第一轨迹确定为目标轨迹;
第五确定子单元1122,用于在第一轨迹不是最优轨迹的情况下,根据第二轨迹对第一轨迹进行调整,并将调整后的第一轨迹确定为目标轨迹。
上述控制装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图12所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种控制方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random AccessMemory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (16)

1.一种控制方法,其特征在于,所述控制方法包括:
根据协同一致性原则,确定航行器集群的第一控制参量和目标的第二控制参量;所述协同一致性原则用于指示所述航行器集群中每个航行器在围捕所述目标的过程中均转向所述目标;
将所述第一控制参量输入至所述航行器集群对应的运动模型进行轨迹预测,以及将所述第二控制参量输入至所述目标对应的运动模型中进行轨迹预测,得到所述航行器集群围捕所述目标的目标轨迹;
根据所述目标轨迹控制所述航行器集群中各航行器进行移动。
2.根据权利要求1所述的控制方法,其特征在于,所述根据协同一致性原则,确定航行器集群的第一控制参量和目标的第二控制参量,包括:
确定所述航行器集群和所述目标组成系统的系统支付函数;
根据所述协同一致性原则和所述系统支付函数,确定航行器集群的第一控制参量和目标的第二控制参量。
3.根据权利要求2所述的控制方法,其特征在于,所述确定所述航行器集群和所述目标组成系统的系统支付函数,包括:
确定所述航行器集群对应的第一支付函数;
确定所述目标对应的第二支付函数;
根据所述第一支付函数和所述第二支付函数,确定所述系统支付函数。
4.根据权利要求3所述的控制方法,其特征在于,所述确定所述航行器集群对应的第一支付函数,包括:
获取所述航行器集群对应的约束函数;所述约束函数包括避碰约束函数、通信约束函数和终止约束函数;
根据所述避碰约束函数、所述通信约束函数和所述终止约束函数,确定所述第一支付函数。
5.根据权利要求2所述的控制方法,其特征在于,所述根据所述协同一致性原则和所述系统支付函数,确定航行器集群的第一控制参量和目标的第二控制参量,包括:
将所述系统支付函数转换为哈密顿方程,并以所述协同一致性原则为求解目标,求解所述哈密顿方程得到所述航行器集群的第一控制参量和所述目标的第二控制参量。
6.根据权利要求1所述的控制方法,其特征在于,所述将所述第一控制参量输入至所述航行器集群对应的运动模型进行轨迹预测,以及将所述第二控制参量输入至所述目标对应的运动模型中进行轨迹预测,得到所述航行器集群围捕所述目标的目标轨迹,包括:
将所述第一控制参量输入至所述航行器集群对应的运动模型进行轨迹预测,得到所述航行器集群的第一轨迹;
将所述第二控制参量输入至所述目标对应的运动模型中进行轨迹预测,得到所述目标的第二轨迹;
根据所述第一轨迹和所述第二轨迹,确定所述目标轨迹。
7.根据权利要求6所述的控制方法,其特征在于,所述根据所述第一轨迹和所述第二轨迹,确定所述目标轨迹,包括:
根据所述第二轨迹确定所述第一轨迹是否为最优轨迹;
若是,则将所述第一轨迹确定为所述目标轨迹;
若否,则根据所述第二轨迹对所述第一轨迹进行调整,并将调整后的第一轨迹确定为所述目标轨迹。
8.一种控制装置,其特征在于,所述控制装置包括:
第一确定模块,用于根据协同一致性原则,确定航行器集群的第一控制参量和目标的第二控制参量;所述协同一致性原则用于指示所述航行器集群中每个航行器在围捕所述目标的过程中均转向所述目标;
第二确定模块,用于将所述第一控制参量输入至所述航行器集群对应的运动模型进行轨迹预测,以及将所述第二控制参量输入至所述目标对应的运动模型中进行轨迹预测,得到所述航行器集群围捕所述目标的目标轨迹;
控制模块,用于根据所述目标轨迹控制所述航行器集群中各航行器进行移动。
9.根据权利要求8所述的控制装置,其特征在于,所述第一确定模块,包括:
第一确定单元,用于确定所述航行器集群和所述目标组成系统的系统支付函数;
第二确定单元,用于根据所述协同一致性原则和所述系统支付函数,确定航行器集群的第一控制参量和目标的第二控制参量。
10.根据权利要求9所述的控制装置,其特征在于,所述第一确定单元,包括:
第一确定子单元,用于确定所述航行器集群对应的第一支付函数;
第二确定子单元,用于确定所述目标对应的第二支付函数;
第三确定子单元,用于根据所述第一支付函数和所述第二支付函数,确定所述系统支付函数。
11.根据权利要求10所述的控制装置,其特征在于,所述第一确定子单元用于获取所述航行器集群对应的约束函数;所述约束函数包括避碰约束函数、通信约束函数和终止约束函数;
根据所述避碰约束函数、所述通信约束函数和所述终止约束函数,确定所述第一支付函数。
12.根据权利要求9所述的控制装置,其特征在于,所述第二确定单元用于将所述系统支付函数转换为哈密顿方程,并以所述协同一致性原则为求解目标,求解所述哈密顿方程得到所述航行器集群的第一控制参量和所述目标的第二控制参量。
13.根据权利要求8所述的控制装置,其特征在于,所述第二确定模块,包括:
第一获取单元,用于将所述第一控制参量输入至所述航行器集群对应的运动模型进行轨迹预测,得到所述航行器集群的第一轨迹;
第二获取单元,用于将所述第二控制参量输入至所述目标对应的运动模型中进行轨迹预测,得到所述目标的第二轨迹;
第三确定单元,用于根据所述第一轨迹和所述第二轨迹,确定所述目标轨迹。
14.根据权利要求13所述的控制装置,其特征在于,所述第三确定单元,包括:
判断子单元,用于根据所述第二轨迹确定所述第一轨迹是否为最优轨迹;
第四确定子单元,用于在所述第一轨迹是最优轨迹的情况下,将所述第一轨迹确定为所述目标轨迹;
第五确定子单元,用于在所述第一轨迹不是最优轨迹的情况下,根据所述第二轨迹对所述第一轨迹进行调整,并将调整后的第一轨迹确定为所述目标轨迹。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的控制方法的步骤。
16.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的控制方法的步骤。
CN202310589074.2A 2023-05-24 2023-05-24 控制方法、装置、计算机设备和存储介质 Active CN116300985B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310589074.2A CN116300985B (zh) 2023-05-24 2023-05-24 控制方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310589074.2A CN116300985B (zh) 2023-05-24 2023-05-24 控制方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN116300985A true CN116300985A (zh) 2023-06-23
CN116300985B CN116300985B (zh) 2023-09-05

Family

ID=86813542

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310589074.2A Active CN116300985B (zh) 2023-05-24 2023-05-24 控制方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN116300985B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005214665A (ja) * 2004-01-27 2005-08-11 Mitsubishi Electric Corp 目標追尾装置
CN112269396A (zh) * 2020-10-14 2021-01-26 北京航空航天大学 一种仿鹰鸽智能博弈的无人机集群协同对抗控制方法
CN112783209A (zh) * 2020-12-31 2021-05-11 北京航空航天大学 一种基于鸽群智能竞争学习的无人机集群对抗控制方法
CN113554680A (zh) * 2021-07-21 2021-10-26 清华大学 目标跟踪方法、装置、无人机和存储介质
CN114115285A (zh) * 2021-11-29 2022-03-01 大连海事大学 一种多智能体搜索情感目标路径规划方法及装置
CN114138011A (zh) * 2021-11-23 2022-03-04 北京航空航天大学 一种基于飞蛾信息素机制的无人机集群目标搜索方法
CN114384530A (zh) * 2022-01-04 2022-04-22 清华大学 水下目标追踪方法、装置和计算机设备
CN114578851A (zh) * 2022-03-01 2022-06-03 重庆邮电大学 一种基于差分加速度的无人机集群快速转向方法
CN114779647A (zh) * 2022-05-11 2022-07-22 上海大学 无人艇集群的围堵控制方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005214665A (ja) * 2004-01-27 2005-08-11 Mitsubishi Electric Corp 目標追尾装置
CN112269396A (zh) * 2020-10-14 2021-01-26 北京航空航天大学 一种仿鹰鸽智能博弈的无人机集群协同对抗控制方法
CN112783209A (zh) * 2020-12-31 2021-05-11 北京航空航天大学 一种基于鸽群智能竞争学习的无人机集群对抗控制方法
CN113554680A (zh) * 2021-07-21 2021-10-26 清华大学 目标跟踪方法、装置、无人机和存储介质
CN114138011A (zh) * 2021-11-23 2022-03-04 北京航空航天大学 一种基于飞蛾信息素机制的无人机集群目标搜索方法
CN114115285A (zh) * 2021-11-29 2022-03-01 大连海事大学 一种多智能体搜索情感目标路径规划方法及装置
CN114384530A (zh) * 2022-01-04 2022-04-22 清华大学 水下目标追踪方法、装置和计算机设备
CN114578851A (zh) * 2022-03-01 2022-06-03 重庆邮电大学 一种基于差分加速度的无人机集群快速转向方法
CN114779647A (zh) * 2022-05-11 2022-07-22 上海大学 无人艇集群的围堵控制方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHENRAN LI 等: "Efficient Game-Theoretic Planning With Prediction Heuristic for Socially-Compliant Autonomous Driving", IEEE ROBOTICS AND AUTOMATION LETTERS, vol. 7, no. 4 *
王修强: "基于博弈论的无人水面艇编队控制方法研究", 中国优秀硕士学位论文全文数据库工程科技Ⅱ辑, no. 03 *
陈健瑞 等: "挺进深蓝:从单体仿生到群体智能", 电子学报, no. 12, pages 2458 - 2467 *

Also Published As

Publication number Publication date
CN116300985B (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
Xiang et al. Robust fuzzy 3D path following for autonomous underwater vehicle subject to uncertainties
Yan et al. Consensus formation tracking for multiple AUV systems using distributed bioinspired sliding mode control
Herissé et al. Landing a VTOL unmanned aerial vehicle on a moving platform using optical flow
Zhou et al. Multirobot active target tracking with combinations of relative observations
CN109447326B (zh) 无人机迁移轨迹生成方法、装置、电子设备和存储介质
CN115993781B (zh) 抗网络攻击无人集群系统协同控制方法、终端及存储介质
CN114115262B (zh) 基于方位角信息的多auv执行器饱和协同编队控制系统和方法
Yan et al. Reinforcement Learning‐Based Autonomous Navigation and Obstacle Avoidance for USVs under Partially Observable Conditions
Kim Control laws to avoid collision with three dimensional obstacles using sensors
Jin et al. Soft formation control for unmanned surface vehicles under environmental disturbance using multi-task reinforcement learning
Saranovic et al. Interception of automated adversarial drone swarms in partially observed environments
CN108958294A (zh) 无人水下潜航器编队控制方法及装置
CN112363527A (zh) 基于最优控制理论的多飞行器协同围捕方法及系统
Li et al. Sim-real joint experimental verification for an unmanned surface vehicle formation strategy based on multi-agent deterministic policy gradient and line of sight guidance
Zhou et al. Energy-based trajectory tracking control of under-actuated unmanned surface vessels
Zhang et al. AUV 3D docking control using deep reinforcement learning
CN116300985B (zh) 控制方法、装置、计算机设备和存储介质
Zhu et al. Receding horizon optimization method for solving the cops and robbers problems in a complex environment with obstacles: categories (2),(5)
CN115542746B (zh) 高超声速飞行器的能量管控再入制导方法及装置
CN116820129A (zh) 一种基于自主协同机制的无人机集群编队方法及系统
Liu et al. A Gaussian-Process-Based Model Predictive Control Approach for Trajectory Tracking and Obstacle Avoidance in Autonomous Underwater Vehicles
Dai et al. Distributed Time-Varying Nash Equilibrium Seeking Algorithm for Target Protection of MultiUSVs With Conflicting Goals
Li et al. UAV-USV cooperative tracking based on MPC
CN113689501A (zh) 一种基于收敛点的双机协同目标机定位跟踪控制方法
CN118707962B (zh) 智能体网络的编队控制方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant