CN115421517A - 一种基于路径规划的无人机控制方法及系统 - Google Patents

一种基于路径规划的无人机控制方法及系统 Download PDF

Info

Publication number
CN115421517A
CN115421517A CN202211168019.8A CN202211168019A CN115421517A CN 115421517 A CN115421517 A CN 115421517A CN 202211168019 A CN202211168019 A CN 202211168019A CN 115421517 A CN115421517 A CN 115421517A
Authority
CN
China
Prior art keywords
unmanned aerial
aerial vehicle
path planning
state
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211168019.8A
Other languages
English (en)
Inventor
杨航
吴碧
王骁飞
轩永波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
93236 Troops Of Chinese Pla
Original Assignee
93236 Troops Of Chinese Pla
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 93236 Troops Of Chinese Pla filed Critical 93236 Troops Of Chinese Pla
Priority to CN202211168019.8A priority Critical patent/CN115421517A/zh
Publication of CN115421517A publication Critical patent/CN115421517A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明公开了一种基于路径规划的无人机控制方法及系统,属于无人机控制领域,所述的基于路径规划的无人机控制方法包括以下步骤:步骤1、建立无人机控制模型;步骤2、建立无人机路径规划算法;步骤3、对无人机路径规划算法进行优化。本发明基于信号接收强度的路径规划方法,在结合玻尔兹曼概率选择策略指导无人机自动进行路径规划,同时根据无人机飞行环境的特点,引入“导向强化”原则强化学习Q‑Learning算法的学习概率,提高了无人机路径规划的收敛速度,大大减少了控制方法的迭代次数。

Description

一种基于路径规划的无人机控制方法及系统
技术领域
本发明属于无人机控制领域,更具体的说涉及一种基于路径规划的无人机控制方法及系统。
背景技术
无人机作为一种新型的智能载体,具有机动性高、灵活性强、结构简单、造价低、隐蔽性强和安全性高等优势,在地质气象观测、快递运输等民用领域发挥了重要作用,同时也被广泛应用于军事领域中执行监视、侦察、追踪等任务。路径规划是指在有障碍物的环境中,根据最短路径和最短规划时间等评估标准,找到一条从初始位置到目标位置的最优/较优的无碰撞路径。无人机应用场景一般地域广阔、环境复杂,如何快速准确地规划出一条安全、快捷的路径,是无人机应用的重要研究方向。
现有的无人机路径规划算法都存在着容易陷入局部最优、收敛速度慢等问题。导致无人机的实时路径规划速度较慢。在军事领域这种需要对路径规划进行快速计算的情况下,会导致无人机的反应变得迟钝。
发明内容
本发明基于信号接收强度的路径规划方法,在结合玻尔兹曼概率选择策略指导无人机自动进行路径规划,同时根据无人机飞行环境的特点,引入“导向强化”原则强化学习Q-Learning算法的学习概率,提高了无人机路径规划的收敛速度,大大减少了控制方法的迭代次数,提高了无人机实时路径规划的效率。
为了实现上述目的,本发明是采用以下技术方案实现的:所述的基于路径规划的无人机控制方法包括以下步骤:
步骤1、建立无人机控制模型;建立基于无人机接收目标信号强度的模型,并建立基于玻尔兹曼概率选择的无人机飞行动作选择模型;
步骤2、建立无人机路径规划算法;建立基于Q-Learning算法的无人机路径规划算法;
步骤3、对无人机路径规划算法进行优化;基于强化导向原则,对步骤2所建立的无人机路径规划算法进行优化。
进一步地,所述的步骤1、建立无人机控制模型;详细步骤如下:
步骤1.1、建立基于无人机接收目标信号强度的模型;建立基于传输链路为视距传输模型LOS还是非视距传输模型NOLS的无人机Ui与可疑信号源D之间路径损耗模型:
Figure BDA0003862213350000021
其中、
Figure BDA0003862213350000022
fc为载波中心频率,c为光速,
Figure BDA0003862213350000023
为无人机Ui与可疑信号源D之间的距离;ηLoS和ηNLoS为由视距链路和非视距链路决定的衰减因子;
LOS的概率由无人机与信号源之间的环境所决定,可表示为
Figure BDA0003862213350000024
式中:B和C为由环境(乡村、城市等)所决定的参数,为常数,
Figure BDA0003862213350000025
为仰角,知道LOS的概率时,NLOS的概率为
Figure BDA0003862213350000026
由此可得,无人机Ui与可疑信号源D之间路径损耗为;
Figure BDA0003862213350000027
假设无人机和信号源的天线都是全向天线,基于以上的信道模型,无人机Ui接收到信号源D的信号强度RSS可以表示为:
Figure BDA0003862213350000028
其中、
Figure BDA0003862213350000029
为接收到的信号强度,
Figure BDA00038622133500000210
为信号源发射功率,
Figure BDA0003862213350000031
为无人机u(xi,yi,h)信道增益;σ2为噪声功率;
步骤1.2、建立基于玻尔兹曼概率选择的无人机飞行动作选择模型;
假设无人机所处的状态为s,此时的动作空间为A={a1,a2,…,aK},k=1,2,…,K,玻尔兹曼概率选择公式为:
Figure BDA0003862213350000032
其中、
Figure BDA0003862213350000033
表示无人机处于状态s时选择动作aK∈A;的概率,κB≥0为玻尔兹曼常数,T为温度,Z(T)为概率分布的标准化因子:
Figure BDA0003862213350000034
根据上述的动作选择概率公式(6),无人机在状态s转移到下一个状态s′的概率可表示为:
Figure BDA0003862213350000035
假设在状态s执行某个动作aK后,依概率1转移到状态s′,执行其他动作时,依概率0转移到状态s′,即:
Figure BDA0003862213350000036
则,状态s到状态s′的转移概率可简化为:
Figure BDA0003862213350000039
进一步地,所述的步骤2、建立无人机路径规划算法;建立基于Q-Learning算法的无人机路径规划算法;
无人机Ui在状态s获得的信号强度
Figure BDA0003862213350000037
D(s)小于在下一个状态s′所获得的信号强度
Figure BDA0003862213350000038
D(S′)假设无人机Ui在状态s实施动作aK后到达状态s′,则说明无人机的飞行方向趋向目标信号源,且如果
Figure BDA0003862213350000041
越大,说明动作aK方向与目标信号源方向的偏离角越小,故将回报函数定义为
Figure BDA0003862213350000042
式中:α为信号强度差系数,α越大,信号强度差在回报函数中占得比重就越大。
进一步地,所述的步骤3、对无人机路径规划算法进行优化;基于强化导向原则,对步骤2所建立的无人机路径规划算法进行优化;
在标准Q-Learning算法的基础上,可以通过方向信息对于无人机动作选择进行优化,称之为具有“导向强化”原则,动作的选择由Q值表决定,方向信息对下一个动作的影响可表示为:
Figure BDA0003862213350000043
式中:aK为无人机Ui在状态s时执行的特定动作,ai∈A为无人机Ui在状态s′时可选择执行的任意动作;ρ∈[0,1]为折扣因子,控制前一步的方向信息对后一步动作的影响的大小,其值越大,方向的导向性越强。
另一方面、所述的无人机控制系统包括:
目标信号接收模块:用于接收目标发射出的信号;
远程控制信号收发模块:用于接收远程后台传输来的手动控制信息,以及将无人机的飞行状态和飞行参数实时的传输到远程控制台;
红外模块:用于对地进行红外特征扫描,得到目标和飞行过程中的红外参数,用于判断目标的红外特征提供依据;
数据处理模块:用于通过路径规划算法,对接收到的目标信号强度进行解析,和计算出无人机控制参数;
执行机构:用于执行数据处理模块传输来的控制参数,对无人机的飞行方向进行控制。
本发明有益效果:
本发明基于信号接收强度的路径规划方法,在结合玻尔兹曼概率选择策略指导无人机自动进行路径规划,同时根据无人机飞行环境的特点,引入“导向强化”原则强化学习Q-Learning算法的学习概率,提高了无人机路径规划的收敛速度,大大减少了控制方法的迭代次数,提高了无人机实时路径规划的效率。
附图说明
图1为本发明实施例控制流程图;
图2为本发明实施例导向Q-Learning算法流程;
图3为本发明实施例基于接收信号强度算法的路径轨迹;
图4为本发明实施例基于位置距离算法的路径轨迹;
图5为本发明实施例多障碍基于接收信号强度算法的路径轨迹;
图6为本发明实施例两种算法收敛过程图。
具体实施方式
以下将以附图公开本公开的实施方式,为明确说明起见,许多实务上的细节将在以下叙述中一并说明。然而,应了解到,这些实务上的细节不应用以限制本公开。也就是说,在本公开内容部分实施方式中,这些实务上的细节是非必要的。此外,为简化附图起见,一些现有惯用的结构与元件在附图中将以简单示意的方式示出的。
如图1所示,所述的基于路径规划的无人机控制方法包括以下步骤:
步骤1、建立无人机控制模型;建立基于无人机接收目标信号强度的模型,并建立基于玻尔兹曼概率选择的无人机飞行动作选择模型。
所述的步骤1、建立无人机控制模型;详细步骤如下:
步骤1.1、建立基于无人机接收目标信号强度的模型;建立基于传输链路为视距传输模型LOS还是非视距传输模型NOLS的无人机Ui与可疑信号源D之间路径损耗模型:
Figure BDA0003862213350000051
其中、
Figure BDA0003862213350000052
fc为载波中心频率,c为光速,
Figure BDA0003862213350000061
为无人机Ui与可疑信号源D之间的距离;ηLoS和ηNLoS为由视距链路和非视距链路决定的衰减因子;
LOS的概率由无人机与信号源之间的环境所决定,可表示为
Figure BDA0003862213350000062
式中:B和C为由环境(乡村、城市等)所决定的参数,为常数,
Figure BDA0003862213350000063
为仰角,知道LOS的概率时,NLOS的概率为
Figure BDA0003862213350000064
由此可得,无人机Ui与可疑信号源D之间路径损耗为;
Figure BDA0003862213350000065
假设无人机和信号源的天线都是全向天线,基于以上的信道模型,无人机Ui接收到信号源D的信号强度RSS可以表示为:
Figure BDA0003862213350000066
其中、
Figure BDA0003862213350000067
为接收到的信号强度,
Figure BDA0003862213350000068
为信号源发射功率,
Figure BDA0003862213350000069
为无人机u(xi,yi,h)信道增益;σ2为噪声功率;
步骤1.2、建立基于玻尔兹曼概率选择的无人机飞行动作选择模型;
假设无人机所处的状态为s,此时的动作空间为A={a1,a2,…,aK},k=1,2,…,K,玻尔兹曼概率选择公式为:
Figure BDA00038622133500000610
其中、
Figure BDA00038622133500000611
表示无人机处于状态s时选择动作aK∈A;的概率,κB≥0为玻尔兹曼常数,T为温度,Z(T)为概率分布的标准化因子:
Figure BDA0003862213350000071
根据上述的动作选择概率公式(6),无人机在状态s转移到下一个状态s′的概率可表示为:
Figure BDA0003862213350000072
假设在状态s执行某个动作aK后,依概率1转移到状态s′,执行其他动作时,依概率0转移到状态s′,即:
Figure BDA0003862213350000073
则,状态s到状态s′的转移概率可简化为:
Figure BDA0003862213350000078
步骤2、建立无人机路径规划算法;建立基于Q-Learning算法的无人机路径规划算法。
所述的步骤2、建立无人机路径规划算法;建立基于Q-Learning算法的无人机路径规划算法;
无人机Ui在状态s获得的信号强度
Figure BDA0003862213350000074
D(s)小于在下一个状态s′所获得的信号强度
Figure BDA0003862213350000075
D(S′)假设无人机Ui在状态s实施动作aK后到达状态s′,则说明无人机的飞行方向趋向目标信号源,且如果
Figure BDA0003862213350000076
越大,说明动作aK方向与目标信号源方向的偏离角越小,故将回报函数定义为
Figure BDA0003862213350000077
式中:α为信号强度差系数,α越大,信号强度差在回报函数中占得比重就越大。
步骤3、对无人机路径规划算法进行优化;基于强化导向原则,对步骤2所建立的无人机路径规划算法进行优化。
所述的步骤3、对无人机路径规划算法进行优化;基于强化导向原则,对步骤2所建立的无人机路径规划算法进行优化;
在标准Q-Learning算法的基础上,可以通过方向信息对于无人机动作选择进行优化,称之为具有“导向强化”原则,动作的选择由Q值表决定,方向信息对下一个动作的影响可表示为:
Figure BDA0003862213350000081
式中:aK为无人机Ui在状态s时执行的特定动作,ai∈A为无人机Ui在状态s′时可选择执行的任意动作;ρ∈[0,1]为折扣因子,控制前一步的方向信息对后一步动作的影响的大小,其值越大,方向的导向性越强。
所述的导向Q-Learning学习算法的主要步骤:
1)对当前环境进行栅格化,确定起始点坐标和目标点坐标,并以目标点为中心建立信号强度场,作为无人机获取接收信号强度来计算回报值。
2)初始化状态值,清空Q函数矩阵和回报矩阵,无人机从起始点开始进行探索并获取信号强度。
3)根据无人机所在状态s位置的Q函数计算各个动作aK的转移概率,并根据概率策略选择动作a。
4)执行动作a飞行至状态s′位置,并获取新的信号强度。通过回报函数计算出回报值,更新状态s下动作a的Q函数,并根据导向强化以折扣因子ρ来更新状态s′对应的Q函数。
5)将当前环境位置更新至状态s′位置,并判断是否为目标位置或达到最大迭代次数,如果不是,则结束本次迭代学习过程,迭代次数+1,继续返回到步骤3),否则到步骤6)。
6)结束该次尝试学习,尝试次数+1,并返回到步骤2),继续进行下一次尝试学习。
7)最后判断是否到达可接受目标参数,或已经达到设定的最大尝试次数,2个条件中只要有一个满足,则结束整个学习过程。
所述的无人机控制系统包括:
目标信号接收模块:用于接收目标发射出的信号;
远程控制信号收发模块:用于接收远程后台传输来的手动控制信息,以及将无人机的飞行状态和飞行参数实时的传输到远程控制台;
红外模块:用于对地进行红外特征扫描,得到目标和飞行过程中的红外参数,用于判断目标的红外特征提供依据;
数据处理模块:用于通过路径规划算法,对接收到的目标信号强度进行解析,和计算出无人机控制参数;
执行机构:用于执行数据处理模块传输来的控制参数,对无人机的飞行方向进行控制。
对比分析:
通过对比基于接收信号强度算法的路径规划和基于位置距离算法的路径规划,来提醒本发明基于接收信号强度算法的路径规划的优势。其中基于接收信号强度算法的路径规划为实验组,基于位置距离算法的路径规划为对照组。
为验证以接收信号强度为回报值的导向强化Q-Learing算法的可行性,假设对照组中的无人机能够获取与目标之间的位置距离并将其作为回报值,其中无人机ui与信号源D之间的位置距离定义为di
Figure BDA0003862213350000091
回报函数定义为R(s,a,s′)=α[di,D(s′)-di,D(s)],
图3为基于接收信号强度的算法产生的路径轨迹,图4为基于位置距离的算法产生的路径轨迹。图5为多障碍基于接收信号强度的算法产生的路径轨迹。如图3~图5所示,在每次尝试中都会对周围的路径进行探索,并根据回报值调整路径,最终寻得目标点,且基于接收信号的算法在多障碍的情况下也能获得较好的路径,如图6所示,基于接收信号强度的算法前期收敛速度较快,在尝试20次左右开始收敛;而基于位置距离的算法在尝试25次左右开始收敛。
由此可见,前者比后者具有更好的收敛性,其最少迭代步数也几乎是相同的,可以说明以接收信号强度为回报值有较好的规划效果。但在研究背景中并无法预知目标的确切位置,即无人机与目标之间的位置距离并不容易获得,因此基于接收信号强度的路径规划可以发挥很好的作用。
1)在目标位置信息未知的情况下,本发明以接收信号强度为回报值,能够迅速准确地规划出飞行路径,与基于位置距离的方法相比,收敛速度更快,表现出了更好的路径规划性能。
2)与传统算法相比,导向强化Q-Learning算法在收敛性、时间复杂度和路径规划上优势明显。从而验证了“导向强化”原则,可以加快算法收敛速度,在无人机飞行路径规划中有较好的适用性。
应当理解,以上借助优选实施例对本发明的技术方案进行的详细说明是示意性的而非限制性的。本领域的普通技术人员在阅读本发明说明书的基础上可以对各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (5)

1.一种基于路径规划的无人机控制方法,其特征在于:所述的基于路径规划的无人机控制方法包括以下步骤:
步骤1、建立无人机控制模型;建立基于无人机接收目标信号强度的模型,并建立基于玻尔兹曼概率选择的无人机飞行动作选择模型;
步骤2、建立无人机路径规划算法;建立基于Q-Learning算法的无人机路径规划算法;
步骤3、对无人机路径规划算法进行优化;基于强化导向原则,对步骤2所建立的无人机路径规划算法进行优化。
2.根据权利要求1所述的一种基于路径规划的无人机控制方法,其特征在于:所述的步骤1、建立无人机控制模型;详细步骤如下:
步骤1.1、建立基于无人机接收目标信号强度的模型;建立基于传输链路为视距传输模型LOS还是非视距传输模型NOLS的无人机Ui与可疑信号源D之间路径损耗模型:
Figure FDA0003862213340000011
其中、
Figure FDA0003862213340000012
fc为载波中心频率,c为光速,
Figure FDA0003862213340000013
为无人机Ui与可疑信号源D之间的距离;ηLoS和ηNLoS为由视距链路和非视距链路决定的衰减因子;
LOS的概率由无人机与信号源之间的环境所决定,可表示为
Figure FDA0003862213340000014
式中:B和C为由环境(乡村、城市等)所决定的参数,为常数,
Figure FDA0003862213340000015
为仰角,知道LOS的概率时,NLOS的概率为
Figure FDA0003862213340000016
由此可得,无人机Ui与可疑信号源D之间路径损耗为;
Figure FDA0003862213340000021
假设无人机和信号源的天线都是全向天线,基于以上的信道模型,无人机Ui接收到信号源D的信号强度RSS可以表示为:
Figure FDA0003862213340000022
其中、
Figure FDA0003862213340000023
为接收到的信号强度,
Figure FDA0003862213340000024
为信号源发射功率,
Figure FDA0003862213340000025
为无人机u(xi,yi,h)信道增益;σ2为噪声功率;
步骤1.2、建立基于玻尔兹曼概率选择的无人机飞行动作选择模型;
假设无人机所处的状态为s,此时的动作空间为A={a1,a2,…,aK},k=1,2,…,K,玻尔兹曼概率选择公式为:
Figure FDA0003862213340000026
其中、
Figure FDA0003862213340000027
表示无人机处于状态s时选择动作aK∈A;的概率,κB≥0为玻尔兹曼常数,T为温度,Z(T)为概率分布的标准化因子:
Figure FDA0003862213340000028
根据上述的动作选择概率公式(6),无人机在状态s转移到下一个状态s′的概率可表示为:
Figure FDA0003862213340000031
假设在状态s执行某个动作aK后,依概率1转移到状态s′,执行其他动作时,依概率0转移到状态s′,即:
Figure FDA0003862213340000032
则,状态s到状态s′的转移概率可简化为:
Figure FDA0003862213340000033
3.根据权利要求1所述的一种基于路径规划的无人机控制方法,其特征在于:所述的步骤2、建立无人机路径规划算法;建立基于Q-Learning算法的无人机路径规划算法;
无人机Ui在状态s获得的信号强度
Figure FDA0003862213340000034
D(s)小于在下一个状态s′所获得的信号强度
Figure FDA0003862213340000035
D(S′)假设无人机Ui在状态s实施动作aK后到达状态s′,则说明无人机的飞行方向趋向目标信号源,且如果
Figure FDA0003862213340000036
越大,说明动作aK方向与目标信号源方向的偏离角越小,故将回报函数定义为
Figure FDA0003862213340000037
式中:α为信号强度差系数,α越大,信号强度差在回报函数中占得比重就越大。
4.根据权利要求1所述的一种基于路径规划的无人机控制方法,其特征在于:所述的步骤3、对无人机路径规划算法进行优化;基于强化导向原则,对步骤2所建立的无人机路径规划算法进行优化;
在标准Q-Learning算法的基础上,可以通过方向信息对于无人机动作选择进行优化,称之为具有“导向强化”原则,动作的选择由Q值表决定,方向信息对下一个动作的影响可表示为:
Figure FDA0003862213340000041
式中:aK为无人机Ui在状态s时执行的特定动作,ai∈A为无人机Ui在状态s′时可选择执行的任意动作;ρ∈[0,1]为折扣因子,控制前一步的方向信息对后一步动作的影响的大小,其值越大,方向的导向性越强。
5.一种基于路径规划的无人机控制系统,该系统适用于一种基于路径规划的无人机控制方法,其特征在于:所述的无人机控制系统包括:
目标信号接收模块:用于接收目标发射出的信号;
远程控制信号收发模块:用于接收远程后台传输来的手动控制信息,以及将无人机的飞行状态和飞行参数实时的传输到远程控制台;
红外模块:用于对地进行红外特征扫描,得到目标和飞行过程中的红外参数,用于判断目标的红外特征提供依据;
数据处理模块:用于通过路径规划算法,对接收到的目标信号强度进行解析,和计算出无人机控制参数;
执行机构:用于执行数据处理模块传输来的控制参数,对无人机的飞行方向进行控制。
CN202211168019.8A 2022-09-23 2022-09-23 一种基于路径规划的无人机控制方法及系统 Pending CN115421517A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211168019.8A CN115421517A (zh) 2022-09-23 2022-09-23 一种基于路径规划的无人机控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211168019.8A CN115421517A (zh) 2022-09-23 2022-09-23 一种基于路径规划的无人机控制方法及系统

Publications (1)

Publication Number Publication Date
CN115421517A true CN115421517A (zh) 2022-12-02

Family

ID=84204063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211168019.8A Pending CN115421517A (zh) 2022-09-23 2022-09-23 一种基于路径规划的无人机控制方法及系统

Country Status (1)

Country Link
CN (1) CN115421517A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116106824A (zh) * 2023-01-06 2023-05-12 南京航空航天大学 一种基于认知学习的无人机多阶段信号源定位方法和系统
CN117151425A (zh) * 2023-10-20 2023-12-01 暨南大学 一种基于rql算法的选择拆卸规划方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108387866A (zh) * 2018-01-16 2018-08-10 南京航空航天大学 一种基于强化学习的无人机查找非法广播电台方法
CN109655066A (zh) * 2019-01-25 2019-04-19 南京邮电大学 一种基于Q(λ)算法的无人机路径规划方法
CN112068590A (zh) * 2020-08-21 2020-12-11 广东工业大学 无人机基站飞行规划方法、系统、储存介质及无人机基站
US20210103286A1 (en) * 2019-10-04 2021-04-08 Hong Kong Applied Science And Technology Research Institute Co., Ltd. Systems and methods for adaptive path planning
CN112712193A (zh) * 2020-12-02 2021-04-27 南京航空航天大学 基于改进Q-Learning的多无人机局部航路规划方法及装置
CN113206701A (zh) * 2021-04-30 2021-08-03 重庆大学 一种无人机飞行基站的三维部署和功率分配联合优化方法
CN114237277A (zh) * 2021-11-09 2022-03-25 国网江苏省电力有限公司盐城供电分公司 一种基于毫米波雷达和近电感应的无人机避障系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108387866A (zh) * 2018-01-16 2018-08-10 南京航空航天大学 一种基于强化学习的无人机查找非法广播电台方法
CN109655066A (zh) * 2019-01-25 2019-04-19 南京邮电大学 一种基于Q(λ)算法的无人机路径规划方法
US20210103286A1 (en) * 2019-10-04 2021-04-08 Hong Kong Applied Science And Technology Research Institute Co., Ltd. Systems and methods for adaptive path planning
CN112068590A (zh) * 2020-08-21 2020-12-11 广东工业大学 无人机基站飞行规划方法、系统、储存介质及无人机基站
CN112712193A (zh) * 2020-12-02 2021-04-27 南京航空航天大学 基于改进Q-Learning的多无人机局部航路规划方法及装置
CN113206701A (zh) * 2021-04-30 2021-08-03 重庆大学 一种无人机飞行基站的三维部署和功率分配联合优化方法
CN114237277A (zh) * 2021-11-09 2022-03-25 国网江苏省电力有限公司盐城供电分公司 一种基于毫米波雷达和近电感应的无人机避障系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周彬 等: "基于导向强化Q学习的无人机路径规划", 航空学报, vol. 42, no. 9, 25 September 2021 (2021-09-25), pages 506 - 513 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116106824A (zh) * 2023-01-06 2023-05-12 南京航空航天大学 一种基于认知学习的无人机多阶段信号源定位方法和系统
CN116106824B (zh) * 2023-01-06 2023-11-03 南京航空航天大学 一种基于认知学习的无人机多阶段信号源定位方法和系统
CN117151425A (zh) * 2023-10-20 2023-12-01 暨南大学 一种基于rql算法的选择拆卸规划方法及系统
CN117151425B (zh) * 2023-10-20 2024-04-26 暨南大学 一种基于rql算法的选择拆卸规划方法及系统

Similar Documents

Publication Publication Date Title
CN115421517A (zh) 一种基于路径规划的无人机控制方法及系统
Nie et al. Energy-efficient UAV trajectory design for backscatter communication: A deep reinforcement learning approach
CN113259836A (zh) 一种irs辅助无人机通信网络联合优化方法
CN112363539B (zh) 多无人机协同目标搜索方法
CN112902969A (zh) 一种无人机在数据收集过程中的路径规划方法
CN114624645B (zh) 一种基于微型天线阵列的小型旋翼无人机雷达侦察系统
CN113885566B (zh) 面向多无人机数据采集时间最小化的v型轨迹规划方法
CN115826601A (zh) 基于逆向强化学习的无人机路径规划方法
US6771608B2 (en) Link tracking with a phased array antenna in a TDMA network
CN109657928B (zh) 一种车载传感器系统的闭环协同调度框架的协同调度方法
CN115435787B (zh) 一种基于改进蝴蝶算法的无人机三维路径规划方法及系统
CN114879745B (zh) 基于预规划和禁忌搜索算法的多无人机协同任务规划方法
CN117425220A (zh) 一种无人机通信感知一体化系统的优化方法
CN116593962A (zh) 一种基于在线无人机航迹规划的辐射源定位方法
Zou et al. Vision-assisted 3-D predictive beamforming for green UAV-to-vehicle communications
CN114281101B (zh) 一种基于强化学习的无人机与云台干扰源联合搜索方法
CN117709678A (zh) 基于多智能体强化学习的多机协同雷达搜索资源优化方法
CN113093171A (zh) 基于目标跟踪的机载雷达路径与辐射资源联合优化方法
CN114337875B (zh) 面向多辐射源追踪的无人机群飞行轨迹优化方法
CN116430870A (zh) 一种基于蚁群优化的多无人艇目标搜索算法
CN116048126A (zh) 一种基于abc快速收敛的无人机实时路径规划方法
Gao et al. Multi-agent reinforcement learning for UAVs 3D trajectory designing and mobile ground users scheduling with no-fly zones
CN113052312A (zh) 深度强化学习模型的训练方法、装置、介质及电子设备
CN114613037B (zh) 一种机载融合信息引导传感器提示搜索方法及装置
Yan et al. Beijing Blue Sky Innovation Center for Frontier Science, Beijing 100085, China yanghangnudt@ 163. com

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination