CN111431644B - 面向频谱认知的无人机路径自主规划装置及方法 - Google Patents

面向频谱认知的无人机路径自主规划装置及方法 Download PDF

Info

Publication number
CN111431644B
CN111431644B CN202010213159.7A CN202010213159A CN111431644B CN 111431644 B CN111431644 B CN 111431644B CN 202010213159 A CN202010213159 A CN 202010213159A CN 111431644 B CN111431644 B CN 111431644B
Authority
CN
China
Prior art keywords
unmanned aerial
aerial vehicle
state
action
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010213159.7A
Other languages
English (en)
Other versions
CN111431644A (zh
Inventor
刘�东
黄洋
朱秋明
吴启晖
仲伟志
胡田钰
吴光宇
成能
杜孝夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202010213159.7A priority Critical patent/CN111431644B/zh
Publication of CN111431644A publication Critical patent/CN111431644A/zh
Application granted granted Critical
Publication of CN111431644B publication Critical patent/CN111431644B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/30Monitoring; Testing of propagation channels
    • H04B17/382Monitoring; Testing of propagation channels for resource allocation, admission control or handover
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S11/00Systems for determining distance or velocity not using reflection or reradiation
    • G01S11/02Systems for determining distance or velocity not using reflection or reradiation using radio waves
    • G01S11/06Systems for determining distance or velocity not using reflection or reradiation using radio waves using intensity measurements
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft

Abstract

本发明公开了一种面向频谱认知的无人机路径自主规划装置及方法,其中装置包括无人机平台单元以及状态信息认知单元,所述无人机平台单元包括状态信息获取模块、飞行路径控制模块和机载数据链收发模块,所述状态信息认知单元包括地面接收模块和中央处理器模块,所述无人机平台单元中的机载数据链收发模块分别和无人机平台单元的状态信息获取模块、飞行路径控制模块相连接通信,状态信息认知单元中地面接收模块和中央处理器模块相连接通信。本发明面向频谱认知的无人机路径自主规划装置及方法,可以实现高动态变化环境下,面向频谱认知的无人机路径自主规划。

Description

面向频谱认知的无人机路径自主规划装置及方法
技术领域:
本发明涉及面向频谱认知的无人机路径自主规划装置及方法,其属于无人机技术领域。
背景技术:
频谱认知是为天地一体频谱资源共享、无线电秩序管理与频谱作战服务,其任务往往是预先无法确定的,其所处环境往往是高动态变化的,例如微弱信号源的探测、方向性信号角度域方向性的描绘、三维立体空间频谱态势测绘等频谱认知任务。如何提高任务完成的效率及精度,如何以最优的方式执行频谱认知的无人机路径自主规划策略,并具有快速而有效地自主规划能力,对于实现频谱认知任务至关重要。
无人机路径自主规划是无人机任务规划的重要组成部分,是实现无人机自主执行任务的重要阶段。当前无人机路径自主规划能力能够适应相对结构化任务环境的要求,但距离解决动态、不确定环境下的路径自主规划问题尚有很大的差距。因此,设计一款可以实现面向频谱认知任务的,其所处环境高动态变化下的无人机飞行路径快速、有效地自主规划的方法及装置是十分必要的。
发明内容:
本发明是为了解决上述现有技术存在的问题而提供一种面向频谱认知的无人机路径自主规划装置及方法,实现了任务预先无法确定的,其所处的是高动态变化的环境下的无人机飞行动作的自主决策选择,进而对其路径自主规划。
本发明采用如下技术方案:一种面向频谱认知的无人机路径自主规划装置,包括无人机平台单元以及状态信息认知单元,所述无人机平台单元包括状态信息获取模块、飞行路径控制模块和机载数据链收发模块,所述状态信息认知单元包括地面接收模块和中央处理器模块,所述无人机平台单元中的机载数据链收发模块分别和无人机平台单元的状态信息获取模块、飞行路径控制模块相连接通信,状态信息认知单元中地面接收模块和中央处理器模块相连接通信;
所述无人机平台单元中的状态信息获取模块获取当前无人机位置每一方向上的频谱认知任务状态信息,所述飞行路径控制模块接收从无人机平台单元的机载数据链收发模块反馈的无人机飞行路径控制信息,控制无人机实时的飞行路径,机载数据链收发模块接收状态信息认知单元发送的无人机飞行动作决策指令信息,机载数据链收发模块向地面接收模块发送无人机平台单元的状态信息获取模块获取的状态信息;
所述地面接收模块接收无人机平台单元的机载数据链收发模块发射的无人机飞行位置每一方向上的频谱认知任务状态信息,并将其传递给状态信息认知单元的中央处理器模块,所述状态信息认知单元的中央处理器模块选择调用算法程序模块,所述中央处理器模块进行路径自主规划决策并向无人机平台单元的机载数据链收发模块发送无人机飞行动作决策指令信息。
2.一种面向频谱认知的无人机路径自主规划方法,步骤如下:
第一步:测量前检查装置同步校准设备,检查各模块之间线缆连接是否正常,初始化系统各模块设置,根据当前执行的频谱认知任务,状态信息认知单元的中央处理器模块选择调用算法程序模块;
第二步:无人机飞行动作记为ak,其中ak为定义为多方向的某一方向上飞行一定距离,所有的动作组成了此次频谱认知任务中的无人机飞行动作集合A,控制无人机处于设定的高度,在悬停位置旋转多个方向或者利用天线阵列通过控制接收波束成型测量多个方向的信号,无人机平台单元的状态信息获取模块完成当前无人机飞行位置每一方向上的频谱认知任务状态信息的获取,并将获取的频谱认知任务状态信息传递给无人机平台单元的机载数据链收发模块,机载数据链收发模块发送频谱认知任务状态信息数据给状态信息认知单元的地面接收模块接收,地面接收模块传输频谱认知任务状态信息数据给中央处理器模块;
第三步,在中央处理器模块中,基于从地面接收模块收到的当前无人机飞行位置每一个方向上的频谱认知任务状态信息得到对应方向上的状态和对应方向上的奖励回报值,状态记为sk,奖励回报值记为rk,通过相邻时刻获取的微弱信号源强度信息的变化来设置rk,满足以上要求的rk以下方式:
rk为当前无人机在该时刻执行动作获得的微弱信号源强度和上一时刻获得的微弱信号源强度的差值,即rk=Pr(k)-Pr(k-1),记长期累加回报奖励值折扣因子为γ(γ∈[0,1]);
定义每个无人机状态和无人机飞行动作组成一个状态—动作对(s,a),记Q为状态—动作对所映射的值,状态—动作对与该值构成值函数Q(s,a),表示指定状态—动作对的累积奖赏回报值,则基于动作集、状态集组成了一张表格记作Q值表,初始化时置零,通过每次执行无人机飞行动作后状态的变化及得到的奖励回报值来不断更新Q值表,然后基于Q值表和当前无人机状态决策出下一时刻的无人机飞行动作;
以上更新Q值表的过程,描述如下:执行当前动作ak后的奖励回报值rk加上执行当前动作后的无人机飞行状态sk+1对应Q值表中的最大值φ的γ倍,γ为长期累加回报奖励值折扣因子减去无人机当前对应的状态记为sk和无人机当前执行的动作记为ak对应的Q值表中的Q值Q(sk,ak)得到结果的α倍再加上无人机当前对应的状态记为sk和无人机当前执行的动作记为ak对应的Q值表中的Q值Q(sk,ak),其结果为在此迭代过程中的新的Q值Q(sk,ak);
则Q值表的更新过程概述以下公式:
Q(sk,ak)=α(rk+γφ-Q(sk,ak))+Q(sk,ak)
其中,执行飞行动作ak后,在k+1时刻无人机飞行状态到达sk+1状态,φ为sk+1状态下所有飞行动作里的对应的最大Q值;
第四步,状态信息认知单元的中央处理器模块中的无人机飞行动作决策部分基于ε-greedy动作选择策略,来决策出无人机下一时刻的飞行动作,接着中央处理器模块向无人机平台单元的机载数据链收发模块发出的无人机飞行动作决策指令信息;
第五步,状态信息认知单元的中央处理器模块发出的无人机飞行动作决策指令信息由无人机平台单元的机载数据链收发模块的接收,然后反馈给无人机平台单元的飞行路径控制模块,飞行路径控制模块根据收到的无人机飞行动作决策指令信息执行下一时刻无人机的飞行动作;
第六步,若没有达到预先设定的频谱认知任务完成的条件,则返回第二步继续迭代执行高动态环境下的频谱认知任务。若达到了预先设定的频谱认知任务完成的条件,则结束任务。
本发明具有如下有益效果:
1)本发明面向频谱认知的无人机路径自主规划装置及方法,可以实现高动态变化环境下,面向频谱认知的无人机路径自主规划。
2)本发明面向频谱认知的无人机路径自主规划装置及方法,通过实时的对当前无人机飞行位置每一方向(此方向为无人机自身旋转的方向或天线阵列中接收波束成型的方向)上的频谱认知任务状态信息,进一步对信息的评估与分析,然后根据面向频谱认知的路径自主规划决策机制决策选择下一时刻将要执行的飞行动作,该方法不依赖于环境的模型,也不需要环境的先验信息知识,适用于动态未知环境中面向频谱认知的无人机路径自主规划。
附图说明:
图1是本发明面向频谱认知的无人机路径自主规划装置的结构示意图。
图2是本发明面向频谱认知的无人机路径自主规划方法的流程图。
图3是图2中状态信息认知单元的中央处理器模块的决策机制采用的算法模块流程图。
具体实施方式:
下面结合附图对本发明作进一步的说明。
如图1所示,本发明面向频谱认知的无人机路径自主规划装置包括无人机平台单元1-1以及状态信息认知单元1-2。其中无人机平台单元1-1包括状态信息获取模块1-4、飞行路径控制模块1-3和机载数据链收发模块1-5;状态信息认知单元1-2包括地面接收模块1-6和中央处理器模块1-7。无人机平台单元1-1中的机载数据链收发模块1-5分别和无人机平台单元1-1的状态信息获取模块1-4、飞行路径控制模块1-3相连接通信,状态信息认知单元1-2中地面接收模块1-6和中央处理器模块1-7相连接通信。
其中无人机平台单元1-1控制无人机处于设定的高度,在悬停位置旋转多个方向或者利用天线阵列通过控制接收波束成型测量多个方向的信号(与设定动作集中方向数保持一致),状态信息获取模块1-4获取当前无人机位置每一方向上的频谱认知任务状态信息;飞行路径控制模块1-3接收从无人机平台单元1-1的机载数据链收发模块1-5反馈的无人机飞行路径控制信息,控制无人机实时的飞行路径;机载数据链收发模块1-5接收状态信息认知单元1-2发送的无人机飞行动作决策指令信息,也承担着向地面接收模块1-6发送无人机平台单元1-1的状态信息获取模块获取的状态信息。
地面接收模块1-6负责接收无人机平台单元1-1的机载数据链收发模块1-5发射的无人机飞行位置每一方向上的频谱认知任务状态信息,并将其传递给状态信息认知单元1-2的中央处理器模块1-7。中央处理器模块1-7具备无人机路径自主规划功能,可根据当前执行的频谱认知任务,状态信息认知单元1-2的中央处理器模块1-7选择调用本发明中的算法程序模块。中央处理器模块1-7具有面向不同的频谱认知任务的无人机路径自主规划决策功能,进行路径自主规划决策并向无人机平台单元1-1的机载数据链收发模块1-5发送无人机飞行动作决策指令信息。
为使本发明的目的、技术方案和优点更加清楚,结合图2、图3及两个具体实施例对本发明的面向频谱认知的无人机路径自主规划方法实施过程作进一步的详细说明。
实施例一
本实施例以无人机执行微弱信号源探测的频谱认知任务为例,其实施的方法步骤如下:
第一步,测量前检查系统同步校准设备,检查各模块之间线缆连接是否正常,初始化系统各模块设置,根据当前执行的频谱认知任务,状态信息认知单元1-2的中央处理器模块1-7选择调用本发明中的算法程序模块。
第二步,无人机飞行动作记为ak,其中ak为定义为多方向的某一方向上飞行一定距离(“多方向”:为对应角域上均匀分布的多个方向;“飞行一定距离”:该距离可初始设置不同参数),所有的动作组成了此次微弱信号源探测的频谱认知任务中的无人机飞行动作集合A。
控制无人机处于设定的高度,在悬停位置旋转多个方向或者利用天线阵列通过控制接收波束成型测量多个方向的信号(与设定动作集中方向数保持一致),无人机平台单元1-1的状态信息获取模块1-4完成当前无人机飞行位置每一方向上的微弱信号源探测的频谱认知任务状态信息,此处状态信息为每一方向所获取的微弱信号强度得到的平均值记为Pr,基于每一方向所获取的微弱信号强度得到的平均值得到对应的状态s,状态集可根据划分的获取微弱信号强度范围设定,记每一方向所获取的微弱信号强度得到的平均值为Pr(dB),则无人机状态和Pr对应关系可采用(且不限于)以下方式:
state P<sub>r</sub>(dB)
s=1 P<sub>r</sub>>-10
s=2 -20≤P<sub>r</sub>≤-10
s=3 -30≤P<sub>r</sub>≤-20
s=4 -40≤P<sub>r</sub>≤-30
s=5 -50≤P<sub>r</sub>≤-40
s=6 -60≤P<sub>r</sub>≤-50
s=7 -70≤P<sub>r</sub>≤-60
s=8 -80≤P<sub>r</sub>≤-70
s=9 -90≤P<sub>r</sub>≤-80
s=10 P<sub>r</sub><-90
即所有无人机状态组成状态集S∈{1,2,3,4,5,6,7,8,9,10}。
状态信息获取模块1-4将其获取的微弱信号强度信息传递给无人机平台单元1-1的机载数据链收发模块1-5。机载数据链收发模块1-5发送获取的微弱信号强度信息认知单元1-2的地面接收模块1-6接收,地面接收模块1-6传输获取的微弱信号强度信息给中央处理器模块1-7。
第三步,在中央处理器模块1-7中,基于从地面接收模块1-6收到的当前无人机飞行位置每一个方向上的微弱信号强度信息得到对应方向上的无人机状态和对应方向上的奖励回报值,状态记为sk,奖励回报值记为rk。通过相邻时刻获取的微弱信号源强度信息的变化来设置rk,满足以上要求的rk可采用(且不限于)以下方式:
rk为当前无人机在该时刻执行动作获得的微弱信号源强度和上一时刻获得的微弱信号源强度的差值,即rk=Pr(k)-Pr(k-1)。
记长期累加回报奖励值折扣因子为γ(γ∈[0,1]),记智能决策的学习速率为α(α∈[0,1]),用来控制智能决策的学习速率。
我们定义每个无人机状态和无人机飞行动作组成一个状态—动作对(s,a),记Q为状态—动作对所映射的值,状态—动作对与该值构成值函数Q(s,a),表示指定状态—动作对的累积奖赏回报值。则基于动作集、状态集组成了一张表格记作Q值表(初始化时置零)。通过每次执行无人机飞行动作后状态的变化及得到的奖励回报值来不断更新Q值表,然后基于Q值表和当前无人机状态决策出下一时刻的无人机飞行动作。
以上所述更新Q值表的过程,描述如下:执行当前动作ak后的奖励回报值rk加上执行当前动作后的无人机飞行状态sk+1对应Q值表中的最大值φ的γ倍(γ为长期累加回报奖励值折扣因子)减去无人机当前对应的状态(记为sk)和无人机当前执行的动作(记为ak)对应的Q值表中的Q值Q(sk,ak)得到结果的α倍(学习速率)再加上无人机当前对应的状态(记为sk)和无人机当前执行的动作(记为ak)对应的Q值表中的Q值Q(sk,ak),其结果为在此迭代过程中的新的Q值Q(sk,ak)。
则Q值表的更新过程概述以下公式:
Q(sk,ak)=α(rk+γφ-Q(sk,ak))+Q(sk,ak)
其中,执行飞行动作ak后,在k+1时刻无人机飞行状态到达sk+1状态。φ为sk+1状态下所有飞行动作里的对应的最大Q值。
第四步,状态信息认知单元1-2的中央处理器模块1-7中的无人机飞行动作决策部分基于ε-greedy动作选择策略,来决策出无人机下一时刻的飞行动作。接着中央处理器模块1-7向无人机平台单元1-1的机载数据链收发模块1-4发出的无人机飞行动作决策指令信息。
第五步,状态信息认知单元1-2的中央处理器模块1-7发出的无人机飞行动作决策指令信息由无人机平台单元1-1的机载数据链收发模块1-4的接收,然后反馈给无人机平台单元1-1的飞行路径控制模块1-3,飞行路径控制模块1-3根据收到的无人机飞行动作决策指令信息执行下一时刻无人机的飞行动作。
第六步,若没有达到预先设定的探测微弱信号源任务完成的条件,则返回第二步继续执行高动态环境下的探测微弱信号源任务,经过不断地更新迭代的过程,无人机可以通过其自主规划飞行路径来探测微弱信号源。若达到了预先设定的探测微弱信号源任务完成的条件,则结束任务。
实施例二
本实施以无人机执行方向性信号角度域方向性描绘的频谱认知任务为例,其实施的方法步骤如下:
第一步,测量前检查系统同步校准设备,检查各模块之间线缆连接是否正常,初始化系统各模块设置,根据当前执行的频谱认知任务,状态信息认知单元1-2的中央处理器模块1-7选择调用本发明中的算法程序模块。
第二步,无人机飞行动作记为ak,其中ak为定义为多方向的某一方向上飞行一定距离(“多方向”:为对应角域上均匀分布的多个方向;“飞行一定距离”:该距离可初始设置不同参数),所有的动作组成了此次方向性信号角度域方向性描绘的频谱认知任务中的无人机飞行动作集合A。
控制无人机处于设定的高度,在悬停位置旋转多个方向或者利用天线阵列通过控制接收波束成型测量多个方向的信号(与设定动作集中方向数保持一致),无人机平台单元1-1的状态信息获取模块1-4完成当前无人机飞行位置每一方向上的方向性信号角度域方向性描绘的频谱认知任务状态信息,此处状态信息为每一方向所获取的方向性信号强度得到的平均值记为Pr,基于每一方向所获取的方向性信号强度得到的平均值得到对应的状态s,状态集可根据划分的获取方向性信号强度范围设定,记每一方向所获取的方向性信号强度得到的平均值为Pr(dB),则无人机状态s和Pr对应关系可采用(且不限于)以下方式:
当Pr>P1时:s=1;当P1≤Pr﹤P2时:s=2;当P2≤Pr﹤P3时:s=3;...当Pr<Pn时:s=n;(其中,P1,P2,P3,...,Pn为初始设置的、表示信号强度的常量值。)
即所有无人机状态组成状态集s∈{1,2,3,...,n}。
状态信息获取模块1-4将其获取的方向性信号强度信息传递给无人机平台单元1-1的机载数据链收发模块1-5。机载数据链收发模块1-5发送方向性信号强度信息给状态信息认知单元1-2的地面接收模块接收1-6,地面接收模块1-6传输方向性信号强度信息给中央处理器模块1-7。
第三步,在中央处理器模块1-7中,基于从地面接收模块1-6收到的当前无人机飞行位置每一个方向上的方向性信号强度信息得到对应方向上的状态和对应方向上的奖励回报值,状态记为sk,奖励回报值记为rk(rk的设置描述为,给定一个方向性信号强度参考值为P0,该参考值P0存在一定的误差范围θ。如果无人机获取的方向性信号强度得到的平均值低于该参考值,回报值rk降低;如果高于该参考值,回报值rk也降低。满足以上要求的rk可采用(且不限于)以下方式:
当获取的方向性信号强度得到的平均值为Pr(k)大于等于P0+θ或者小于等于P0+θ时,rk等于ω00为一系数常量)乘以e的二分之Pr(k)减P0的平方次幂。
当获取的方向性信号强度得到的平均值为Pr(k)大于等于P0+θ或者小于等于P0+θ时,rk等于ω00为一系数常量)乘以e的二分之P0平方次幂。
Figure BDA0002423496840000091
记长期累加回报奖励值折扣因子为γ(γ∈[0,1]),记智能决策的学习速率为α(α∈[0,1]),用来控制智能决策的学习速率。
我们定义每个状态和动作组成一个状态—动作对(s,a),记Q为状态—动作对所映射的值,状态—动作对与该值构成值函数Q(s,a),表示指定状态—动作对的累积奖赏回报值。则基于动作集、状态集组成了一张表格记作Q值表(初始化时置零)。通过每次执行无人机飞行动作后状态的变化及得到的奖励回报值来不断更新Q值表,然后基于Q值表和当前无人机状态决策出下一时刻的无人机飞行动作。
以上所述更新Q值表的过程,描述如下:执行当前动作ak后的奖励回报值rk加上执行当前动作后的无人机飞行状态sk+1对应Q值表中的最大值φ的γ倍(γ为长期累加回报奖励值折扣因子)减去无人机当前对应的状态(记为sk)和无人机当前执行的动作(记为ak)对应的Q值表中的Q值Q(sk,ak)得到结果的α倍(学习速率)再加上无人机当前对应的状态(记为sk)和无人机当前执行的动作(记为ak)对应的Q值表中的Q值Q(sk,ak),其结果为在此迭代过程中的新的Q值Q(sk,ak)。
则Q值表的更新过程概述以下公式:
Q(sk,ak)=α(rk+γφ-Q(sk,ak))+Q(sk,ak)
其中,执行飞行动作ak后,在k+1时刻无人机飞行状态到达sk+1状态。φ为sk+1状态下所有飞行动作里的对应的最大Q值。
第四步,状态信息认知单元1-2的中央处理器模块1-7中的无人机飞行动作决策部分基于ε-greedy动作选择策略,来决策出无人机下一时刻的飞行动作。接着中央处理器模块1-7向无人机平台单元1-1的机载数据链收发模块1-4发出的无人机飞行动作决策指令信息。
第五步,状态信息认知单元1-2的中央处理器模块1-7发出的无人机飞行动作决策指令信息由无人机平台单元1-1的机载数据链收发模块1-4的接收,然后反馈给无人机平台单元1-1的飞行路径控制模块1-3,飞行路径控制模块1-3根据收到的无人机飞行动作决策指令信息执行下一时刻无人机的飞行动作。
第六步,若没有达到预先设定的方向性信号角度域方向性描绘的频谱认知任务完成的条件,则返回第二步继续执行高动态环境下的方向性信号角度域方向性描绘的频谱认知任务,经过不断地更新迭代的过程,无人机可以通过其自主规划的飞行轨迹来描绘方向性信号角度域方向性。若达到了预先设定的方向性信号角度域方向性描绘的频谱认知任务完成的条件,则结束任务。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下还可以作出若干改进,这些改进也应视为本发明的保护范围。

Claims (1)

1.一种面向频谱认知的无人机路径自主规划方法,其特征在于:步骤如下:
第一步:测量前检查装置同步校准设备,检查各模块之间线缆连接是否正常,初始化系统各模块设置,根据当前执行的频谱认知任务,状态信息认知单元(1-2)的中央处理器模块(1-7)选择调用算法程序模块;
第二步:无人机飞行动作记为ak,其中ak为定义为多方向的某一方向上飞行一定距离,所有的动作组成了此次频谱认知任务中的无人机飞行动作集合A,控制无人机处于设定的高度,在悬停位置旋转多个方向或者利用天线阵列通过控制接收波束成型测量多个方向的信号,无人机平台单元(1-1)的状态信息获取模块(1-4)完成当前无人机飞行位置每一方向上的频谱认知任务状态信息的获取,并将获取的频谱认知任务状态信息传递给无人机平台单元的机载数据链收发模块(1-5),机载数据链收发模块(1-5)发送频谱认知任务状态信息数据给状态信息认知单元(1-2)的地面接收模块接收(1-6),地面接收模块(1-6)传输频谱认知任务状态信息数据给中央处理器模块(1-7);
第三步,在中央处理器模块(1-7)中,基于从地面接收模块(1-6)收到的当前无人机飞行位置每一个方向上的频谱认知任务状态信息得到对应方向上的状态和对应方向上的奖励回报值,状态记为sk,奖励回报值记为rk,通过相邻时刻获取的微弱信号源强度信息的变化来设置rk,rk满足以下要求:
rk为当前无人机在该时刻执行动作获得的微弱信号源强度和上一时刻获得的微弱信号源强度的差值,即rk=Pr(k)-Pr(k-1),记长期累加回报奖励值折扣因子为γ∈[0,1];
定义每个无人机状态和无人机飞行动作组成一个状态—动作对(s,a),记Q为状态—动作对所映射的值,状态—动作对与该值构成值函数Q(s,a),表示指定状态—动作对的累积奖赏回报值,则基于动作集、状态集组成了一张表格记作Q值表,初始化时置零,通过每次执行无人机飞行动作后状态的变化及得到的奖励回报值来不断更新Q值表,然后基于Q值表和当前无人机状态决策出下一时刻的无人机飞行动作;
以上更新Q值表的过程,描述如下:执行当前动作ak后的奖励回报值rk加上执行当前动作后的无人机飞行状态sk+1对应Q值表中的最大值φ的γ倍,γ为长期累加回报奖励值折扣因子减去无人机当前对应的状态记为sk和无人机当前执行的动作记为ak对应的Q值表中的Q值Q(sk,ak)得到结果的α倍再加上无人机当前对应的状态记为sk和无人机当前执行的动作记为ak对应的Q值表中的Q值Q(sk,ak),其结果为在此迭代过程中的新的Q值Q(sk,ak);
其中,执行飞行动作ak后,在k+1时刻无人机飞行状态到达sk+1状态,φ为sk+1状态下所有飞行动作里的对应的最大Q值;
当执行微弱信号源探测的频谱认知任务时:
无人机状态s和Pr对应关系可采用以下方式:
当Pr>P1时:s=1;当P1≤Pr﹤P2时:s=2;当P2≤Pr﹤P3时:s=3;...当Pr<Pn时:s=n;其中,P1,P2,P3,...,Pn为初始设置的、表示信号强度的常量值
即所有无人机状态组成状态集s∈{1,2,3,...,n};
rk采用以下方式:
当获取的方向性信号强度得到的平均值为Pr(k)大于等于P0+θ或者小于等于P0+θ时,rk等于ω0乘以e的二分之Pr(k)减P0的平方次幂,ω0为一系数常量;
当获取的方向性信号强度得到的平均值为Pr(k)大于等于P0+θ或者小于等于P0+θ时,rk等于ω0乘以e的二分之P0平方次幂;
第四步,状态信息认知单元(1-2)的中央处理器模块(1-7)中的无人机飞行动作决策部分基于ε-greedy动作选择策略,来决策出无人机下一时刻的飞行动作,接着中央处理器模块(1-7)向无人机平台单元(1-1)的机载数据链收发模块(1-4)发出的无人机飞行动作决策指令信息;
第五步,状态信息认知单元(1-2)的中央处理器模块(1-7)发出的无人机飞行动作决策指令信息由无人机平台单元(1-1)的机载数据链收发模块(1-4)的接收,然后反馈给无人机平台单元(1-1)的飞行路径控制模块(1-3),飞行路径控制模块(1-3)根据收到的无人机飞行动作决策指令信息执行下一时刻无人机的飞行动作;
第六步,若没有达到预先设定的频谱认知任务完成的条件,则返回第二步继续迭代执行高动态环境下的频谱认知任务,若达到了预先设定的频谱认知任务完成的条件,则结束任务。
CN202010213159.7A 2020-03-24 2020-03-24 面向频谱认知的无人机路径自主规划装置及方法 Active CN111431644B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010213159.7A CN111431644B (zh) 2020-03-24 2020-03-24 面向频谱认知的无人机路径自主规划装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010213159.7A CN111431644B (zh) 2020-03-24 2020-03-24 面向频谱认知的无人机路径自主规划装置及方法

Publications (2)

Publication Number Publication Date
CN111431644A CN111431644A (zh) 2020-07-17
CN111431644B true CN111431644B (zh) 2022-06-10

Family

ID=71548587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010213159.7A Active CN111431644B (zh) 2020-03-24 2020-03-24 面向频谱认知的无人机路径自主规划装置及方法

Country Status (1)

Country Link
CN (1) CN111431644B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112533221B (zh) * 2020-09-28 2022-03-01 南京航空航天大学 一种联合轨迹规划与频谱决策的无人机抗干扰方法
CN113110541A (zh) * 2021-04-15 2021-07-13 浙江大学 一种基于无人机和移动地面站的无线电频谱监测与定位装置和方法
CN113342030B (zh) * 2021-04-27 2022-07-08 湖南科技大学 基于强化学习的多无人机协同自组织控制方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106595671A (zh) * 2017-02-22 2017-04-26 南方科技大学 一种基于强化学习的无人机路径规划方法和装置
CN108135002A (zh) * 2017-12-22 2018-06-08 南京航空航天大学 一种基于块坐标下降的无人机频谱资源分配方法
US10254499B1 (en) * 2016-08-05 2019-04-09 Southern Methodist University Additive manufacturing of active devices using dielectric, conductive and magnetic materials
CN109614930A (zh) * 2018-12-11 2019-04-12 湖南华诺星空电子技术有限公司 一种基于深度学习的无人机频谱探测方法
KR20190131337A (ko) * 2018-05-16 2019-11-26 한양대학교 산학협력단 인지 무선 통신 기반의 중계 장치 및 이를 포함하는 무인 항공기와, 상기 무인 항공기를 이용한 인지 무선 통신 기반의 중계 방법
CN110830136A (zh) * 2019-11-13 2020-02-21 中国科学技术大学 一种基于无线电地图的无人机轨迹设计和功率分配方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108594851A (zh) * 2015-10-22 2018-09-28 飞智控(天津)科技有限公司 一种基于双目视觉的无人机自主障碍物检测系统、方法及无人机

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10254499B1 (en) * 2016-08-05 2019-04-09 Southern Methodist University Additive manufacturing of active devices using dielectric, conductive and magnetic materials
CN106595671A (zh) * 2017-02-22 2017-04-26 南方科技大学 一种基于强化学习的无人机路径规划方法和装置
CN108135002A (zh) * 2017-12-22 2018-06-08 南京航空航天大学 一种基于块坐标下降的无人机频谱资源分配方法
KR20190131337A (ko) * 2018-05-16 2019-11-26 한양대학교 산학협력단 인지 무선 통신 기반의 중계 장치 및 이를 포함하는 무인 항공기와, 상기 무인 항공기를 이용한 인지 무선 통신 기반의 중계 방법
CN109614930A (zh) * 2018-12-11 2019-04-12 湖南华诺星空电子技术有限公司 一种基于深度学习的无人机频谱探测方法
CN110830136A (zh) * 2019-11-13 2020-02-21 中国科学技术大学 一种基于无线电地图的无人机轨迹设计和功率分配方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A novel 3D non-stationary UAV-MIMO channel model and its statistical properties;Qiuming Zhu 等;《China Communications》;20181228;全文 *
Jamming mitigation in cognitive radio networks using a modified Q-learning algorithm;Feten Slimeni 等;《2015 International Conference on Military Communications and Information Systems (ICMCIS)》;20150716;第1-6页 *
基于强化学习的认知无线网络抗敌意干扰技术研究;韩国安;《中国优秀硕士学位论文全文库》;20190715;全文 *

Also Published As

Publication number Publication date
CN111431644A (zh) 2020-07-17

Similar Documents

Publication Publication Date Title
CN111431644B (zh) 面向频谱认知的无人机路径自主规划装置及方法
CN107656264B (zh) 杂波环境下的机会阵雷达多目标跟踪的功率资源管理方法
US10887029B2 (en) Method and apparatus for analysing communication channel in consideration of material and contours of objects
CN104567860A (zh) 一种机器人自主导航方法、装置及系统
US20200311985A1 (en) Radio coverage map generation
CN113543066B (zh) 感通导指一体化交互与多目标应急组网方法及系统
CN110068803A (zh) 一种雷达设备空中定标试验装置及方法
CN105738887B (zh) 基于多普勒通道划分的机载雷达杂波功率谱的优化方法
CN116405111B (zh) 一种基于深度强化学习的海上无人机辅助光数据收集方法
CN106597369A (zh) 一种无人机的控制方法、控制平台、控制系统
CN112689772A (zh) 标物雷达散射截面积确定方法、装置和存储介质
CN113949439A (zh) 一种面向无人机空对空通信的几何随机信道建模方法
CN111487597B (zh) 一种基于时空频能数据的通用电子侦察截获仿真方法
CN115236611A (zh) 一种针对雷达系统的多干扰机协同压制资源调度方法
US11349583B2 (en) Prorogation environment recognition method and propagation environment recognition apparatus
US20230131879A1 (en) Wireless power transmission condition learning apparatus, wireless power transmission condition determining apparatus, wireless power transmission apparatus, and wireless power receiving apparatus
WO2024012018A1 (zh) 一种太赫兹频谱环境地图构建方法及设备
CN112762935A (zh) 一种基于船体姿态监测的定位方法及系统
WO2021068194A1 (zh) 天线信号处理模型的训练方法、装置、天线及存储介质
CN107276644A (zh) 阵列天线波束赋形方法和系统
CN113207106B (zh) 一种无人机融合控制方法及装置
CN115021800A (zh) 使用无人机查找Ka频段卫星终端的方法、装置和电子设备
WO2021068136A1 (zh) 雷达的抗干扰方法、设备、系统及存储介质
Aksan et al. Channel characterization for aircraft integrated antennas via machine learning
JP2000338238A (ja) レーダ装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant