CN116847460A - 一种无人机辅助的通感一体化系统资源调度方法 - Google Patents
一种无人机辅助的通感一体化系统资源调度方法 Download PDFInfo
- Publication number
- CN116847460A CN116847460A CN202310937887.6A CN202310937887A CN116847460A CN 116847460 A CN116847460 A CN 116847460A CN 202310937887 A CN202310937887 A CN 202310937887A CN 116847460 A CN116847460 A CN 116847460A
- Authority
- CN
- China
- Prior art keywords
- aerial vehicle
- unmanned aerial
- modeling
- representing
- time slot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000004891 communication Methods 0.000 claims abstract description 61
- 230000008447 perception Effects 0.000 claims abstract description 41
- 230000005540 biological transmission Effects 0.000 claims abstract description 34
- 230000006870 function Effects 0.000 claims abstract description 27
- 238000005265 energy consumption Methods 0.000 claims abstract description 25
- 230000009471 action Effects 0.000 claims abstract description 24
- 238000001514 detection method Methods 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 6
- 230000001186 cumulative effect Effects 0.000 claims description 8
- 230000008901 benefit Effects 0.000 claims description 6
- 238000005562 fading Methods 0.000 claims description 3
- 230000006698 induction Effects 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 230000035945 sensitivity Effects 0.000 claims description 3
- 238000005457 optimization Methods 0.000 abstract description 5
- 238000009423 ventilation Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W72/00—Local resource management
- H04W72/04—Wireless resource allocation
- H04W72/044—Wireless resource allocation based on the type of the allocated resource
- H04W72/0446—Resources in time domain, e.g. slots or frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B17/00—Monitoring; Testing
- H04B17/30—Monitoring; Testing of propagation channels
- H04B17/391—Modelling the propagation channel
- H04B17/3912—Simulation models, e.g. distribution of spectral power density or received signal strength indicator [RSSI] for a given geographic region
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B7/00—Radio transmission systems, i.e. using radiation field
- H04B7/14—Relay systems
- H04B7/15—Active relay systems
- H04B7/185—Space-based or airborne stations; Stations for satellite systems
- H04B7/18502—Airborne stations
- H04B7/18506—Communications with or from aircraft, i.e. aeronautical mobile service
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/16—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/02—Arrangements for optimising operational condition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W28/00—Network traffic management; Network resource management
- H04W28/16—Central resource management; Negotiation of resources or communication parameters, e.g. negotiating bandwidth or QoS [Quality of Service]
- H04W28/24—Negotiating SLA [Service Level Agreement]; Negotiating QoS [Quality of Service]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Physics & Mathematics (AREA)
- Aviation & Aerospace Engineering (AREA)
- Astronomy & Astrophysics (AREA)
- Electromagnetism (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明涉及一种无人机辅助的通感一体化系统资源调度方法,属于无线通信技术领域,包括以下步骤:S1:建模无人机辅助的通感一体化系统,由一架无人机、多个地面用户和多个目标组成;S2:建模无人机通信信道模型感知信道模型;S3:建模无人机传输速率及无人机能耗;S4:建模目标感知变量及用户通信调度变量,建模用户队列长度;S5:建模累积目标检测概率;S6:建模系统成本函数;S7:建模无人机通信感知限制条件;S8:建模系统状态、动作和收益函数;S9:建模并训练DDQN网络;S10:基于DDQN网络确定无人机飞行轨迹、通信调度及目标感知策略。本发明提升了系统传输性能优化及用户QoS。
Description
技术领域
本发明属于无线通信技术领域,涉及一种无人机辅助的通感一体化系统资源调度方法。
背景技术
无人机具有机动性强,低成本及易部署等特性,可作为移动基站部署于无线通信系统中,提升用户通信性能。相对于传统静态部署的蜂窝基站而言,移动无人机基站充分利用无人机高机动性特点,通过优化设计无人机的飞行轨迹,有望进一步提升无人机对地通信性能。此外,通过搭载通信及感知设备,无人机可作为融合通信与感知技术的高性能空中平台。然而,在无人机辅助的通感一体化系统中,如何合理优化设计无人机的飞行轨迹,以及通信、感知资源的调度策略,满足用户通信、感知需求,并实现两者之间的性能折中成为极具挑战性的问题。现有研究考虑无人机资源分配与功率控制问题,通过感知数据和用户需求,设计相应的算法和策略,以优化系统传输性能,提升用户的服务质量和公平性。然而,目前工作较少考虑地面用户业务的随机动态,以及用户传输性能与目标感知性能的联合优化。
发明内容
有鉴于此,本发明的目的在于提供一种无人机辅助的通感一体化系统资源调度方法,针对包含一架无人机、M个地面用户和N个目标的无人机通感一体化系统,建模系统奖励为优化目标,联合考虑无人机通信和感知性能,优化设计通信调度及目标感知策略,实现系统传输性能优化及用户QoS提升。
为达到上述目的,本发明提供如下技术方案:
一种无人机辅助的通感一体化系统资源调度方法,包括以下步骤:
S1:建模无人机辅助的通感一体化系统,由一架无人机、多个地面用户和多个目标组成;
S2:建模无人机通信信道模型感知信道模型;
S3:建模无人机传输速率及无人机能耗;
S4:建模目标感知变量及用户通信调度变量,建模用户队列长度;
S5:建模累积目标检测概率;
S6:建模系统成本函数;
S7:建模无人机通信感知限制条件;
S8:建模系统状态、动作和收益函数;
S9:建模并训练DDQN网络;
S10:基于DDQN网络确定无人机飞行轨迹、通信调度及目标感知策略。
进一步,所述建模无人机辅助的通感一体化系统,具体包括:令M表示系统中用户数目,N表示系统中目标数目;将系统时间划分为T个等长的时隙,每个时隙的长度用τ表示;
所述无人机用于执行通信任务,向地面用户传输数据,还用于执行目标感知任务,在一个时隙内发送感知信号,并接收回波信号;
所述无人机采用时分多址机制,在一个时隙内只能选择与一个用户进行通信或执行一个目标感知任务;
所述无人机通过回程网络获取用户数据,并存储在本地队列中,令表示无人机为第m个用户分配的最大队列长度;
所述无人机飞行高度固定为H,飞行速度为ν,令表示第t个时隙无人机的位置,1≤t≤T,令/>表示第m个用户的位置,1≤m≤M,令/>表示第n个目标的位置,1≤n≤N。
进一步,步骤S2中所述建模无人机通信信道模型,具体包括:
第t个时隙无人机与第m个用户之间的通信链路为:
其中表示第t个时隙无人机与第m个用户的距离,建模为:
通信链路中存在存在视距传输LoS和非视距传输NLoS,αe表示路径损失系数,e∈{LoS,NLoS};
第t个时隙无人机与第m个用户之间的平均空对地路径损失为:
其中和/>分别表示第t个时隙无人机与第m个用户之间LoS传输和NLoS传输的概率,/>为:
其中χ和ω是与传播环境相关的常数,表示第t个时隙无人机与第m个用户之间的夹角,建模为:
表示LOS链路的路径损耗,建模为:
其中λL表示LOS链路的路径损耗因子,d0表示自由空间参考距离,fc表示载波频率,c表示光速,表示LOS链路的阴影衰落损耗;/>表示NLOS链路的路径损耗,建模为:
其中λN表示NLOS链路的路径损耗因子,表示NLOS链路的阴影衰落损耗;
步骤S2中所述建模感知信道模型具体包括:
第t个时隙无人机与第n个目标之间的感知链路增益为:
其中表示第t个时隙无人机与第n个目标之间的距离,建模为:
cn建模为:
其中Gt和Gr分别表示发送天线增益和接收天线增益,λ表示机载雷达发送信号波长,μn表示第n个目标的雷达截面积。
进一步,步骤S3中所述建模无人机传输速率及无人机能耗,具体包括:
无人机传输速率:第t个时隙无人机到第m个用户的链路传输速率为:
其中B表示系统带宽,表示第t个时隙无人机传输数据至第m个用户时对应的发送功率,σ2为通信链路噪声功率;
无人机飞行能耗:无人机飞行能耗为:
其中表示第t个时隙无人机飞行能耗,建模为:
表示无人机飞行变量,若第t个时隙无人机处于飞行状态,/>否则,P0和P0′分别表示无人机悬停状态下叶型功率和诱导功率的常数,Utip表示转子叶片的叶尖速度,v0为悬停状态下转子的平均诱导速度,ξd和ξr分别为机身阻力比和转子可靠性,ρa和Sr分别为空气密度和转子盘面积;
无人机悬停能耗:令Eh表示无人机悬停能耗,建模为:
其中表示第t个时隙无人机悬停能耗,建模为:
为无人机悬停变量,若第t个时隙无人机悬停,/>反之,/>
进一步,步骤S4中所述建模目标感知变量及用户通信调度变量,具体包括:
建模目标感知变量:令表示第t个时隙第n个目标的感知变量,/>表示无人机在第t个时隙检测第n个目标,反之,/>1≤n≤N,1≤t≤T;
建模用户通信调度变量:令βm,t表示第t个时隙第m个用户的数据调度变量,βm,t=1表示第t个时隙无人机向第m个用户发送数据,反之,βm,t=0,1≤m≤M,1≤t≤T;
所述建模用户队列长度,具体包括:第t个时隙无人机处第m个用户的队列长度为:
其中Am,t表示第t个时隙无人机接收的第m个用户的数据量。
进一步,步骤S5中所述建模累积目标检测概率,具体包括:前t个时隙第n个目标的累计检测概率为:
其中表示第t个时隙第n个目标的检测概率,建模为:
其中I0(·)是第一类零阶贝塞尔函数,VT为雷达接收机的检测阈值;令pf表示雷达虚警概率,建模为:
表示第t个时隙雷达检测第n个目标的接收功率,建模为:
其中表示第t个时隙雷达的发送功率,Lrt为检测信道损失系数。
进一步,步骤S6中,建模系统成本函数,具体包括:
第t个时隙的系统成本函数,考虑用户队列长度及目标感知性能为:
Ft=θ1Qt-θ2Ψt
其中θ1和θ2为权重因子,Qt表示第t个时隙用户的平均队列长度,建模为:
Ψt表示第t个时隙目标的累积检测概率,建模为:
进一步,步骤S7中,建模无人机通信感知限制条件,具体包括:
(1)建模无人机飞行限制条件,包括:
①
②
(2)建模无人机能量限制条件,包括:
①Ef+Eh≤Emax,其中Emax表示无人机的可用能量;
(3)建模无人机通信限制条件,包括:
②其中Rmin表示用户最小通信速率需求;
(4)建模无人机感知限制条件,包括:
①
②其中/>表示无人机最大感知距离;
③其中Smin表示雷达接收机的最小灵敏度。
进一步,步骤S8中所述建模系统状态、动作和收益函数,具体包括:
系统在第t个时隙的状态为:
其中,表示第t个时隙用户队列集合,Et表示第t个时隙无人机的剩余能量,建模为:
令at表示系统的动作空间,建模为:
其中At表示第t个时隙无人机选择的飞行动作,建模为:
其中d表示无人机移动距离,建模为:
d=vτ
令rt表示无人机在状态st下采取行动at获得的奖励,建模为:
进一步,步骤S9中,建模并训练DDQN网络,具体包括:
初始化Q网络参数θ及目标Q网络参数初始化经验回放缓冲区Z和贪心策略参数ε;初始化系统状态st;将动作施加于系统环境,得到第t个时隙的奖励值rt和第t+1个时隙的状态st+1,并将其存入经验回放缓冲区Z中;从Z中抽取一批样本,确定目标网络中最大Q值所对应的动作,将该动作输入到Q网络中,得到更新后的Q值;
目标网络的输出为:
其中γ为折扣因子,0≤γ≤1;Qθ(st+1,at+1)表示从Z抽取的小批量数据样本中观察状态为st+1时的Q值;
损失函数L(θ)为均方误差,即:
L(θ)=E[(Qθ(st,at)-Y(st,at,st+1))2]
基于损失函数最小化确定参数θ,具体为:
其中α为学习率,α∈[0,1],经过一定次数的迭代,利用更新后的θ替换重复上述过程,直至Q网络参数θ及目标Q网络参数/>均收敛。
本发明的有益效果在于:本发明能够有效保障地面用户业务的随机动态到达的情况下,联合考虑无人机通信和感知性能,基于通信调度及目标感知策略,实现系统传输性能优化及用户QoS提升。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明涉及的无人机辅助的通感一体化系统场景示意图;
图2为本发明无人机辅助的通感一体化系统资源分配方法的流程示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
请参阅图1~图2,图1为本发明采用的无人机辅助的通感一体化系统场景示意图,如图1所示,该通信系统包含一架无人机、M个地面用户和N个目标,通过联合设计通信调度及目标感知策略可实现系统奖励函数最大化。
图2为本发明无人机辅助的通感一体化系统资源分配方法的流程示意图,如图2所示,该方法具体包括以下步骤:
步骤1:无人机辅助的通感一体化系统建模;
无人机辅助的通感一体化系统建模,具体为:系统由一架无人机、多个地面用户和多个目标组成,令M表示系统中用户数目,N表示系统中目标数目;将系统时间划分为T个等长的时隙,每个时隙的长度用τ表示;无人机需执行通信任务,向地面用户传输数据;还需执行目标感知任务,在一个时隙内发送感知信号,并接收回波信号;假设无人机采用时分多址机制,在一个时隙内只能选择与一个用户进行通信或执行一个目标感知任务;假设无人机可通过回程网络获取用户数据,并存储在本地队列中,令表示无人机为第m个用户分配的最大队列长度;假设无人机飞行高度固定为H,飞行速度为ν,令/>表示第t个时隙无人机的位置,1≤t≤T,令/>表示第m个用户的位置,1≤m≤M,令表示第n个目标的位置,1≤n≤N。
步骤2:无人机通信及感知信道模型建模;
无人机通信及感知信道模型建模,具体为:
(1)通信信道模型:令表示第t个时隙无人机与第m个用户之间的通信链路,建模为:/>其中/>表示第t个时隙无人机与第m个用户的距离,建模为:
通信链路中存在存在视距传输LoS和非视距传输NLoS,αe表示路径损失系数,e∈{LoS,NLoS},令Lm,t表示第t个时隙无人机与第m个用户之间的平均空对地路径损失,建模为:/>其中/>和/>分别表示第t个时隙无人机与第m个用户之间LoS传输和NLoS传输的概率,建模/>为:其中χ和ω是与传播环境相关的常数,/>表示第t个时隙无人机与第m个用户之间的夹角,建模为:/>表示LOS链路的路径损耗,建模为:/>其中λL表示LOS链路的路径损耗因子,d0表示自由空间参考距离,fc表示载波频率,c表示光速,/>表示LOS链路的阴影衰落损耗;/>表示NLOS链路的路径损耗,建模为:
其中λN表示NLOS链路的路径损耗因子,/>表示NLOS链路的阴影衰落损耗;
(2)感知信道模型:令表示第t个时隙无人机与第n个目标之间的感知链路增益,建模为:/>其中/>表示第t个时隙无人机与第n个目标之间的距离,建模为:/>cn建模为:/>其中Gt和Gr分别表示发送天线增益和接收天线增益,λ表示机载雷达发送信号波长,μn表示第n个目标的雷达截面积。
步骤3:无人机传输速率及能耗建模;
无人机传输速率及能耗建模,具体为:
(1)无人机传输速率:令Rm,t表示第t个时隙无人机到第m个用户的链路传输速率,建模为:其中B表示系统带宽,/>表示第t个时隙无人机传输数据至第m个用户时对应的发送功率,σ2为通信链路噪声功率;
(2)无人机飞行能耗:令Ef表示无人机飞行能耗,建模为:其中/>表示第t个时隙无人机飞行能耗,建模为:
表示无人机飞行变量,若第t个时隙无人机处于飞行状态,/>否则,/>P0和P0′分别表示无人机悬停状态下叶型功率和诱导功率的常数,Utip表示转子叶片的叶尖速度,v0为悬停状态下转子的平均诱导速度,ξd和ξr分别为机身阻力比和转子可靠性,ρa和Sr分别为空气密度和转子盘面积;
(3)无人机悬停能耗:令Eh表示无人机悬停能耗,建模为:其中/>表示第t个时隙无人机悬停能耗,建模为:/>为无人机悬停变量,若第t个时隙无人机悬停,/>反之,/>
步骤4:目标感知变量及用户通信调度变量建模;
目标感知变量及用户通信调度变量建模,具体为:
(1)建模目标感知变量:令表示第t个时隙第n个目标的感知变量,/>表示无人机在第t个时隙检测第n个目标,反之,/>1≤n≤N,1≤t≤T;
(2)建模用户通信调度变量:令βm,t表示第t个时隙第m个用户的数据调度变量,βm,t=1表示第t个时隙无人机向第m个用户发送数据,反之,βm,t=0,1≤m≤M,1≤t≤T。
步骤5:用户队列长度建模;
用户队列长度建模,具体为:令Qm,t表示第t个时隙无人机处第m个用户的队列长度,建模为:其中Am,t表示第t个时隙无人机接收的第m个用户的数据量。
步骤6:累积目标检测概率建模;
累积目标检测概率建模,具体为:令表示前t个时隙第n个目标的累计检测概率,建模为:/>其中/>表示第t个时隙第n个目标的检测概率,建模为:/>其中I0(·)是第一类零阶贝塞尔函数,VT为雷达接收机的检测阈值;令pf表示雷达虚警概率,建模为:/>表示第t个时隙雷达检测第n个目标的接收功率,建模为:/>其中/>表示第t个时隙雷达的发送功率,Lrt为检测信道损失系数。
步骤7:系统成本函数建模;
系统成本函数建模,具体为:令Ft表示第t个时隙的系统成本函数,考虑用户队列长度及目标感知性能,建模Ft为:Ft=θ1Qt-θ2Ψt,其中θ1和θ2为权重因子,Qt表示第t个时隙用户的平均队列长度,建模为:Ψt表示第t个时隙目标的累积检测概率,建模为:/>
步骤8:无人机通信感知限制条件建模,具体包括:
(1)建模无人机飞行限制条件,包括:
①
②
(2)建模无人机能量限制条件,包括:
①Ef+Eh≤Emax;其中Emax表示无人机的可用能量;
(3)建模无人机通信限制条件,包括:
①
②其中Rmin表示用户最小通信速率需求;
(4)建模无人机感知限制条件,包括:
①
②其中/>表示无人机最大感知距离;
③其中Smin表示雷达接收机的最小灵敏度。
步骤9:系统状态、动作和收益函数建模;
系统状态、动作和收益函数建模,具体为:建模系统在第t个时隙的状态其中,/>表示第t个时隙用户队列集合,Et表示第t个时隙无人机的剩余能量,建模为:/>令at表示系统的动作空间,建模为:其中At表示第t个时隙无人机选择的飞行动作,建模为:其中d表示无人机移动距离,建模为:d=vτ;令rt表示无人机在状态st下采取行动at获得的奖励,建模为:/>
步骤10:构建并训练DDQN网络;
构建并训练DDQN网络,具体为:初始化Q网络参数θ及目标Q网络参数初始化经验回放缓冲区Z和贪心策略参数ε;初始化系统状态st;将动作施加于系统环境,得到第t个时隙的奖励值rt和第t+1个时隙的状态st+1,并将其存入经验回放缓冲区Z中;从Z中抽取一批样本,确定目标网络中最大Q值所对应的动作,将该动作输入到Q网络中,得到更新后的Q值;令Y(st,at,st+1)表示目标网络的输出,建模为:其中γ为折扣因子,0≤γ≤1;Qθ(st+1,at+1)表示从Z抽取的小批量数据样本中观察状态为st+1时的Q值;建模损失函数L(θ)为均方误差,即:L(θ)=E[(Qθ(st,at)-Y(st,at,st+1))2],基于损失函数最小化确定参数θ,具体为:其中α为学习率,α∈[0,1],经过一定次数的迭代,利用更新后的θ替换/>重复上述过程,直至Q网络参数θ及目标Q网络参数/>均收敛。
步骤11:基于DDQN网络确定无人机飞行轨迹、通信调度及目标感知策略。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (10)
1.一种无人机辅助的通感一体化系统资源调度方法,其特征在于:包括以下步骤:
S1:建模无人机辅助的通感一体化系统,由一架无人机、多个地面用户和多个目标组成;
S2:建模无人机通信信道模型感知信道模型;
S3:建模无人机传输速率及无人机能耗;
S4:建模目标感知变量及用户通信调度变量,建模用户队列长度;
S5:建模累积目标检测概率;
S6:建模系统成本函数;
S7:建模无人机通信感知限制条件;
S8:建模系统状态、动作和收益函数;
S9:建模并训练DDQN网络;
S10:基于DDQN网络确定无人机飞行轨迹、通信调度及目标感知策略。
2.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法,其特征在于:所述建模无人机辅助的通感一体化系统,具体包括:令M表示系统中用户数目,N表示系统中目标数目;将系统时间划分为T个等长的时隙,每个时隙的长度用τ表示;
所述无人机用于执行通信任务,向地面用户传输数据,还用于执行目标感知任务,在一个时隙内发送感知信号,并接收回波信号;
所述无人机采用时分多址机制,在一个时隙内只能选择与一个用户进行通信或执行一个目标感知任务;
所述无人机通过回程网络获取用户数据,并存储在本地队列中,令表示无人机为第m个用户分配的最大队列长度;
所述无人机飞行高度固定为H,飞行速度为ν,令表示第t个时隙无人机的位置,1≤t≤T,令/>表示第m个用户的位置,1≤m≤M,令/>表示第n个目标的位置,1≤n≤N。
3.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法,其特征在于:步骤S2中所述建模无人机通信信道模型,具体包括:
第t个时隙无人机与第m个用户之间的通信链路为:
其中表示第t个时隙无人机与第m个用户的距离,建模为:
通信链路中存在存在视距传输LoS和非视距传输NLoS,αe表示路径损失系数,e∈{LoS,NLoS};
第t个时隙无人机与第m个用户之间的平均空对地路径损失为:
其中和/>分别表示第t个时隙无人机与第m个用户之间LoS传输和NLoS传输的概率,/>为:
其中χ和ω是与传播环境相关的常数,表示第t个时隙无人机与第m个用户之间的夹角,建模为:
表示LOS链路的路径损耗,建模为:
其中λL表示LOS链路的路径损耗因子,d0表示自由空间参考距离,fc表示载波频率,c表示光速,表示LOS链路的阴影衰落损耗;/>表示NLOS链路的路径损耗,建模为:
其中λN表示NLOS链路的路径损耗因子,表示NLOS链路的阴影衰落损耗;
步骤S2中所述建模感知信道模型具体包括:
第t个时隙无人机与第n个目标之间的感知链路增益为:
其中表示第t个时隙无人机与第n个目标之间的距离,建模为:
cn建模为:
其中Gt和Gr分别表示发送天线增益和接收天线增益,λ表示机载雷达发送信号波长,μn表示第n个目标的雷达截面积。
4.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法,其特征在于:步骤S3中所述建模无人机传输速率及无人机能耗,具体包括:
无人机传输速率:第t个时隙无人机到第m个用户的链路传输速率为:
其中B表示系统带宽,表示第t个时隙无人机传输数据至第m个用户时对应的发送功率,σ2为通信链路噪声功率;
无人机飞行能耗:无人机飞行能耗为:
其中表示第t个时隙无人机飞行能耗,建模为:
表示无人机飞行变量,若第t个时隙无人机处于飞行状态,/>否则,P0和P′0分别表示无人机悬停状态下叶型功率和诱导功率的常数,Utip表示转子叶片的叶尖速度,v0为悬停状态下转子的平均诱导速度,ξd和ξr分别为机身阻力比和转子可靠性,ρa和Sr分别为空气密度和转子盘面积;
无人机悬停能耗:令Eh表示无人机悬停能耗,建模为:
其中表示第t个时隙无人机悬停能耗,建模为:
为无人机悬停变量,若第t个时隙无人机悬停,/>反之,/>
5.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法,其特征在于:步骤S4中所述建模目标感知变量及用户通信调度变量,具体包括:
建模目标感知变量:令表示第t个时隙第n个目标的感知变量,/>表示无人机在第t个时隙检测第n个目标,反之,/>1≤n≤N,1≤t≤T;
建模用户通信调度变量:令βm,t表示第t个时隙第m个用户的数据调度变量,βm,t=1表示第t个时隙无人机向第m个用户发送数据,反之,βm,t=0,1≤m≤M,1≤t≤T;
所述建模用户队列长度,具体包括:第t个时隙无人机处第m个用户的队列长度为:
其中Am,t表示第t个时隙无人机接收的第m个用户的数据量。
6.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法,其特征在于:步骤S5中所述建模累积目标检测概率,具体包括:前t个时隙第n个目标的累计检测概率为:
其中表示第t个时隙第n个目标的检测概率,建模为:
其中I0(·)是第一类零阶贝塞尔函数,VT为雷达接收机的检测阈值;令pf表示雷达虚警概率,建模为:
表示第t个时隙雷达检测第n个目标的接收功率,建模为:
其中表示第t个时隙雷达的发送功率,Lrt为检测信道损失系数。
7.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法,其特征在于:步骤S6中,建模系统成本函数,具体包括:
第t个时隙的系统成本函数,考虑用户队列长度及目标感知性能为:
Ft=θ1Qt-θ2Ψt
其中θ1和θ2为权重因子,Qt表示第t个时隙用户的平均队列长度,建模为:
Ψt表示第t个时隙目标的累积检测概率,建模为:
。
8.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法,其特征在于:步骤S7中,建模无人机通信感知限制条件,具体包括:
(1)建模无人机飞行限制条件,包括:
①
②
(2)建模无人机能量限制条件,包括:
①Ef+Eh≤Emax,其中Emax表示无人机的可用能量;
(3)建模无人机通信限制条件,包括:
①
②其中Rmin表示用户最小通信速率需求;
(4)建模无人机感知限制条件,包括:
①
②其中/>表示无人机最大感知距离;
③其中Smin表示雷达接收机的最小灵敏度。
9.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法,其特征在于:步骤S8中所述建模系统状态、动作和收益函数,具体包括:
系统在第t个时隙的状态为:
其中,表示第t个时隙用户队列集合,Et表示第t个时隙无人机的剩余能量,建模为:
令at表示系统的动作空间,建模为:
其中At表示第t个时隙无人机选择的飞行动作,建模为:
其中d表示无人机移动距离,建模为:
d=vτ
令rt表示无人机在状态st下采取行动at获得的奖励,建模为:
10.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法,其特征在于:步骤S9中,建模并训练DDQN网络,具体包括:
初始化Q网络参数θ及目标Q网络参数初始化经验回放缓冲区Z和贪心策略参数ε;初始化系统状态st;将动作施加于系统环境,得到第t个时隙的奖励值rt和第t+1个时隙的状态st+1,并将其存入经验回放缓冲区Z中;从Z中抽取一批样本,确定目标网络中最大Q值所对应的动作,将该动作输入到Q网络中,得到更新后的Q值;
目标网络的输出为:
其中γ为折扣因子,0≤γ≤1;Qθ(st+1,at+1)表示从Z抽取的小批量数据样本中观察状态为st+1时的Q值;
损失函数L(θ)为均方误差,即:
L(θ)=E[(Qθ(st,at)-Y(st,at,st+1))2]
基于损失函数最小化确定参数θ,具体为:
其中α为学习率,α∈[0,1],经过一定次数的迭代,利用更新后的θ替换重复上述过程,直至Q网络参数θ及目标Q网络参数/>均收敛。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310937887.6A CN116847460A (zh) | 2023-07-27 | 2023-07-27 | 一种无人机辅助的通感一体化系统资源调度方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310937887.6A CN116847460A (zh) | 2023-07-27 | 2023-07-27 | 一种无人机辅助的通感一体化系统资源调度方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116847460A true CN116847460A (zh) | 2023-10-03 |
Family
ID=88172598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310937887.6A Pending CN116847460A (zh) | 2023-07-27 | 2023-07-27 | 一种无人机辅助的通感一体化系统资源调度方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116847460A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117241300A (zh) * | 2023-11-16 | 2023-12-15 | 南京信息工程大学 | 一种无人机辅助的通感算网络融合方法 |
-
2023
- 2023-07-27 CN CN202310937887.6A patent/CN116847460A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117241300A (zh) * | 2023-11-16 | 2023-12-15 | 南京信息工程大学 | 一种无人机辅助的通感算网络融合方法 |
CN117241300B (zh) * | 2023-11-16 | 2024-03-08 | 南京信息工程大学 | 一种无人机辅助的通感算网络融合方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112118556B (zh) | 基于深度强化学习的无人机轨迹及功率联合优化方法 | |
US20210165405A1 (en) | Multiple unmanned aerial vehicles navigation optimization method and multiple unmanned aerial vehicles system using the same | |
Zhan et al. | Energy minimization for cellular-connected UAV: From optimization to deep reinforcement learning | |
CN110730031B (zh) | 一种用于多载波通信的无人机轨迹与资源分配联合优化方法 | |
Fan et al. | RIS-assisted UAV for fresh data collection in 3D urban environments: A deep reinforcement learning approach | |
CN109916372B (zh) | 信道状态信息不准确下的无人机基站最佳高度计算方法 | |
CN113255218B (zh) | 无线自供电通信网络的无人机自主导航及资源调度方法 | |
CN116847460A (zh) | 一种无人机辅助的通感一体化系统资源调度方法 | |
CN109885088A (zh) | 边缘计算网络中基于机器学习的无人机飞行轨迹优化方法 | |
CN109839955A (zh) | 一种无人机与多个地面终端进行无线通信的轨迹优化方法 | |
CN114980169B (zh) | 一种基于轨迹与相位联合优化的无人机辅助地面通信方法 | |
EP4046404B1 (en) | Delivering connectivity to a service area by aerial vehicles using probabilistic methods | |
CN113055078A (zh) | 有效信息年龄确定方法、以及无人机飞行轨迹优化方法 | |
Zhan et al. | Energy-efficient trajectory optimization for aerial video surveillance under QoS constraints | |
Luo et al. | A two-step environment-learning-based method for optimal UAV deployment | |
CN115499921A (zh) | 面向复杂无人机网络的三维轨迹设计及资源调度优化方法 | |
CN117119489A (zh) | 一种基于多无人机辅助的无线供能网络的部署和资源优化方法 | |
Chenxiao et al. | Energy-efficiency maximization for fixed-wing UAV-enabled relay network with circular trajectory | |
CN117873171A (zh) | 多旋翼无人机集群应用联邦学习框架训练神经网络模型 | |
Ahn et al. | Velocity optimization for UAV-mounted transmitter in population-varying fields | |
CN116009590A (zh) | 无人机网络分布式轨迹规划方法、系统、设备及介质 | |
Yang et al. | An AoI-guaranteed sensor data collection strategy for RIS-assisted UAV communication system | |
Lyu et al. | Resource Allocation in UAV‐Assisted Wireless Powered Communication Networks for Urban Monitoring | |
Huang et al. | Intelligent Reflecting Surface-Assisted Fresh Data Collection in UAV Communications | |
CN116878520B (zh) | 一种无人机路径规划方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |