CN115633320A - 多无人机辅助的数据采集与回传方法、系统、设备及介质 - Google Patents

多无人机辅助的数据采集与回传方法、系统、设备及介质 Download PDF

Info

Publication number
CN115633320A
CN115633320A CN202211207707.0A CN202211207707A CN115633320A CN 115633320 A CN115633320 A CN 115633320A CN 202211207707 A CN202211207707 A CN 202211207707A CN 115633320 A CN115633320 A CN 115633320A
Authority
CN
China
Prior art keywords
unmanned aerial
aerial vehicle
data
time slot
drone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211207707.0A
Other languages
English (en)
Other versions
CN115633320B (zh
Inventor
龚世民
龙钰斯
庄嘉琳
崔磊洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN202211207707.0A priority Critical patent/CN115633320B/zh
Publication of CN115633320A publication Critical patent/CN115633320A/zh
Application granted granted Critical
Publication of CN115633320B publication Critical patent/CN115633320B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/14Relay systems
    • H04B7/15Active relay systems
    • H04B7/185Space-based or airborne stations; Stations for satellite systems
    • H04B7/18502Airborne stations
    • H04B7/18506Communications with or from aircraft, i.e. aeronautical mobile service
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • H04W4/38Services specially adapted for particular environments, situations or purposes for collecting sensor information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/04Wireless resource allocation
    • H04W72/044Wireless resource allocation based on the type of the allocated resource
    • H04W72/0446Resources in time domain, e.g. slots or frames
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Astronomy & Astrophysics (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • General Physics & Mathematics (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供了一种多无人机辅助的数据采集与回传方法、系统、设备及介质,所述方法包括:构建多无人机感知传输系统模型;多无人机感知传输系统模型包括若干单天线无人机、基站和若干地面传感器用户;根据多无人机感知传输系统模型,以最小化无线通信网络长期平均信息年龄为目标,建立多阶段耦合随机动态规划问题模型;利用李亚普诺夫优化框架将多阶段耦合随机动态规划问题模型转化为单时隙确定性子问题模型;采用交替优化算法,对单时隙确定性子问题模型进行求解,得到无人机调度与移动控制策略。本发明的多无人机调度与移动控制联合优化方法,能提高基站接收信息的新鲜度,避免无人机间信道竞争,提升通信网络服务性能,保持系统的长期稳定性。

Description

多无人机辅助的数据采集与回传方法、系统、设备及介质
技术领域
本发明涉及无人机数据感知和传输技术领域,特别是涉及一种多无人机辅助的数据采集与回传方法、系统、计算机设备和存储介质。
背景技术
物联网(IoT)技术中许多新兴应用需要及时获取与处理地面上的感知数据。由于无人机(Unmanned Aerial Vehicle,UAV)具有移动快速、部署灵活的特性,以及空地视距链路增强的优势,而被广泛部署应用于无线网络通信,提供可靠的无线连接以辅助地面用户(GUs)将感知信息传输给基站(BS);此外,UAV还可以实时动态改变当前所处的位置,根据任务需求改变覆盖范围和UAV之间的连接关系,从而帮助提高BS的网络覆盖率和容量。可见,UAV在各种需要对传感信息进行快速响应的实时传感应用中扮演着举足轻重的角色。然而,无线通信系统的信息年龄(Age of information,AoI)性能与感知信息收集延迟、感知信息传输延迟和报告延迟密切相关,会对BS接收信息的新鲜度产生重要影响,进而降低UAV的实际应用效果和价值。
现有的UAV辅助实时无线通信系统研究中,关键设计问题通常表述为最小化AoI以保证BS接收信息的新鲜度,对应的技术方案主要有:1)在高度变化的动态信道条件下最小化AoI的基于启发式算法或迭代优化算法的在线调度策略;2)基于机器学习方法来获得单/多UAV的调度决策,在动态环境或有损信道条件下降低感知数据时延,保持信息新鲜度;虽然现有技术能够在一定程度上实现UAV辅助的实时无线通信系统,但都只是追求UAV本身数据量或AoI状态的单个参数最优,无法实现对多UAV间的有效统筹调度,且在维持系统数据队列和AoI的稳定性上表现不佳,难以有效提升通信系统的AoI性能。
发明内容
本发明的目的是提供一种多无人机辅助的数据采集与回传方法,通过联合优化多无人机的运动轨迹与调度策略来最小化地面传感器用户数据传输的等待时间,利用李亚普诺夫优化框架将多阶段耦合的随机问题转化为每个时隙的确定性优化问题,并在每个时隙中,根据缓存区数据队列和信息年龄的实时状态,采用交替优化算法迭代更新多无人机的调度和移动控制策略,解决现有无人机辅助采集数据与回传的应用缺陷,提高基站接收信息新鲜度的同时,避免无人机之间对信道的竞争,有效提升无线通信网络的服务性能,保持系统的长期稳定性。
为了实现上述目的,有必要针对上述技术问题,提供了一种多无人机辅助的数据采集与回传方法、系统、计算机设备和存储介质。
第一方面,本发明实施例提供了一种多无人机辅助的数据采集与回传方法,所述方法包括以下步骤:
构建多无人机感知传输系统模型;所述多无人机感知传输系统模型包括若干单天线无人机、基站和若干地面传感器用户;
根据所述多无人机感知传输系统模型,以最小化无线通信网络长期平均信息年龄为目标,建立多阶段耦合随机动态规划问题模型;
利用李亚普诺夫优化框架将所述多阶段耦合随机动态规划问题模型转化为单时隙确定性子问题模型;
采用交替优化算法,对所述单时隙确定性子问题模型进行求解,得到无人机调度与移动控制策略。
进一步地,所述根据所述多无人机感知传输系统模型,以最小化无线通信网络长期平均信息年龄为目标,建立多阶段耦合随机动态规划问题模型的步骤包括:
根据所述多无人机感知传输系统模型,将各个通信时间帧划分为若干个具有单位长度的时隙,并基于被调度无人机在各个时隙的工作过程,得到所述无人机飞行传输协议;所述无人机传输协议包括无人机工作时隙结构和无人机工作约束;所述无人机时隙结构包括感知数据子时隙、飞行子时隙和传输数据子时隙;
根据所述无人机飞行传输协议,通过优化无人机的调度策略和移动控制策略来最小化无线通信网络长期平均信息年龄,构建所述多阶段耦合随机动态规划问题模型;所述移动控制策略包括各个时隙内无人机的轨迹规划,以及感知数据、飞行和传输数据的时间分配。
进一步地,所述无人机工作约束包括无人机调度约束、无人机时间分配约束、无人机数据存储约束、无人机飞行约束、无人机信息约束和长期平均信息年龄约束;所述无人机调度约束表示为:
Figure BDA0003876200800000031
其中,βm[n]表示在第n个时隙内第m个无人机的调度变量;
Figure BDA0003876200800000032
Figure BDA0003876200800000033
分别表示无人机集合和时隙集合;
所述无人机时间分配约束表示为:
Figure BDA0003876200800000034
其中,tm,s[n]、tm,f[n]和tm,d[n]分别表示第m个无人机在第n个时隙的感知数据子时隙、飞行子时隙和传输数据子时隙;
所述无人机数据存储约束表示为:
sm[n]≤Qmax
其中,sm[n]表示第m个无人机在第n个时隙内感知的所有传感数据量;Qmax表示无人机缓存数据队列的存储上限;
所述无人机飞行约束表示为:
Figure BDA0003876200800000035
式中,
lm[n]=(xm[n],ym[n],H)
lm'[n]=(xm'[n],ym'[n],H)
其中,lm[n]和lm'[n]分别表示第n个时隙内第m个和第m'个无人机的位置;H表示无人机的固定飞行高度;dmin表示两架无人机间的最小安全距离;vmax表示无人机最大飞行速度;
所述无人机信息约束表示为:
Figure BDA0003876200800000041
其中,Dm[n]表示在第n个时隙内第m个无人机的传输吞吐量;
Figure BDA0003876200800000042
表示到达第m个无人机的缓存数据队列的长期平均传感数据量;
Figure BDA0003876200800000043
表示第m个无人机传输到基站的平均数据量;
所述长期平均信息年龄约束表示为:
Figure BDA0003876200800000044
其中,
Figure BDA0003876200800000045
表示第m个无人机在第n个时隙的长期平均信息年龄;amax表示无人机信息年龄上限。
进一步地,根据所述无人机飞行传输协议,通过优化无人机的调度策略和移动控制策略来最小化无线通信网络长期平均信息年龄,构建所述多阶段耦合随机动态规划问题模型的步骤包括:
根据所述无人机飞行传输协议,得到各个时隙内每架无人机的传输吞吐量,并根据所述传输吞吐量,动态更新对应的数据队列积压量;所述数据队列积压量的更新公式为:
Qm[n+1]=[min{Qm[n]+sm[n],Qmax}-Dm[n]]+
根据所述传输吞吐量和所述数据队列积压量,动态更新无人机缓存数据信息年龄;所述无人机缓存数据信息年龄的更新公式为:
Figure BDA0003876200800000051
其中,am[n]和am[n+1]分别表示第m个无人机在第n个时隙和第n+1个时隙的初始时缓存数据信息年龄;
根据各个时隙内所有无人机缓存数据信息年龄,计算无线通信网络长期平均信息年龄;
在所述无人机工作约束条件下,以通过无人机的调度策略和移动控制策略最小化所述无线通信网络长期平均信息年龄为目标,构建所述多阶段耦合随机动态规划问题模型;所述多阶段耦合随机动态规划问题模型的目标函数表示为:
Figure BDA0003876200800000052
式中,
Figure BDA0003876200800000053
其中,lm[n]表示第n个时隙内第m个无人机的位置;βm[n]表示在第n个时隙内第m个无人机的调度变量;tm[n]表示第m个无人机在第n个时隙的感知数据、飞行和传输数据的时间分配。
进一步地,所述利用李亚普诺夫优化框架将所述多阶段耦合随机动态规划问题模型转化为单时隙确定性子问题模型的步骤包括:
构建各个时隙的虚拟信息年龄状态队列;所述虚拟信息年龄状态队列表示为:
Figure BDA0003876200800000054
其中,Xm[n]分别表示第m个无人机在第n个时隙和第n+1个时隙的虚拟信息年龄状态队列;amax表示无人机信息年龄上限;
根据各个时隙的每架无人机的所述虚拟信息年龄状态队列和所述缓存数据队列的数据队列积压量,构建对应的数据缓存信息年龄广义队列;所述数据缓存信息年龄广义队列表示为:
Figure BDA0003876200800000061
其中,Ym[n]表示第m个无人机在第n个时隙内对应的数据缓存信息年龄广义队列;
Figure BDA0003876200800000062
表示无人机集合;Qm[n]表示第m个无人机在第n个时隙内缓存数据队列的数据队列积压量;
根据所述数据缓存信息年龄广义队列,得到李亚普诺夫函数漂移项,并根据所述李亚普诺夫函数漂移项,将所述多阶段耦合随机动态规划问题模型转化为单时隙确定性子问题模型;所述单时隙确定性子问题模型表示为:
Figure BDA0003876200800000063
Figure BDA0003876200800000064
Figure BDA0003876200800000065
Figure BDA0003876200800000066
Figure BDA0003876200800000067
Dm≤min{Qm+sm,Qmax}
式中,
Figure BDA0003876200800000068
其中,V表示权重;μ表示用于模拟通信系统对数据队列积压量和信息年龄状态的时间敏感度差异的控制参数。
进一步地,所述采用交替优化算法,对所述单时隙确定性子问题模型进行求解,得到无人机调度与移动控制策略的步骤包括:
随机初始化多无人机的缓存数据队列以及信息年龄状态队列的长度;
在各个时隙迭代中,交替优化无线通信网络的调度策略和移动控制策略;
根据无人机的缓存数据队列和信息年龄状态队列的动态变化,更新所述数据缓存信息年龄广义队列,直至得到所述无人机调度与移动控制策略。
进一步地,所述在各个时隙迭代中,交替优化无线通信网络的调度策略和移动控制策略的步骤包括:
当固定所述调度策略优化所述移动控制策略时,通过引入辅助松弛变量结合正余弦优化算法,将所述单时隙确定性子问题模型中的移动控制策略优化问题模型转化为对应的凸优化问题模型;所述凸优化问题模型表示为:
Figure BDA0003876200800000071
Figure BDA0003876200800000072
Figure BDA0003876200800000073
Figure BDA0003876200800000074
Figure BDA0003876200800000075
Figure BDA0003876200800000076
ηm≤min{Qm[n]+sm[n],Qmax}.
式中,
Figure BDA0003876200800000077
Figure BDA0003876200800000078
ηm=Dm
Figure BDA0003876200800000079
Figure BDA00038762008000000710
其中,ηm
Figure BDA0003876200800000081
表示辅助松弛变量;τ表示迭代次数索引;
求解所述凸优化问题模型,得到对应的最优移动控制策略。
第二方面,本发明实施例提供了一种多无人机辅助的数据采集与回传系统,所述系统包括:
系统构建模块,用于构建多无人机感知传输系统模型;所述多无人机感知传输系统模型包括若干单天线无人机、基站和若干地面传感器用户;
模型构建模块,用于根据所述多无人机感知传输系统模型,以最小化无线通信网络长期平均信息年龄为目标,建立多阶段耦合随机动态规划问题模型;
模型转化模块,用于利用李亚普诺夫优化框架将所述多阶段耦合随机动态规划问题模型转化为单时隙确定性子问题模型;
模型求解模块,用于采用交替优化算法,对所述单时隙确定性子问题模型进行求解,得到无人机调度与移动控制策略。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
第四方面,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
上述本申请提供了一种多无人机辅助的数据采集与回传方法、系统、计算机设备及存储介质,通过所述方法,实现了构建包括若干单天线无人机、基站和若干地面传感器用户的多无人机感知传输系统模型后,根据多无人机感知传输系统模型,以最小化无线通信网络长期平均信息年龄为目标建立多阶段耦合随机动态规划问题模型,并利用李亚普诺夫优化框架将多阶段耦合随机动态规划问题模型转化为单时隙确定性子问题模型,以及采用交替优化算法对单时隙确定性子问题模型进行求解,得到无人机调度与移动控制策略的技术方案。与现有技术相比,该多无人机辅助的数据采集与回传方法,通过联合优化多无人机的运动轨迹与调度策略来最小化地面传感器用户数据传输的等待时间,提高基站接收信息新鲜度的同时,避免无人机间对信道的竞争,有效提升无线通信网络的服务性能,保持系统的长期稳定性。
附图说明
图1是本发明实施例中多无人机辅助的数据采集与回传方法的应用框架示意图;
图2是本发明实施例中多无人机辅助的数据采集与回传方法的流程示意图;
图3是本发明实施例中无人机工作时隙结构示意图;
图4本发明实施例中UAV-m的AoI随时间的变化曲线示意图;
图5是本发明实施例中仿真实验的不同方案下无人机AoI变化过程示意图;
图6中a和b分别表示本发明实施例中多无人机辅助的数据采集与回传方法仿真实验的UAV的数据队列和虚拟AoI队列示意图;
图7中a和b分别表示本发明实施例中仿真实验的不同方案下系统平均AoI、总时间与UAV发射功率的对应关系曲线示意图;
图8是本发明实施例中多无人机辅助的数据采集与回传系统的结构示意图;
图9是本发明实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案和有益效果更加清楚明白,下面结合附图及实施例,对本发明作进一步详细说明,显然,以下所描述的实施例是本发明实施例的一部分,仅用于说明本发明,但不用来限制本发明的范围。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的多无人机辅助的数据采集与回传方法可应用于图1所示的多无人机(UAV)来辅助从地面传感器用户(GUs)到基站(BS)的感知数据传输的应用场景,由每架UAV先缓存从GUs收集的感知数据,再将缓存的感知数据回传给BS,基于多UAV的运动轨迹与调度策略的联合优化,提供可靠无线通信连接,提高BS的网络覆盖率和容量。下述实施例将对本发明的多无人机辅助的数据采集与回传方法进行详细说明。
在一个实施例中,如图2所示,提供了一种多无人机辅助的数据采集与回传方法,包括以下步骤:
S11、构建多无人机感知传输系统模型;所述多无人机感知传输系统模型包括若干单天线无人机、基站和若干地面传感器用户;其中,多无人机感知传输系统模型可理解为由M架单天线无人机、一个基站和K个地面传感器用户组成的无线网络通信系统。UAV的集合表示为
Figure BDA0003876200800000101
GUs集合表示为
Figure BDA0003876200800000102
GUs分布在地面,不能直接与BS进行通信,多架UAV在GUs周围飞行,任务是作为无线中继来协助通信,将GUs的感知数据收集并回传到BS,即每架单天线无人机感知对应区域范围内的地面传感器用户数据(GUs),然后飞到适当的位置,将缓存的地面传感器用户数据传输至基站(BS),辅助GUs和BS之间的数据传输。
S12、根据所述多无人机感知传输系统模型,以最小化无线通信网络长期平均信息年龄为目标,建立多阶段耦合随机动态规划问题模型;其中,多阶段耦合随机动态规划问题模型可理解为一个基于本发明设计的无人机飞行传输协议得到的受UAV长期数据队列稳定性和信息年龄(AoI)上限约束的多阶段耦合的随机优化问题;
具体地,所述根据所述多无人机感知传输系统模型,以最小化无线通信网络长期平均信息年龄为目标,建立多阶段耦合随机动态规划问题模型的步骤包括:
根据所述多无人机感知传输系统模型,将各个通信时间帧划分为若干个具有单位长度的时隙,并基于被调度无人机在各个时隙的工作过程,得到所述无人机飞行传输协议;所述无人机传输协议包括无人机工作时隙结构和无人机工作约束;
如图3所示,每个通信时间帧划分得到具有多个时隙的时隙集合
Figure BDA0003876200800000111
在每个时隙中,多个UAV都可进行感知数据采集和飞行,但只允许一架UAV将其数据发送给BS,用变量βm[n]∈{0,1}表示第m架UAV在第n个时隙的调度策略,βm[n]=1表示UAV-m被调度以传输感知数据,βm[n]=0则表示UAV-m没有被调度。被调度的UAV在一个时隙内的工作过程被按照无人机工作时隙结构进一步划分为三个子时隙:在感知数据子时隙内,UAV收集GUs最新的传感数据并存储在UAV的数据队列中;在飞行子时隙内,UAV携带缓存数据飞行到信道条件更好的位置,以便将数据传输到BS;在传输数据子时隙内,UAV将缓存的数据传输到BS中;即得到的用于后续建模分析的无人机时隙结构可用tm[n]=(tm,s[n],tm,f[n],tm,d[n])表示,其中,tm,s[n]、tm,f[n]和tm,d[n]分别表示第m个无人机在第n个时隙的感知数据子时隙、飞行子时隙和传输数据子时隙;
无人机工作约束可理解为无人机在无线通信系统中感知和传输数据时所需满足的系统约束;具体的,所述无人机工作约束包括无人机调度约束、无人机时间分配约束、无人机数据存储约束、无人机飞行约束、无人机信息约束和长期平均信息年龄约束;
所述无人机调度约束,可理解为一个时隙只能选择一个UAV进行数据传输调度,表示为:
Figure BDA0003876200800000112
其中,βm[n]表示在第n个时隙内第m个无人机的调度变量;M和N分别表示无人机集合和时隙集合;
所述无人机时间分配约束,可理解为三个子时隙的总时长不能超过单位长度,表示为:
Figure BDA0003876200800000121
其中,tm,s[n]、tm,f[n]和tm,d[n]分别表示第m个无人机在第n个时隙的感知数据子时隙、飞行子时隙和传输数据子时隙;在每个时隙内,较大的tm,s[n]意味着更多的GUs可以将他们的感知信息上传给UAV;较大的tm,f[n]意味着UAV可以飞到更合适的位置(信道条件更好的、离BS更近的);较大的tm,d[n]意味着UAV可以提供更大的数据吞吐量;
无人机数据存储约束、无人机飞行约束和无人机信息约束是理解为对应于UAV在每个时隙内具体工作过程的限制:
UAV信息收集:假设地面传感器用户数据量非常小,给定UAV在空中的位置,UAV覆盖范围下的所有GUs可以在信息收集周期内逐个地上传数据给UAV,对应所有传感数据sm[n]将存储在上限为Qmax的UAV数据队列中,即所述无人机数据存储约束表示为:
sm[n]≤Qmax
其中,sm[n]表示第m个无人机在第n个时隙内感知的所有传感数据;Qmax表示无人机缓存数据队列的存储上限;
UAV飞行:假设所有的UAV都在固定的高度H的高空飞行时,为避免UAV相互之间碰撞和限制速度的每个UAV的运行轨迹需要满足的约束,即所述无人机飞行约束表示为:
Figure BDA0003876200800000122
式中,
lm[n]=(xm[n],ym[n],H)
lm'[n]=(xm'[n],ym'[n],H)
其中,lm[n]和lm'[n]分别表示第n个时隙内第m个和第m′个无人机的位置;H表示无人机的固定飞行高度;dmin表示两架无人机间的最小安全距离;vmax表示无人机最大飞行速度;
UAV信息回传:当UAV停止飞行时,它将悬停在空中,将缓存数据传输给BS;为了保证队列的稳定性,要求到达UAV数据队列的长期平均传感数据量小于传输到BS的平均数据量,即所述无人机信息约束表示为:
Figure BDA0003876200800000131
其中,
Figure BDA0003876200800000132
表示数学期望;N表示时隙总数;
Figure BDA0003876200800000133
表示到达第m个缓存数据队列的长期平均传感数据量;
Figure BDA0003876200800000134
表示第m个无人机传输到基站的平均数据量;
基于上述的UAV在每个时隙内具体工作过程机制,可得图4所示的缓存数据队列中数据的AoI随时间的更新过程,且考虑到UAV的AoI上限amax,长期平均AoI应有以下约束,即所述长期平均信息年龄约束表示为:
Figure BDA0003876200800000135
其中,
Figure BDA0003876200800000136
表示第m个无人机在第n个时隙的长期平均信息年龄;amax表示无人机信息年龄上限。
根据所述无人机飞行传输协议,通过无人机的调度策略和移动控制策略来最小化无线通信网络长期平均信息年龄为目标,构建所述多阶段耦合随机动态规划问题模型;即,基于上述方法步骤得到无线通信网络的无人机飞行传输协议,通过联合优化无人机的调度策略和移动控制策略的方式使得无线通信网络长期平均信息年龄最小化,构建对应的多阶段耦合随机动态规划问题模型;其中,调度策略可理解为在某个时隙需要调度哪个无人机传输数据策略,且移动控制策略可理解控制无人机飞行和工作的策略,包括各个时隙内无人机的轨迹规划,以及感知数据、飞行和传输数据的时间分配;
具体的,所述根据所述无人机飞行传输协议,通过无人机的调度策略和移动控制策略来最小化无线通信网络长期平均信息年龄为目标,构建所述多阶段耦合随机动态规划问题模型的步骤包括:
根据所述无人机飞行传输协议,确定得到各个时隙内每架无人机的传输吞吐量,并根据所述传输吞吐量,动态更新对应的数据队列积压量;所述数据队列积压量的更新公式为:
Qm[n+1]=[min{Qm[n]+sm[n],Qmax}-Dm[n]]+
其中,sm[n]和Dm[n]分别表示在第n个时隙内第m个无人机的传感数据量和传输吞吐量;Qmax表示缓存数据队列的存储上限;Qm[n+1]和Qm[n]分别表示第m个无人机在第n+1个时隙和第n个时隙内缓存数据队列的数据队列积压量;
具体的传输吞吐量取决于信道模型的选择,本实施例基于UAV与BS的通信链路主要为视距链路的假设,优选地采用一个简单的自由空间路径损耗信道模型来表征信道,即得到UAV-m在第n个时隙的传输吞吐量为:
Figure BDA0003876200800000141
l0=(x0,y0,0)
其中,pm为UAV-m的传输功率,ρ表示参考距离(如1米)对应的信道功率增益。Dm[n]表示在第n个时隙内第m个无人机的传输吞吐量;l0表示基站的位置;pm表示第m个无人机的传输功率;本实施例里使用了归一化的噪声功率来简化公式;
令Qm[n]为UAV-m在第n个时隙的数据积压,则缓存数据队列的数据队列积压量可由下列式子动态表示:
Qm[n+1]=[min{Qm[n]+sm[n],Qmax}-Dm[n]]+
其中[x]+=max[x,0];sm[n]在第n个时隙内第m个无人机的传感数据量;
根据所述传输吞吐量和所述数据队列积压量,动态更新无人机缓存数据信息年龄;所述无人机缓存数据信息年龄的更新公式为:
Figure BDA0003876200800000151
其中,am[n]和am[n+1]分别表示第m个无人机在第n个时隙和第n+1个时隙的初始时缓存数据信息年龄;βm[n]表示在第n个时隙内第m个无人机的调度变量;
具体的,如图4所示,定义am[n]为第n个时隙初始时UAV-m缓存数据的AoI,如果UAV-m在第n个时隙未被调度,则该UAV上的AoI将累积一个时隙,即am[n+1]=am[n]+1;如果UAV-m在第n个时隙被调度并且所携带的所有数据成功传输到BS,则UAV-m下一个时隙的AoI将重置为零,即am[n+1]=0;然而由于传输能力有限,不能保证UAV-m携带的全部数据均能及时传输到BS;综上,即可得到无人机缓存数据信息年龄的上述更新公式;
根据各个时隙内所有无人机缓存数据信息年龄,计算无线通信网络长期平均信息年龄;其中,无线通信网络长期平均信息年龄表示为:
Figure BDA0003876200800000152
其中,
Figure BDA0003876200800000153
和am[n]分别表示第m个无人机在第n个时隙的长期平均信息年龄无线通信网络长期平均信息年龄和无人机缓存数据信息年龄;N表示时隙总数;
在所述无人机工作约束条件下,以通过无人机的调度策略和移动控制策略最小化所述无线通信网络长期平均信息年龄为目标,构建所述多阶段耦合随机动态规划问题模型;所述多阶段耦合随机动态规划问题模型的目标函数表示为:
Figure BDA0003876200800000154
式中,
Figure BDA0003876200800000161
其中,Am[n]为
Figure BDA0003876200800000162
在第n个时隙中的积分,如图4所示,Am[n]等于am[n]与坐标轴在第n个时隙内所包围的图形面积,即:
Figure BDA0003876200800000163
其中,lm[n]表示第n个时隙内第m个无人机的位置;βm[n]表示在第n个时隙内第m个无人机的调度变量;tm[n]表示第m个无人机在第n个时隙的感知数据、飞行和传输数据的时间分配。
上述长期平均信息年龄约束使得上述目标函数在不同时隙之间高度耦合:每个时隙的调度策略取决于当前的状态并且会影响将来的调度及轨迹规划;由于调度策略的组合性以及UAV轨迹与时间分配的高维时空耦合性,上述建立的多阶段耦合随机动态规划问题模型为时空耦合的非凸问题,采用传统或启发式的优化方法求解性能表现不佳,本实施例优选的利用下述李亚普诺夫优化框架先将其简化为每个时隙的确定性优化问题再进行求解。
S13、利用李亚普诺夫优化框架将所述多阶段耦合随机动态规划问题模型转化为单时隙确定性子问题模型;其中,李雅普诺夫本质上是求解一个具有统计约束条件的多时隙优化问题,通过李亚普诺夫优化框架可将多阶段耦合随机问题解耦为单时隙的优化问题;
具体的,所述利用李亚普诺夫优化框架将所述多阶段耦合随机动态规划问题模型转化为单时隙确定性子问题模型的步骤包括:
构建各个时隙的虚拟信息年龄状态队列;其中,虚拟信息年龄状态队列可理解为构造的一个虚拟AoI队列,表示为:
Figure BDA0003876200800000164
其中,Xm[n]分别表示第m个无人机在第n个时隙和第n+1个时隙的虚拟信息年龄状态队列;amax表示无人机信息年龄上限;
由信息年龄状态队列的表达式可知,
Xm[n+1]≥Xm[n]-amax+am[n+1],
Figure BDA0003876200800000171
将上述不等式两边取期望,可得:
Figure BDA0003876200800000172
若Xm[n]是平均速率稳定的,即
Figure BDA0003876200800000173
则上述式子满足长期平均AoI上限约束。
根据各个时隙的每架无人机的所述虚拟信息年龄状态队列和所述缓存数据队列的数据队列积压量,构建对应的数据缓存信息年龄广义队列;所述数据缓存信息年龄广义队列表示为:
Figure BDA0003876200800000174
其中,Ym[n]表示第m个无人机在第n个时隙内对应的数据缓存信息年龄广义队列;M表示无人机集合;Qm[n]表示第m个无人机在第n个时隙内缓存数据队列的数据队列积压量;
根据所述数据缓存信息年龄广义队列,得到李亚普诺夫函数漂移项,并根据所述李亚普诺夫函数漂移项,将所述多阶段耦合随机动态规划问题模型转化为单时隙确定性子问题模型;其中,李亚普诺夫函数是为了同时满足缓存数据队列和AoI队列的稳定性,而引入用于度量数据缓存信息年龄广义队列的稳定性的函数,表示为:
Figure BDA0003876200800000175
其中,μ表示用于模拟通信系统对数据队列积压量和信息年龄状态的时间敏感度差异的控制参数;其他参数参见前文释义,此处不再赘述。
基于上述给出李亚普诺夫函数,根据其从当前时隙到下一个时隙的期望之差,得到李亚普诺夫函数漂移表示如下:
Figure BDA0003876200800000181
为了稳定数据缓存信息年龄广义队列Y[n],需要最小化队列的增量,即最小化李亚普诺夫函数漂移ΔL(Y[n]),可通过调整权重V来使缓存数据队列的稳定性和信息年龄AoI最小化的性能折中:
Figure BDA0003876200800000182
其中,
Figure BDA0003876200800000183
而am[n+1]的峰值为
Figure BDA0003876200800000184
Dm[n]的峰值为Qmax,代入上式,可以得到:
Figure BDA0003876200800000185
其中,
Figure BDA0003876200800000186
Β是一个独立于V的常数,表示为:
Figure BDA0003876200800000187
至此,通过上述步骤的推导,实现了将多阶段耦合随机动态规划问题模型转化为单时隙确定性子问题模型,为了使表达更加简便可视化,此处消去时间索引[n],将原问题简化,得到单时隙确定性子问题模型表示为:
Figure BDA0003876200800000191
Figure BDA0003876200800000192
Figure BDA0003876200800000193
Figure BDA0003876200800000194
Figure BDA0003876200800000195
Dm≤min{Qm+sm,Qmax} (1f)
由于长期平均AoI上限约束可以通过限制虚拟队列Xm[n]是平均速率稳定来满足,即
Figure BDA0003876200800000196
而长期数据队列稳定性约束也可以通过(1f)限制。至此,已将时间平均多阶段随机优化问题解耦为广义队列状态为数据缓存信息年龄广义队列Y[n]的单时隙确定性子问题,而不必考虑以上两个长期的时隙耦合约束。即,可通过求解上述子问题来确定βm[n],tm[n]和lm[n+1],然后更新队列,进入下一个时隙,如此迭代可求解一整个多阶段随机优化问题。
本实施例利用李亚普诺夫优化框架将原始的多阶段耦合随机优化问题解耦为单时隙的确定性子问题,通过解决规模小得多的单时隙子问题来保证满足长期队列稳定性和AoI上限的约束,不仅可以降低无线通信网络的平均AoI,保证感知信息的新鲜度,而能缩短系统趋于稳定的时间,保持UAV数据队列的稳定性,进而大幅度提升无线通信系统的稳定性。
S14、采用交替优化算法,对所述单时隙确定性子问题模型进行求解,得到无人机调度与移动控制策略;其中,单时隙确定性子问题模型求解中,由于
Figure BDA0003876200800000197
是二元变量,即约束(1b)为整数约束。为了使问题更易于求解,本实施例优选的,先将约束(1b)中的离散变量松弛为连续变量作为问题的一个上界,尽管问题得到松弛,但由于多UAV之间的轨迹规划和时间分配之间存在耦合性,问题仍然是非凸的;基于此,本实施例优选的采用交替优化(AO)算法来解决上述已松弛问题,即无人机调度与移动控制策略的求解过程是基于交替优化算法(AO算法)与连续凸逼近(SCA)方法的结合应用,先将单时隙确定性子问题模型分为两步:多无人机的调度策略优化和移动控制策略优化,再通过引入松弛变量采用连续凸逼近(SCA)方法将移动控制策略优化问题近似转化为对应的凸优化模型求解;
具体的,所述采用交替优化算法,对所述单时隙确定性子问题模型进行求解,得到无人机调度与移动控制策略的步骤包括:
随机初始化多无人机的缓存数据队列以及信息年龄状态队列的长度;
在各个时隙迭代中,交替优化无线通信网络的调度策略和移动控制策略;其中,交替优化如上所述可理解为先固定移动控制策略优化调度策略优化,再固定调度策略优化移动控制策略的调度策略与移动控制策略的轮流优化方法:
1)固定移动控制策略优化调度策略优化,即固定
Figure BDA0003876200800000201
优化βm(调度策略子问题):对于给定的
Figure BDA0003876200800000202
调度策略子问题是一个关于βm的标准线性规划(LP),因此βm的最优解
Figure BDA0003876200800000203
且直观上看,只有UAV-m在该时隙被调度才可能减少其缓存数据队列积压和降低AoI。
2)固定调度策略优化移动控制策略,即固定
Figure BDA0003876200800000204
优化tm,lm(移动控制子问题):给定
Figure BDA0003876200800000205
移动控制子问题仍非凸,本实施例优选利用连续凸逼近(SCA)法求其近似解;
上述步骤1)的标准线性规划IP问题求解采用现有求解方式即可,此处不再赘述,本实施例交替优化步骤以固定调度策略优化移动控制策略过程为重点进行阐述;具体的,所述在各个时隙迭代中,交替优化无线通信网络的调度策略和移动控制策略的步骤包括:
当固定所述调度策略优化所述移动控制策略时,通过引入辅助松弛变量结合正余弦优化算法,将所述单时隙确定性子问题模型中的移动控制策略优化问题模型转化为对应的凸优化问题模型;
对应凸优化问题模型的获取过程如下:
由于约束(1f)中的Dm[n]对于lm既不是凸的也不是凹的,但对于||lm-l0||2是凸的,再者,由于Dm[n]涉及多个变量,难以直接求解,因此,通过引入辅助松弛变量ηm
Figure BDA0003876200800000211
分别替代Dm[n]和||lm-l0||2,使得问题更便于解决,得到下述简化模型:
Figure BDA0003876200800000212
Figure BDA0003876200800000213
Figure BDA0003876200800000214
ηm≤min{Qm[n]+sm[n],Qmax}, (2d)
(1c)-(1e), (2e)
其中,
Figure BDA0003876200800000215
Figure BDA0003876200800000216
虽然该模型的目标函数对于ηm是凸的,但是约束条件(1d)、(2b)和(2c)仍然是非凸的。
为了处理上述非凸约束,本实施例优选的在每次迭代中利用SCA法构造一个凸函数来逼近它们,即在给定点
Figure BDA0003876200800000217
Figure BDA0003876200800000218
处用一阶泰勒展开,将||lm-lm'||2和||lm-l0||2分别重写为:
Figure BDA0003876200800000219
Figure BDA00038762008000002110
此外,给定点
Figure BDA00038762008000002111
Figure BDA00038762008000002112
(2b)中右边的项可以近似为:
Figure BDA00038762008000002113
至此,第τ次迭代中对UAV的移动控制问题化简为关于辅助松弛变量ηm
Figure BDA0003876200800000221
的凸问题,即得到凸优化问题模型为:
Figure BDA0003876200800000222
Figure BDA0003876200800000223
Figure BDA0003876200800000224
Figure BDA0003876200800000225
Figure BDA0003876200800000226
Figure BDA0003876200800000227
ηm≤min{Qm[n]+sm[n],Qmax}.
式中,
Figure BDA0003876200800000228
Figure BDA0003876200800000229
ηm=Dm
Figure BDA00038762008000002210
Figure BDA00038762008000002211
其中,ηm
Figure BDA00038762008000002212
表示辅助松弛变量;τ表示迭代次数索引;
求解所述凸优化问题模型,得到对应的最优移动控制策略;其中,凸优化问题模型的求解方法可根据实际应用需求确定,此处不作限定。
根据无人机的缓存数据队列和信息年龄状态队列的动态变化,更新所述数据缓存信息年龄广义队列,直至得到所述无人机调度与移动控制策略;即,基于上述步骤1)和2)的交替优化,实现了无人机的缓存数据队列和信息年龄状态队列的动态更新后,可依次更新数据缓存信息年龄广义队列进行重复迭代,直至得到联合优化的最优解,不仅能保证收敛速度快、收敛结果好,而且能够将每个节点的AoI控制在较小值,还能保持所有节点平均AoI的方差较小,在节点选择公平性和AoI最小化性能上均优于现有技术。
本实施例通过构建包括若干单天线无人机、基站和若干地面传感器用户的多无人机感知传输系统模型后,根据多无人机感知传输系统模型,以最小化无线通信网络长期平均信息年龄为目标建立多阶段耦合随机动态规划问题模型,并利用李亚普诺夫优化框架将多阶段耦合随机动态规划问题模型转化为单时隙确定性子问题模型,以及采用交替优化算法对单时隙确定性子问题模型进行求解,得到无人机调度与移动控制策略的AoI感知自适应传输方法,基于联合优化多无人机的运动轨迹与调度策略来最小化地面传感器用户数据传输的等待时间,提高基站接收信息新鲜度的同时,避免无人机间对信道的竞争,有效提升无线通信网络的服务性能,保持系统的长期稳定性。
为了对本发明方法的技术效果进行验证,本实施例基于在无线网络中设置了三架UAV,它们的坐标分别为[50,50,50],[150,50,50]和[150,150,50](以米为单位),BS的位置为[100,100,0];其他初始参数设置如下:UAV的速度vmax=25m/s,信道功率增益ρ=-60dB,UAV之间的最小距离dmin=50m,阈值ε=10-3,μ=1和V=100的实验条件下,将其与最大数据方案、最大AoI方案以及随机方案三个基准方案进行仿真实验对比验证,基于图5-7所示的验证结果可知本发明提出的AoI自适应传输方案可以显著提升学习效率和性能表现:
1)更优的AoI性能:图5描述了传输功率pm=27dBm的三架UAV在四个不同方案下实时AoI的变化过程;在四种算法中,实时AoI的传输功率在训练过程中均最终呈减小的趋势,最终收敛于稳定值。AoI自适应传输方案收敛速度相比其他三种基准算法有了较为显著提升,同时保证AoI最小。
2)更稳定、公平的系统性能:图5中可以看出四种算法在学习过程中的性能方差,对于模拟的三架UAV,曲线波动越大,系统越不稳定;另外,图6展示了本发明所提出的AoI感知自适应传输方案在数据队列和虚拟AoI队列稳定性上的表现;通过跟踪时变实时数据队列和虚拟AoI队列,可以发现这两个队列在较早时段内会产生轻微波动,在后续时隙中由于数据积压而趋于稳定;以上结果证实,李亚普诺夫控制有助于保持队列的稳定性,这是实现系统稳定高效运行的关键。
3)更优的传输功率:图7展示了所有方案的系统性能(即平均AoI和总时间)与UAV传输功率之间的关系;结果表明,所有方案的平均AoI随UAV传输功率的增加而减小,且趋于稳定。值得注意的是,较大的pm可以实现足够大的传输吞吐量来清空当前的数据积压,因此基准方案可以实现与所提出的AoI感知自适应传输方案相同的AoI性能。为进一步验证本发明的优越性,图7(b)表明,与基准方案相比,本方案可以在给定数据量下用最少时间实现信息更新。
在一个实施例中,如图8所示,提供了一种多无人机辅助的数据采集与回传系统,所述系统包括:
系统构建模块1,用于构建多无人机感知传输系统模型;所述多无人机感知传输系统模型包括若干单天线无人机、基站和若干地面传感器用户;
模型构建模块2,用于根据所述多无人机感知传输系统模型,以最小化无线通信网络长期平均信息年龄为目标,建立多阶段耦合随机动态规划问题模型;
模型转化模块3,用于利用李亚普诺夫优化框架将所述多阶段耦合随机动态规划问题模型转化为单时隙确定性子问题模型;
模型求解模块4,用于采用交替优化算法,对所述单时隙确定性子问题模型进行求解,得到无人机调度与移动控制策略。
关于一种多无人机辅助的数据采集与回传系统的具体限定可以参见上文中对于一种多无人机辅助的数据采集与回传方法的限定,在此不再赘述。上述一种多无人机辅助的数据采集与回传系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
图9示出一个实施例中计算机设备的内部结构图,该计算机设备具体可以是终端或服务器。如图9所示,该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示器和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种多无人机辅助的数据采集与回传方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域普通技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法的步骤。
综上,本发明实施例提供的一种多无人机辅助的数据采集与回传方法、系统、计算机设备及存储介质,其多无人机辅助的数据采集与回传方法实现了通过构建包括若干单天线无人机、基站和若干地面传感器用户的多无人机感知传输系统模型后,根据多无人机感知传输系统模型,以最小化无线通信网络长期平均信息年龄为目标建立多阶段耦合随机动态规划问题模型,并利用李亚普诺夫优化框架将多阶段耦合随机动态规划问题模型转化为单时隙确定性子问题模型,以及采用交替优化算法对单时隙确定性子问题模型进行求解,得到无人机调度与移动控制策略的的AoI感知自适应传输技术方案,该方法基于联合优化多无人机的运动轨迹与调度策略来最小化地面传感器用户数据传输的等待时间,提高基站接收信息新鲜度的同时,避免无人机间对信道的竞争,有效提升无线通信网络的服务性能,保持系统的长期稳定性。
本说明书中的各个实施例均采用递进的方式描述,各个实施例直接相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。需要说明的是,上述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种优选实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本申请的保护范围。因此,本申请专利的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种多无人机辅助的数据采集与回传方法,其特征在于,所述方法包括以下步骤:
构建多无人机感知传输系统模型;所述多无人机感知传输系统模型包括若干单天线无人机、基站和若干地面传感器用户;
根据所述多无人机感知传输系统模型,以最小化无线通信网络长期平均信息年龄为目标,建立多阶段耦合随机动态规划问题模型;
利用李亚普诺夫优化框架将所述多阶段耦合随机动态规划问题模型转化为单时隙确定性子问题模型;
采用交替优化算法,对所述单时隙确定性子问题模型进行求解,得到无人机调度与移动控制策略。
2.如权利要求1所述的多无人机辅助的数据采集与回传方法,其特征在于,所述根据所述多无人机感知传输系统模型,以最小化无线通信网络长期平均信息年龄为目标,建立多阶段耦合随机动态规划问题模型的步骤包括:
根据所述多无人机感知传输系统模型,将各个通信时间帧划分为若干个具有单位长度的时隙,并基于被调度无人机在各个时隙的工作过程,得到所述无人机飞行传输协议;所述无人机传输协议包括无人机工作时隙结构和无人机工作约束;所述无人机时隙结构包括感知数据子时隙、飞行子时隙和传输数据子时隙;
根据所述无人机飞行传输协议,通过优化无人机的调度策略和移动控制策略来最小化无线通信网络长期平均信息年龄,构建所述多阶段耦合随机动态规划问题模型;所述移动控制策略包括各个时隙内无人机的轨迹规划,以及感知数据、飞行和传输数据的时间分配。
3.如权利要求2所述的多无人机辅助的数据采集与回传方法,其特征在于,所述无人机工作约束包括无人机调度约束、无人机时间分配约束、无人机数据存储约束、无人机飞行约束、无人机信息约束和长期平均信息年龄约束;所述无人机调度约束表示为:
Figure FDA0003876200790000021
其中,βm[n]表示在第n个时隙内第m个无人机的调度变量;
Figure FDA0003876200790000022
Figure FDA0003876200790000023
分别表示无人机集合和时隙集合;
所述无人机时间分配约束表示为:
Figure FDA0003876200790000024
其中,tm,s[n]、tm,f[n]和tm,d[n]分别表示第m个无人机在第n个时隙的感知数据子时隙、飞行子时隙和传输数据子时隙;
所述无人机数据存储约束表示为:
sm[n]≤Qmax
其中,sm[n]表示第m个无人机在第n个时隙内感知的所有传感数据量;Qmax表示无人机缓存数据队列的存储上限;
所述无人机飞行约束表示为:
Figure FDA0003876200790000025
式中,
lm[n]=(xm[n],ym[n],H)
lm'[n]=(xm'[n],ym'[n],H)
其中,lm[n]和lm'[n]分别表示第n个时隙内第m个和第m'个无人机的位置;H表示无人机的固定飞行高度;dmin表示两架无人机间的最小安全距离;vmax表示无人机最大飞行速度;
所述无人机信息约束表示为:
Figure FDA0003876200790000026
其中,Dm[n]表示在第n个时隙内第m个无人机的传输吞吐量;
Figure FDA0003876200790000031
表示到达第m个无人机的缓存数据队列的长期平均传感数据量;
Figure FDA0003876200790000032
表示第m个无人机传输到基站的平均数据量;
所述长期平均信息年龄约束表示为:
Figure FDA0003876200790000033
其中,
Figure FDA0003876200790000034
表示第m个无人机在第n个时隙的长期平均信息年龄;amax表示无人机信息年龄上限。
4.如权利要求2所述的多无人机辅助的数据采集与回传方法,其特征在于,所述根据所述无人机飞行传输协议,通过无人机的调度策略和移动控制策略来最小化无线通信网络长期平均信息年龄为目标,构建所述多阶段耦合随机动态规划问题模型的步骤包括:
根据所述无人机飞行传输协议,确定得到各个时隙内每架无人机的传输吞吐量,并根据所述传输吞吐量,动态更新对应的数据队列积压量;所述数据队列积压量的更新公式为:
Qm[n+1]=[min{Qm[n]+sm[n],Qmax}-Dm[n]]+
其中,sm[n]和Dm[n]分别表示在第n个时隙内第m个无人机的传感数据量和传输吞吐量;Qmax表示缓存数据队列的存储上限;Qm[n+1]和Qm[n]分别表示第m个无人机在第n+1个时隙和第n个时隙内缓存数据队列的数据队列积压量;
根据所述传输吞吐量和所述数据队列积压量,动态更新无人机缓存数据信息年龄;所述无人机缓存数据信息年龄的更新公式为:
Figure FDA0003876200790000035
其中,am[n]和am[n+1]分别表示第m个无人机在第n个时隙和第n+1个时隙的初始时缓存数据信息年龄;βm[n]表示在第n个时隙内第m个无人机的调度变量;
根据各个时隙内所有无人机缓存数据信息年龄,计算无线通信网络长期平均信息年龄;
在所述无人机工作约束条件下,以通过无人机的调度策略和移动控制策略最小化所述无线通信网络长期平均信息年龄为目标,构建所述多阶段耦合随机动态规划问题模型;所述多阶段耦合随机动态规划问题模型的目标函数表示为:
Figure FDA0003876200790000041
式中,
Figure FDA0003876200790000042
其中,lm[n]表示第n个时隙内第m个无人机的位置;βm[n]表示在第n个时隙内第m个无人机的调度变量;tm[n]表示第m个无人机在第n个时隙的感知数据、飞行和传输数据的时间分配。
5.如权利要求4所述的多无人机辅助的数据采集与回传方法,其特征在于,所述利用李亚普诺夫优化框架将所述多阶段耦合随机动态规划问题模型转化为单时隙确定性子问题模型的步骤包括:
构建各个时隙的虚拟信息年龄状态队列;所述虚拟信息年龄状态队列表示为:
Figure FDA0003876200790000043
其中,Xm[n]分别表示第m个无人机在第n个时隙和第n+1个时隙的虚拟信息年龄状态队列;
根据各个时隙的每架无人机的所述虚拟信息年龄状态队列和所述缓存数据队列的数据队列积压量,构建对应的数据缓存信息年龄广义队列;所述数据缓存信息年龄广义队列表示为:
Figure FDA0003876200790000051
其中,Ym[n]表示第m个无人机在第n个时隙内对应的数据缓存信息年龄广义队列;
Figure FDA0003876200790000052
表示无人机集合;Qm[n]表示第m个无人机在第n个时隙内缓存数据队列的数据队列积压量;
根据所述数据缓存信息年龄广义队列,得到李亚普诺夫函数漂移项,并根据所述李亚普诺夫函数漂移项,将所述多阶段耦合随机动态规划问题模型转化为单时隙确定性子问题模型;所述单时隙确定性子问题模型表示为:
Figure FDA0003876200790000053
Figure FDA0003876200790000054
Figure FDA0003876200790000055
Figure FDA0003876200790000056
Figure FDA0003876200790000057
Dm≤min{Qm+sm,Qmax}
式中,
Figure FDA0003876200790000058
其中,V表示权重;μ表示用于模拟通信系统对数据队列积压量和信息年龄状态的时间敏感度差异的控制参数。
6.如权利要求5所述的多无人机辅助的数据采集与回传方法,其特征在于,所述采用交替优化算法,对所述单时隙确定性子问题模型进行求解,得到无人机调度与移动控制策略的步骤包括:
随机初始化多无人机的缓存数据队列以及信息年龄状态队列的长度;
在各个时隙迭代中,交替优化无线通信网络的调度策略和移动控制策略;
根据无人机的缓存数据队列和信息年龄状态队列的动态变化,更新所述数据缓存信息年龄广义队列,直至得到所述无人机调度与移动控制策略。
7.如权利要求6所述的多无人机辅助的数据采集与回传方法,其特征在于,所述在各个时隙迭代中,交替优化无线通信网络的调度策略和移动控制策略的步骤包括:
当固定所述调度策略优化所述移动控制策略时,通过引入辅助松弛变量结合正余弦优化算法,将所述单时隙确定性子问题模型中的移动控制策略优化问题模型转化为对应的凸优化问题模型;所述凸优化问题模型表示为:
Figure FDA0003876200790000061
Figure FDA0003876200790000062
Figure FDA0003876200790000063
Figure FDA0003876200790000064
Figure FDA0003876200790000065
Figure FDA0003876200790000066
ηm≤min{Qm[n]+sm[n],Qmax}.
式中,
Figure FDA0003876200790000067
Figure FDA0003876200790000068
ηm=Dm
Figure FDA0003876200790000069
Figure FDA0003876200790000071
其中,ηm
Figure FDA0003876200790000072
表示辅助松弛变量;τ表示迭代次数索引;
求解所述凸优化问题模型,得到对应的最优移动控制策略。
8.一种多无人机辅助的数据采集与回传系统,其特征在于,所述系统包括:
系统构建模块,用于构建多无人机感知传输系统模型;所述多无人机感知传输系统模型包括若干单天线无人机、基站和若干地面传感器用户;
模型构建模块,用于根据所述多无人机感知传输系统模型,以最小化无线通信网络长期平均信息年龄为目标,建立多阶段耦合随机动态规划问题模型;
模型转化模块,用于利用李亚普诺夫优化框架将所述多阶段耦合随机动态规划问题模型转化为单时隙确定性子问题模型;
模型求解模块,用于采用交替优化算法,对所述单时隙确定性子问题模型进行求解,得到无人机调度与移动控制策略。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一所述方法的步骤。
CN202211207707.0A 2022-09-28 2022-09-28 多无人机辅助的数据采集与回传方法、系统、设备及介质 Active CN115633320B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211207707.0A CN115633320B (zh) 2022-09-28 2022-09-28 多无人机辅助的数据采集与回传方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211207707.0A CN115633320B (zh) 2022-09-28 2022-09-28 多无人机辅助的数据采集与回传方法、系统、设备及介质

Publications (2)

Publication Number Publication Date
CN115633320A true CN115633320A (zh) 2023-01-20
CN115633320B CN115633320B (zh) 2023-06-06

Family

ID=84903785

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211207707.0A Active CN115633320B (zh) 2022-09-28 2022-09-28 多无人机辅助的数据采集与回传方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN115633320B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116233791A (zh) * 2023-03-23 2023-06-06 重庆邮电大学 多机协同车联网中轨迹优化和资源分配方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113131985A (zh) * 2019-12-31 2021-07-16 丽水青达科技合伙企业(有限合伙) 一种基于信息年龄最优路径规划的多无人机数据收集方法
CN114172942A (zh) * 2021-12-09 2022-03-11 中国人民解放军陆军工程大学 多无人机辅助物联网的协同任务分配与轨迹优化方法
CN114389679A (zh) * 2022-01-13 2022-04-22 吉林大学 基于信息年龄最小化的多天线无人机感知和传输优化方法
CN114690799A (zh) * 2022-01-24 2022-07-01 东莞理工学院 基于信息年龄的空天地一体化无人机物联网数据采集方法
CN115037638A (zh) * 2022-06-14 2022-09-09 北京邮电大学 低能耗和高时效性的无人机网络数据采集与传输控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113131985A (zh) * 2019-12-31 2021-07-16 丽水青达科技合伙企业(有限合伙) 一种基于信息年龄最优路径规划的多无人机数据收集方法
CN114172942A (zh) * 2021-12-09 2022-03-11 中国人民解放军陆军工程大学 多无人机辅助物联网的协同任务分配与轨迹优化方法
CN114389679A (zh) * 2022-01-13 2022-04-22 吉林大学 基于信息年龄最小化的多天线无人机感知和传输优化方法
CN114690799A (zh) * 2022-01-24 2022-07-01 东莞理工学院 基于信息年龄的空天地一体化无人机物联网数据采集方法
CN115037638A (zh) * 2022-06-14 2022-09-09 北京邮电大学 低能耗和高时效性的无人机网络数据采集与传输控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HUIMIN HU,ETC: "AoI-Minimal Trajectory Planning and Data Collection in UAV-Assisted Wireless Powered IoT Networks", 《IEEE INTERNET OF THINGS JOURNAL》 *
刘玲珊等: "信息年龄受限下最小化无人机辅助无线供能网络的能耗:一种基于DQN 的方法", 《南京大学学报(自然科学)》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116233791A (zh) * 2023-03-23 2023-06-06 重庆邮电大学 多机协同车联网中轨迹优化和资源分配方法
CN116233791B (zh) * 2023-03-23 2024-05-24 重庆邮电大学 多机协同车联网中轨迹优化和资源分配方法

Also Published As

Publication number Publication date
CN115633320B (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
Zhou et al. Deep reinforcement learning for delay-oriented IoT task scheduling in SAGIN
Sun et al. AoI-energy-aware UAV-assisted data collection for IoT networks: A deep reinforcement learning method
Samir et al. Online altitude control and scheduling policy for minimizing AoI in UAV-assisted IoT wireless networks
CN110730031B (zh) 一种用于多载波通信的无人机轨迹与资源分配联合优化方法
CN109099918B (zh) 无人机辅助无线能量传输系统及节点调度与路径规划方法
Li et al. LSTM-characterized deep reinforcement learning for continuous flight control and resource allocation in UAV-assisted sensor network
CN113452956B (zh) 一种输电线路巡检任务智能分配方法及系统
CN114169234A (zh) 一种无人机辅助移动边缘计算的调度优化方法及系统
CN108667504B (zh) 一种基于交替方向乘子法的无人飞行器中继系统分布式资源优化方法
Fan et al. Ris-assisted uav for fresh data collection in 3d urban environments: A deep reinforcement learning approach
CN112671451B (zh) 一种无人机数据收集方法、设备、电子设备及存储介质
CN115633320A (zh) 多无人机辅助的数据采集与回传方法、系统、设备及介质
CN114690799A (zh) 基于信息年龄的空天地一体化无人机物联网数据采集方法
Li et al. Onboard deep deterministic policy gradients for online flight resource allocation of UAVs
CN114389679A (zh) 基于信息年龄最小化的多天线无人机感知和传输优化方法
CN114339842B (zh) 基于深度强化学习无人机集群在时变场景下动态轨迹设计方法和装置
CN114268986A (zh) 一种无人机计算卸载与充电服务效能优化方法
Long et al. AoI-aware scheduling and trajectory optimization for multi-UAV-assisted wireless networks
CN117580105B (zh) 一种面向电网巡检的无人机任务卸载优化方法
Cui et al. Joint trajectory and power optimization for energy efficient UAV communication using deep reinforcement learning
Babu et al. Fairness-based energy-efficient 3-D path planning of a portable access point: A deep reinforcement learning approach
Zhang et al. Multi-objective optimization for UAV-enabled wireless powered IoT networks: an LSTM-based deep reinforcement learning approach
Shi et al. Age of information optimization with heterogeneous uavs based on deep reinforcement learning
Zhang et al. AoI-Minimal Power and Trajectory Optimization for UAV-Assisted Wireless Networks
CN116882270A (zh) 一种基于深度强化学习的多无人机无线充电与边缘计算联合优化方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant