CN113253249B - 一种基于深度强化学习的mimo雷达功率分配设计方法 - Google Patents

一种基于深度强化学习的mimo雷达功率分配设计方法 Download PDF

Info

Publication number
CN113253249B
CN113253249B CN202110416424.6A CN202110416424A CN113253249B CN 113253249 B CN113253249 B CN 113253249B CN 202110416424 A CN202110416424 A CN 202110416424A CN 113253249 B CN113253249 B CN 113253249B
Authority
CN
China
Prior art keywords
action
mimo radar
antenna
power distribution
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110416424.6A
Other languages
English (en)
Other versions
CN113253249A (zh
Inventor
余晨
李�昊
杨益川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 29 Research Institute
Original Assignee
CETC 29 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 29 Research Institute filed Critical CETC 29 Research Institute
Priority to CN202110416424.6A priority Critical patent/CN113253249B/zh
Publication of CN113253249A publication Critical patent/CN113253249A/zh
Application granted granted Critical
Publication of CN113253249B publication Critical patent/CN113253249B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S13/00Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
    • G01S13/003Bistatic radar systems; Multistatic radar systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S13/00Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
    • G01S13/02Systems using reflection of radio waves, e.g. primary radar systems; Analogous systems
    • G01S13/06Systems determining position data of a target
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E40/00Technologies for an efficient electrical power generation, transmission or distribution
    • Y02E40/70Smart grids as climate change mitigation technology in the energy generation sector
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本发明提供一种基于深度强化学习的MIMO雷达功率分配设计方法,包括如下步骤:S1,设置一个固定收发天线位置的MIMO雷达系统对指定目标区域进行监视;S2,通过深度强化学习方法对所述MIMO雷达系统进行功率分配控制。本发明使用深度强化学习方法,实现MIMO雷达系统中各发射天线功率分配策略的自主学习,完成训练学习后能够快速完成功率分配。在高维空间复杂场景中,能够快速优化雷达功率资源,满足监视任务指标。

Description

一种基于深度强化学习的MIMO雷达功率分配设计方法
技术领域
本发明涉及MIMO雷达功率分配技术领域,具体而言,涉及一种基于深度强化学习的MIMO雷达功率分配设计方法。
背景技术
对于没有足够燃料补充的分布式多雷达系统,例如车载、机载和天基雷达等移动雷达站,要求在有限的能量资源下进行长时间的工作。通过优化雷达功率分配策略可以在功率一定的条件下提升性能。
Godrich等人2011年在IEEE Transaction on Signal Processing上发表的论文《Power allocation strategies for target localization indistributed multiple-radar architecture》中提出了基于凸松弛和区域分解方法的功率分配方案,证明了平均功率分配不一定是最佳选择。Ghassemi等人2011年在IEEE Transaction on AerospaceElectronic Systems上发表的论文《Separable approximation for solving the sensorsubset selection problem》中提出了一种基于沙普利值的迭代功率优化分配策略,有效提高资源的使用效率,获得更高的目标定位精度。Gharehshiran等人2010年在IEEETransaction on Signal Processing上发表的论文《Coalition Formation forBearings-Only Localization in Sensor Networks-A Cooperative Game Approach》中针对基于方位观测的目标定位问题,提出了改进的合作博弈算法,使得分配到各节点的平均休眠时间最大。
发明内容
本发明旨在提供一种基于深度强化学习的MIMO雷达功率分配设计方法,以在指定监视区域情况下,对多个收发天线分置组成的MIMO雷达定位系统,优化发射天线功率分配、提升监视性能。
本发明提供的一种基于深度强化学习的MIMO雷达功率分配设计方法,包括如下步骤:
S1,设置一个固定收发天线位置的MIMO雷达系统对指定目标区域进行监视;
S2,通过深度强化学习方法对所述MIMO雷达系统进行功率分配控制。
进一步的,步骤S2包括如下子步骤:
S21,将监视的目标区域进行离散化处理,获得该目标区域的栅格模型,分成L个栅格;将所述MIMO雷达系统的总功率P离散化为N份;发射天线功率Pi,i=1,2,…,N,N表示发射天线数量;每个份发射天线功率最大值为B;
S22,初始化容量为M的储存空间D;
S23,初始化两个神经网络,分别为当前状态-动作网络Q和目标状态-动作网络
Figure BDA0003026068190000024
权重分别为w和
Figure BDA0003026068190000023
Figure BDA0003026068190000022
S24,对于1到K次功率分配任务,进行步骤S241~S242的循环:
S241,初始化功率分配状态s0=[p1,p2,p3.p4],表示T1、T2、T3、T4四个发射天线功率初始分配情况;
并初始化动作空间A=[a1,a2,a3,a4,a5,a6,a7,a8,a9,a10,a11,a12,a13];
S242,对于时间步1到T,进行步骤S2421~S2425的循环:
S2421,根据ε-greedy策略,以概率ε选择一个随机动作at∈A;以概率1-ε选择当前状态-动作网络Q所对应的动作
Figure BDA0003026068190000021
执行动作at,获得回报值rt以及下一时刻状态st+1
S2422,将状态转移样本(st,at,rt,st+1)保持在存储空间D中,如果存储空间已满,根据先进先出原则删除状态转移样本;
S2423,从存储空间D中均匀随机采用一批状态转移样本(st,at,rt,st+1),判断该状态转移样本是否是一个功率分配任务的终止状态,若是终止状态,则时间差分目标为yt=rt,否则时间差分目标为
Figure BDA0003026068190000031
S2424,根据梯度下降算法更新当前状态-动作网络Q的权重w;
S2425,每间隔C时间步更新一次目标状态-动作网络
Figure BDA0003026068190000032
的权重:
Figure BDA0003026068190000033
S243,当更新次数满足预设阈值时,停止训练并保存训练完成的目标状态-动作网络
Figure BDA0003026068190000034
S25,利用训练完成的目标状态-动作网络
Figure BDA0003026068190000035
对所述MIMO雷达系统进行功率分配控制。
进一步的,初始化的所述功率分配状态s0=[p1,p2,p3.p4]中,
Figure BDA0003026068190000036
进一步的,步骤S2421中,如果pi<B,回报值rt为F(st)-F(st-1),否则rt=-10;其中,
Figure BDA0003026068190000037
φl(st)值作为目标区域的栅格模型中第l个栅格的监视性能指标函数。
进一步的,所述目标区域的栅格模型中第l个栅格的监视性能指标函数φl(st)与信噪比的关系如下:
Figure BDA0003026068190000038
Figure BDA0003026068190000041
其中,D0代表满足设计探测性能的探测因子;σi,j是针对第i个发射天线和第j个接收天线的目标RCS,σi,i是针对第i个发射天线的目标RCS;Rti是从第i个发射天线到第k个距离分辨单元的的欧几里得距离;Rrj是从第j个接收天线到第k个距离分辨单元的欧几里得距离;Rmax是MIMO雷达系统的最大探测距离。
进一步的,步骤S2424中根据梯度下降算法更新当前状态-动作网络Q的权重的公式为:
Figure BDA0003026068190000042
进一步的,初始化动作空间A=[a1,a2,a3,a4,a5,a6,a7,a8,a9,a10,a11,a12,a13]具体如下:
Figure BDA0003026068190000043
综上所述,由于采用了上述技术方案,本发明的有益效果是:
本发明使用深度强化学习方法,实现MIMO雷达系统中各发射天线功率分配策略的自主学习,完成训练学习后能够快速完成功率分配。在高维空间复杂场景中,能够快速优化雷达功率资源,满足监视任务指标。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例的基于深度强化学习的MIMO雷达功率分配设计方法的原理图。
图2为本发明实施例的通过深度强化学习方法对所述MIMO雷达系统进行功率分配控制的算法流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
如图1所示,本实施例提出一种基于深度强化学习的MIMO雷达功率分配设计方法,包括如下步骤:
S1,设置一个固定收发天线位置的MIMO雷达系统对指定目标区域(24kmX24km)进行监视;
S2,通过深度强化学习方法对所述MIMO雷达系统进行功率分配控制。
如图2所示,步骤S2包括如下子步骤:
S21,将监视的目标区域进行离散化处理,获得该目标区域的栅格模型,分成L个栅格;将所述MIMO雷达系统的总功率P离散化为N份;发射天线功率Pi,i=1,2,…,N,N表示发射天线数量;每个份发射天线功率最大值为B;
S22,初始化容量为M的储存空间D;
S23,初始化两个神经网络,分别为当前状态-动作网络Q和目标状态-动作网络
Figure BDA0003026068190000061
权重分别为w和
Figure BDA0003026068190000062
Figure BDA0003026068190000063
S24,对于1到K次功率分配任务,进行步骤S241~S242的循环:
S241,初始化功率分配状态s0=[p1,p2,p3.p4],表示T1、T2、T3、T4四个发射天线功率初始分配情况,与T1、T2、T3、T4四个发射天线对应有四个接收天线R1、R2、R3、R4;其中,
Figure BDA0003026068190000064
即以功率平均分配为初始化状态s0
并初始化动作空间A=[a1,a2,a3,a4,a5,a6,a7,a8,a9,a10,a11,a12,a13],如表1所示。
表1,本实施例的初始化动作空间定义:
Figure BDA0003026068190000065
Figure BDA0003026068190000071
S242,对于时间步1到T,进行步骤S2421~S2425的循环:
S2421,根据ε-greedy策略,以概率ε选择一个随机动作at∈A;以概率1-ε选择当前状态-动作网络Q所对应的动作
Figure BDA0003026068190000072
执行动作at,获得回报值rt以及下一时刻状态st+1;如果pi<B,回报值rt为F(st)-F(st-1),否则rt=-10;
其中,
Figure BDA0003026068190000073
φl(st)值作为目标区域的栅格模型中第l个栅格的监视性能指标函数。
所述目标区域的栅格模型中第l个栅格的监视性能指标函数φl(st)与信噪比的关系如下:
Figure BDA0003026068190000074
Figure BDA0003026068190000075
其中,D0代表满足设计探测性能的探测因子;σi,j是针对第i个发射天线和第j个接收天线的目标RCS,σi,i是针对第i个发射天线的目标RCS;Rti是从第i个发射天线到第k个距离分辨单元的的欧几里得距离;Rrj是从第j个接收天线到第k个距离分辨单元的欧几里得距离;Rmax是MIMO雷达系统的最大探测距离。
S2422,将状态转移样本(st,at,rt,st+1)保持在存储空间D中,如果存储空间已满,根据先进先出原则删除状态转移样本;
S2423,从存储空间D中均匀随机采用一批状态转移样本(st,at,rt,st+1),判断该状态转移样本是否是一个功率分配任务的终止状态,若是终止状态,则时间差分目标为yt=rt,否则时间差分目标为
Figure BDA0003026068190000081
S2424,根据梯度下降算法更新当前状态-动作网络Q的权重:
Figure BDA0003026068190000082
S2425,每间隔C时间步更新一次目标状态-动作网络
Figure BDA0003026068190000083
的权重:
Figure BDA0003026068190000084
S243,当更新次数满足预设阈值时,停止训练并保存训练完成的目标状态-动作网络
Figure BDA0003026068190000085
S25,利用训练完成的目标状态-动作网络
Figure BDA0003026068190000086
对所述MIMO雷达系统进行功率分配控制。即,将当前各发射天线功率分配状态作为目标状态-动作网络
Figure BDA0003026068190000087
的输入,然后输出功率分配策略,指导发射天线功率分配,各发射天线功率分配状态更新后作为新的状态输入目标状态-动作网络
Figure BDA0003026068190000088
重复此过程直到各发射天线功率分配状态稳定。
至此,本发明使用深度强化学习方法,实现MIMO雷达系统中各发射天线功率分配策略的自主学习,完成训练学习后能够快速完成功率分配。在高维空间复杂场景中,能够快速优化雷达功率资源,满足监视任务指标。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于深度强化学习的MIMO雷达功率分配设计方法,其特征在于,包括如下步骤:
S1,设置一个固定收发天线位置的MIMO雷达系统对指定目标区域进行监视;
S2,通过深度强化学习方法对所述MIMO雷达系统进行功率分配控制;
步骤S2包括如下子步骤:
S21,将监视的目标区域进行离散化处理,获得该目标区域的栅格模型,分成L个栅格;将所述MIMO雷达系统的总功率P离散化为N份;发射天线功率Pi,i=1,2,…,N,N表示发射天线数量;每个份发射天线功率最大值为B;
S22,初始化容量为M的储存空间D;
S23,初始化两个神经网络,分别为当前状态-动作网络Q和目标状态-动作网络
Figure FDA0004132649650000011
权重分别为w和
Figure FDA0004132649650000012
Figure FDA0004132649650000013
S24,对于1到K次功率分配任务,进行步骤S241~S242的循环:
S241,初始化功率分配状态s0=[p1,p2,p3.p4],表示T1、T2、T3、T4四个发射天线功率初始分配情况;
并初始化动作空间A=[a1,a2,a3,a4,a5,a6,a7,a8,a9,a10,a11,a12,a13];
S242,对于时间步1到T,进行步骤S2421~S2425的循环:
S2421,根据ε-greedy策略,以概率ε选择一个随机动作at∈A;以概率1-ε选择当前状态-动作网络Q所对应的动作
Figure FDA0004132649650000014
执行动作at,获得回报值rt以及下一时刻状态st+1
S2422,将状态转移样本(st,at,rt,st+1)保持在存储空间D中,如果存储空间已满,根据先进先出原则删除状态转移样本;
S2423,从存储空间D中均匀随机采用一批状态转移样本(st,at,rt,st+1),判断该状态转移样本是否是一个功率分配任务的终止状态,若是终止状态,则时间差分目标为yt=rt,否则时间差分目标为
Figure FDA0004132649650000021
S2424,根据梯度下降算法更新当前状态-动作网络Q的权重w;
S2425,每间隔C时间步更新一次目标状态-动作网络
Figure FDA0004132649650000022
的权重:
Figure FDA0004132649650000027
S243,当更新次数满足预设阈值时,停止训练并保存训练完成的目标状态-动作网络
Figure FDA0004132649650000023
S25,利用训练完成的目标状态-动作网络
Figure FDA0004132649650000024
对所述MIMO雷达系统进行功率分配控制。
2.根据权利要求1所述的基于深度强化学习的MIMO雷达功率分配设计方法,其特征在于,初始化的所述功率分配状态s0=[p1,p2,p3.p4]中,
Figure FDA0004132649650000025
3.根据权利要求1所述的基于深度强化学习的MIMO雷达功率分配设计方法,其特征在于,步骤S2421中,如果pi<B,回报值rt为F(st)-F(st-1),否则rt=-10;其中,
Figure FDA0004132649650000026
φl(st)值作为目标区域的栅格模型中第l个栅格的监视性能指标函数。
4.根据权利要求3所述的基于深度强化学习的MIMO雷达功率分配设计方法,其特征在于,所述目标区域的栅格模型中第l个栅格的监视性能指标函数φl(st)与信噪比的关系如下:
Figure FDA0004132649650000031
Figure FDA0004132649650000032
其中,D0代表满足设计探测性能的探测因子;σi,j是针对第i个发射天线和第j个接收天线的目标RCS,σi,i是针对第i个发射天线的目标RCS;Rti是从第i个发射天线到第k个距离分辨单元的的欧几里得距离;Rrj是从第j个接收天线到第k个距离分辨单元的欧几里得距离;Rmax是MIMO雷达系统的最大探测距离。
5.根据权利要求1所述的基于深度强化学习的MIMO雷达功率分配设计方法,其特征在于,步骤S2424中根据梯度下降算法更新当前状态-动作网络Q的权重的公式为:
Figure FDA0004132649650000033
6.根据权利要求1所述的基于深度强化学习的MIMO雷达功率分配设计方法,其特征在于,初始化动作空间A=[a1,a2,a3,a4,a5,a6,a7,a8,a9,a10,a11,a12,a13]具体如下:
动作a1,天线功率调整包括:
p1=p1+1/N
p2=p2-1/N
动作a2,天线功率调整包括:
p1=p1+1/N
p3=p3-1/N
动作a3,天线功率调整包括:
p1=p1+1/N
p4=p4-1/N
动作a4,天线功率调整包括:p2=p2+1/N
p1=p1-1/N
动作a5,天线功率调整包括:p2=p2+1/N
p3=p3-1/N
动作a6,天线功率调整包括:p2=p2+1/N
p4=p4-1/N
动作a7,天线功率调整包括:p3=p3+1/N
p1=p1-1/N
动作a8,天线功率调整包括:p3=p3+1/N
p2=p2-1/N
动作a9,天线功率调整包括:p3=p3+1/N
p4=p4-1/N
动作a10,天线功率调整包括:p4=p4+1/N
p1=p1-1/N
动作a11,天线功率调整包括:p4=p4+1/N
p2=p2-1/N
动作a12,天线功率调整包括:p4=p4+1/N
p3=p3-1/N
动作a13,天线功率保持当前功率分配状态。
CN202110416424.6A 2021-04-19 2021-04-19 一种基于深度强化学习的mimo雷达功率分配设计方法 Active CN113253249B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110416424.6A CN113253249B (zh) 2021-04-19 2021-04-19 一种基于深度强化学习的mimo雷达功率分配设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110416424.6A CN113253249B (zh) 2021-04-19 2021-04-19 一种基于深度强化学习的mimo雷达功率分配设计方法

Publications (2)

Publication Number Publication Date
CN113253249A CN113253249A (zh) 2021-08-13
CN113253249B true CN113253249B (zh) 2023-04-28

Family

ID=77221037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110416424.6A Active CN113253249B (zh) 2021-04-19 2021-04-19 一种基于深度强化学习的mimo雷达功率分配设计方法

Country Status (1)

Country Link
CN (1) CN113253249B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109743084A (zh) * 2019-01-31 2019-05-10 南京航空航天大学 频谱共存下基于lpi的分布式组网雷达功率分配方法
US10895635B1 (en) * 2020-08-14 2021-01-19 King Abdulaziz University Method of processing waveforms at a multiple-input-multiple-output (MIMO) radar for an unknown target
CN112507622A (zh) * 2020-12-16 2021-03-16 中国人民解放军国防科技大学 一种基于强化学习的反无人机任务分配方法
CN112566261A (zh) * 2020-12-08 2021-03-26 南京爱而赢科技有限公司 一种基于深度强化学习的上行noma资源分配方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102426358B (zh) * 2011-09-05 2013-06-26 西安电子科技大学 用于雷达多目标跟踪的多波束发射功率动态分配方法
CN103941248B (zh) * 2014-04-30 2016-05-18 电子科技大学 一种适用于协同探测网络的频率-极化配置方法
CN106199579B (zh) * 2016-06-22 2018-07-13 中国人民解放军信息工程大学 分布式mimo雷达目标跟踪精度联合资源优化方法
EP3339893A1 (en) * 2016-12-22 2018-06-27 Airbus Defence and Space GmbH Multiple input multiple output, mimo, radar system
US10396919B1 (en) * 2017-05-12 2019-08-27 Virginia Tech Intellectual Properties, Inc. Processing of communications signals using machine learning
CN108173579A (zh) * 2018-01-24 2018-06-15 四川大学 无线供能mimo中继系统中的功率分配方法及无线供能mimo中继系统
CN111433627B (zh) * 2018-04-05 2023-09-22 谷歌有限责任公司 使用机器学习执行角估计的基于智能设备的雷达系统
CN108717180B (zh) * 2018-07-05 2021-09-17 南京航空航天大学 一种基于斯塔克尔伯格博弈的组网雷达功率分配方法
US11057170B2 (en) * 2018-07-27 2021-07-06 Raytheon Company Multidimensional shared spectrum access
CN109151975B (zh) * 2018-07-27 2022-05-17 北京工业大学 一种时分双工大规模mimo系统的联合动态导频和数据功率分配方法
US10503174B1 (en) * 2019-01-31 2019-12-10 StradVision, Inc. Method and device for optimized resource allocation in autonomous driving on the basis of reinforcement learning using data from lidar, radar, and camera sensor
CN110673131B (zh) * 2019-11-25 2022-04-26 电子科技大学 多波束集中式mimo雷达时空资源-波形选择管理方法
EP4066008B1 (en) * 2019-11-27 2024-01-03 Google LLC Detecting a frame-of-reference change in a smart-device-based radar system
CN111263332A (zh) * 2020-03-02 2020-06-09 湖北工业大学 基于深度强化学习的无人机轨迹及功率联合优化方法
CN112054828B (zh) * 2020-08-12 2021-07-27 南京航空航天大学 面向低截获的分布式mimo雷达通信一体化系统功率分配方法
CN112416588B (zh) * 2020-11-20 2022-06-07 中国电子科技集团公司第二十九研究所 一种基于随机森林算法的资源分配方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109743084A (zh) * 2019-01-31 2019-05-10 南京航空航天大学 频谱共存下基于lpi的分布式组网雷达功率分配方法
US10895635B1 (en) * 2020-08-14 2021-01-19 King Abdulaziz University Method of processing waveforms at a multiple-input-multiple-output (MIMO) radar for an unknown target
CN112566261A (zh) * 2020-12-08 2021-03-26 南京爱而赢科技有限公司 一种基于深度强化学习的上行noma资源分配方法
CN112507622A (zh) * 2020-12-16 2021-03-16 中国人民解放军国防科技大学 一种基于强化学习的反无人机任务分配方法

Also Published As

Publication number Publication date
CN113253249A (zh) 2021-08-13

Similar Documents

Publication Publication Date Title
Yuan et al. Scaled accuracy based power allocation for multi-target tracking with colocated MIMO radars
Cao et al. Deep reinforcement learning for multi-user access control in non-terrestrial networks
CN109709535B (zh) 一种针对协同分布式系统的波束驻留调度方法
CN107808212B (zh) 基于灰色神经网络的太阳能收集功率预测方法
CN113543176A (zh) 基于智能反射面辅助的移动边缘计算系统的卸载决策方法
CN106131862B (zh) 一种无线传感器网络中基于多目标进化算法的优化覆盖方法
CN113128121B (zh) 基于强化学习与蒙特卡洛搜索树的mimo雷达布站方法
Xiang et al. Hybrid WSN node deployment optimization strategy based on CS algorithm
CN102014344A (zh) 一种基于dpso的智能无线传感网络分簇控制方法
CN111582445A (zh) 一种基于脉冲神经网络的高效学习系统及学习方法
Chen et al. Energy-aware path planning for obtaining fresh updates in UAV-IoT MEC systems
CN113253249B (zh) 一种基于深度强化学习的mimo雷达功率分配设计方法
Qi et al. A cooperative autonomous scheduling approach for multiple earth observation satellites with intensive missions
Meng et al. Phased-array radar task scheduling method for hypersonic-glide vehicles
CN112465301B (zh) 一种基于差分隐私机制的边缘智能电网协作决策方法
CN117709678A (zh) 基于多智能体强化学习的多机协同雷达搜索资源优化方法
Maheswararajah et al. Sensor scheduling for target tracking by suboptimal algorithms
Chen et al. The contract net based task allocation algorithm for wireless sensor network
CN109409594B (zh) 一种短期风电功率预测方法
CN116088317A (zh) 一种基于动态事件触发的多智能体一致性控制方法
CN113157344B (zh) 移动边缘计算环境下基于drl的能耗感知任务卸载方法
CN116193516A (zh) 一种物联网场景下用于高效联邦学习的成本优化方法
Yan Research on hybrid discrete particle swarm algorithm to solve uav task assignment problem
Tuba et al. Firefly algorithm for multi-objective RFID network planning problem
CN110414043B (zh) 一种基于离散迭代的双事件驱动分布式优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant