CN115278901B - 水下无定位移动网络的自适应通信方法 - Google Patents

水下无定位移动网络的自适应通信方法 Download PDF

Info

Publication number
CN115278901B
CN115278901B CN202210935525.9A CN202210935525A CN115278901B CN 115278901 B CN115278901 B CN 115278901B CN 202210935525 A CN202210935525 A CN 202210935525A CN 115278901 B CN115278901 B CN 115278901B
Authority
CN
China
Prior art keywords
node
idle time
nodes
underwater
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210935525.9A
Other languages
English (en)
Other versions
CN115278901A (zh
Inventor
孙大军
明婉婷
张居成
韩云峰
郑翠娥
洪小平
李海鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN202210935525.9A priority Critical patent/CN115278901B/zh
Publication of CN115278901A publication Critical patent/CN115278901A/zh
Application granted granted Critical
Publication of CN115278901B publication Critical patent/CN115278901B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/04Wireless resource allocation
    • H04W72/044Wireless resource allocation based on the type of the allocated resource
    • H04W72/0446Resources in time domain, e.g. slots or frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B13/00Transmission systems characterised by the medium used for transmission, not provided for in groups H04B3/00 - H04B11/00
    • H04B13/02Transmission systems in which the medium consists of the earth or a large mass of water thereon, e.g. earth telegraphy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/12Wireless traffic scheduling
    • H04W72/1221Wireless traffic scheduling based on age of data to be sent
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/12Wireless traffic scheduling
    • H04W72/1263Mapping of traffic onto schedule, e.g. scheduled allocation or multiplexing of flows
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

水下无定位移动网络的自适应通信方法,解决了现有水下传感器网络传输效率和信道利用率低的问题,属于水下传感器网络技术领域。本发明包括:S1、对水下无定位移动网络中规定运动范围内的节点进行排序及标号,并按照排序作为节点发送数据包的顺序,对n个节点进行轮询式组网;S2、各节点接收完数据包后,根据当前周期数据包的发送时刻进行发送,同时利用神经网络对各节点下一周期按照排序的空闲时间进行预测;S3、采用Q‑learning算法对预测的空闲时间进行自适应调整,将空闲时间调整至最优值,并相应地调整各节点下一周期数据包按照排序的发送时刻;S4、运行至下一周期时,将调整后的空闲时间分配至各节点,转入S2。

Description

水下无定位移动网络的自适应通信方法
技术领域
本发明涉及一种水下无定位移动网络的自适应通信方法,属于水下传感器网络技术领域。
背景技术
水声通信网络由布放在水下和水面上多个设备相互结合建立成一个整体的网络,传统的TDMA协议规定节点在固定时隙传输从而避免数据包冲突,但由于水下信道传输延迟长、通信带宽窄,导致传输效率和信道利用率低。
公开号为CN108430111A的发明专利《一种分布式TDMA协议中的混合时隙预约方法》,将固定时隙划分、动态时隙预约与非预约的突发传输结合,提供了自适应负载变化的数据传输能力。根据业务负载变化自适应地分配时隙,保证了稳定的时延要求提高了时隙利用率。但在陆地传感器网络中,端到端时延很小,可以忽略,并不适用与传播时延很大的水下传感器网络。
公开号为CN101287000A的发明专利《一种基于TDMA的水下传感器网络介质访问控制协议》。该方法根据节点所在的具体网络环境中的传播时延不同而设置不同的最优保护时间,利用推迟时间为节点分配传输时间,减少冲突,提高信道利用率。该方法的不足是节点在计算推迟时间时,需要掌握水下节点的位置信息,对于移动自组织网络来说不易实现。
发明内容
针对现有水下传感器网络传输效率和信道利用率低的问题,本发明提供一种水下无定位移动网络的自适应通信方法。
本发明的一种水下无定位移动网络的自适应通信方法,所述方法包括:
S1、对水下无定位移动网络中规定运动范围内的节点进行排序及标号为:1,2,3…n,并按照排序作为节点发送数据包的顺序,对n个节点进行轮询式组网;
S2、各节点接收完数据包后,并根据当前周期数据包的发送时刻进行发送,同时利用神经网络对各节点下一周期按照排序的空闲时间进行预测;
神经网络的输入为当前周期及其前3周期按照排序的空闲时间,输出为各节点下一周期按照排序的空闲时间;
S3、采用Q-learning算法对预测的空闲时间进行自适应调整,将空闲时间调整至最优值,并相应地调整各节点下一周期数据包按照排序的发送时刻;
S4、运行至下一周期时,将调整后的空闲时间分配至各节点,转入S2。
作为优选,
空闲时间τ满足条件:
0≤τ<min(Δtmax-Δtij),i,j∈n,i≠j
其中,Δtij表示任意两个节点间的传输时延,Δtmax表示规定运动范围内最大传输时延。
作为优选,所述S3包括:
多智能体Q-learnin下n个节点的最优价值估计函数为:
Figure BDA0003782395330000021
其中,s表示空闲时间的状态,a表示可选取的动作集,st+1表示状态s在执行动作集a后获得状态;
Figure BDA0003782395330000022
表示更新前的动作状态值,
Figure BDA0003782395330000023
更新后的动作状态值,α为学习率,γ为折损率,
Figure BDA0003782395330000024
为节点调整产生的回报值;
根据
Figure BDA0003782395330000025
对最优价值估计函数进行更新,
Figure BDA0003782395330000026
为:
Figure BDA0003782395330000027
其中,w1和w2为选取权重,
Figure BDA0003782395330000028
为当前周期节点i的空闲时间,pre_error为预测值的平均预测误差,
Figure BDA0003782395330000029
为运动节点传输时延的最大突变值,表示为:
Figure BDA00037823953300000210
其中,vi为节点i的运动速度,Δt为节点运动的时间步长,vc为水下声速;
综合考虑预测的空闲时间、预测值的平均预测误差和运动节点传输时延的最大突变值的影响,自适应调整预测的空闲时间至最优值,保证在最优的空闲时间的基础上不会产生节点运动导致的数据包收发碰撞。
作为优选,当
Figure BDA00037823953300000211
时,w1≤0,w2≤0;当
Figure BDA00037823953300000212
时,w1=1000,w2≤0。
作为优选,0<α≤0.1,0.9≤γ<1。
作为优选,所述神经网络采用LSTM网络实现。
作为优选,构建训练数据,对输入训练数据进行归一化处理,输入训练数据为每个周期各节点按照排序的空闲时间,LSTM网络的权重和偏置采用随机梯度下降算法进行训练,使用训练好的权重偏置进行预测,最后对预测值进行反归一化得到空闲时间,即为最后输出数据为下一周期各节点按照排序的空闲时间。
作为优选,对输入训练数据进行归一化处理包括:
Figure BDA0003782395330000031
其中,xnormalized表示归一化后的数据,xmean表示数据的平均值,xsd表示数据的标准差。
本发明的有益效果,本发明的方法无需水下定位信息,通过对空闲时间进行预测并自适应调整,在保证无冲突传输的条件下,实现高效的信息交互,减小了端到端时延,提高了网络吞吐量和信道利用率。
附图说明
图1为本发明的流程示意图;
图2为具体实施方式中节点数据链路示意图;
图3为具体实施方式中自适应TDMA协议示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
本实施方式的水下无定位移动网络的自适应通信方法,在传统TDMA协议的基础上,对水下各移动节点发送数据前的空闲时间进行预测和自适应调整,并相应调整下一周期各节点数据包发送时刻,构建无需水下定位信息的自适应通信协议。本实施方式的包括:
S1、对水下无定位移动网络中规定运动范围内的节点进行排序及标号为:1,2,3…n,并按照排序作为节点发送数据包的顺序,发送数据包固定时长为t0,对n个节点进行轮询式组网;根据轮询式组网,水下传感器网络在当前周期结束前即下一周期开始前,需要规定好下一周期各节点发射数据包时刻。
S2、各节点接收完数据包后,各节点接收完数据包后保留一定的空闲时间作为保护时间,根据当前周期数据包的发送时刻进行发送,同时利用神经网络预测模型对各节点下一周期按照排序的空闲时间进行预测;
神经网络预测模型的输入为当前周期及其前3周期按照排序的空闲时间,输出为各节点下一周期按照排序的空闲时间;
S3、采用Q-learning算法对预测的空闲时间进行自适应调整,将空闲时间调整至最优值,并相应地调整各节点下一周期数据包按照排序的发送时刻;
S4、运行至下一周期时,将调整后的空闲时间分配至各节点,转入S2。
本实施方式中,空闲时间τ满足条件:
0≤τ<min(Δtmax-Δtij),i,j∈n,i≠j
其中,Δtij表示任意两个节点间的传输时延,Δtmax表示规定运动范围内最大传输时延。
本实施方式中,步骤3包括:
多智能体Q-learnin下n个节点的最优价值估计函数为:
Figure BDA0003782395330000041
其中,s表示空闲时间的状态,a表示可选取的动作集,st+1表示状态s在执行动作集a后获得状态;
Figure BDA0003782395330000042
表示更新前的动作状态值,
Figure BDA0003782395330000043
更新后的动作状态值,α为学习率,γ为折损率,
Figure BDA0003782395330000044
为节点调整产生的回报值;
根据
Figure BDA0003782395330000045
对最优价值估计函数进行更新,
Figure BDA0003782395330000046
为:
Figure BDA0003782395330000047
其中,w1和w2为选取权重,
Figure BDA0003782395330000048
为当前周期节点i的空闲时间,pre_error为预测值的平均预测误差,
Figure BDA0003782395330000049
为运动节点传输时延的最大突变值,表示为:
Figure BDA0003782395330000051
其中,vi为节点i的运动速度,Δt为节点运动的时间步长,vc为水下声速;
综合考虑预测的空闲时间、预测误差和节点传输时延因水下环境突变的影响,自适应调整预测的空闲时间至最优值,保证在最优的空闲时间的基础上不会产生节点运动导致的数据包收发碰撞。本实施方式无需水下移动节点的定位信息,适用范围广泛,避免了各节点空闲时间长导致信道利用率低的问题,减小了端到端时延,提高了网络吞吐量。
具体实施例:图2为水下节点数为3时的信息交互形式,水下移动网络在2km*2km范围内运动,针对水下无定位移动网络的自适应协议包括如下步骤:
步骤1:水下移动节点发射固定时长为t0的数据包,数据传输速率为b,每个阵元间距离为Si,i∈n,传输时延为ti=Si/c,i∈n。节点1,2,3的三条链路连线距离关系为d1<d3<d2,节点传输顺序为节点1→节点2→节点3,t1、t2、t3分别为链路12、23、13对应的传播时延,t0为数据包长度。
步骤2:图3所示为自适应TDMA协议传输图,每个节点的时隙起点,即进入发送时隙的时刻是自适应变化的,且占用的时隙长度也是动态变化的。节点1发送的数据包到达节点2和3的时刻分别为t1和t3,节点1在[0,t0]时间段内处于发射状态,节点2、3分别在[t1,t1+t0]、[t3,t3+t0]时间段内处于接收状态(t0>t1>t3)。节点2接收完数据包后保留一定的空闲时间τ作为保护时间,防止数据包间发生收发碰撞,τ满足条件:
0≤τ<min(Δtmax-Δtij),i,j∈n,i≠j
其中Δtij表示任意两个节点间的传输时延,Δtmax表示规定运动范围内最大传输时延。
节点2接收完数据并经过时间τ后向节点1和3发送数据包,此时第二个节点的发送时刻为t1+t0+τ。同理节点3接收完节点2发送的数据包并经过空闲时间τ后,立刻向节点1和2发送,发送时刻为t1+t2+2t0+2τ。当最后一个节点发送,第一个发送节点成功接收后完成一个最短无碰撞周期,周期长为:T=t1+t2+t3+3t0+3τ。
在保证不发生数据冲突的前提下获取空闲时间数据进行预测模型训练,传感器网络中当前周期及其前3周期的空闲时间作为输入量,输入值个数为20。对输入值进行归一化处理,采用Z-score方法进行归一化:
Figure BDA0003782395330000061
其中,xnormalized表示归一化后的数据,可直接用于预测模型中;xmean表示数据的平均值,xsd表示数据的标准差。
利用基于LSTM网络的预测模型对下一周期的空闲时间进行预测,输出下一周期各节点按照排序的空闲时间,输出值个数为5。每次训练采用的样本数为Batch-size为100,迭代训练次数epoch为2,学习率为0.005。LSTM网络中预测隐藏层层数采用1层,每层采用10个神经元。LSTM网络预测时,带入训练完成的权重偏置数据和输入数据,经过LSTM网络得到预测值。
步骤3:采用Q-learning算法对的预测的空闲时间进行自适应调整,考虑空闲时间大小、预测误差和传输时延突变的因素,将预测值调整至最优状态,即能够在保证空闲时间较小的情况下不会因为运动时延或预测误差而产生数据包收发碰撞。
采用Q-learning算法根据奖惩机制调整行为策略从而达到目标,对预测的未来空闲时间进行自适应地调整,多智能体Q-learnin下n个节点的最优价值估计函数,为:
Figure BDA0003782395330000062
其中α为学习率设为0<α≤0.1,表示过去的历史价值对状态价值的影响,参数初始化为α=0.05;γ为折损率设为0.9≤γ<1,表示对长期回报价值的参考程度,参数初始化为γ=0.9。
Figure BDA0003782395330000063
表示更新后的动作状态值,s表示空闲时间状态。a表示可选取的动作集,如a=[-a...-0.2 -0.1 0 0.1 0.2...b],a>0,b>0,表示可根据算法相应的选取动作集来改变空闲时间状态,如选择‘-a’减小空闲时间或选择‘b’增加空闲时间,st+1表示状态s在执行动作集a获得状态。
根据节点调整产生的回报值
Figure BDA0003782395330000064
对上式最优价值估计函数进行更新,其中回报函数
Figure BDA0003782395330000065
为:
Figure BDA0003782395330000066
其中w1和w2为选取权重,
Figure BDA0003782395330000067
为当前时刻节点i的空闲时间,pre_error为预测值的平均预测误差,
Figure BDA0003782395330000068
为运动节点传输时延的最大突变值。当
Figure BDA0003782395330000069
时,w1≤0,w2≤0,即可假设w1=-2,w2=-1;当
Figure BDA00037823953300000610
时,w1=1000,w2≤0,即可假设w1=1000,w2=-1。当空闲时间
Figure BDA00037823953300000611
时,表示节点间发生收发碰撞情况,设置w1=1000是为了使空间时间为负时的回报值尽可能小,以此来避免数据包收发碰撞。
Figure BDA0003782395330000071
为运动节点传输时延的最大突变值,可表示为:
Figure BDA0003782395330000072
其中vi为节点i的运动速度,Δt为节点运动的时间步长,vc为水下声速。综合考虑预测空闲时间、预测误差和节点传输时延因水下环境突变等因素的影响,自适应调整未来空闲时间至最优值,保证在较小的空闲时间的基础上不会产生节点运动导致的数据包收发碰撞。
步骤4:等运行至下一周期时,将调整后的空闲时间分配至各节点;
不断重复步骤2至步骤4,其中步骤2的输入量变更为当前水下传感器网络之前周期调整后的空闲时间。
虽然在本文中参照了特定的实施方式来描述本发明,但是应该理解的是,这些实施例仅仅是本发明的原理和应用的示例。因此应该理解的是,可以对示例性的实施例进行许多修改,并且可以设计出其他的布置,只要不偏离所附权利要求所限定的本发明的精神和范围。应该理解的是,可以通过不同于原始权利要求所描述的方式来结合不同的从属权利要求和本文中所述的特征。还可以理解的是,结合单独实施例所描述的特征可以使用在其他所述实施例中。

Claims (6)

1.一种水下无定位移动网络的自适应通信方法,其特征在于,所述方法包括:
S1、对水下无定位移动网络中规定运动范围内的节点进行排序及标号为:1,2,3…n,并按照排序作为节点发送数据包的顺序,对n个节点进行轮询式组网;
S2、各节点接收完数据包后,并根据当前周期数据包的发送时刻进行发送,同时利用神经网络对各节点下一周期按照排序的空闲时间进行预测;
神经网络的输入为当前周期及其前3周期按照排序的空闲时间,输出为各节点下一周期按照排序的空闲时间;
S3、采用Q-learning算法对预测的空闲时间进行自适应调整,将空闲时间调整至最优值,并相应地调整各节点下一周期数据包按照排序的发送时刻;
S4、运行至下一周期时,将调整后的空闲时间分配至各节点,转入S2;
空闲时间τ满足条件:
0≤τ<min(Δtmax-Δtij),i,j∈n,i≠j
其中,Δtij表示任意两个节点间的传输时延,Δtmax表示规定运动范围内最大传输时延;
所述S3包括:
多智能体Q-learning下n个节点的最优价值估计函数为:
Figure FDA0004193938880000011
其中,s表示空闲时间的状态,a表示可选取的动作集,st+1表示状态s在执行动作集a后获得状态;
Figure FDA0004193938880000012
表示更新前的动作状态值,
Figure FDA0004193938880000013
更新后的动作状态值,α为学习率,γ为折损率,rt i为节点调整产生的回报值;
根据rt i对最优价值估计函数进行更新,rt i为:
Figure FDA0004193938880000014
其中,w1和w2为选取权重,
Figure FDA0004193938880000015
为当前周期节点i的空闲时间,pre_error为预测值的平均预测误差,
Figure FDA0004193938880000016
为运动节点传输时延的最大突变值,表示为:
Figure FDA0004193938880000017
其中,vi为节点i的运动速度,Δt为节点运动的时间步长,vc为水下声速;
综合考虑预测的空闲时间、预测值的平均预测误差和运动节点传输时延的最大突变值的影响,自适应调整预测的空闲时间至最优值,保证在最优的空闲时间的基础上不会产生节点运动导致的数据包收发碰撞。
2.根据权利要求1所述的水下无定位移动网络的自适应通信方法,其特征在于,当
Figure FDA0004193938880000021
时,w1≤0,w2≤0;当
Figure FDA0004193938880000022
时,w1=1000,w2≤0。
3.根据权利要求1所述的水下无定位移动网络的自适应通信方法,其特征在于,0<α≤0.1,0.9≤γ<1。
4.根据权利要求1所述的水下无定位移动网络的自适应通信方法,其特征在于,所述神经网络采用LSTM网络实现。
5.根据权利要求4所述的水下无定位移动网络的自适应通信方法,其特征在于,
构建训练数据,对输入训练数据进行归一化处理,输入训练数据为每个周期各节点按照排序的空闲时间,LSTM网络的权重和偏置采用随机梯度下降算法进行训练,使用训练好的权重偏置进行预测,最后对预测值进行反归一化得到空闲时间,即为最后输出数据为下一周期各节点按照排序的空闲时间。
6.根据权利要求5所述的水下无定位移动网络的自适应通信方法,其特征在于,
对输入训练数据进行归一化处理包括:
Figure FDA0004193938880000023
其中,xnormalized表示归一化后的数据,xmean表示数据的平均值,xsd表示数据的标准差。
CN202210935525.9A 2022-08-04 2022-08-04 水下无定位移动网络的自适应通信方法 Active CN115278901B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210935525.9A CN115278901B (zh) 2022-08-04 2022-08-04 水下无定位移动网络的自适应通信方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210935525.9A CN115278901B (zh) 2022-08-04 2022-08-04 水下无定位移动网络的自适应通信方法

Publications (2)

Publication Number Publication Date
CN115278901A CN115278901A (zh) 2022-11-01
CN115278901B true CN115278901B (zh) 2023-06-06

Family

ID=83749047

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210935525.9A Active CN115278901B (zh) 2022-08-04 2022-08-04 水下无定位移动网络的自适应通信方法

Country Status (1)

Country Link
CN (1) CN115278901B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103716898A (zh) * 2013-12-27 2014-04-09 天津大学 基于运动预测的水下传感器网络介质访问控制方法
CN107063195A (zh) * 2016-11-09 2017-08-18 哈尔滨工程大学 一种基于递归位置估计的大规模水下网络定位方法
JP2021034050A (ja) * 2019-08-21 2021-03-01 哈爾浜工程大学 強化学習に基づくauv行動計画及び動作制御方法
CN113155134A (zh) * 2021-04-27 2021-07-23 哈尔滨工程大学 一种基于惯性信息辅助的水声信道跟踪与预测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ITUB20155063A1 (it) * 2015-10-16 2017-04-16 Univ Degli Studi Di Roma La Sapienza Roma ?metodo e dispositivo per selezionare dinamicamente ed in modo autonomo nel tempo, la migliore soluzione da usare per la comunicazione fra i diversi nodi di una rete di sensori sottomarina, al fine di adattarsi automaticamente alle condizioni mutevoli dell?ambiente sottomarino?
US11146479B2 (en) * 2019-10-10 2021-10-12 United States Of America As Represented By The Secretary Of The Navy Reinforcement learning-based intelligent control of packet transmissions within ad-hoc networks

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103716898A (zh) * 2013-12-27 2014-04-09 天津大学 基于运动预测的水下传感器网络介质访问控制方法
CN107063195A (zh) * 2016-11-09 2017-08-18 哈尔滨工程大学 一种基于递归位置估计的大规模水下网络定位方法
JP2021034050A (ja) * 2019-08-21 2021-03-01 哈爾浜工程大学 強化学習に基づくauv行動計画及び動作制御方法
CN113155134A (zh) * 2021-04-27 2021-07-23 哈尔滨工程大学 一种基于惯性信息辅助的水声信道跟踪与预测方法

Also Published As

Publication number Publication date
CN115278901A (zh) 2022-11-01

Similar Documents

Publication Publication Date Title
CN113254197B (zh) 一种基于深度强化学习的网络资源调度方法及系统
CN111867139B (zh) 基于q学习的深度神经网络自适应退避策略实现方法及系统
US11265077B1 (en) Method for deploying task in satellite network
Vu et al. Multi-agent reinforcement learning for channel assignment and power allocation in platoon-based C-V2X systems
Lin et al. Popularity-aware online task offloading for heterogeneous vehicular edge computing using contextual clustering of bandits
CN113507328B (zh) 水声网络时隙mac协议方法、系统、装置及介质
CN113691391B (zh) 基于q学习的节点数量可变水声网络介质访问控制方法
CN109660375B (zh) 一种高可靠的自适应mac层调度方法
CN110167054A (zh) 一种面向边缘计算节点能量优化的QoS约束路由方法
Ke et al. Applying deep reinforcement learning to improve throughput and reduce collision rate in IEEE 802.11 networks
CN112929900A (zh) 水声网络中基于深度强化学习实现时域干扰对齐的mac协议
WO2024000344A1 (zh) 一种模型训练方法及相关装置
CN109889253A (zh) 支持临近空间网络的自适应多信道媒介访问控制方法
WO2022218516A1 (en) Devices and methods for collaborative learning of a transmission policy in wireless networks
CN114024639B (zh) 一种无线多跳网络中分布式信道分配方法
Cui et al. Dynamic multichannel access based on deep reinforcement learning in distributed wireless networks
CN115278901B (zh) 水下无定位移动网络的自适应通信方法
CN114599115A (zh) 一种无人机自组织网络信道接入方法
CN113490239A (zh) 基于自适应网络编码的异构无线链路并发传输控制方法
CN114189937A (zh) 基于深度强化学习的实时集中式无线网络调度方法和设备
CN109861774B (zh) 一种认知水声网络接入调度方法
Lee et al. Multi-agent reinforcement learning for a random access game
CN114500383A (zh) 天地一体化信息网络智能拥塞控制方法、系统及介质
CN111294284B (zh) 流量调度方法及装置
Mamduhi et al. State-dependent data queuing in shared-resource networked control systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant