CN115278901B

CN115278901B - 水下无定位移动网络的自适应通信方法

Info

Publication number: CN115278901B
Application number: CN202210935525.9A
Authority: CN
Inventors: 孙大军; 明婉婷; 张居成; 韩云峰; 郑翠娥; 洪小平; 李海鹏
Original assignee: Harbin Engineering University
Current assignee: Harbin Engineering University
Priority date: 2022-08-04
Filing date: 2022-08-04
Publication date: 2023-06-06
Anticipated expiration: 2042-08-04
Also published as: CN115278901A

Abstract

水下无定位移动网络的自适应通信方法,解决了现有水下传感器网络传输效率和信道利用率低的问题，属于水下传感器网络技术领域。本发明包括：S1、对水下无定位移动网络中规定运动范围内的节点进行排序及标号，并按照排序作为节点发送数据包的顺序，对n个节点进行轮询式组网；S2、各节点接收完数据包后，根据当前周期数据包的发送时刻进行发送，同时利用神经网络对各节点下一周期按照排序的空闲时间进行预测；S3、采用Q‑learning算法对预测的空闲时间进行自适应调整，将空闲时间调整至最优值，并相应地调整各节点下一周期数据包按照排序的发送时刻；S4、运行至下一周期时，将调整后的空闲时间分配至各节点，转入S2。

Description

水下无定位移动网络的自适应通信方法

技术领域

本发明涉及一种水下无定位移动网络的自适应通信方法，属于水下传感器网络技术领域。

背景技术

水声通信网络由布放在水下和水面上多个设备相互结合建立成一个整体的网络，传统的TDMA协议规定节点在固定时隙传输从而避免数据包冲突，但由于水下信道传输延迟长、通信带宽窄，导致传输效率和信道利用率低。

公开号为CN108430111A的发明专利《一种分布式TDMA协议中的混合时隙预约方法》，将固定时隙划分、动态时隙预约与非预约的突发传输结合，提供了自适应负载变化的数据传输能力。根据业务负载变化自适应地分配时隙，保证了稳定的时延要求提高了时隙利用率。但在陆地传感器网络中，端到端时延很小，可以忽略，并不适用与传播时延很大的水下传感器网络。

公开号为CN101287000A的发明专利《一种基于TDMA的水下传感器网络介质访问控制协议》。该方法根据节点所在的具体网络环境中的传播时延不同而设置不同的最优保护时间，利用推迟时间为节点分配传输时间，减少冲突，提高信道利用率。该方法的不足是节点在计算推迟时间时，需要掌握水下节点的位置信息，对于移动自组织网络来说不易实现。

发明内容

针对现有水下传感器网络传输效率和信道利用率低的问题，本发明提供一种水下无定位移动网络的自适应通信方法。

本发明的一种水下无定位移动网络的自适应通信方法，所述方法包括：

S1、对水下无定位移动网络中规定运动范围内的节点进行排序及标号为：1，2，3…n，并按照排序作为节点发送数据包的顺序，对n个节点进行轮询式组网；

S2、各节点接收完数据包后，并根据当前周期数据包的发送时刻进行发送，同时利用神经网络对各节点下一周期按照排序的空闲时间进行预测；

神经网络的输入为当前周期及其前3周期按照排序的空闲时间，输出为各节点下一周期按照排序的空闲时间；

S3、采用Q-learning算法对预测的空闲时间进行自适应调整，将空闲时间调整至最优值，并相应地调整各节点下一周期数据包按照排序的发送时刻；

S4、运行至下一周期时，将调整后的空闲时间分配至各节点，转入S2。

作为优选，

空闲时间τ满足条件：

0≤τ＜min(Δt_max-Δt_ij),i,j∈n,i≠j

其中，Δt_ij表示任意两个节点间的传输时延，Δt_max表示规定运动范围内最大传输时延。

作为优选，所述S3包括：

多智能体Q-learnin下n个节点的最优价值估计函数为：

其中，s表示空闲时间的状态，a表示可选取的动作集，s_t+1表示状态s在执行动作集a后获得状态；

表示更新前的动作状态值，

更新后的动作状态值，α为学习率，γ为折损率，

为节点调整产生的回报值；

根据

对最优价值估计函数进行更新，

为：

其中，w₁和w₂为选取权重，

为当前周期节点i的空闲时间，pre_error为预测值的平均预测误差，

为运动节点传输时延的最大突变值，表示为：

其中，v_i为节点i的运动速度，Δt为节点运动的时间步长，v_c为水下声速；

综合考虑预测的空闲时间、预测值的平均预测误差和运动节点传输时延的最大突变值的影响，自适应调整预测的空闲时间至最优值，保证在最优的空闲时间的基础上不会产生节点运动导致的数据包收发碰撞。

作为优选，当

时，w₁≤0，w₂≤0；当

时，w₁＝1000，w₂≤0。

作为优选，0＜α≤0.1，0.9≤γ＜1。

作为优选，所述神经网络采用LSTM网络实现。

作为优选，构建训练数据，对输入训练数据进行归一化处理，输入训练数据为每个周期各节点按照排序的空闲时间，LSTM网络的权重和偏置采用随机梯度下降算法进行训练，使用训练好的权重偏置进行预测，最后对预测值进行反归一化得到空闲时间，即为最后输出数据为下一周期各节点按照排序的空闲时间。

作为优选，对输入训练数据进行归一化处理包括：

其中，x_normalized表示归一化后的数据，x_mean表示数据的平均值，x_sd表示数据的标准差。

本发明的有益效果，本发明的方法无需水下定位信息，通过对空闲时间进行预测并自适应调整，在保证无冲突传输的条件下，实现高效的信息交互，减小了端到端时延，提高了网络吞吐量和信道利用率。

附图说明

图1为本发明的流程示意图；

图2为具体实施方式中节点数据链路示意图；

图3为具体实施方式中自适应TDMA协议示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

下面结合附图和具体实施例对本发明作进一步说明，但不作为本发明的限定。

本实施方式的水下无定位移动网络的自适应通信方法，在传统TDMA协议的基础上，对水下各移动节点发送数据前的空闲时间进行预测和自适应调整，并相应调整下一周期各节点数据包发送时刻，构建无需水下定位信息的自适应通信协议。本实施方式的包括：

S1、对水下无定位移动网络中规定运动范围内的节点进行排序及标号为：1，2，3…n，并按照排序作为节点发送数据包的顺序，发送数据包固定时长为t₀，对n个节点进行轮询式组网；根据轮询式组网，水下传感器网络在当前周期结束前即下一周期开始前，需要规定好下一周期各节点发射数据包时刻。

S2、各节点接收完数据包后，各节点接收完数据包后保留一定的空闲时间作为保护时间，根据当前周期数据包的发送时刻进行发送，同时利用神经网络预测模型对各节点下一周期按照排序的空闲时间进行预测；

神经网络预测模型的输入为当前周期及其前3周期按照排序的空闲时间，输出为各节点下一周期按照排序的空闲时间；

本实施方式中，空闲时间τ满足条件：

0≤τ＜min(Δt_max-Δt_ij),i,j∈n,i≠j

本实施方式中，步骤3包括：

多智能体Q-learnin下n个节点的最优价值估计函数为：

表示更新前的动作状态值，

更新后的动作状态值，α为学习率，γ为折损率，

为节点调整产生的回报值；

根据

对最优价值估计函数进行更新，

为：

其中，w₁和w₂为选取权重，

为运动节点传输时延的最大突变值，表示为：

综合考虑预测的空闲时间、预测误差和节点传输时延因水下环境突变的影响，自适应调整预测的空闲时间至最优值，保证在最优的空闲时间的基础上不会产生节点运动导致的数据包收发碰撞。本实施方式无需水下移动节点的定位信息，适用范围广泛，避免了各节点空闲时间长导致信道利用率低的问题，减小了端到端时延，提高了网络吞吐量。

具体实施例：图2为水下节点数为3时的信息交互形式，水下移动网络在2km*2km范围内运动，针对水下无定位移动网络的自适应协议包括如下步骤：

步骤1：水下移动节点发射固定时长为t₀的数据包，数据传输速率为b，每个阵元间距离为S_i,i∈n，传输时延为t_i＝S_i/c,i∈n。节点1,2,3的三条链路连线距离关系为d₁＜d₃＜d₂，节点传输顺序为节点1→节点2→节点3，t₁、t₂、t₃分别为链路12、23、13对应的传播时延，t₀为数据包长度。

步骤2：图3所示为自适应TDMA协议传输图，每个节点的时隙起点，即进入发送时隙的时刻是自适应变化的，且占用的时隙长度也是动态变化的。节点1发送的数据包到达节点2和3的时刻分别为t₁和t₃，节点1在[0,t₀]时间段内处于发射状态，节点2、3分别在[t₁,t₁+t₀]、[t₃,t₃+t₀]时间段内处于接收状态(t₀＞t₁＞t₃)。节点2接收完数据包后保留一定的空闲时间τ作为保护时间，防止数据包间发生收发碰撞，τ满足条件：

0≤τ＜min(Δt_max-Δt_ij),i,j∈n,i≠j

其中Δt_ij表示任意两个节点间的传输时延，Δt_max表示规定运动范围内最大传输时延。

节点2接收完数据并经过时间τ后向节点1和3发送数据包，此时第二个节点的发送时刻为t₁+t₀+τ。同理节点3接收完节点2发送的数据包并经过空闲时间τ后，立刻向节点1和2发送，发送时刻为t₁+t₂+2t₀+2τ。当最后一个节点发送，第一个发送节点成功接收后完成一个最短无碰撞周期，周期长为：T＝t₁+t₂+t₃+3t₀+3τ。

在保证不发生数据冲突的前提下获取空闲时间数据进行预测模型训练，传感器网络中当前周期及其前3周期的空闲时间作为输入量，输入值个数为20。对输入值进行归一化处理，采用Z-score方法进行归一化：

其中，x_normalized表示归一化后的数据，可直接用于预测模型中；x_mean表示数据的平均值，x_sd表示数据的标准差。

利用基于LSTM网络的预测模型对下一周期的空闲时间进行预测，输出下一周期各节点按照排序的空闲时间，输出值个数为5。每次训练采用的样本数为Batch-size为100，迭代训练次数epoch为2，学习率为0.005。LSTM网络中预测隐藏层层数采用1层，每层采用10个神经元。LSTM网络预测时，带入训练完成的权重偏置数据和输入数据，经过LSTM网络得到预测值。

步骤3：采用Q-learning算法对的预测的空闲时间进行自适应调整，考虑空闲时间大小、预测误差和传输时延突变的因素，将预测值调整至最优状态，即能够在保证空闲时间较小的情况下不会因为运动时延或预测误差而产生数据包收发碰撞。

采用Q-learning算法根据奖惩机制调整行为策略从而达到目标，对预测的未来空闲时间进行自适应地调整，多智能体Q-learnin下n个节点的最优价值估计函数，为：

其中α为学习率设为0＜α≤0.1，表示过去的历史价值对状态价值的影响，参数初始化为α＝0.05；γ为折损率设为0.9≤γ＜1，表示对长期回报价值的参考程度，参数初始化为γ＝0.9。

表示更新后的动作状态值，s表示空闲时间状态。a表示可选取的动作集，如a＝[-a...-0.2 -0.1 0 0.1 0.2...b],a>0,b>0，表示可根据算法相应的选取动作集来改变空闲时间状态，如选择‘-a’减小空闲时间或选择‘b’增加空闲时间，s_t+1表示状态s在执行动作集a获得状态。

根据节点调整产生的回报值

对上式最优价值估计函数进行更新，其中回报函数

为：

其中w₁和w₂为选取权重，

为当前时刻节点i的空闲时间，pre_error为预测值的平均预测误差，

为运动节点传输时延的最大突变值。当

时，w₁≤0，w₂≤0，即可假设w₁＝-2，w₂＝-1；当

时，w₁＝1000，w₂≤0，即可假设w₁＝1000，w₂＝-1。当空闲时间

时，表示节点间发生收发碰撞情况，设置w₁＝1000是为了使空间时间为负时的回报值尽可能小，以此来避免数据包收发碰撞。

为运动节点传输时延的最大突变值，可表示为：

其中v_i为节点i的运动速度，Δt为节点运动的时间步长，v_c为水下声速。综合考虑预测空闲时间、预测误差和节点传输时延因水下环境突变等因素的影响，自适应调整未来空闲时间至最优值，保证在较小的空闲时间的基础上不会产生节点运动导致的数据包收发碰撞。

步骤4：等运行至下一周期时，将调整后的空闲时间分配至各节点；

不断重复步骤2至步骤4，其中步骤2的输入量变更为当前水下传感器网络之前周期调整后的空闲时间。

虽然在本文中参照了特定的实施方式来描述本发明，但是应该理解的是，这些实施例仅仅是本发明的原理和应用的示例。因此应该理解的是，可以对示例性的实施例进行许多修改，并且可以设计出其他的布置，只要不偏离所附权利要求所限定的本发明的精神和范围。应该理解的是，可以通过不同于原始权利要求所描述的方式来结合不同的从属权利要求和本文中所述的特征。还可以理解的是，结合单独实施例所描述的特征可以使用在其他所述实施例中。