CN112437490B

CN112437490B - 一种基于分布式理性竞争的移动自组织网络资源分配方法

Info

Publication number: CN112437490B
Application number: CN202011177065.5A
Authority: CN
Inventors: 井俊
Original assignee: Nanjing Weipingheng Information Technology Co ltd
Current assignee: Nanjing Xinglu Aerospace Technology Co ltd
Priority date: 2020-10-29
Filing date: 2020-10-29
Publication date: 2022-08-16
Anticipated expiration: 2040-10-29
Also published as: CN112437490A

Abstract

本发明公开了一种基于分布式理性竞争的移动自组织网络资源分配算法，初始化无线自组织网络中各节点的动作集和选择概率，从各个节点的动作集中随机选择该节点的初始动作；根据各节点选择的动作和对应的选择概率，结合环境和通信需求，计算与选择的动作对应的效用值；根据对应的效用值，更新动作集中各个候选动作的选择概率，确定下步动作进行数据通信；重复效用和下一步动作更新过程，进行移动自组织网络资源分配。本发明环境变化以及通信需求变化时，会动态调整当前动作对应的效用值，以及下一时刻各候选动作的选择概率，能够适应不同通信业务传输需求，进行分布式的理性通信资源竞争和使用的算法，提高了全网的节点通信功率自动分配的合理性。

Description

一种基于分布式理性竞争的移动自组织网络资源分配方法

技术领域

本发明涉及移动自组织网络资源分配技术，具体涉及一种基于分布式理性竞争的移动自组织网络资源分配算法。

背景技术

无线自组织网络由于具备较为强大的鲁棒性和很强的灵活性以及环境适应能力，在偏远地区通信、应急通信，以及下一代无线通信网络中都有较为广泛的应用。但是，无线自组织网络的无中心特性给网络的资源分配带来了挑战。传统的基于管理中心实体的资源分配方法不再适用于无线自组织网络。即便采用类似的方法，也与无线自组织网络的固有特性相悖，削弱无线自组织网络的灵活性、鲁棒性。因此，无线自组织网络的分布式资源分配技术显得尤为重要。

随着无线自组织网络中的节点业务的多样化，各个节点的通信业务类型、通信需求、对通信指标的敏感度都不一样，再采用传统的分布式资源竞争方法，将不再适应现在无线自组织网络发展的需求。传统上，分布式资源竞争，主要是无线自组织网络节点根据自身所处环境，调整自身通信功率，以获得更大的通信效果。这种思路运用在如今已经需求异构化的无线自组织网络中，会导致两个方面的问题：一方面，各个节点尽可能争取多的资源，将会倾向于发射较大的功率，这会对周边节点造成干扰，影响系统整体性能。另一方面，节点通过大功率通信获得的吞吐量等收益，有时候自身并不十分需要，造成了资源浪费的同时，还影响了一些急需提高吞吐量的邻近节点。

所以，有必要研究基于分布式理性竞争的移动自组织网络资源分配算法。该研究具有较强的实用背景和多场景适用性，在技术上也有较强的创新意义，因此具有较强的理论和实用价值。

发明内容

本发明的目的在于提出一种基于分布式理性竞争的移动自组织网络资源分配算法。

实现本发明目的的技术解决方案为：一种基于分布式理性竞争的移动自组织网络资源分配算法，包括以下步骤：

步骤1，初始化无线自组织网络中各节点的动作集和选择概率，从各个节点的动作集中随机选择该节点的初始动作；

步骤2，根据各节点选择的动作和对应的选择概率，结合环境和通信需求，计算与选择的动作对应的效用值；

步骤3，根据与选择的动作对应的效用值，更新动作集中各个候选动作的选择概率，确定下步动作进行数据通信；

步骤4，重复步骤2-3，进行移动自组织网络资源分配。

进一步的，步骤1中，初始化无线自组织网络节点的动作集和选择概率，具体方法为：

如果节点i选择信道c_i和功率P_i，其中c_i∈M，M表示信道集合，P_i∈P，P 表示可选功率集合，i∈N，N表示自组织网络节点集合，则a_i＝(c_i,P_i)表示一个动作；定义节点i的第k个候选动作为a_i,k，则初始化该节点的动作集合为A_i＝{a_i,k}，由节点i所有可能的候选动作a_i,k组成，初始化各候选动作的选择概率为 p_i,k＝1/K，其中K表示节点i可以选择的候选动作数目。

进一步的，步骤2中，根据各节点选择的动作和对应的选择概率，结合环境和通信需求，计算与选择的动作对应的效用值，具体方法为：

用参数a_i表示节点i的动作，a_-i表示除i以外的其他节点的动作集，则节点i 选择a_i，而除i以外的其他节点选择a_-i的效用值U_i(a_i,a_-i)表示为：

其中，C是需求敏感度因子，用来针对不同的通信需求调整适配，R_i表示节点i的通信需求，N表示自组织网络节点集合，r_i是r_i(a_i)的缩写，表示节点i选择动作a_i时获取的通信速率，具体计算公式为：

r_i＝Blog2(1+SINR_i)

其中，B为信噪带宽，SINR_i表示节点i接收信号的信干噪比，具体计算公式为：

其中，P_i表示节点i的功率，P_j表示节点j的功率，h_ji表示节点i和j之间的瑞利衰落系数，d_ji表示节点j与节点i之间的距离，α表示路径衰落指数，σ²为高斯噪声功率，δ(a_i,a_j)的定义如下所示：

其中，c_i、c_j分别表示节点i、j的信道，综合上述公式即得节点i选择动作a_i时的效用值。

进一步的，步骤3中，根据与选择的动作对应的效用值，更新动作集中各个候选动作的选择概率，确定下步动作进行数据通信，具体方法为：

设当前时刻为t，下一时刻为t+1，τ表示当前时刻到起始时刻的时间段标号，节点i的动作集为A_i，

表示τ时刻节点i选择的动作，

表示τ时刻除i以外的其他节点的动作集，记节点i的当前动作为m，则对于节点i的任意非m候选动作 n∈A_i，下一时刻选择动作m或n的概率表示为：

其中，μ是学习参数，

分别表示下一时刻节点i选择动作m 或n的概率，

是

的缩写，表示节点i选择动作n，除i以外的其他节点选择动作

的效用值，

是

的缩写，表示节点 i选择动作

除i以外的其他节点选择动作a_-i的效用值；

求得下一时刻节点i的各候选动作的选择概率后，随机产生一个数，与各候选动作的选择概率进行区间匹配确定下一步动作，进行数据通信。

一种基于分布式理性竞争的移动自组织网络资源分配系统，采用上述算法进行移动自组织网络资源分配，包括：

初始化模块，用于初始化无线自组织网络中各节点的动作集和选择概率，从各个节点的动作集中随机选择该节点的初始动作；

效用计算模块，用于根据各节点选择的动作和对应的选择概率，结合环境和通信需求，计算与选择的动作对应的效用值；

下一步动作更新模块，用于根据与选择的动作对应的效用值，更新动作集中各个候选动作的选择概率，确定下步动作进行数据通信。

一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述算法。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述算法。

本发明与现有技术相比，其显著优点为：联合考虑节点所处环境和自身通信业务需要，通过迭代学习更新，由各个节点自主决策调整其通信功率，使得无线自组织网络各个节点能根据自身需要，合理确定通信功率，兼顾自身收益和全网其他节点的通信需求，达到网络节点吞吐量之间的平衡，提升网络整体吞吐量水平。

附图说明

图1是本发明基于分布式理性竞争的移动自组织网络资源分配的流程图。

图2是本发明实施例的网络拓扑图。

图3是本发明实施例节点策略的更新收敛图。

图4是本发明实施例性能对比图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

如图1所示，本发明一种基于分布式理性竞争的移动自组织网络资源分配算法，该算法具体包括以下步骤：

步骤1中，如果节点i选择信道c_i和功率P_i，其中c_i∈M，M表示信道集合， P_i∈P，P表示可选功率集合，i∈N，N表示自组织网络节点集合，则a_i＝(c_i,P_i) 表示一个动作；定义节点i的第k个候选动作为a_i,k，则初始化该节点的动作集合为A_i＝{a_i,k}，由节点i所有可能的候选动作a_i,k组成，初始化各候选动作的选择概率为p_i,k＝1/K，其中K表示节点i可以选择的候选动作数目。

对于

确定所有节点的动作集后，无线自组织网络的策略集可表示为

其中

表示笛卡尔积。

步骤2中，用参数a_i表示节点i的动作，a_-i表示除i以外的其他节点的动作集，则节点i选择a_i，而除i以外的其他节点选择a_-i的效用值U_i(a_i,a_-i)表示为：

其中，C是需求敏感度因子，用来针对不同的通信需求调整适配，R_i表示节点i的通信需求，只与节点i本身有关，与其动作a_i无关，N表示自组织网络节点集合，r_i是r_i(a_i)的缩写，表示节点i选择动作a_i时获取的通信速率，具体计算公式为：

r_i＝Blog₂(1+SINR_i)

步骤3中，根据与选择的动作对应的效用值，更新动作集中各个候选动作的选择概率，确定下步动作进行数据通信，具体方法为：

设当前时刻为t，下一时刻为t+1，τ表示当前时刻到起始时刻的时间段标号，节点i的动作集为

表示τ时刻节点i选择的动作，

表示τ时刻除i以外的其他节点的动作集，记节点i的当前动作为m，则对于节点i的任意非m候选动作

下一时刻选择动作m或n的概率表示为：

上式意思是：当前动作为m，把其他的动作概率计算一下，剩下的就是选择原来动作m的概率，式中，μ是学习参数，

分别表示下一时刻节点i选择动作m或n的概率，

是

的缩写，表示节点i选择动作n，除i以外的其他节点选择动作

的效用值，

是

的缩写，表示节点i选择动作

除i以外的其他节点选择动作a_-i的效用值；

步骤4，重复步骤2-3，进行移动自组织网络资源分配。

本发明还提出一种基于分布式理性竞争的移动自组织网络资源分配系统，采用上述算法进行移动自组织网络资源分配，包括：

综上所述，本发明环境变化以及通信需求变化时，会动态调整当前动作对应的效用值，以及下一时刻各候选动作的选择概率，能够适应不同通信业务传输需求，进行分布式的理性通信资源竞争和使用的算法，提高了全网的节点通信功率自动分配的合理性。

实施例

为了验证本发明方案的有效性，进行如下仿真实验。

首先简要介绍实施例的场景，考虑一个微蜂窝网络，用黑色小圆圈代表节点，黑色大圆圈区域代表节点覆盖半径，黑色虚线表示节点之间的干扰关系。设置仿真场景如下：设定无线自组织网络的15个节点随机分布在一个100m×100m的正方形区域内，网络拓扑结构如图2所示。节点通信覆盖半径是10m，干扰范围为 50m，信道带宽B＝200KHz，背景噪声为-174dBm，节点满意通信速率门限设置为0.8，需求敏感度因子C＝60。网络中有三个子信道和四个功率层级 P＝{40mW,60mW,80mW,100mW}。假定信道衰落是微妙变化的，且h＝1。每个节点的通信需求在[0,3]Mbps之间随机产生。

图3给出了采用本发明所述方法，各个节点的动作更新最终将达到收敛状态，即通过各个节点的自主学习，所有节点的动作将不再是随机的，而是收敛到一个固定的动作。

图4显示了本发明方法与传统的各节点吞吐量优化方法的性能对比。节点数目从15个逐渐扩展到60个可以看出，本发明的方法获得了更好的系统性能。整个无线自组织网络中达到让自己满意的通信速率的节点数最多。主要原因在于，传统的吞吐量优化方法，势必造成有的节点获得了太多的超过自己需求的吞吐量，而有的节点却离自己理想的吞吐量相差甚远。通过本发明的效用设计和迭代更新算法，能使得系统在没有中心节点控制的情况下，通过自主学习，让更多的节点达到满意，这对于提升无线自组织网络的整体性能和系统公平性具有重要意义。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM (EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM 以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM (SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态 RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种基于分布式理性竞争的移动自组织网络资源分配方法，其特征在于，包括以下步骤：

步骤4，重复步骤2-3，进行移动自组织网络资源分配；

步骤1中，初始化无线自组织网络节点的动作集和选择概率，具体方法为：

如果节点i选择信道c_i和功率P_i，其中c_i∈M，M表示信道集合，P_i∈P，P表示可选功率集合，i∈N，N表示自组织网络节点集合，则a_i＝(c_i,P_i)表示一个动作；定义节点i的第k个候选动作为a_i,k，则初始化该节点的动作集合为A_i＝{a_i,k}，由节点i所有可能的候选动作a_i,k组成，初始化各候选动作的选择概率为pi_,k＝1/K，其中K表示节点i可以选择的候选动作数目；

步骤2中，根据各节点选择的动作和对应的选择概率，结合环境和通信需求，计算与选择的动作对应的效用值，具体方法为：

用参数a_i表示节点i的动作，a_-i表示除i以外的其他节点的动作集，则节点i选择a_i，而除i以外的其他节点选择a_-i的效用值U_i(a_i,a_-i)表示为：