CN117119486B

CN117119486B - 一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法

Info

Publication number: CN117119486B
Application number: CN202311031560.9A
Authority: CN
Inventors: 孙明; 王淑梅; 姜泽旭; 董二寒; 吕天宇; 苏禹
Original assignee: Qiqihar University
Current assignee: Qiqihar University
Priority date: 2023-08-16
Filing date: 2023-08-16
Publication date: 2024-04-05
Anticipated expiration: 2043-08-16
Also published as: CN117119486A

Abstract

本发明公开了一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法，属于无线通信技术领域。本发明构建了一个深度神经网络，同时输出功率分配变量、功率控制变量和信道分配变量，并通过输出的功率分配变量、功率控制变量和信道分配变量，获得信道分配方案和功率分配方案；构建存储池，对深度神经网络同时进行训练和测试，在训练中采用拉格朗日损失函数对深度神经网络进行无监督学习。本发明具有提高用户速率、长期稳定性、自适应性和智能化、节省能源和可扩展性等优点。通过优化资源分配和网络性能，提升蜂窝网的运行效率和用户体验。

Description

一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法

技术领域

本发明涉及一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法，属于无线通信技术领域。

背景技术

当前，无线通讯技术已经大规模商用，给社会生产和人民生活带来了极大便利，成为人们日常生活不可或缺的通讯方式。然而，智能手机等移动客户端的普及，使得越来越多的无线移动终端需要接入互联网中，这给本就紧张的无线资源带来了巨大压力，不仅使得有限的无线通信资源和日益增长的业务需求之间的矛盾更加突出，同时也大大增加了能源的消耗和无线网络维护运营的成本。

随着机器学习技术的迅速发展，人工智能在很多领域取得了突破性进展。其中，作为机器学习技术中重要研究方向之一的深度学习技术，已被广泛应用于无人驾驶、目标识别、图像分类、情感及语音识别等领域。近些年，随着深度学习技术的发展，越来越多的研究者使用深度学习方法处理无线通信问题，这为开发出低计算复杂性，支持实时计算的通用分配算法模型创造了可能。经过线下训练得出通用的模型后，可以部署为基于深度学习的在线推断平台，这种方式不仅计算复杂度低同时也降低了无线系统的延时。

利用深度学习对信道和功率等无线资源进行优化分配的研究日趋增加。目前，已有监督深度学习、深度强化学习、无监督深度学习应用于无线网络信道和功率等无线资源的优化分配上。在监督学习上，研究者首先使用遗传算法或其他启发式算法生成信道分配和功率等级标签数据，再对深度神经网络模型进行训练。在深度强化学习上，研究者一般采用深度Q网络产生信道分配方案以及离散功率控制方案，或者借助深度确定性策略梯度算法、深度无监督学习产生连续功率控制方案。在深度无监督学习上，研究者一般用于解决无线网络的功率控制问题。

长期性能度量对于在快衰落环境中优化网络是重要的，在快衰落环境中，通信服务的质量通常由平均性能来评估，例如平均速率、平均功耗。长期用户速率约束对于在快衰落环境中保障用户的公平具有重要的意义，对多小区蜂窝网络的资源分配具有重要的研究价值。更重要的用途是，保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法，可对系统收集到的若干连续时隙的信息同时进行资源分配，并能够保障多小区蜂窝系统若干连续时隙的长期平均用户速率，因而具有高效性等优势。

然而，将深度无监督学习同时应用于多小区蜂窝网络的信道分配和功率控制的研究很少，故保障多小区蜂窝网长期用户速率的深度无监督学习资源分配的研究也较少。其中一个主要的挑战是该资源分配问题既要面对基于离散变量的子载波信道分配问题又要面对基于连续变量的功率控制问题。而为了运用深度无监督学习技术保障多小区蜂窝网络的长期用户速率，既需要深度无监督学习同时进行信道分配和功率控制，又需要在深度无监督学习中将带有长期用户速率保障的约束优化问题转换成无约束优化问题；前者需要为后者提供待优化的离散信道分配变量和连续的功率分配、控制变量，后者需要为深度无监督学习提供合理有效的损失函数，有助于深度神经网络输出优化的信道分配变量和功率分配、控制变量。

发明内容

本发明提出了一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法，通过构建一个深度神经网络，同时输出功率分配变量、功率控制变量和信道分配变量，并通过输出的功率分配变量、功率控制变量和信道分配变量，获得信道分配方案和功率分配方案；构建存储池，对深度神经网络同时进行训练和测试，在训练中采用拉格朗日损失函数对深度神经网络进行无监督学习，从而解决现有技术中存在的问题。

一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法，一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法包括以下步骤：

S100、构建一个深度神经网络，深度神经网络同时输出有三个输出变量，分别是功率分配变量功率控制变量Δp_m(m＝1,2,…,M)和信道分配变量/>其中，M为小区数，N为信道数，K为用户数；

S200、将每一小区m(m∈{1,2,...,M})所对应的信道分配变量转化为信道分配方案/>使得每一小区里的每个用户至少占用/>个信道，以利于保障长期用户速率，其中/>表示向下取整，K_m是小区m的用户数，N>K_m；

S300、将每一小区m(m∈{1,2,...,M})所对应的功率分配变量功率控制变量Δp_m和信道分配方案/>转化为功率分配方案/>转化所采用的公式为：

其中，Δp_m为小区m的功率控制变量，为小区m的功率分配变量，/>为小区m在信道n上的功率分配变量，p_min(p_min≥0)为小区基站在信道上的最小发射功率，为小区m中用户k关于信道n的信道分配方案；

S400、构建存储池，对S100中所构建的深度神经网络同时进行训练和测试，直到达到结束训练与测试的时隙数量。

进一步的，在S100中，深度神经网络包括输入层、残差隐层、全连接隐层和输出层，输入层、残差隐层、全连接隐层和输出层依次连接，深度神经网络输入层的维度为(Batch,M,N,K)，Batch为批大小，输入层的输入为归一化的信道增益信息；

输出层包含三个子输出层，第一个子输出层包括维度等于(Batch,M×N)的全连接层、批归一化层和Sigmoid激活层，第二个子输出层包括维度等于(Batch,M)的全连接层、批归一化层和Sigmoid激活层，第三个子输出层包括维度等于(Batch,M×N×K)的全连接层、批归一化层和Sigmoid激活层；

功率分配变量为第一个子输出层的输出；功率控制变量Δp_m(m＝1,2,…,M)由第二个子输出层的输出与功率控制量Δp相乘后得到，其中，Δp＝p_max-N×p_min，p_max为小区基站的最大发射功率，p_min(p_min≥0)为小区基站在信道上的最小发射功率；信道分配变量/>为第三个子输出层的输出。

进一步的，在S200中，将每一小区m(m∈{1,2,...,M})所对应的信道分配变量转化为信道分配方案/>的方法，包括以下步骤：

S201、将小区m所对应的信道分配变量降序排列；

S202、按照信道分配变量的降序排列结果，为小区m中的用户进行信道分配，使得小区m中的用户在本次分配中只占用一个信道；

S203、对信道分配变量进行如下更新：从信道分配变量/>中扣除已经被分配的信道分配变量；

S204、若剩余的未被分配的信道数大于小区m的用户数K_m，则跳转到S202继续执行；若剩余的未被分配的信道数小于小区m的用户数K_m，将剩余的未被分配的信道，按照信道分配变量的降序排列结果，在小区m的用户中进行分配，直到所有信道分配完毕为止；

S205、将小区m中用户占用信道的结果转化为信道分配方案，将小区m中用户占用信道的结果转化为信道分配方案的方法为：若小区m中的用户k占用了信道n，则令若小区m中的用户k没有占用信道n，则令/>

进一步的，在S400中，包括以下步骤：

S401、构建大小固定的先入先出式存储池，并初始化结束训练与测试的时隙数量；

S402、利用存储池收集多小区蜂窝系统不同时隙的动态信道增益信息数据；

S403、判断存储池收集到的信道增益信息数据是否达到了一定的数量，若未达到，返回S402继续收集动态信道增益信息数据；若达到，进入S404；

S404、从存储池中随机抽取一批信道增益信息数据，采用拉格朗日损失函数对深度神经网络进行无监督学习；

拉格朗日损失函数，表示如下，

其中，表示关于信道信息增益H的期望，E(H,D,P；θ)为能量效率，θ为深度神经网络参数，λ_k(λ_k≥0,k＝1,2,...,K)为拉格朗日系数，R_k(H,D,P；θ)(k＝1,2,...,K)为用户k的速率，/>为需要保障的长期用户速率；

采用拉格朗日损失函数对深度神经网络进行无监督学习，包括如下步骤：

首先，采用mini-batch梯度下降法，优化更新深度神经网络参数θ，如下式所示，

然后，采用mini-batch梯度上升法，优化更新拉格朗日系数λ_k(λ_k≥0,k＝1,2,...,K)，如下式所示，

上式中，θ^[t]与θ^[t+1]为第t次迭代和第t+1次迭代的深度神经网络参数；与/>为第t次迭代和第t+1次迭代的拉格朗日系数；D^[t]与P^[t]为第t次迭代利用S200和S300对深度神经网络的输出进行转化而得到的信道分配方案和功率分配方案；/>为第t次迭代能量效率对深度神经网络参数的梯度；/>为第t次迭代用户k的速率对深度神经网络参数的梯度；S为批量大小，H_S为批量大小为S的信道信息增益集合；{}_ReLU表示对大括号中的结果取ReLU激活函数运算；η₁与η₂为学习率；

S405、反复多次执行S404，然后将训练得到的深度神经网络用于测试，并利用S200和S300对深度神经网络测试的输出进行转化，计算出能量效率和用户速率；

S406、若达到了结束训练与测试的时隙数量，则结束训练与测试；否则，将新时隙的动态信道增益信息数据收集到存储池中，并返回到S404继续执行。

一种存储介质，该存储介质上储存有计算机程序，计算机程序被处理器执行时实现上述的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法。

一种计算机设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序，以实现上述的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法。

本发明的有益效果：本发明提出了一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法，通过深度神经网络的输出能够同时转换为信道分配方案和功率分配方案；通过构建存储池，在训练深度神经网络的过程中对深度神经网络进行测试；采用拉格朗日损失函数对深度神经网络进行无监督学习，可对系统收集到的若干连续时隙的信息同时进行资源分配，能够在优化多小区蜂窝网能量效率的同时保障系统的长期用户速率。

附图说明

图1是本发明所提出的能够同时输出功率分配变量、功率控制变量和信道分配变量的深度神经网络模型；

图2是本发明的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法的实施流程图；

图3是本发明实施例的多小区蜂窝系统模型；

图4是实施例中本发明与对比文件1方法的拉格朗日损失函数对比图；

图5是实施例中本发明的各用户的长期用户速率；

图6是实施例中对比文件1方法的各用户的长期用户速率；

图7是实施例中本发明与对比文件1方法的多小区蜂窝系统的测试能量效率对比图；

图8是实施例中本发明与对比文件1方法的多小区蜂窝系统的测试速率对比图；

图9是实施例中本发明与对比文件1方法的多小区蜂窝系统的瞬时速率满足率对比图。

具体实施方式

下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的具体实施例附图中，为了更好、更清楚的描述系统中的各元件的工作原理，表现所述装置中各部分的连接关系，只是明显区分了各元件之间的相对位置关系，并不能构成对元件或结构内的信号传输方向、连接顺序及各部分结构大小、尺寸、形状的限定。

参照图2所示，一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法，一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法包括以下步骤：

S100、构建一个深度神经网络，深度神经网络同时输出有三个输出变量，分别是功率分配变量yn_m(m＝1,2,…,M，n＝1,2,…,N)、功率控制变量Δp_m(m＝1,2,…,M)和信道分配变量其中，M为小区数，N为信道数，K为用户数；

具体的，本方法通过构建深度神经网络，并输出功率分配变量、功率控制变量和信道分配变量。通过综合考虑这些变量，可以实现对多小区蜂窝网中的资源进行综合性分配。这种综合性分配有助于平衡不同小区之间的资源利用，优化整个网络的性能。在信道分配方案中，每个小区的用户都至少占用一个信道。这样做可以更好地保障长期用户的速率和体验。通过采用向下取整的方式，将用户数合理分配到每个信道上，确保用户能够获得足够的资源以支持其通信需求。本方法将功率分配变量、功率控制变量和信道分配方案转化为最终的功率分配方案。这有助于优化功率的分配，使每个小区的基站在信道上以最小发射功率的方式进行通信。通过合理的功率分配，可以提高能量效率和系统容量。本发明通过构建存储池并对深度神经网络进行训练和测试，该方法可以利用多个连续时隙的信息改善资源分配的准确性和稳定性。存储池的使用使得系统能够收集和利用大量的数据，从而更好地适应网络的动态变化和波动。

进一步的，参照图1所示，在S100中，深度神经网络包括输入层、残差隐层、全连接隐层和输出层，输入层、残差隐层、全连接隐层和输出层依次连接，深度神经网络输入层的维度为(Batch,M,N,K)，Batch为批大小，输入层的输入为归一化的信道增益信息；

具体的，通过深度神经网络的多个子输出层，将输入的归一化信道增益信息转化为功率分配变量和信道分配变量。这种综合资源分配方法考虑了小区、信道和用户之间的关系，可以在考虑多个因素的基础上进行资源分配优化，提高整个多小区蜂窝网的效率和性能。残差隐层作为深度神经网络的一部分，可以增强网络的非线性拟合能力和学习能力。通过残差隐层的引入，网络可以更好地适应复杂的资源分配问题，提高资源分配的准确性和可靠性。输出层的子输出层中包含批归一化层，可以提高网络的训练稳定性。批归一化层通过对每个批次的输入进行归一化操作，有助于缩小输入的范围，减少梯度消失和梯度爆炸问题，提高网络的训练速度和稳定性。通过第二个子输出层的输出与功率控制量相乘，可以灵活地调整小区基站的发射功率。其中，最大发射功率和最小发射功率提供了对功率控制的限制和参考。这种灵活的功率控制可以根据实际情况和网络需求进行调整，提高网络的能量效率和功率管理能力。第三个子输出层的输出表示信道分配变量，即每个小区、信道和用户之间的信道分配方案。这样可以实现个性化的信道资源分配，根据不同小区和用户的需求，为每个用户分配合适的信道，提高用户的速率和通信质量。

S201、将小区m所对应的信道分配变量降序排列；

具体的，通过S201步骤将小区m所对应的信道分配变量进行降序排列，可以找到信道分配变量最大的信道，从而实现对信道的最优分配。按照S202步骤的操作，为小区m中的用户逐一分配信道，确保每个用户在本次分配中只占用一个信道。这样可以最大程度地减少信道间的干扰，提高系统的容量和用户的通信质量。根据S203步骤的更新操作，每次分配后都会对信道分配变量进行扣除，即已分配的信道在下次分配中不再考虑。这种动态的信道资源管理可以确保每轮分配时，可用的信道池中只包含未被分配的信道，避免重复分配或浪费资源。同时，剩余未被分配的信道数与小区m的用户数之间的判断(S204步骤)也保证了资源的高效利用。S205步骤将小区m中用户占用信道的结果转化为信道分配方案。这样的转化方法能够方便地将分配结果转化为可理解和可实现的信道分配方案。对于协同通信系统而言，不同小区的信道分配方案应协调一致，以最大程度地提升整个系统的性能和用户体验。

进一步的，在S400中，包括以下步骤：

拉格朗日损失函数，表示如下，

具体的，通过S402步骤，利用大小固定的存储池收集多小区蜂窝系统不同时隙的动态信道增益信息数据。这样的数据收集可以提供系统在不同时刻和不同条件下的信道状态信息，为后续的信道分配和功率调整提供准确的参考依据。在S404步骤中，通过拉格朗日损失函数对深度神经网络进行无监督学习。这种学习方式允许系统从大量的信道增益信息数据中自动学习信道分配和功率调整的模式和规律，而不需要标注的监督数据。深度神经网络的使用可以潜在地发现复杂的非线性关系，从而更好地优化系统性能。通过拉格朗日损失函数中的能量效率和用户速率项，系统可以优化深度神经网络的参数和拉格朗日系数，以达到平衡能量效率和用户速率的目标。迭代的优化过程(S404步骤中的梯度下降和梯度上升)有助于逐步改进系统的性能，并找到最优的信道分配和功率调整策略。S405步骤中，通过多次执行S404来训练深度神经网络，并将训练得到的网络用于测试。通过与S200和S300的转化，可以计算出使用深度神经网络的信道分配方案和功率分配方案下的能量效率和用户速率。这样可以评估深度神经网络模型在系统中的实际效果，并作为调整策略的参考。

其中，S402中的动态信道增益信息数据，包括但不限于以下方式得到：

1.实际测量：可以通过实际的场地测试、测量或采集来获取动态信道增益信息数据；

2.信道估计：可以使用信号处理和通信技术中的信道估计方法来计算动态信道增益信息数据。当接收到发射信号时，可以通过估计信号在信道中的传输特性来推断信道增益；

3.仿真模拟：可以使用计算机仿真模拟来生成动态信道增益信息数据。通过建立适当的信道模型，结合随机性和实际场景参数，可以模拟生成信道增益数据。

具体的，通过存储介质中的计算机程序，系统可以自动实现对多小区蜂窝网的资源分配。无需手动干预和配置，系统可以根据信道增益信息动态地优化信道分配和功率调整，以保障长期用户速率。这种自动化的资源分配大大减轻了网络管理人员的工作负担，并提高了资源利用率和性能。该计算机程序中采用深度无监督学习方法进行资源分配优化。深度学习具有强大的表达能力和学习能力，可以从大量的信道增益数据中挖掘出潜在的模式和规律，优化网络的性能。通过存储介质上的计算机程序的执行，系统可以利用深度神经网络进行无监督学习，并根据数据自动调整网络的参数和模型，以适应不同的信道条件和用户需求。本方法旨在保障多小区蜂窝网的长期用户速率。通过计算机程序的执行，系统可以通过优化信道分配和功率调整来最大化用户速率，并在一定程度上保障用户的持续性和稳定性。长期用户速率保障有助于提高用户体验和满意度，提升网络的整体性能和竞争力。将本方法存储在计算机程序中，系统可以灵活地根据实际情况进行调整和扩展。通过修改和更新存储介质中的计算机程序，可以引入新的算法和技术，进一步优化资源分配方法并适应不断变化的网络环境和需求。这种灵活性和可扩展性使得系统能够快速响应和适应不断演化的通信场景。

具体的，计算机设备中的存储器和处理器结合存储的计算机程序，可以实现高效的资源分配。处理器执行计算机程序时，可以基于深度无监督学习的方法对信道分配和功率调整进行优化。通过计算机设备的计算能力和存储能力，可以对大量的信道增益数据进行实时分析和处理，以实现更精确和准确的资源分配。这种高效的资源分配有助于提高网络的容量和性能，提升用户的体验和满意度。计算机设备中的处理器可以实时执行计算机程序，根据实时收集的数据进行决策和调整。通过实时的决策和调整，计算机设备可以实时响应网络中的变化条件，如信道状况、用户需求等。这种实时性使系统更加适应动态变化的通信环境，能够及时调整资源分配策略，保障长期用户速率。计算机设备中的存储器和处理器可以存储和执行不同版本的计算机程序，使得系统具备可编程性和扩展性。如果有新的算法和策略出现，可以通过更新计算机程序来引入这些新方法，同时保留旧的版本以备可能的回退。这种可编程性和扩展性使得计算机设备能够不断适应业界的最新技术和研究成果，提高资源分配的效果和性能。通过计算机程序的执行，计算机设备可以实现资源分配方法的自动化和智能化。无需人工干预，系统可以根据深度无监督学习的方法自主地进行资源分配和优化，提高效率和准确性。这种自动化和智能化降低了操作和管理的工作负担，同时提供了更优质的服务。

以下为本发明提供的一个具体实施例：

图3是实施例中的多小区网络全频复用系统模型，该多小区网络全频复用系统模型有3个相邻的小区，每个小区半径为200m，基站位于小区中央，基站的最大发射功率为38dBm，小区A、B、C均随机分布有3个用户，用户与小区的接入关系固定，所有小区共享系统中的信道资源，可用子信道数为21个，子信道带宽为180kHz，载波频率为2GHz，信道噪声功率谱密度为-174dBm/Hz，系统要求每个子信道的最低传输功率为20dBm，路径损耗采用对数距离路径损耗模型，参考距离设为100m，路径损耗指数设为3.2，正态随机变量的标准差设为8，要求保障长期用户速率为2×10⁵bps。

S100、构建一个深度神经网络；所述的深度神经网络，能够同时输出功率分配变量功率控制变量Δp_m(m＝1,2,…,M)和信道分配变量

所述的深度神经网络包含输入层、残差隐层、全连接隐层和输出层，其中，所述深度神经网络输入层的维度为(Batch,M,N,K)，Batch为批大小，M为小区数，N为信道数，K为用户数，所述的输入层的输入为归一化的信道增益信息；

所述深度神经网络残差隐层包含一个卷积层、批归一化层、ReLU激活层和一个全连接层、批归一化层、ELU激活层；所述深度神经网络全连接隐层包含3个全连接层、批归一化层、ReLU激活层；

所述深度神经网络输出层包含三个子输出层，第一个子输出层由维度等于(Batch,M×N)的全连接层、批归一化层、Sigmoid激活层构成，第二个子输出层由维度等于(Batch,M)的全连接层、批归一化层、Sigmoid激活层构成，第三个子输出层由维度等于(Batch,M×N×K)的全连接层、批归一化层、Sigmoid激活层构成；

所述的功率分配变量为第一个子输出层的输出；所述的功率控制变量Δp_m(m＝1,2,…,M)由第二个子输出层的输出与功率控制量Δp相乘后得到，其中，Δp＝p_max-N×p_min，p_max为小区基站的最大发射功率，p_min(p_min≥0)为小区基站在信道上的最小发射功率；所述的信道分配变量/>为第三个子输出层的输出。

根据实施例，在S100中设置M＝3，N＝21，K＝9，Batch＝20，

所述的将每一小区m所对应的信道分配变量转化为初始信道分配方案的方法，包括如下步骤：

S201、将小区m所对应的信道分配变量降序排列；

S205、将小区m中用户占用信道的结果转化为信道分配方案，所述的将小区m中用户占用信道的结果转化为信道分配方案的方法为：若小区m中的用户k占用了信道n，则令若小区m中的用户k没有占用信道n，则令/>

根据实施例，每小区有3个用户即K₁＝K₂＝K₃＝3且每小区可用子信道数为21个，故在S200中每一小区中的每个用户至少占用7个信道。下面以其中一个小区3用户的信道分配变量为例，详细说明产生信道分配方案的步骤。假定该小区的3用户的信道分配变量/>如下：

用户1在21个信道上的信道分配变量分别为0.5317,0.5168,0.5007,0.5000,0.5267,0.5073,0.5196,0.5260,0.5056,0.5332,0.5153,0.5000,0.5284,0.5000,0.5024,0.5067,0.5121,0.5283,0.5526,0.5720,0.5763；

用户2在21个信道上的信道分配变量分别为0.5540,0.5000,0.5066,0.5071,0.5127,0.5000,0.5665,0.5645,0.6420,0.5051,0.5190,0.5324,0.5154,0.5680,0.5154,0.5559,0.5390,0.5321,0.5092,0.5558,0.5122；

用户3在21个信道上的信道分配变量分别为0.5419,0.5353,0.5273,0.5112,0.5000,0.5214,0.5000,0.5000,0.5224,0.5064,0.5178,0.5037,0.5066,0.5419,0.5251,0.5051,0.5220,0.5063,0.5188,0.5151,0.5080。

由S201，对用户的信道分配变量降序排列。方便起见，在排序的信道分配变量后加入上标(用户号:信道号)作标记，降序排列结果如下：0.6420^(2:9),0.5763^(1:21),0.5720^(1:20),0.5680^(2:14),0.5665^(2:7),0.5645^(2:8),0.5559^(2:16),0.5558^(2:20),0.5540^(2:1),0.5526^(1:19),0.5419^(3:14),0.5419^(3:1),0.5390^(2:17),0.5353^(3:2),0.5332^(1:10),0.5324^(2:12),0.5321^(2:18),0.5317^(1:1),0.5284^(1:13),0.5283^(1:18),0.5273^(3:3),0.5267^(1:5),0.5260^(1:8),0.5251^(3:15),0.5224^(3:9),0.5220^(3:17),0.5214^(3:6),0.5196^(1:7),0.5190^(2:11),0.5188^(3:19),0.5178^(3:11),0.5168^(1:2),0.5154^(2:15),0.5154^(2:13),0.5153^(1:11),0.5151^(3:20),0.5127^(2:5),0.5122^(2:21),0.5121^(1:17),0.5112^(3:4),0.5092^(2:19),0.5080^(3:21),0.5073^(1:6),0.5071^(2:4),0.5067^(1:16),0.5066^(2:3),0.5066^(3:13),0.5064^(3:10),0.5063^(3:18),0.5056^(1:9),0.5051^(3:16),0.5051^(2:10),0.5037^(3:12),0.5024^(1:15),0.5007^(1:3),0.5000^(1:12),0.5000^(3:8),0.5000^(1:4),0.5000^(2:6),0.5000^(2:2),0.5000^(3:5),0.5000^(1:14),0.5000^(3:7)。

由S202、S203和S204，一共需要进行7次信道分配，每次信道分配均需要保障用户在本次分配中只占用一个信道。

第1次信道分配，按照信道变量降序排列结果，由S202选择0.6420^(2:9)、0.5763^(1:21)、0.5419^(3:14)，即用户2占用信道9、用户1占用信道21、用户3占用信道14。由S203，信道分配变量更新为0.5720^(1:20),0.5665^(2:7),0.5645^(2:8),0.5559^(2:16),0.5558^(2:20),0.5540^(2:1),0.5526^(1:19),0.5419^(3:1),0.5390^(2:17),0.5353^(3:2),0.5332^(1:10),0.5324^(2:12),0.5321^(2:18),0.5317^(1:1),0.5284^(1:13),0.5283^(1:18),0.5273^(3:3),0.5267^(1:5),0.5260^(1:8),0.5251^(3:15),0.5220^(3:17),0.5214^(3:6),0.5196^(1:7),0.5190^(2:11),0.5188^(3:19),0.5178^(3:11),0.5168^(1:2),0.5154^(2:15),0.5154^(2:13),0.5153^(1:11),0.5151^(3:20),0.5127^(2:5),0.5121^(1:17),0.5112^(3:4),0.5092^(2:19),0.5073^(1:6),0.5071^(2:4),0.5067^(1:16),0.5066^(2:3),0.5066^(3:13),0.5064^(3:10),0.5063^(3:18),0.5051^(3:16),0.5051^(2:10),0.5037^(3:12),0.5024^(1:15),0.5007^(1:3),0.5000^(1:12),0.5000^(3:8),0.5000^(1:4),0.5000^(2:6),0.5000^(2:2),0.5000^(3:5),0.5000^(3:7)。

第2次信道分配，按照信道变量降序排列结果，由S202选择0.5720^(1:20)、0.5665^(2:7)、0.5419^(3:1)，即用户1占用信道20、用户2占用信道7、用户3占用信道1。由S203，信道分配变量更新为0.5645^(2:8),0.5559^(2:16),0.5526^(1:19),0.5390^(2:17),0.5353^(3:2),0.5332^(1:10),0.5324^(2:12),0.5321^(2:18),0.5284^(1:13),0.5283^(1:18),0.5273^(3:3),0.5267^(1:5),0.5260^(1:8),0.5251^(3:15),0.5220^(3:17),0.5214^(3:6),0.5190^(2:11),0.5188^(3:19),0.5178^(3:11),0.5168^(1:2),0.5154^(2:15),0.5154^(2:13),0.5153^(1:11),0.5127^(2:5),0.5121^(1:17),0.5112^(3:4),0.5092^(2:19),0.5073^(1:6),0.5071^(2:4),0.5067^(1:16),0.5066^(2:3),0.5066^(3:13),0.5064^(3:10),0.5063^(3:18),0.5051^(3:16),0.5051^(2:10),0.5037^(3:12),0.5024^(1:15),0.5007^(1:3),0.5000^(1:12),0.5000^(3:8),0.5000^(1:4),0.5000^(2:6),0.5000^(2:2),0.5000^(3:5)。

第3次信道分配，按照信道变量降序排列结果，由S202选择0.5645^(2:8)、0.5526^(1:19)、0.5353^(3:2)，即用户2占用信道8、用户1占用信道19、用户3占用信道2。由S203，信道分配变量更新为0.5559^(2:16),0.5390^(2:17),0.5332^(1:10),0.5324^(2:12),0.5321^(2:18),0.5284^(1:13),0.5283^(1:18),0.5273^(3:3),0.5267^(1:5),0.5251^(3:15),0.5220^(3:17),0.5214^(3:6),0.5190^(2:11),0.5178^(3:11),0.5154^(2:15),0.5154^(2:13),0.5153^(1:11),0.5127^(2:5),0.5121^(1:17),0.5112^(3:4),0.5073^(1:6),0.5071^(2:4),0.5067^(1:16),0.5066^(2:3),0.5066^(3:13),0.5064^(3:10),0.5063^(3:18),0.5051^(3:16),0.5051^(2:10),0.5037^(3:12),0.5024^(1:15),0.5007^(1:3),0.5000^(1:12),0.5000^(1:4),0.5000^(2:6),0.5000^(3:5)。

第4次信道分配，按照信道变量降序排列结果，由S202选择0.5559^(2:16)、0.5332^(1:10)、0.5273^(3:3)，即用户2占用信道16、用户1占用信道10、用户3占用信道3。由S203，信道分配变量更新为0.5390^(2:17),0.5324^(2:12),0.5321^(2:18),0.5284^(1:13),0.5283^(1:18),0.5267^(1:5),0.5251^(3:15),0.5220^(3:17),0.5214^(3:6),0.5190^(2:11),0.5178^(3:11),0.5154^(2:15),0.5154^(2:13),0.5153^(1:11),0.5127^(2:5),0.5121^(1:17),0.5112^(3:4),0.5073^(1:6),0.5071^(2:4),0.5066^(3:13),0.5063^(3:18),0.5037^(3:12),0.5024^(1:15),0.5000^(1:12),0.5000^(1:4),0.5000^(2:6),0.5000^(3:5)。

第5次信道分配，按照信道变量降序排列结果，由S202选择0.5390^(2:17)、0.5284^(1:13)、0.5251^(3:15)，即用户2占用信道17、用户1占用信道13、用户3占用信道15。由S203，信道分配变量更新为0.5324^(2:12),0.5321^(2:18),0.5283^(1:18),0.5267^(1:5),0.5214^(3:6),0.5190^(2:11),0.5178^(3:11),0.5153^(1:11),0.5127^(2:5),0.5112^(3:4),0.5073^(1:6),0.5071^(2:4),0.5063^(3:18),0.5037^(3:12),0.5000^(1:12),0.5000^(1:4),0.5000^(2:6),0.5000^(3:5)。

第6次信道分配，按照信道变量降序排列结果，由S202选择0.5324^(2:12)、0.5283^(1:18)、0.5214^(3:6)，即用户2占用信道12、用户1占用信道18、用户3占用信道6。由S203，信道分配变量更新为0.5267^(1:5),0.5190^(2:11),0.5178^(3:11),0.5153^(1:11),0.5127^(2:5),0.5112^(3:4),0.5071^(2:4),0.5000^(1:4),0.5000^(3:5)。

第7次信道分配，按照信道变量降序排列结果，由S202选择0.5267^(1:5)、0.5190^(2:11)、0.5112^(3:4)，即用户1占用信道5、用户2占用信道11、用户3占用信道4。由S203，信道分配变量更新为空。

由S205，将小区用户占用信道的结果转化为信道分配方案。

多小区蜂窝系统中的每一小区均按照S201、S202、S203、S204、S205执行，将每一小区户占用信道的结果转化为信道分配方案。

S300、将每一小区m(m∈{1,2,...,M})所对应的功率分配变量功率控制变量Δp_m，以及信道分配方案/>转化为功率分配方案/>转化所采用的公式为：

其中，Δp_m为小区m的功率控制变量，为小区m的功率分配变量，/>为小区m在信道n上的功率分配变量，p_min(p_min≥0)为小区基站在信道上的最小发射功率，/>为小区m中用户k关于信道n的信道分配方案；

S400、构建存储池，对S100所构建的深度神经网络同时进行训练和测试，具体步骤如下：

所述的拉格朗日损失函数，表示如下，

所述的采用拉格朗日损失函数对深度神经网络进行无监督学习，包括如下步骤：

根据S400，实施例中构建的存储池大小等于100，当存储池收集到的信道增益信息数据大于等于50时，从存储池中随机抽取Batch大小为20的信道增益信息数据，采用拉格朗日损失函数对深度神经网络进行无监督学习，反复执行S404训练深度神经网络的次数设为20，停止训练与测试的时隙数设为20000，用于测试的信道增益信息数据来自于系统当前时隙以后的20个时隙。在实施例中，采用的系统能量效率E(H,D,P；θ)表示如下：

系统速率R(H,D,P；θ)表示如下：

用户k速率R_k(H,D,P；θ)表示如下：

其中p₀为非常小的正数，p₀＝10^-10，B为子信道带宽，N₀为信道噪声功率谱密度，为基站m使用信道n与用户k通信所形成的干扰，表示如下：

在实施例中，将本发明与对比文件1方法(“基于深度无监督学习的多小区蜂窝网资源分配方法”，孙明等，《控制与决策》，第37卷第9期，2022年)进行了对比。对比文件1方法采用了两个深度神经网络，即基于无监督学习的深度功率控制神经网络和基于无监督学习的深度信道分配神经网络，先训练深度功率控制神经网络，然后再联合训练好的深度功率控制神经网络来训练深度信道分配神经网络。不同于对比文件1方法，本发明采用的是如S100及图1所示的一个深度神经网络，能够同时输出功率分配变量、功率控制变量和信道分配变量；而且，为了保障多小区蜂窝系统的长期用户速率，本发明采用了如S200所示的信道分配方法以及如S400与图2所示的基于存储池和拉格朗日损失函数的深度神经网络无监督学习方法。仿真中，η₁＝4×10^-4，η₂＝1×10^-8。仿真对比了本发明与对比文件1方法在保障多小区蜂窝系统的长期用户速率过程中的拉格朗日损失函数、测试能量效率、测试速率、长期用户速率保障情况以及瞬时速率满足率。图4是实施例中本发明与对比文件1方法的拉格朗日损失函数对比图，图5是实施例中本发明的各用户的长期用户速率，图6是实施例中对比文件1方法的各用户的长期用户速率，由此可见，采用S400的基于存储池和拉格朗日损失函数的深度神经网络无监督学习方法，均能使本发明与对比文件1方法具有较高的长期用户速率保障性能，即在测试中均能使20个时隙每个用户的平均用户速率达到要求的2×10⁵bps，这说明了本发明所提出的基于存储池和拉格朗日损失函数的深度神经网络无监督学习方法是有效的。但在测试能量效率、测试速率、以及瞬时速率满足率方面，本发明与对比文件1方法有不同的表现。图7是实施例中本发明与对比文件1方法的多小区蜂窝系统的测试能量效率对比图，图8是本发明与对比文件1方法在多小区蜂窝系统的测试速率对比图，图9是实施例中本发明与对比文件1方法的多小区蜂窝系统的瞬时速率满足率对比图。由图7和图8可以看出，本发明在测试能量效率以及测试速率上的表现均优于对比文件1方法；由图9也可以看出，随着时隙的增加，如1500至2000时隙，本发明获得的瞬时速率满足率好于对比文件1方法。

综上所述，本发明的保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法具有提高用户速率、长期稳定性、自适应性和智能化、节省能源和可扩展性等优点。通过优化资源分配和网络性能，提升蜂窝网的运行效率和用户体验。

Claims

1.一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法，其特征在于，所述一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法包括以下步骤：

S100、构建一个深度神经网络，所述深度神经网络同时输出有三个输出变量，分别是功率分配变量功率控制变量Δp_m(m＝1,2,…,M)和信道分配变量/>其中，M为小区数，N为信道数，K为用户数；

2.根据权利要求1所述的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法，其特征在于，在S100中，所述深度神经网络包括输入层、残差隐层、全连接隐层和输出层，所述输入层、残差隐层、全连接隐层和输出层依次连接，所述深度神经网络输入层的维度为(Batch,M,N,K)，Batch为批大小，所述输入层的输入为归一化的信道增益信息；

所述输出层包含三个子输出层，第一个子输出层包括维度等于(Batch,M×N)的全连接层、批归一化层和Sigmoid激活层，第二个子输出层包括维度等于(Batch,M)的全连接层、批归一化层和Sigmoid激活层，第三个子输出层包括维度等于(Batch,M×N×K)的全连接层、批归一化层和Sigmoid激活层；

所述功率分配变量为第一个子输出层的输出；所述功率控制变量Δp_m(m＝1,2,…,M)由第二个子输出层的输出与功率控制量Δp相乘后得到，其中，Δp＝p_max-N×p_min，p_max为小区基站的最大发射功率，p_min(p_min≥0)为小区基站在信道上的最小发射功率；所述信道分配变量/>为第三个子输出层的输出。

3.根据权利要求2所述的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法，其特征在于，在S200中，将每一小区m(m∈{1,2,...,M})所对应的信道分配变量转化为信道分配方案/>的方法，包括以下步骤：

S201、将小区m所对应的信道分配变量降序排列；

S205、将小区m中用户占用信道的结果转化为信道分配方案，所述将小区m中用户占用信道的结果转化为信道分配方案的方法为：若小区m中的用户k占用了信道n，则令若小区m中的用户k没有占用信道n，则令/>

4.根据权利要求3所述的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法，其特征在于，在S400中，包括以下步骤：

所述拉格朗日损失函数，表示如下，

所述采用拉格朗日损失函数对深度神经网络进行无监督学习，包括如下步骤：

5.一种存储介质，该存储介质上储存有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1-4任一项所述的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法。

6.一种计算机设备，其特征在于，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序，以实现权利要求1-4任一项所述的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法。