CN117119486B - 一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法 - Google Patents

一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法 Download PDF

Info

Publication number
CN117119486B
CN117119486B CN202311031560.9A CN202311031560A CN117119486B CN 117119486 B CN117119486 B CN 117119486B CN 202311031560 A CN202311031560 A CN 202311031560A CN 117119486 B CN117119486 B CN 117119486B
Authority
CN
China
Prior art keywords
channel
cell
neural network
deep neural
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311031560.9A
Other languages
English (en)
Other versions
CN117119486A (zh
Inventor
孙明
王淑梅
姜泽旭
董二寒
吕天宇
苏禹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qiqihar University
Original Assignee
Qiqihar University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qiqihar University filed Critical Qiqihar University
Priority to CN202311031560.9A priority Critical patent/CN117119486B/zh
Publication of CN117119486A publication Critical patent/CN117119486A/zh
Application granted granted Critical
Publication of CN117119486B publication Critical patent/CN117119486B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/16Central resource management; Negotiation of resources or communication parameters, e.g. negotiating bandwidth or QoS [Quality of Service]
    • H04W28/18Negotiating wireless communication parameters
    • H04W28/22Negotiating communication rate
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Quality & Reliability (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法,属于无线通信技术领域。本发明构建了一个深度神经网络,同时输出功率分配变量、功率控制变量和信道分配变量,并通过输出的功率分配变量、功率控制变量和信道分配变量,获得信道分配方案和功率分配方案;构建存储池,对深度神经网络同时进行训练和测试,在训练中采用拉格朗日损失函数对深度神经网络进行无监督学习。本发明具有提高用户速率、长期稳定性、自适应性和智能化、节省能源和可扩展性等优点。通过优化资源分配和网络性能,提升蜂窝网的运行效率和用户体验。

Description

一种保障多小区蜂窝网长期用户速率的深度无监督学习资源 分配方法
技术领域
本发明涉及一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法,属于无线通信技术领域。
背景技术
当前,无线通讯技术已经大规模商用,给社会生产和人民生活带来了极大便利,成为人们日常生活不可或缺的通讯方式。然而,智能手机等移动客户端的普及,使得越来越多的无线移动终端需要接入互联网中,这给本就紧张的无线资源带来了巨大压力,不仅使得有限的无线通信资源和日益增长的业务需求之间的矛盾更加突出,同时也大大增加了能源的消耗和无线网络维护运营的成本。
随着机器学习技术的迅速发展,人工智能在很多领域取得了突破性进展。其中,作为机器学习技术中重要研究方向之一的深度学习技术,已被广泛应用于无人驾驶、目标识别、图像分类、情感及语音识别等领域。近些年,随着深度学习技术的发展,越来越多的研究者使用深度学习方法处理无线通信问题,这为开发出低计算复杂性,支持实时计算的通用分配算法模型创造了可能。经过线下训练得出通用的模型后,可以部署为基于深度学习的在线推断平台,这种方式不仅计算复杂度低同时也降低了无线系统的延时。
利用深度学习对信道和功率等无线资源进行优化分配的研究日趋增加。目前,已有监督深度学习、深度强化学习、无监督深度学习应用于无线网络信道和功率等无线资源的优化分配上。在监督学习上,研究者首先使用遗传算法或其他启发式算法生成信道分配和功率等级标签数据,再对深度神经网络模型进行训练。在深度强化学习上,研究者一般采用深度Q网络产生信道分配方案以及离散功率控制方案,或者借助深度确定性策略梯度算法、深度无监督学习产生连续功率控制方案。在深度无监督学习上,研究者一般用于解决无线网络的功率控制问题。
长期性能度量对于在快衰落环境中优化网络是重要的,在快衰落环境中,通信服务的质量通常由平均性能来评估,例如平均速率、平均功耗。长期用户速率约束对于在快衰落环境中保障用户的公平具有重要的意义,对多小区蜂窝网络的资源分配具有重要的研究价值。更重要的用途是,保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法,可对系统收集到的若干连续时隙的信息同时进行资源分配,并能够保障多小区蜂窝系统若干连续时隙的长期平均用户速率,因而具有高效性等优势。
然而,将深度无监督学习同时应用于多小区蜂窝网络的信道分配和功率控制的研究很少,故保障多小区蜂窝网长期用户速率的深度无监督学习资源分配的研究也较少。其中一个主要的挑战是该资源分配问题既要面对基于离散变量的子载波信道分配问题又要面对基于连续变量的功率控制问题。而为了运用深度无监督学习技术保障多小区蜂窝网络的长期用户速率,既需要深度无监督学习同时进行信道分配和功率控制,又需要在深度无监督学习中将带有长期用户速率保障的约束优化问题转换成无约束优化问题;前者需要为后者提供待优化的离散信道分配变量和连续的功率分配、控制变量,后者需要为深度无监督学习提供合理有效的损失函数,有助于深度神经网络输出优化的信道分配变量和功率分配、控制变量。
发明内容
本发明提出了一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法,通过构建一个深度神经网络,同时输出功率分配变量、功率控制变量和信道分配变量,并通过输出的功率分配变量、功率控制变量和信道分配变量,获得信道分配方案和功率分配方案;构建存储池,对深度神经网络同时进行训练和测试,在训练中采用拉格朗日损失函数对深度神经网络进行无监督学习,从而解决现有技术中存在的问题。
一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法,一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法包括以下步骤:
S100、构建一个深度神经网络,深度神经网络同时输出有三个输出变量,分别是功率分配变量功率控制变量Δpm(m=1,2,…,M)和信道分配变量/>其中,M为小区数,N为信道数,K为用户数;
S200、将每一小区m(m∈{1,2,...,M})所对应的信道分配变量转化为信道分配方案/>使得每一小区里的每个用户至少占用/>个信道,以利于保障长期用户速率,其中/>表示向下取整,Km是小区m的用户数,N>Km
S300、将每一小区m(m∈{1,2,...,M})所对应的功率分配变量功率控制变量Δpm和信道分配方案/>转化为功率分配方案/>转化所采用的公式为:
其中,Δpm为小区m的功率控制变量,为小区m的功率分配变量,/>为小区m在信道n上的功率分配变量,pmin(pmin≥0)为小区基站在信道上的最小发射功率,为小区m中用户k关于信道n的信道分配方案;
S400、构建存储池,对S100中所构建的深度神经网络同时进行训练和测试,直到达到结束训练与测试的时隙数量。
进一步的,在S100中,深度神经网络包括输入层、残差隐层、全连接隐层和输出层,输入层、残差隐层、全连接隐层和输出层依次连接,深度神经网络输入层的维度为(Batch,M,N,K),Batch为批大小,输入层的输入为归一化的信道增益信息;
输出层包含三个子输出层,第一个子输出层包括维度等于(Batch,M×N)的全连接层、批归一化层和Sigmoid激活层,第二个子输出层包括维度等于(Batch,M)的全连接层、批归一化层和Sigmoid激活层,第三个子输出层包括维度等于(Batch,M×N×K)的全连接层、批归一化层和Sigmoid激活层;
功率分配变量为第一个子输出层的输出;功率控制变量Δpm(m=1,2,…,M)由第二个子输出层的输出与功率控制量Δp相乘后得到,其中,Δp=pmax-N×pmin,pmax为小区基站的最大发射功率,pmin(pmin≥0)为小区基站在信道上的最小发射功率;信道分配变量/>为第三个子输出层的输出。
进一步的,在S200中,将每一小区m(m∈{1,2,...,M})所对应的信道分配变量转化为信道分配方案/>的方法,包括以下步骤:
S201、将小区m所对应的信道分配变量降序排列;
S202、按照信道分配变量的降序排列结果,为小区m中的用户进行信道分配,使得小区m中的用户在本次分配中只占用一个信道;
S203、对信道分配变量进行如下更新:从信道分配变量/>中扣除已经被分配的信道分配变量;
S204、若剩余的未被分配的信道数大于小区m的用户数Km,则跳转到S202继续执行;若剩余的未被分配的信道数小于小区m的用户数Km,将剩余的未被分配的信道,按照信道分配变量的降序排列结果,在小区m的用户中进行分配,直到所有信道分配完毕为止;
S205、将小区m中用户占用信道的结果转化为信道分配方案,将小区m中用户占用信道的结果转化为信道分配方案的方法为:若小区m中的用户k占用了信道n,则令若小区m中的用户k没有占用信道n,则令/>
进一步的,在S400中,包括以下步骤:
S401、构建大小固定的先入先出式存储池,并初始化结束训练与测试的时隙数量;
S402、利用存储池收集多小区蜂窝系统不同时隙的动态信道增益信息数据;
S403、判断存储池收集到的信道增益信息数据是否达到了一定的数量,若未达到,返回S402继续收集动态信道增益信息数据;若达到,进入S404;
S404、从存储池中随机抽取一批信道增益信息数据,采用拉格朗日损失函数对深度神经网络进行无监督学习;
拉格朗日损失函数,表示如下,
其中,表示关于信道信息增益H的期望,E(H,D,P;θ)为能量效率,θ为深度神经网络参数,λkk≥0,k=1,2,...,K)为拉格朗日系数,Rk(H,D,P;θ)(k=1,2,...,K)为用户k的速率,/>为需要保障的长期用户速率;
采用拉格朗日损失函数对深度神经网络进行无监督学习,包括如下步骤:
首先,采用mini-batch梯度下降法,优化更新深度神经网络参数θ,如下式所示,
然后,采用mini-batch梯度上升法,优化更新拉格朗日系数λkk≥0,k=1,2,...,K),如下式所示,
上式中,θ[t]与θ[t+1]为第t次迭代和第t+1次迭代的深度神经网络参数;与/>为第t次迭代和第t+1次迭代的拉格朗日系数;D[t]与P[t]为第t次迭代利用S200和S300对深度神经网络的输出进行转化而得到的信道分配方案和功率分配方案;/>为第t次迭代能量效率对深度神经网络参数的梯度;/>为第t次迭代用户k的速率对深度神经网络参数的梯度;S为批量大小,HS为批量大小为S的信道信息增益集合;{}ReLU表示对大括号中的结果取ReLU激活函数运算;η1与η2为学习率;
S405、反复多次执行S404,然后将训练得到的深度神经网络用于测试,并利用S200和S300对深度神经网络测试的输出进行转化,计算出能量效率和用户速率;
S406、若达到了结束训练与测试的时隙数量,则结束训练与测试;否则,将新时隙的动态信道增益信息数据收集到存储池中,并返回到S404继续执行。
一种存储介质,该存储介质上储存有计算机程序,计算机程序被处理器执行时实现上述的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法。
一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序,以实现上述的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法。
本发明的有益效果:本发明提出了一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法,通过深度神经网络的输出能够同时转换为信道分配方案和功率分配方案;通过构建存储池,在训练深度神经网络的过程中对深度神经网络进行测试;采用拉格朗日损失函数对深度神经网络进行无监督学习,可对系统收集到的若干连续时隙的信息同时进行资源分配,能够在优化多小区蜂窝网能量效率的同时保障系统的长期用户速率。
附图说明
图1是本发明所提出的能够同时输出功率分配变量、功率控制变量和信道分配变量的深度神经网络模型;
图2是本发明的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法的实施流程图;
图3是本发明实施例的多小区蜂窝系统模型;
图4是实施例中本发明与对比文件1方法的拉格朗日损失函数对比图;
图5是实施例中本发明的各用户的长期用户速率;
图6是实施例中对比文件1方法的各用户的长期用户速率;
图7是实施例中本发明与对比文件1方法的多小区蜂窝系统的测试能量效率对比图;
图8是实施例中本发明与对比文件1方法的多小区蜂窝系统的测试速率对比图;
图9是实施例中本发明与对比文件1方法的多小区蜂窝系统的瞬时速率满足率对比图。
具体实施方式
下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的具体实施例附图中,为了更好、更清楚的描述系统中的各元件的工作原理,表现所述装置中各部分的连接关系,只是明显区分了各元件之间的相对位置关系,并不能构成对元件或结构内的信号传输方向、连接顺序及各部分结构大小、尺寸、形状的限定。
参照图2所示,一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法,一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法包括以下步骤:
S100、构建一个深度神经网络,深度神经网络同时输出有三个输出变量,分别是功率分配变量ynm(m=1,2,…,M,n=1,2,…,N)、功率控制变量Δpm(m=1,2,…,M)和信道分配变量其中,M为小区数,N为信道数,K为用户数;
S200、将每一小区m(m∈{1,2,...,M})所对应的信道分配变量转化为信道分配方案/>使得每一小区里的每个用户至少占用/>个信道,以利于保障长期用户速率,其中/>表示向下取整,Km是小区m的用户数,N>Km
S300、将每一小区m(m∈{1,2,...,M})所对应的功率分配变量功率控制变量Δpm和信道分配方案/>转化为功率分配方案/>转化所采用的公式为:
其中,Δpm为小区m的功率控制变量,为小区m的功率分配变量,/>为小区m在信道n上的功率分配变量,pmin(pmin≥0)为小区基站在信道上的最小发射功率,为小区m中用户k关于信道n的信道分配方案;
S400、构建存储池,对S100中所构建的深度神经网络同时进行训练和测试,直到达到结束训练与测试的时隙数量。
具体的,本方法通过构建深度神经网络,并输出功率分配变量、功率控制变量和信道分配变量。通过综合考虑这些变量,可以实现对多小区蜂窝网中的资源进行综合性分配。这种综合性分配有助于平衡不同小区之间的资源利用,优化整个网络的性能。在信道分配方案中,每个小区的用户都至少占用一个信道。这样做可以更好地保障长期用户的速率和体验。通过采用向下取整的方式,将用户数合理分配到每个信道上,确保用户能够获得足够的资源以支持其通信需求。本方法将功率分配变量、功率控制变量和信道分配方案转化为最终的功率分配方案。这有助于优化功率的分配,使每个小区的基站在信道上以最小发射功率的方式进行通信。通过合理的功率分配,可以提高能量效率和系统容量。本发明通过构建存储池并对深度神经网络进行训练和测试,该方法可以利用多个连续时隙的信息改善资源分配的准确性和稳定性。存储池的使用使得系统能够收集和利用大量的数据,从而更好地适应网络的动态变化和波动。
进一步的,参照图1所示,在S100中,深度神经网络包括输入层、残差隐层、全连接隐层和输出层,输入层、残差隐层、全连接隐层和输出层依次连接,深度神经网络输入层的维度为(Batch,M,N,K),Batch为批大小,输入层的输入为归一化的信道增益信息;
输出层包含三个子输出层,第一个子输出层包括维度等于(Batch,M×N)的全连接层、批归一化层和Sigmoid激活层,第二个子输出层包括维度等于(Batch,M)的全连接层、批归一化层和Sigmoid激活层,第三个子输出层包括维度等于(Batch,M×N×K)的全连接层、批归一化层和Sigmoid激活层;
功率分配变量为第一个子输出层的输出;功率控制变量Δpm(m=1,2,…,M)由第二个子输出层的输出与功率控制量Δp相乘后得到,其中,Δp=pmax-N×pmin,pmax为小区基站的最大发射功率,pmin(pmin≥0)为小区基站在信道上的最小发射功率;信道分配变量/>为第三个子输出层的输出。
具体的,通过深度神经网络的多个子输出层,将输入的归一化信道增益信息转化为功率分配变量和信道分配变量。这种综合资源分配方法考虑了小区、信道和用户之间的关系,可以在考虑多个因素的基础上进行资源分配优化,提高整个多小区蜂窝网的效率和性能。残差隐层作为深度神经网络的一部分,可以增强网络的非线性拟合能力和学习能力。通过残差隐层的引入,网络可以更好地适应复杂的资源分配问题,提高资源分配的准确性和可靠性。输出层的子输出层中包含批归一化层,可以提高网络的训练稳定性。批归一化层通过对每个批次的输入进行归一化操作,有助于缩小输入的范围,减少梯度消失和梯度爆炸问题,提高网络的训练速度和稳定性。通过第二个子输出层的输出与功率控制量相乘,可以灵活地调整小区基站的发射功率。其中,最大发射功率和最小发射功率提供了对功率控制的限制和参考。这种灵活的功率控制可以根据实际情况和网络需求进行调整,提高网络的能量效率和功率管理能力。第三个子输出层的输出表示信道分配变量,即每个小区、信道和用户之间的信道分配方案。这样可以实现个性化的信道资源分配,根据不同小区和用户的需求,为每个用户分配合适的信道,提高用户的速率和通信质量。
进一步的,在S200中,将每一小区m(m∈{1,2,...,M})所对应的信道分配变量转化为信道分配方案/>的方法,包括以下步骤:
S201、将小区m所对应的信道分配变量降序排列;
S202、按照信道分配变量的降序排列结果,为小区m中的用户进行信道分配,使得小区m中的用户在本次分配中只占用一个信道;
S203、对信道分配变量进行如下更新:从信道分配变量/>中扣除已经被分配的信道分配变量;
S204、若剩余的未被分配的信道数大于小区m的用户数Km,则跳转到S202继续执行;若剩余的未被分配的信道数小于小区m的用户数Km,将剩余的未被分配的信道,按照信道分配变量的降序排列结果,在小区m的用户中进行分配,直到所有信道分配完毕为止;
S205、将小区m中用户占用信道的结果转化为信道分配方案,将小区m中用户占用信道的结果转化为信道分配方案的方法为:若小区m中的用户k占用了信道n,则令若小区m中的用户k没有占用信道n,则令/>
具体的,通过S201步骤将小区m所对应的信道分配变量进行降序排列,可以找到信道分配变量最大的信道,从而实现对信道的最优分配。按照S202步骤的操作,为小区m中的用户逐一分配信道,确保每个用户在本次分配中只占用一个信道。这样可以最大程度地减少信道间的干扰,提高系统的容量和用户的通信质量。根据S203步骤的更新操作,每次分配后都会对信道分配变量进行扣除,即已分配的信道在下次分配中不再考虑。这种动态的信道资源管理可以确保每轮分配时,可用的信道池中只包含未被分配的信道,避免重复分配或浪费资源。同时,剩余未被分配的信道数与小区m的用户数之间的判断(S204步骤)也保证了资源的高效利用。S205步骤将小区m中用户占用信道的结果转化为信道分配方案。这样的转化方法能够方便地将分配结果转化为可理解和可实现的信道分配方案。对于协同通信系统而言,不同小区的信道分配方案应协调一致,以最大程度地提升整个系统的性能和用户体验。
进一步的,在S400中,包括以下步骤:
S401、构建大小固定的先入先出式存储池,并初始化结束训练与测试的时隙数量;
S402、利用存储池收集多小区蜂窝系统不同时隙的动态信道增益信息数据;
S403、判断存储池收集到的信道增益信息数据是否达到了一定的数量,若未达到,返回S402继续收集动态信道增益信息数据;若达到,进入S404;
S404、从存储池中随机抽取一批信道增益信息数据,采用拉格朗日损失函数对深度神经网络进行无监督学习;
拉格朗日损失函数,表示如下,
其中,表示关于信道信息增益H的期望,E(H,D,P;θ)为能量效率,θ为深度神经网络参数,λkk≥0,k=1,2,...,K)为拉格朗日系数,Rk(H,D,P;θ)(k=1,2,...,K)为用户k的速率,/>为需要保障的长期用户速率;
采用拉格朗日损失函数对深度神经网络进行无监督学习,包括如下步骤:
首先,采用mini-batch梯度下降法,优化更新深度神经网络参数θ,如下式所示,
然后,采用mini-batch梯度上升法,优化更新拉格朗日系数λkk≥0,k=1,2,...,K),如下式所示,
上式中,θ[t]与θ[t+1]为第t次迭代和第t+1次迭代的深度神经网络参数;与/>为第t次迭代和第t+1次迭代的拉格朗日系数;D[t]与P[t]为第t次迭代利用S200和S300对深度神经网络的输出进行转化而得到的信道分配方案和功率分配方案;/>为第t次迭代能量效率对深度神经网络参数的梯度;/>为第t次迭代用户k的速率对深度神经网络参数的梯度;S为批量大小,HS为批量大小为S的信道信息增益集合;{}ReLU表示对大括号中的结果取ReLU激活函数运算;η1与η2为学习率;
S405、反复多次执行S404,然后将训练得到的深度神经网络用于测试,并利用S200和S300对深度神经网络测试的输出进行转化,计算出能量效率和用户速率;
S406、若达到了结束训练与测试的时隙数量,则结束训练与测试;否则,将新时隙的动态信道增益信息数据收集到存储池中,并返回到S404继续执行。
具体的,通过S402步骤,利用大小固定的存储池收集多小区蜂窝系统不同时隙的动态信道增益信息数据。这样的数据收集可以提供系统在不同时刻和不同条件下的信道状态信息,为后续的信道分配和功率调整提供准确的参考依据。在S404步骤中,通过拉格朗日损失函数对深度神经网络进行无监督学习。这种学习方式允许系统从大量的信道增益信息数据中自动学习信道分配和功率调整的模式和规律,而不需要标注的监督数据。深度神经网络的使用可以潜在地发现复杂的非线性关系,从而更好地优化系统性能。通过拉格朗日损失函数中的能量效率和用户速率项,系统可以优化深度神经网络的参数和拉格朗日系数,以达到平衡能量效率和用户速率的目标。迭代的优化过程(S404步骤中的梯度下降和梯度上升)有助于逐步改进系统的性能,并找到最优的信道分配和功率调整策略。S405步骤中,通过多次执行S404来训练深度神经网络,并将训练得到的网络用于测试。通过与S200和S300的转化,可以计算出使用深度神经网络的信道分配方案和功率分配方案下的能量效率和用户速率。这样可以评估深度神经网络模型在系统中的实际效果,并作为调整策略的参考。
其中,S402中的动态信道增益信息数据,包括但不限于以下方式得到:
1.实际测量:可以通过实际的场地测试、测量或采集来获取动态信道增益信息数据;
2.信道估计:可以使用信号处理和通信技术中的信道估计方法来计算动态信道增益信息数据。当接收到发射信号时,可以通过估计信号在信道中的传输特性来推断信道增益;
3.仿真模拟:可以使用计算机仿真模拟来生成动态信道增益信息数据。通过建立适当的信道模型,结合随机性和实际场景参数,可以模拟生成信道增益数据。
一种存储介质,该存储介质上储存有计算机程序,计算机程序被处理器执行时实现上述的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法。
具体的,通过存储介质中的计算机程序,系统可以自动实现对多小区蜂窝网的资源分配。无需手动干预和配置,系统可以根据信道增益信息动态地优化信道分配和功率调整,以保障长期用户速率。这种自动化的资源分配大大减轻了网络管理人员的工作负担,并提高了资源利用率和性能。该计算机程序中采用深度无监督学习方法进行资源分配优化。深度学习具有强大的表达能力和学习能力,可以从大量的信道增益数据中挖掘出潜在的模式和规律,优化网络的性能。通过存储介质上的计算机程序的执行,系统可以利用深度神经网络进行无监督学习,并根据数据自动调整网络的参数和模型,以适应不同的信道条件和用户需求。本方法旨在保障多小区蜂窝网的长期用户速率。通过计算机程序的执行,系统可以通过优化信道分配和功率调整来最大化用户速率,并在一定程度上保障用户的持续性和稳定性。长期用户速率保障有助于提高用户体验和满意度,提升网络的整体性能和竞争力。将本方法存储在计算机程序中,系统可以灵活地根据实际情况进行调整和扩展。通过修改和更新存储介质中的计算机程序,可以引入新的算法和技术,进一步优化资源分配方法并适应不断变化的网络环境和需求。这种灵活性和可扩展性使得系统能够快速响应和适应不断演化的通信场景。
一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序,以实现上述的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法。
具体的,计算机设备中的存储器和处理器结合存储的计算机程序,可以实现高效的资源分配。处理器执行计算机程序时,可以基于深度无监督学习的方法对信道分配和功率调整进行优化。通过计算机设备的计算能力和存储能力,可以对大量的信道增益数据进行实时分析和处理,以实现更精确和准确的资源分配。这种高效的资源分配有助于提高网络的容量和性能,提升用户的体验和满意度。计算机设备中的处理器可以实时执行计算机程序,根据实时收集的数据进行决策和调整。通过实时的决策和调整,计算机设备可以实时响应网络中的变化条件,如信道状况、用户需求等。这种实时性使系统更加适应动态变化的通信环境,能够及时调整资源分配策略,保障长期用户速率。计算机设备中的存储器和处理器可以存储和执行不同版本的计算机程序,使得系统具备可编程性和扩展性。如果有新的算法和策略出现,可以通过更新计算机程序来引入这些新方法,同时保留旧的版本以备可能的回退。这种可编程性和扩展性使得计算机设备能够不断适应业界的最新技术和研究成果,提高资源分配的效果和性能。通过计算机程序的执行,计算机设备可以实现资源分配方法的自动化和智能化。无需人工干预,系统可以根据深度无监督学习的方法自主地进行资源分配和优化,提高效率和准确性。这种自动化和智能化降低了操作和管理的工作负担,同时提供了更优质的服务。
以下为本发明提供的一个具体实施例:
图3是实施例中的多小区网络全频复用系统模型,该多小区网络全频复用系统模型有3个相邻的小区,每个小区半径为200m,基站位于小区中央,基站的最大发射功率为38dBm,小区A、B、C均随机分布有3个用户,用户与小区的接入关系固定,所有小区共享系统中的信道资源,可用子信道数为21个,子信道带宽为180kHz,载波频率为2GHz,信道噪声功率谱密度为-174dBm/Hz,系统要求每个子信道的最低传输功率为20dBm,路径损耗采用对数距离路径损耗模型,参考距离设为100m,路径损耗指数设为3.2,正态随机变量的标准差设为8,要求保障长期用户速率为2×105bps。
S100、构建一个深度神经网络;所述的深度神经网络,能够同时输出功率分配变量功率控制变量Δpm(m=1,2,…,M)和信道分配变量
所述的深度神经网络包含输入层、残差隐层、全连接隐层和输出层,其中,所述深度神经网络输入层的维度为(Batch,M,N,K),Batch为批大小,M为小区数,N为信道数,K为用户数,所述的输入层的输入为归一化的信道增益信息;
所述深度神经网络残差隐层包含一个卷积层、批归一化层、ReLU激活层和一个全连接层、批归一化层、ELU激活层;所述深度神经网络全连接隐层包含3个全连接层、批归一化层、ReLU激活层;
所述深度神经网络输出层包含三个子输出层,第一个子输出层由维度等于(Batch,M×N)的全连接层、批归一化层、Sigmoid激活层构成,第二个子输出层由维度等于(Batch,M)的全连接层、批归一化层、Sigmoid激活层构成,第三个子输出层由维度等于(Batch,M×N×K)的全连接层、批归一化层、Sigmoid激活层构成;
所述的功率分配变量为第一个子输出层的输出;所述的功率控制变量Δpm(m=1,2,…,M)由第二个子输出层的输出与功率控制量Δp相乘后得到,其中,Δp=pmax-N×pmin,pmax为小区基站的最大发射功率,pmin(pmin≥0)为小区基站在信道上的最小发射功率;所述的信道分配变量/>为第三个子输出层的输出。
根据实施例,在S100中设置M=3,N=21,K=9,Batch=20,
S200、将每一小区m(m∈{1,2,...,M})所对应的信道分配变量转化为信道分配方案/>使得每一小区里的每个用户至少占用/>个信道,以利于保障长期用户速率,其中/>表示向下取整,Km是小区m的用户数,N>Km
所述的将每一小区m所对应的信道分配变量转化为初始信道分配方案的方法,包括如下步骤:
S201、将小区m所对应的信道分配变量降序排列;
S202、按照信道分配变量的降序排列结果,为小区m中的用户进行信道分配,使得小区m中的用户在本次分配中只占用一个信道;
S203、对信道分配变量进行如下更新:从信道分配变量/>中扣除已经被分配的信道分配变量;
S204、若剩余的未被分配的信道数大于小区m的用户数Km,则跳转到S202继续执行;若剩余的未被分配的信道数小于小区m的用户数Km,将剩余的未被分配的信道,按照信道分配变量的降序排列结果,在小区m的用户中进行分配,直到所有信道分配完毕为止;
S205、将小区m中用户占用信道的结果转化为信道分配方案,所述的将小区m中用户占用信道的结果转化为信道分配方案的方法为:若小区m中的用户k占用了信道n,则令若小区m中的用户k没有占用信道n,则令/>
根据实施例,每小区有3个用户即K1=K2=K3=3且每小区可用子信道数为21个,故在S200中每一小区中的每个用户至少占用7个信道。下面以其中一个小区3用户的信道分配变量为例,详细说明产生信道分配方案的步骤。假定该小区的3用户的信道分配变量/>如下:
用户1在21个信道上的信道分配变量分别为0.5317,0.5168,0.5007,0.5000,0.5267,0.5073,0.5196,0.5260,0.5056,0.5332,0.5153,0.5000,0.5284,0.5000,0.5024,0.5067,0.5121,0.5283,0.5526,0.5720,0.5763;
用户2在21个信道上的信道分配变量分别为0.5540,0.5000,0.5066,0.5071,0.5127,0.5000,0.5665,0.5645,0.6420,0.5051,0.5190,0.5324,0.5154,0.5680,0.5154,0.5559,0.5390,0.5321,0.5092,0.5558,0.5122;
用户3在21个信道上的信道分配变量分别为0.5419,0.5353,0.5273,0.5112,0.5000,0.5214,0.5000,0.5000,0.5224,0.5064,0.5178,0.5037,0.5066,0.5419,0.5251,0.5051,0.5220,0.5063,0.5188,0.5151,0.5080。
由S201,对用户的信道分配变量降序排列。方便起见,在排序的信道分配变量后加入上标(用户号:信道号)作标记,降序排列结果如下:0.6420(2:9),0.5763(1:21),0.5720(1:20),0.5680(2:14),0.5665(2:7),0.5645(2:8),0.5559(2:16),0.5558(2:20),0.5540(2:1),0.5526(1:19),0.5419(3:14),0.5419(3:1),0.5390(2:17),0.5353(3:2),0.5332(1:10),0.5324(2:12),0.5321(2:18),0.5317(1:1),0.5284(1:13),0.5283(1:18),0.5273(3:3),0.5267(1:5),0.5260(1:8),0.5251(3:15),0.5224(3:9),0.5220(3:17),0.5214(3:6),0.5196(1:7),0.5190(2:11),0.5188(3:19),0.5178(3:11),0.5168(1:2),0.5154(2:15),0.5154(2:13),0.5153(1:11),0.5151(3:20),0.5127(2:5),0.5122(2:21),0.5121(1:17),0.5112(3:4),0.5092(2:19),0.5080(3:21),0.5073(1:6),0.5071(2:4),0.5067(1:16),0.5066(2:3),0.5066(3:13),0.5064(3:10),0.5063(3:18),0.5056(1:9),0.5051(3:16),0.5051(2:10),0.5037(3:12),0.5024(1:15),0.5007(1:3),0.5000(1:12),0.5000(3:8),0.5000(1:4),0.5000(2:6),0.5000(2:2),0.5000(3:5),0.5000(1:14),0.5000(3:7)
由S202、S203和S204,一共需要进行7次信道分配,每次信道分配均需要保障用户在本次分配中只占用一个信道。
第1次信道分配,按照信道变量降序排列结果,由S202选择0.6420(2:9)、0.5763(1:21)、0.5419(3:14),即用户2占用信道9、用户1占用信道21、用户3占用信道14。由S203,信道分配变量更新为0.5720(1:20),0.5665(2:7),0.5645(2:8),0.5559(2:16),0.5558(2:20),0.5540(2:1),0.5526(1:19),0.5419(3:1),0.5390(2:17),0.5353(3:2),0.5332(1:10),0.5324(2:12),0.5321(2:18),0.5317(1:1),0.5284(1:13),0.5283(1:18),0.5273(3:3),0.5267(1:5),0.5260(1:8),0.5251(3:15),0.5220(3:17),0.5214(3:6),0.5196(1:7),0.5190(2:11),0.5188(3:19),0.5178(3:11),0.5168(1:2),0.5154(2:15),0.5154(2:13),0.5153(1:11),0.5151(3:20),0.5127(2:5),0.5121(1:17),0.5112(3:4),0.5092(2:19),0.5073(1:6),0.5071(2:4),0.5067(1:16),0.5066(2:3),0.5066(3:13),0.5064(3:10),0.5063(3:18),0.5051(3:16),0.5051(2:10),0.5037(3:12),0.5024(1:15),0.5007(1:3),0.5000(1:12),0.5000(3:8),0.5000(1:4),0.5000(2:6),0.5000(2:2),0.5000(3:5),0.5000(3:7)
第2次信道分配,按照信道变量降序排列结果,由S202选择0.5720(1:20)、0.5665(2:7)、0.5419(3:1),即用户1占用信道20、用户2占用信道7、用户3占用信道1。由S203,信道分配变量更新为0.5645(2:8),0.5559(2:16),0.5526(1:19),0.5390(2:17),0.5353(3:2),0.5332(1:10),0.5324(2:12),0.5321(2:18),0.5284(1:13),0.5283(1:18),0.5273(3:3),0.5267(1:5),0.5260(1:8),0.5251(3:15),0.5220(3:17),0.5214(3:6),0.5190(2:11),0.5188(3:19),0.5178(3:11),0.5168(1:2),0.5154(2:15),0.5154(2:13),0.5153(1:11),0.5127(2:5),0.5121(1:17),0.5112(3:4),0.5092(2:19),0.5073(1:6),0.5071(2:4),0.5067(1:16),0.5066(2:3),0.5066(3:13),0.5064(3:10),0.5063(3:18),0.5051(3:16),0.5051(2:10),0.5037(3:12),0.5024(1:15),0.5007(1:3),0.5000(1:12),0.5000(3:8),0.5000(1:4),0.5000(2:6),0.5000(2:2),0.5000(3:5)
第3次信道分配,按照信道变量降序排列结果,由S202选择0.5645(2:8)、0.5526(1:19)、0.5353(3:2),即用户2占用信道8、用户1占用信道19、用户3占用信道2。由S203,信道分配变量更新为0.5559(2:16),0.5390(2:17),0.5332(1:10),0.5324(2:12),0.5321(2:18),0.5284(1:13),0.5283(1:18),0.5273(3:3),0.5267(1:5),0.5251(3:15),0.5220(3:17),0.5214(3:6),0.5190(2:11),0.5178(3:11),0.5154(2:15),0.5154(2:13),0.5153(1:11),0.5127(2:5),0.5121(1:17),0.5112(3:4),0.5073(1:6),0.5071(2:4),0.5067(1:16),0.5066(2:3),0.5066(3:13),0.5064(3:10),0.5063(3:18),0.5051(3:16),0.5051(2:10),0.5037(3:12),0.5024(1:15),0.5007(1:3),0.5000(1:12),0.5000(1:4),0.5000(2:6),0.5000(3:5)
第4次信道分配,按照信道变量降序排列结果,由S202选择0.5559(2:16)、0.5332(1:10)、0.5273(3:3),即用户2占用信道16、用户1占用信道10、用户3占用信道3。由S203,信道分配变量更新为0.5390(2:17),0.5324(2:12),0.5321(2:18),0.5284(1:13),0.5283(1:18),0.5267(1:5),0.5251(3:15),0.5220(3:17),0.5214(3:6),0.5190(2:11),0.5178(3:11),0.5154(2:15),0.5154(2:13),0.5153(1:11),0.5127(2:5),0.5121(1:17),0.5112(3:4),0.5073(1:6),0.5071(2:4),0.5066(3:13),0.5063(3:18),0.5037(3:12),0.5024(1:15),0.5000(1:12),0.5000(1:4),0.5000(2:6),0.5000(3:5)
第5次信道分配,按照信道变量降序排列结果,由S202选择0.5390(2:17)、0.5284(1:13)、0.5251(3:15),即用户2占用信道17、用户1占用信道13、用户3占用信道15。由S203,信道分配变量更新为0.5324(2:12),0.5321(2:18),0.5283(1:18),0.5267(1:5),0.5214(3:6),0.5190(2:11),0.5178(3:11),0.5153(1:11),0.5127(2:5),0.5112(3:4),0.5073(1:6),0.5071(2:4),0.5063(3:18),0.5037(3:12),0.5000(1:12),0.5000(1:4),0.5000(2:6),0.5000(3:5)
第6次信道分配,按照信道变量降序排列结果,由S202选择0.5324(2:12)、0.5283(1:18)、0.5214(3:6),即用户2占用信道12、用户1占用信道18、用户3占用信道6。由S203,信道分配变量更新为0.5267(1:5),0.5190(2:11),0.5178(3:11),0.5153(1:11),0.5127(2:5),0.5112(3:4),0.5071(2:4),0.5000(1:4),0.5000(3:5)
第7次信道分配,按照信道变量降序排列结果,由S202选择0.5267(1:5)、0.5190(2:11)、0.5112(3:4),即用户1占用信道5、用户2占用信道11、用户3占用信道4。由S203,信道分配变量更新为空。
由S205,将小区用户占用信道的结果转化为信道分配方案。
多小区蜂窝系统中的每一小区均按照S201、S202、S203、S204、S205执行,将每一小区户占用信道的结果转化为信道分配方案。
S300、将每一小区m(m∈{1,2,...,M})所对应的功率分配变量功率控制变量Δpm,以及信道分配方案/>转化为功率分配方案/>转化所采用的公式为:
其中,Δpm为小区m的功率控制变量,为小区m的功率分配变量,/>为小区m在信道n上的功率分配变量,pmin(pmin≥0)为小区基站在信道上的最小发射功率,/>为小区m中用户k关于信道n的信道分配方案;
S400、构建存储池,对S100所构建的深度神经网络同时进行训练和测试,具体步骤如下:
S401、构建大小固定的先入先出式存储池,并初始化结束训练与测试的时隙数量;
S402、利用存储池收集多小区蜂窝系统不同时隙的动态信道增益信息数据;
S403、判断存储池收集到的信道增益信息数据是否达到了一定的数量,若未达到,返回S402继续收集动态信道增益信息数据;若达到,进入S404;
S404、从存储池中随机抽取一批信道增益信息数据,采用拉格朗日损失函数对深度神经网络进行无监督学习;
所述的拉格朗日损失函数,表示如下,
其中,表示关于信道信息增益H的期望,E(H,D,P;θ)为能量效率,θ为深度神经网络参数,λkk≥0,k=1,2,...,K)为拉格朗日系数,Rk(H,D,P;θ)(k=1,2,...,K)为用户k的速率,/>为需要保障的长期用户速率;
所述的采用拉格朗日损失函数对深度神经网络进行无监督学习,包括如下步骤:
首先,采用mini-batch梯度下降法,优化更新深度神经网络参数θ,如下式所示,
然后,采用mini-batch梯度上升法,优化更新拉格朗日系数λkk≥0,k=1,2,...,K),如下式所示,
上式中,θ[t]与θ[t+1]为第t次迭代和第t+1次迭代的深度神经网络参数;与/>为第t次迭代和第t+1次迭代的拉格朗日系数;D[t]与P[t]为第t次迭代利用S200和S300对深度神经网络的输出进行转化而得到的信道分配方案和功率分配方案;/>为第t次迭代能量效率对深度神经网络参数的梯度;/>为第t次迭代用户k的速率对深度神经网络参数的梯度;S为批量大小,HS为批量大小为S的信道信息增益集合;{}ReLU表示对大括号中的结果取ReLU激活函数运算;η1与η2为学习率;
S405、反复多次执行S404,然后将训练得到的深度神经网络用于测试,并利用S200和S300对深度神经网络测试的输出进行转化,计算出能量效率和用户速率;
S406、若达到了结束训练与测试的时隙数量,则结束训练与测试;否则,将新时隙的动态信道增益信息数据收集到存储池中,并返回到S404继续执行。
根据S400,实施例中构建的存储池大小等于100,当存储池收集到的信道增益信息数据大于等于50时,从存储池中随机抽取Batch大小为20的信道增益信息数据,采用拉格朗日损失函数对深度神经网络进行无监督学习,反复执行S404训练深度神经网络的次数设为20,停止训练与测试的时隙数设为20000,用于测试的信道增益信息数据来自于系统当前时隙以后的20个时隙。在实施例中,采用的系统能量效率E(H,D,P;θ)表示如下:
系统速率R(H,D,P;θ)表示如下:
用户k速率Rk(H,D,P;θ)表示如下:
其中p0为非常小的正数,p0=10-10,B为子信道带宽,N0为信道噪声功率谱密度,为基站m使用信道n与用户k通信所形成的干扰,表示如下:
在实施例中,将本发明与对比文件1方法(“基于深度无监督学习的多小区蜂窝网资源分配方法”,孙明等,《控制与决策》,第37卷第9期,2022年)进行了对比。对比文件1方法采用了两个深度神经网络,即基于无监督学习的深度功率控制神经网络和基于无监督学习的深度信道分配神经网络,先训练深度功率控制神经网络,然后再联合训练好的深度功率控制神经网络来训练深度信道分配神经网络。不同于对比文件1方法,本发明采用的是如S100及图1所示的一个深度神经网络,能够同时输出功率分配变量、功率控制变量和信道分配变量;而且,为了保障多小区蜂窝系统的长期用户速率,本发明采用了如S200所示的信道分配方法以及如S400与图2所示的基于存储池和拉格朗日损失函数的深度神经网络无监督学习方法。仿真中,η1=4×10-4,η2=1×10-8。仿真对比了本发明与对比文件1方法在保障多小区蜂窝系统的长期用户速率过程中的拉格朗日损失函数、测试能量效率、测试速率、长期用户速率保障情况以及瞬时速率满足率。图4是实施例中本发明与对比文件1方法的拉格朗日损失函数对比图,图5是实施例中本发明的各用户的长期用户速率,图6是实施例中对比文件1方法的各用户的长期用户速率,由此可见,采用S400的基于存储池和拉格朗日损失函数的深度神经网络无监督学习方法,均能使本发明与对比文件1方法具有较高的长期用户速率保障性能,即在测试中均能使20个时隙每个用户的平均用户速率达到要求的2×105bps,这说明了本发明所提出的基于存储池和拉格朗日损失函数的深度神经网络无监督学习方法是有效的。但在测试能量效率、测试速率、以及瞬时速率满足率方面,本发明与对比文件1方法有不同的表现。图7是实施例中本发明与对比文件1方法的多小区蜂窝系统的测试能量效率对比图,图8是本发明与对比文件1方法在多小区蜂窝系统的测试速率对比图,图9是实施例中本发明与对比文件1方法的多小区蜂窝系统的瞬时速率满足率对比图。由图7和图8可以看出,本发明在测试能量效率以及测试速率上的表现均优于对比文件1方法;由图9也可以看出,随着时隙的增加,如1500至2000时隙,本发明获得的瞬时速率满足率好于对比文件1方法。
综上所述,本发明的保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法具有提高用户速率、长期稳定性、自适应性和智能化、节省能源和可扩展性等优点。通过优化资源分配和网络性能,提升蜂窝网的运行效率和用户体验。

Claims (6)

1.一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法,其特征在于,所述一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法包括以下步骤:
S100、构建一个深度神经网络,所述深度神经网络同时输出有三个输出变量,分别是功率分配变量功率控制变量Δpm(m=1,2,…,M)和信道分配变量/>其中,M为小区数,N为信道数,K为用户数;
S200、将每一小区m(m∈{1,2,...,M})所对应的信道分配变量转化为信道分配方案/>使得每一小区里的每个用户至少占用/>个信道,以利于保障长期用户速率,其中/>表示向下取整,Km是小区m的用户数,N>Km
S300、将每一小区m(m∈{1,2,...,M})所对应的功率分配变量功率控制变量Δpm和信道分配方案/>转化为功率分配方案/>转化所采用的公式为:
其中,Δpm为小区m的功率控制变量,为小区m的功率分配变量,/>为小区m在信道n上的功率分配变量,pmin(pmin≥0)为小区基站在信道上的最小发射功率,/>为小区m中用户k关于信道n的信道分配方案;
S400、构建存储池,对S100中所构建的深度神经网络同时进行训练和测试,直到达到结束训练与测试的时隙数量。
2.根据权利要求1所述的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法,其特征在于,在S100中,所述深度神经网络包括输入层、残差隐层、全连接隐层和输出层,所述输入层、残差隐层、全连接隐层和输出层依次连接,所述深度神经网络输入层的维度为(Batch,M,N,K),Batch为批大小,所述输入层的输入为归一化的信道增益信息;
所述输出层包含三个子输出层,第一个子输出层包括维度等于(Batch,M×N)的全连接层、批归一化层和Sigmoid激活层,第二个子输出层包括维度等于(Batch,M)的全连接层、批归一化层和Sigmoid激活层,第三个子输出层包括维度等于(Batch,M×N×K)的全连接层、批归一化层和Sigmoid激活层;
所述功率分配变量为第一个子输出层的输出;所述功率控制变量Δpm(m=1,2,…,M)由第二个子输出层的输出与功率控制量Δp相乘后得到,其中,Δp=pmax-N×pmin,pmax为小区基站的最大发射功率,pmin(pmin≥0)为小区基站在信道上的最小发射功率;所述信道分配变量/>为第三个子输出层的输出。
3.根据权利要求2所述的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法,其特征在于,在S200中,将每一小区m(m∈{1,2,...,M})所对应的信道分配变量转化为信道分配方案/>的方法,包括以下步骤:
S201、将小区m所对应的信道分配变量降序排列;
S202、按照信道分配变量的降序排列结果,为小区m中的用户进行信道分配,使得小区m中的用户在本次分配中只占用一个信道;
S203、对信道分配变量进行如下更新:从信道分配变量/>中扣除已经被分配的信道分配变量;
S204、若剩余的未被分配的信道数大于小区m的用户数Km,则跳转到S202继续执行;若剩余的未被分配的信道数小于小区m的用户数Km,将剩余的未被分配的信道,按照信道分配变量的降序排列结果,在小区m的用户中进行分配,直到所有信道分配完毕为止;
S205、将小区m中用户占用信道的结果转化为信道分配方案,所述将小区m中用户占用信道的结果转化为信道分配方案的方法为:若小区m中的用户k占用了信道n,则令若小区m中的用户k没有占用信道n,则令/>
4.根据权利要求3所述的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法,其特征在于,在S400中,包括以下步骤:
S401、构建大小固定的先入先出式存储池,并初始化结束训练与测试的时隙数量;
S402、利用存储池收集多小区蜂窝系统不同时隙的动态信道增益信息数据;
S403、判断存储池收集到的信道增益信息数据是否达到了一定的数量,若未达到,返回S402继续收集动态信道增益信息数据;若达到,进入S404;
S404、从存储池中随机抽取一批信道增益信息数据,采用拉格朗日损失函数对深度神经网络进行无监督学习;
所述拉格朗日损失函数,表示如下,
其中,表示关于信道信息增益H的期望,E(H,D,P;θ)为能量效率,θ为深度神经网络参数,λkk≥0,k=1,2,...,K)为拉格朗日系数,Rk(H,D,P;θ)(k=1,2,...,K)为用户k的速率,/>为需要保障的长期用户速率;
所述采用拉格朗日损失函数对深度神经网络进行无监督学习,包括如下步骤:
首先,采用mini-batch梯度下降法,优化更新深度神经网络参数θ,如下式所示,
然后,采用mini-batch梯度上升法,优化更新拉格朗日系数λkk≥0,k=1,2,...,K),如下式所示,
上式中,θ[t]与θ[t+1]为第t次迭代和第t+1次迭代的深度神经网络参数;与/>为第t次迭代和第t+1次迭代的拉格朗日系数;D[t]与P[t]为第t次迭代利用S200和S300对深度神经网络的输出进行转化而得到的信道分配方案和功率分配方案;/>为第t次迭代能量效率对深度神经网络参数的梯度;/>为第t次迭代用户k的速率对深度神经网络参数的梯度;S为批量大小,HS为批量大小为S的信道信息增益集合;{}ReLU表示对大括号中的结果取ReLU激活函数运算;η1与η2为学习率;
S405、反复多次执行S404,然后将训练得到的深度神经网络用于测试,并利用S200和S300对深度神经网络测试的输出进行转化,计算出能量效率和用户速率;
S406、若达到了结束训练与测试的时隙数量,则结束训练与测试;否则,将新时隙的动态信道增益信息数据收集到存储池中,并返回到S404继续执行。
5.一种存储介质,该存储介质上储存有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-4任一项所述的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法。
6.一种计算机设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现权利要求1-4任一项所述的一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法。
CN202311031560.9A 2023-08-16 2023-08-16 一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法 Active CN117119486B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311031560.9A CN117119486B (zh) 2023-08-16 2023-08-16 一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311031560.9A CN117119486B (zh) 2023-08-16 2023-08-16 一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法

Publications (2)

Publication Number Publication Date
CN117119486A CN117119486A (zh) 2023-11-24
CN117119486B true CN117119486B (zh) 2024-04-05

Family

ID=88806831

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311031560.9A Active CN117119486B (zh) 2023-08-16 2023-08-16 一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法

Country Status (1)

Country Link
CN (1) CN117119486B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117614573B (zh) * 2024-01-23 2024-03-26 中国人民解放军战略支援部队航天工程大学 基于深度强化学习的联合功率信道分配方法、系统及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200060290A (ko) * 2018-11-22 2020-05-29 한밭대학교 산학협력단 Ofdma swipt 시스템의 통합 자원 할당 장치 및 방법
CN111930501A (zh) * 2020-07-23 2020-11-13 齐齐哈尔大学 一种面向多小区网络的基于无监督学习的无线资源分配方法
KR102409974B1 (ko) * 2022-01-28 2022-06-16 한화시스템(주) 인공신경망 기반의 소스, 채널부호율 및 전력제어 최적화 방법 및 시스템
CN115811788A (zh) * 2022-11-23 2023-03-17 齐齐哈尔大学 一种深度强化学习联合无监督学习的d2d网络分布式资源分配方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230092294A (ko) * 2021-12-17 2023-06-26 조선대학교산학협력단 심층 q-학습을 이용한 우선순위 기반 자원 할당 방법 및 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200060290A (ko) * 2018-11-22 2020-05-29 한밭대학교 산학협력단 Ofdma swipt 시스템의 통합 자원 할당 장치 및 방법
CN111930501A (zh) * 2020-07-23 2020-11-13 齐齐哈尔大学 一种面向多小区网络的基于无监督学习的无线资源分配方法
KR102409974B1 (ko) * 2022-01-28 2022-06-16 한화시스템(주) 인공신경망 기반의 소스, 채널부호율 및 전력제어 최적화 방법 및 시스템
CN115811788A (zh) * 2022-11-23 2023-03-17 齐齐哈尔大学 一种深度强化学习联合无监督学习的d2d网络分布式资源分配方法

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
A Resource Allocation Method of Deep Reinforcement Transfer Learning in WSN;Daxiu Zhang;《2021 International Conference on Computer Network, Electronic and Automation (ICCNEA)》;20211119;全文 *
Joint DDPG and Unsupervised Learning for Channel Allocation and Power Control in Centralized Wireless Cellular Networks;MING SUN;《IEEE Access 》;20230425;全文 *
Sun, M. ; .Deep reinforcement learning for resource allocation in multi-cell cellular networks.《 Business Intelligence and Information Technology》.2022,全文. *
Unsupervised Learning Neural-Network Method for Resource Allocation in Multi-cell Cellular Networks;Ming Sun;《 2021 International Conference on Intelligent Computing, Automation and Applications (ICAA)》;20211230;全文 *
卫星通信中基于深度强化学习的资源分配与可靠性研究;兰松;《CNKI》;20230606;全文 *
基于深度强化学习的多小区功率分配算法;惠庆琳;;技术与市场;20200929(第10期);全文 *
基于深度强化学习的无线网络资源分配算法;李孜恒;孟超;;通信技术;20200810(第08期);全文 *
基于深度无监督学习的多小区蜂窝网资源分配方法;孙明;《控制与决策》;20210802;全文 *

Also Published As

Publication number Publication date
CN117119486A (zh) 2023-11-24

Similar Documents

Publication Publication Date Title
CN109729528B (zh) 一种基于多智能体深度强化学习的d2d资源分配方法
CN111586720B (zh) 一种多小区场景下的任务卸载和资源分配的联合优化方法
CN111800828B (zh) 一种超密集网络的移动边缘计算资源分配方法
CN111585816B (zh) 一种基于自适应遗传算法的任务卸载决策方法
CN111372314A (zh) 基于移动边缘计算场景下的任务卸载方法及任务卸载装置
CN112105062B (zh) 时敏条件下移动边缘计算网络能耗最小化策略方法
CN117119486B (zh) 一种保障多小区蜂窝网长期用户速率的深度无监督学习资源分配方法
CN113286317B (zh) 一种基于无线供能边缘网络的任务调度方法
CN113596785B (zh) 基于深度q网络的d2d-noma通信系统资源分配方法
CN111915142B (zh) 一种基于深度强化学习的无人机辅助资源分配方法
CN113543342B (zh) 基于noma-mec强化学习资源分配与任务卸载方法
CN109618399A (zh) 多用户移动边缘计算系统中的分布式能量管理优化方法
CN113573363B (zh) 基于深度强化学习的mec计算卸载与资源分配方法
CN109787696B (zh) 基于案例推理与合作q学习的认知无线电资源分配方法
CN113781002B (zh) 云边协同网络中基于代理模型和多种群优化的低成本工作流应用迁移方法
CN116456493A (zh) 一种基于深度强化学习算法的d2d用户资源分配方法及存储介质
CN114885420A (zh) 一种noma-mec系统中的用户分组和资源分配方法及装置
CN112492686A (zh) 一种基于深度双q网络的蜂窝网络功率分配方法
CN114126021B (zh) 一种基于深度强化学习的绿色认知无线电的功率分配方法
Hu et al. Edge intelligence for real-time data analytics in an IoT-based smart metering system
Zhu et al. Learn and pick right nodes to offload
CN114521023A (zh) Swipt辅助noma-mec系统资源分配建模方法
CN111930501B (zh) 一种面向多小区网络的基于无监督学习的无线资源分配方法
Do et al. Actor-critic deep learning for efficient user association and bandwidth allocation in dense mobile networks with green base stations
CN115915454A (zh) Swipt辅助的下行资源分配方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant