CN115604824A - 一种用户调度方法及系统 - Google Patents

一种用户调度方法及系统 Download PDF

Info

Publication number
CN115604824A
CN115604824A CN202110720878.2A CN202110720878A CN115604824A CN 115604824 A CN115604824 A CN 115604824A CN 202110720878 A CN202110720878 A CN 202110720878A CN 115604824 A CN115604824 A CN 115604824A
Authority
CN
China
Prior art keywords
user
trained
neural network
channel
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110720878.2A
Other languages
English (en)
Inventor
王晓婧
张伟
朱宇昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Xiongan ICT Co Ltd
China Mobile System Integration Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Xiongan ICT Co Ltd
China Mobile System Integration Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Xiongan ICT Co Ltd, China Mobile System Integration Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202110720878.2A priority Critical patent/CN115604824A/zh
Publication of CN115604824A publication Critical patent/CN115604824A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/04Wireless resource allocation
    • H04W72/044Wireless resource allocation based on the type of the allocated resource
    • H04W72/046Wireless resource allocation based on the type of the allocated resource the resource being in the space domain, e.g. beams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/12Wireless traffic scheduling
    • H04W72/121Wireless traffic scheduling for groups of terminals or users

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供一种用户调度方法及系统,该方法包括:获取基站端和待调度用户终端之间的信道状态数据;将所述信道状态数据输入到训练好的用户选择模型中,获取满足最大信道增益的用户候选集;其中,所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据,对神经网络进行训练得到的,所述训练好的用户选择模型包括第一神经网络和第二神经网络;对所述用户候选集中的空间复用用户进行排序,获取用户调度结果。本发明引入多任务学习,将两个神经网络对应的任务融合为一个整体的用户选择模型,减少了网络参数,降低了运算复杂度,提高了用户调度的性能。

Description

一种用户调度方法及系统
技术领域
本发明涉及无线通信技术领域,具体涉及一种用户调度方法及系统。
背景技术
5G通信系统建立在4G技术架构之上,由现有通信技术演进而来。它要求更快的传输速率,是4G的百倍甚至千倍。为了实现更高的传输速率,毫米波通信技术成为了5G通信技术中备受瞩目的研究方向。
在毫米波大规模多输入多输出(multiple input multiple output,简称MIMO)系统中,全数字预编码的复杂度随着天线数量的增加而急剧增加,导致在实际的通信系统中无法实施。另外,为每一根天线配置一条射频链路则会产生巨大的硬件成本和功耗。由于毫米波信道的超大带宽以及多径特性,其信道是频率选择性的,有必要采用正交频分多址(OFDMA)。因此,用户调度不再是简单的在时频域选择出待服务用户子集,同时还考虑模拟域的波束对选择问题。
现有的用户调度方案主要有以下几种,一、基于空时分多址(Spatial-TimeDivision Multiple Access,简称STDMA)的调度方案:首先引入了调整因子实现用户公平性和吞吐量之间的权衡,然后在此基础上设计了一种低复杂度的链路调度方案;二、兼顾用户间信道相关性和信道能量的两阶段用户调度方案:从信道正交性的角度对用户进行排序,之后在狭窄范围内进行用户和波束选择,以实现信道能量最大化;三、基于有限有效信道状态信息的模拟波束选择和用户调度的联合优化:联合模拟波束选择和用户调度(JBSUS)问题被公式化为非凸和组合优化问题,并且提出了基于DC过程和基于贪婪算法的低复杂度的联合优化方法来解决这个问题;四、基于Lyapunov漂移优化框架:制定了联合用户调度和波束选择的解决方案,并以封闭形式获得了最优调度策略。然而,目前的用户调度解决方案复杂度较高,且存在性能不佳的问题。因此,现在亟需一种用户调度方法及系统来解决上述问题。
发明内容
本发明提供一种用户调度方法及系统,用以解决现有的用户调度解决方案复杂度较高,且存在性能不佳的技术问题。
第一方面,本发明提供一种用户调度方法,包括:
获取基站端和待调度用户终端之间的信道状态数据;
将所述信道状态数据输入到训练好的用户选择模型中,获取满足最大信道增益的用户候选集;其中,所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据,对神经网络进行训练得到的,所述训练好的用户选择模型包括第一神经网络和第二神经网络;
对所述用户候选集中的空间复用用户进行排序,获取用户调度结果。
在一个实施例中,所述训练好的用户选择模型通过以下步骤训练得到:
根据标注有用户终端与基站端之间波束强度标签的样本信道状态数据,构建第一训练样本集;
将所述第一训练样本集输入到第一神经网络中进行训练,获取虚拟用户信道和预训练的第一神经网络模型,所述虚拟用户信道为使用相同波束的用户组对应的信道;
根据所述虚拟用户信道,构建第二训练样本集;
将所述第二训练样本集输入到第二神经网络中进行训练,获取预训练的第二神经网络模型;
根据所述预训练的第一神经网络和所述预训练的第二神经网络,得到训练好的用户选择模型。
在一个实施例中,所述根据所述预训练的第一神经网络和所述预训练的第二神经网络,得到训练好的用户选择模型,包括:
根据所述预训练的第一神经网络和所述预训练的第二神经网络,得到预训练的用户选择模型;
利用所述预训练的用户选择模型预测得到候选用户终端;基于预测得到的候选用户终端对应的波束强度标签与实际训练集的候选用户终端的波束强度标签进行比较,并根据比较结果进行反向传播,以对所述预训练的用户选择模型进行微调,获得训练好的用户选择模型。
在一个实施例中,所述对所述用户候选集中的空间复用用户进行排序,获取用户调度结果,包括:
S1,根据所述用户候选集中用户终端的信道增益,对所述用户候选集中的空间复用用户进行降序排列,构建索引集合;
S2,根据所述索引集合中每个空间复用用户的最大强度波束索引,构建用户索引集合;
S3,根据所述用户索引集合,确定最大强度波束的空间复用用户的频率资源分配预测值;
S4,对所述频率资源分配预测值中每一个资源块分类概率值进行降序排列;
S5,重复S2至S4,直至所有用户终端分配对应的频率资源后,确定用户调度结果。
在一个实施例中,在所述对所述用户候选集中的用户进行排序,获取用户调度结果之后,所述方法还包括:
对预编码码本进行逆快速傅里叶变换,并根据用户调度结果,获取模拟预编码;
根据所述模拟预编码和所述用户调度结果,获取数字预编码;
根据所述模拟预编码和所述数字预编码,对上下行信道进行用户调度。
在一个实施例中,所述根据所述模拟预编码和所述数字预编码,对上下行信道进行用户调度,包括:
根据所述模拟预编码和所述数字预编码,获取系统速率总和;
根据信噪比最大准则和所述系统速率总和,对上下行信道进行用户调度;
所述系统速率总和计算公式包括:
Figure BDA0003136819130000041
Figure BDA0003136819130000042
其中,Rk,n表示第k个用户的第n个资源块可实现速率,Rsum表示系统速率总和,NRB表示资源块的个数,NRF表示射频链路的条数,Hk,n表示维度为Nr×Nt的毫米波大规模MIMO信道,sk,n表示维度为Ns×1的发射信号矢量,
Figure BDA0003136819130000043
表示维度为NRF×Ns的数字预编码器,
Figure BDA0003136819130000044
表示维度为Nt×NRF的模拟预编码器,Nt表示发射天线的根数,Ns表示基站端与用户终端之间进行的数据流通信的个数,σ2表示方差,RF表示模拟域,BB表示数字域,j表示第j个数据流。
第二方面,本发明提供一种用户调度系统,包括:
信道状态数据获取模块,用于获取基站端和待调度用户终端之间的信道状态数据;
用户候选集获取模块,用于将所述信道状态数据输入到训练好的用户选择模型中,获取满足最大信道增益的用户候选集;其中,所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据,对神经网络进行训练得到的,所述训练好的用户选择模型包括第一神经网络和第二神经网络;
用户调度模块,用于对所述用户候选集中的空间复用用户进行排序,获取用户调度结果。
在一个实施例中,所述系统还包括:
第一训练样本集构建模块,用于根据标注有用户终端与基站端之间波束强度标签的样本信道状态数据,构建第一训练样本集;
虚拟用户信道获取模块,用于将所述第一训练样本集输入到第一神经网络中进行训练,获取虚拟用户信道和预训练的第一神经网络模型,所述虚拟用户信道为使用相同波束的用户组对应的信道;
第二训练样本集构建模块,用于根据所述虚拟用户信道,构建第二训练样本集;
第二神经网络模型预训练模块,用于将所述第二训练样本集输入到第二神经网络中进行训练,获取预训练的第二神经网络模型;
用户选择模型训练模块,用于根据所述预训练的第一神经网络和所述预训练的第二神经网络,得到训练好的用户选择模型。
第三方面,本发明提供一种电子设备,包括存储器和存储有计算机程序的存储器,所述处理器执行所述程序时实现第一方面所述用户调度方法的步骤。
第四方面,本发明提供一种处理器可读存储介质,所述处理器可读存储介质存储有计算机程序,所述计算机程序用于使所述处理器执行第一方面所述用户调度方法的步骤。
本发明提供的用户调度方法及系统,通过标注有用户端与基站端之间波束强度标签的样本信道状态数据,对第一神经网络和第二神经网络进行训练,得到训练好的用户选择模型,通过引入多任务,将两个神经网络对应的任务融合为一个整体的用户选择模型,减少了网络参数,降低了运算复杂度;将基站端和待调度用户终端之间的信道状态数据输入到训练好的用户选择模型,获取满足最大信道增益的用户候选集,对用户候选集中的空间复用用户进行排序,以得到用户调度结果,提高了用户调度的性能。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的用户调度方法的流程示意图;
图2为本发明提供的用户调度系统的结构示意图;
图3为本发明提供的一种电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在毫米波MU-MIMO系统中,基站端配置有Nt根发射天线,并通过NRF条射频链路与K个MU-MIMO空间复用用户进行通信,其中K≤NRF。为了尽可能多的服务用户,K可以设置为最大值NRF。另外,被服务的MU-MIMO空间复用用户是从Nall个用户中选择的,每个用户配置Nr根天线。为了实现基站端与用户端之间进行Ns个数据流通信,发射天线数和射频链路数应该满足Ns≤NRF≤Nt。另外,毫米波MU-MIMO系统采用资源块来进行OFDMA传输,整个频带包含NRB个资源块(RB),每个资源块占用Nf个相邻的子载波和No个连续的OFDM符号。
图1为本发明提供的用户调度方法的流程示意图,如图1所示,本发明提供了一种用户调度方法,包括:
步骤101,获取基站端和待调度用户终端之间的信道状态数据。
在本发明中,获取基站端和待调度用户终端之间的信道状态数据,其中,信道状态数据为通信链路的信道属性,描述了信号在每条传输路径上的衰弱因子,包括信号散射、环境衰弱和距离衰减等。
步骤102,将所述信道状态数据输入到训练好的用户选择模型中,获取满足最大信道增益的用户候选集;其中,所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据,对神经网络进行训练得到的,所述训练好的用户选择模型包括第一神经网络和第二神经网络。
在本发明中,用户选择模型是通过第一神经网络和第二神经网络融合而成,其中,第一神经网络为RB网络,RB网络表示资源块网络;第二神经网络为RF网络,RF网络表示射频链路网络。
进一步地,用户终端与基站端之间波束强度标签为用户选择最强波束的标签,将标注有用户选择最强波束的标签的样本信道状态数据输入到融合后的神经网络中进行训练,得到训练好的用户选择模型。
进一步地,将所述信道状态数据输入到训练好的用户选择模型中,获取满足最大信道增益的用户候选集,其中,满足最大信道增益的用户需满足SNR信噪比最大条件,即为:
Figure BDA0003136819130000081
其中,nk表示第i个候选用户的波束索引,σ2表示方差,
Figure BDA0003136819130000082
表示第i个候选用户波束所对应的信道。
步骤103,对所述用户候选集中的空间复用用户进行排序,获取用户调度结果。
在本发明中,对用户候选集中的空间复用用户进行排序,匹配用户选择最强波束的结果,以根据用户选择对应的波束进行用户调度。
本发明提供的用户调度方法,通过标注有用户端与基站端之间波束强度标签的样本信道状态数据,对第一神经网络和第二神经网络进行训练,得到训练好的用户选择模型,通过引入多任务,将两个神经网络对应的任务融合为一个整体的用户选择模型,减少了网络参数,降低了运算复杂度;将基站端和待调度用户终端之间的信道状态数据输入到训练好的用户选择模型,获取满足最大信道增益的用户候选集,对用户候选集中的空间复用用户进行排序,以得到用户调度结果,提高了用户调度的性能。
在上述实施例的基础上,所述训练好的用户选择模型通过以下步骤训练得到:
根据标注有用户终端与基站端之间波束强度标签的样本信道状态数据,构建第一训练样本集;
将所述第一训练样本集输入到第一神经网络中进行训练,获取虚拟用户信道和预训练的第一神经网络模型,所述虚拟用户信道为使用相同波束的用户组对应的信道;
根据所述虚拟用户信道,构建第二训练样本集;
将所述第二训练样本集输入到第二神经网络中进行训练,获取预训练的第二神经网络模型;
根据所述预训练的第一神经网络和所述预训练的第二神经网络,得到训练好的用户选择模型。
在本发明中,第一神经网络为RB网络,第二神经网络为RF网络。假设用户终端完美的信道状态信息是已知的,在该假设下,通过对信道状态信息做实数化处理,可获取RB网络的输入数据xRB
具体地,每个用户终端寻找与其最强波束相关性最大的码字并将其索引反馈给基站。基站端则建立维度为Kall×Nc的矩阵
Figure BDA0003136819130000094
来表示用户终端的波束选择情况,其中,若
Figure BDA0003136819130000091
则表示第i用户终端的最大强度波束为fj,若
Figure BDA0003136819130000092
则表示用户终端未选择最大强度波束。另外,使用相同波束的所有用户组成一个OFDMA分组。
需要说明的是,为了保证使用同一波束的频率复用用户的和速率最大,应采取SNR最大准则进行频域调度。在第nc个OFDMA分组中的第n个资源块上,用户k需满足SNR信噪比最大条件:
Figure BDA0003136819130000093
进一步地,nc表示OFDMA分组序号,k表示用户,σ2表示方差,Hk表示用户k的信道。
进一步地,根据标注有用户终端与基站端之间波束强度标签的样本信道状态数据,构建得到第一训练样本集,用于输入RB网络并对RB网络进行训练,获取预训练的RB神经网络模型。令
Figure BDA0003136819130000101
作为训练RB网络所需的标签数据。在完成在频率资源分配之后,每一个OFDMA分组被看作一个虚拟用户,其信道是由该分组成员的信道合并而来。该信道反映了各个资源上的用户的空间特性。第nc个虚拟用户的信道可以表示为:
Figure BDA0003136819130000102
其中,
Figure BDA0003136819130000103
表示第nc个虚拟用户的信道,
Figure BDA0003136819130000104
表示第nc个资源块中的第1链路的信道,
Figure BDA0003136819130000105
表示第nc个资源块中的第2链路的信道,
Figure BDA0003136819130000106
表示第nc个资源块中的第NRB链路的信道。
进一步地,根据虚拟用户信道,构建第二训练样本集,即对虚拟用户的信道进行实数化处理,获得第二神经网络的输入数据
Figure BDA0003136819130000107
将输入数据xRF输入到RF神经网络中进行训练,得到预训练的RF神经网络模型。
其中,
Figure BDA0003136819130000108
表示第一根天线经实数化处理后的用户信道矩阵,
Figure BDA0003136819130000109
表示第一根天线经实数化处理后的用户信道矩阵,
Figure BDA00031368191300001010
表示第Nt根天线经实数化处理后的用户信道矩阵,
Figure BDA00031368191300001011
表示第Nt根天线经实数化处理后的用户信道矩阵,Nt表示天线数量,nc表示该虚拟用户的最大强度波束索引,l表示虚拟用户的数目,满足l≤Nc。所有的虚拟用户构成了空间复用用户候选集
Figure BDA00031368191300001012
进一步地,为了降低所选择空间复用用户的运算复杂度,需在候选集Ω中选择出信道增益最大用户,即满足SNR最大条件:
Figure BDA0003136819130000111
其中,nk表示第i个候选用户的波束索引。令
Figure BDA0003136819130000112
作为训练RF网络的标签数据,
Figure BDA0003136819130000113
表示第nk个波束对应的虚拟用户被选择为其中一个空间复用用户,剩余的空间复用用户则通过系统速率最大准则寻找。
进一步地,将预训练的RB神经网络模型和预训练的RF神经网络模型融合为一个网络模型,即得到训练好的用户选择模型。
本发明通过共享网络参数实现底层共享机制,该机制允许不同任务之间进行特征共享,以实现不同任务之间学习效果的互相促进以及提升系统性能的目的。同时,将两个神经网络融合为一个用户选择模型,减少了网络参数的数量,降低了运算复杂度。
在上述实施例的基础上,所述根据所述预训练的第一神经网络和所述预训练的第二神经网络,得到训练好的用户选择模型,包括:
根据所述预训练的第一神经网络和所述预训练的第二神经网络,得到预训练的用户选择模型;
利用所述预训练的用户选择模型预测得到候选用户终端;基于预测得到的候选用户终端对应的波束强度标签与实际训练集的候选用户终端的波束强度标签进行比较,并根据比较结果进行反向传播,以对所述预训练的用户选择模型进行微调,获得训练好的用户选择模型。
在本发明中,将RB神经网络与RF神经网络融合,得到预训练的用户选择模型。通过预训练的用户选择模型预测得到候选用户终端,将预测得到的候选用户终端对应的波束强度标签与实际训练集的候选用户终端的波束强度标签进行比较,并计算预测准确率,其中,预测准确率可以用预测正确的标签数量除以训练集标签总数量求得。根据预测准确率结果,通过反向传播算法以及RMSProp(Root Mean Square Prop)优化算法对神经网络参数进行反向调整更新,获取用户选择模型的损失函数值,直至判断损失函数值满足收敛条件,获取训练好的用户选择模型。
在一个实施例中,由于用于神经网络训练的数据集很大,将全部的数据集直接用于迭代训练模型会严重降低学习的效率。因此,可以使用小批量(mini-batch)机制进行训练,并利用Dropout进一步提高学习效率,同时还能防止过拟合。多任务深度神经网络训练过程具体为:构建模型结构并初始化模型参数,初始学习率设置为0.001,丢弃率设置为0.5,迭代次数设置为100,批量大小设置为200;将每组训练数据划分为训练集和验证集,并将训练集和验证集输入到构建的网络模型中进行训练;每组训练数据训练完之后,确定预测数据的分类类别,然后将该预测数据的分类类别与训练集的真实标签进行比较并计算准确率,预测准确率是根据预测正确的标签数量除以训练集标签总数量求得;当完成一次小批量迭代后,通过反向传播算法以及RMSProp优化算法对网络参数进行反向调整更新;根据上述方法重复训练用户选择模型,直至训练损失值和预测损失值收敛;当训练损失值和测试损失值到达最小且收敛时用户选择模型训练完毕。然后保存当前的用户选择模型;最后,利用验证数据集对保存的用户选择模型进行测试。
进一步地,用验证数据集对保存的用户选择模型进行测试,可以通过处理预测数据得到用户调度结果,然后设计混合预编码,并统计系统和速率性能以及运算复杂度性能,与传统的用户调度算法做对比。
在上述实施例的基础上,所述对所述用户候选集中的空间复用用户进行排序,获取用户调度结果,包括:
S1,根据所述用户候选集中用户终端的信道增益,对所述用户候选集中的空间复用用户进行降序排列,构建索引集合;
S2,根据所述索引集合中每个空间复用用户的最大强度波束索引,构建用户索引集合;
S3,根据所述用户索引集合,确定最大强度波束的空间复用用户的频率资源分配预测值;
S4,对所述频率资源分配预测值中每一个资源块分类概率值进行降序排列;
S5,重复S2至S4,直至所有用户终端分配对应的频率资源后,确定用户调度结果。
在本发明中,通过神经网络对空间复用用户选择任务的预测输出值进行降序排列,预测输出值可以是用户候选集中用户终端的信道增益。前NRF个码字所对应的虚拟用户将作为空间复用用户,并将其索引构建为集合
Figure BDA0003136819130000131
进一步地,根据索引集合中每个空间复用用户的最大强度波束索引,确定最大强度波束为
Figure BDA0003136819130000132
的所有用户,并构建用户索引集合
Figure BDA0003136819130000133
可以理解的是,最大强度的波束为选取的最佳波束。
进一步地,根据用户索引集合
Figure BDA0003136819130000134
确定最大强度波束为
Figure BDA0003136819130000135
的空间复用用户的频率资源分配预测值
Figure BDA0003136819130000136
进一步地,对索引集合中的空间复用用户在每一个资源块的分类概率值进行降序排序,即对
Figure BDA0003136819130000137
的每一列的和求均值,概率值大的用户将使用相应的频率资源。
进一步地,继续构建用户索引集合,确定最大强度波束的空间复用用户的频率资源分配预测值,并对频率资源分配预测值中每一个资源块分类概率值进行降序排列,直至确定最终所有用户终端分配对应的频率资源,得到最终的用户调度结果。
在上述实施例的基础上,在所述对所述用户候选集中的用户进行排序,获取用户调度结果之后,所述方法还包括:
对预编码码本进行逆快速傅里叶变换,并根据用户调度结果,获取模拟预编码;
根据所述模拟预编码和所述用户调度结果,获取数字预编码;
根据所述模拟预编码和所述数字预编码,对上下行信道进行用户调度。
在本发明中,预定的RF预编码码本可以表示为:
Figure BDA0003136819130000141
其中,Nc表示码字个数。第k个波束形成向量fk是通过其时域形式Ak做逆快速傅里叶变换得到的,Ak可以表示为:
Figure BDA0003136819130000142
其中,N表示天线数量,φθ表示方位角量化精度,φθ可以设置为15。λ表示波长,d表示天线单元之间的距离。基于多任务神经网络空间复用用户选择任务的预测结果,在预定的RF预编码码本
Figure BDA0003136819130000143
中并行的选择NRF码字构成模拟预编码矩阵,该模拟预编码矩阵可以表示为:
Figure BDA0003136819130000144
其中,
Figure BDA0003136819130000145
表示第l1个波束形成的向量,
Figure BDA0003136819130000146
表示第
Figure BDA0003136819130000147
个波束形成的向量。
进一步地,基于用户调度结果和模拟预编码,得到数字预编码。数字预编码可以采用传统的线性预编码进行设计。首先,计算使用不同波束且复用同一个资源块的空间复用用户的模拟等效信道。其中,第n个资源块第k个空间复用用户的模拟等效信道可以表示为:
Figure BDA0003136819130000151
采用ZF预编码算法设计每个空间复用用户对应的数字预编码FBB,可以表示为:
Figure BDA0003136819130000152
其中,
Figure BDA0003136819130000153
表示所有复用第n个资源块的用户的模拟等效信道矩阵。若将W表示为
Figure BDA0003136819130000154
则第k个空间复用用户在该资源块上的数字预编可以表示为FBB=Wk,n
进一步地,根据获取到的模拟预编码参数和数字预编码参数,对用户调度结果中的多个调度信号进行混合预编码,以对上下行信道进行用户调度。
在上述实施例的基础上,所述根据所述模拟预编码和所述数字预编码,对上下行信道进行用户调度,包括:
根据所述模拟预编码和所述数字预编码,获取系统速率总和;
根据信噪比最大准则和所述系统速率总和,对上下行信道进行用户调度。
在本发明中,当基站与用户通信时,发送数据需要依次经过数字预编码器FBB和模拟预编码器FRF处理。模拟预编码器
Figure BDA0003136819130000155
是通过模拟移相器实现的,仅能实现相位变化,满足条件
Figure BDA0003136819130000156
在本发明中,FRF的列元素fi是从码本
Figure BDA0003136819130000157
选择的,其中,Nc表示码字个数。为了满足基站发射功率的限制,模拟预编码器与数字预编码器需满足
Figure BDA0003136819130000158
第n个资源块中的第k个复用用户的接收信号Yk,n的表达式为:
Figure BDA0003136819130000161
其中,sk,n表示维度为Ns×1的发射信号矢量,并且满足
Figure BDA0003136819130000162
表示维度为NRF×Ns的数字预编码器,FRF表示维度为Nt×NRF的模拟预编码器,Hk,n表示维度为Nr×Nt的毫米波大规模MIMO信道,nk,n表示均值为零,方差为σ2的独立同分布加性复高斯噪声。根据上述用户接收信号表达式,其可实现速率可以表示为:
Figure BDA0003136819130000163
系统速率总和表达式为:
Figure BDA0003136819130000164
其中,Rk,n表示第k个用户的第n个资源块可实现速率,Rsum表示系统速率总和,NRB表示资源块的个数,NRF表示射频链路的条数,Hk,n表示维度为Nr×Nt的毫米波大规模MIMO信道,sk,n表示维度为Ns×1的发射信号矢量,
Figure BDA0003136819130000165
表示维度为NRF×Ns的数字预编码器,
Figure BDA0003136819130000166
表示维度为Nt×NRF的模拟预编码器,Nt表示发射天线的根数,Ns表示基站端与用户终端之间进行的数据流通信的个数,σ2表示方差,RF表示模拟域,BB表示数字域,j表示第j个数据流。
进一步地,基于上述原理,假设上下行信道互易性存在,即h上行=hT 下行,(·)T代表矩阵的转置。通过SNR信噪比最大准则对上下行道进行频域用户调度,从而保证使用同一波束的频率复用用户的和速率最大。
需要说明的是,本发明提供了基于多任务深度学习的用户调度及混合预编码算法。针对现有用户调度方案中的和速率性能损失问题以及训练时间复杂度高的问题,通过引入多任务学习将频率资源分配问题和空间复用用户选择这两个分类问题使用同一个神经网络模型解决,该模型采用了底层共享上层分支的网络结构,底层的共享机制是通过共享网络参数实现的。这种共享机制不仅能够使不同任务之间进行特征共享,以实现不同任务之间学习效果的互相促进,达到提升系统性能的目的,而且有效的减小了神经网络参数的规模。
图2为本发明提供的用户调度系统的结构示意图,如图2所示,本发明提供了一种用户调度系统,包括信道状态数据获取模块201、用户候选集获取模块202和用户调度模块203,其中,信道状态数据获取模块201用于获取基站端和待调度用户终端之间的信道状态数据;用户候选集获取模块202用于将所述信道状态数据输入到训练好的用户选择模型中,获取满足最大信道增益的用户候选集;其中,所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据,对神经网络进行训练得到的,所述训练好的用户选择模型包括第一神经网络和第二神经网络;用户调度模块203用于对所述用户候选集中的空间复用用户进行排序,获取用户调度结果。
本发明提供的用户调度系统,通过标注有用户端与基站端之间波束强度标签的样本信道状态数据,对第一神经网络和第二神经网络进行训练,得到训练好的用户选择模型,通过引入多任务,将两个神经网络对应的任务融合为一个整体的用户选择模型,减少了网络参数,降低了运算复杂度;将基站端和待调度用户终端之间的信道状态数据输入到训练好的用户选择模型,获取满足最大信道增益的用户候选集,对用户候选集中的空间复用用户进行排序,以得到用户调度结果,提高了用户调度的性能。
在上述实施例的基础上,所述系统还包括:
第一训练样本集构建模块,用于根据标注有用户终端与基站端之间波束强度标签的样本信道状态数据,构建第一训练样本集;
虚拟用户信道获取模块,用于将所述第一训练样本集输入到第一神经网络中进行训练,获取虚拟用户信道和预训练的第一神经网络模型,所述虚拟用户信道为使用相同波束的用户组对应的信道;
第二训练样本集构建模块,用于根据所述虚拟用户信道,构建第二训练样本集;
第二神经网络模型预训练模块,用于将所述第二训练样本集输入到第二神经网络中进行训练,获取预训练的第二神经网络模型;
用户选择模型训练模块,用于根据所述预训练的第一神经网络和所述预训练的第二神经网络,得到训练好的用户选择模型。
在上述实施例的基础上,所述用户选择模型训练模块还包括:
用户选择模型预训练单元,用于根据所述预训练的第一神经网络和所述预训练的第二神经网络,得到预训练的用户选择模型;
用户选择模型训练单元,用于利用所述预训练的用户选择模型预测得到候选用户终端;基于预测得到的候选用户终端对应的波束强度标签与实际训练集的候选用户终端的波束强度标签之间进行比较,并根据比较结果进行反向传播,以对所述预训练的用户选择模型进行微调,获得训练好的用户选择模型。
在上述实施例的基础上,所述用户调度模块还包括:
索引集合构建单元,用于根据所述用户候选集中用户终端的信道增益,对所述用户候选集中的空间复用用户进行降序排列,构建索引集合;
用户索引集合构建单元,用于根据所述索引集合中每个空间复用用户的最大强度波束索引,构建用户索引集合;
资源分配预测值确定单元,用于根据所述用户索引集合,确定最大强度波束的空间复用用户的频率资源分配预测值;
降序排列单元,用于对所述频率资源分配预测值中每一个资源块分类概率值进行降序排列;
用户调度结果确定单元,用于继续构建用户索引集合,确定最大强度波束的空间复用用户的频率资源分配预测值,并对频率资源分配预测值中每一个资源块分类概率值进行降序排列,直至所有用户终端分配对应的频率资源后,确定用户调度结果。
在上述实施例的基础上,所述系统还包括:
模拟预编码获取模块,用于对预编码码本进行逆快速傅里叶变换,并根据用户调度结果,获取模拟预编码;
数字预编码获取模块,用于根据所述模拟预编码和所述用户调度结果,获取数字预编码;
混合预编码模块,用于根据所述模拟预编码和所述数字预编码,对上下行信道进行用户调度。
在上述实施例的基础上,所述混合预编码模块还包括:
系统速率总和获取单元,用于根据所述模拟预编码和所述数字预编码,获取系统速率总和;
用户调度单元,用于根据信噪比最大准则和所述系统速率总和,对上下行信道进行用户调度。
本发明提供的系统是用于执行上述各方法实施例的,具体流程和详细内容请参照上述实施例,此处不再赘述。
图3为本发明提供的一种电子设备的结构示意图,如图3所示,该电子设备可以包括:处理器(processor)301、通信接口(Communication Interface)302、存储器(memory)303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信。处理器301可以调用存储器303中的计算机程序,以执行用户调度方法的步骤,例如包括:获取基站端和待调度用户终端之间的信道状态数据;将所述信道状态数据输入到训练好的用户选择模型中,获取满足最大信道增益的用户候选集;其中,所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据,对神经网络进行训练得到的,所述训练好的用户选择模型包括第一神经网络和第二神经网络;对所述用户候选集中的空间复用用户进行排序,获取用户调度结果。
此外,上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的用户调度方法的步骤,例如包括:获取基站端和待调度用户终端之间的信道状态数据;将所述信道状态数据输入到训练好的用户选择模型中,获取满足最大信道增益的用户候选集;其中,所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据,对神经网络进行训练得到的,所述训练好的用户选择模型包括第一神经网络和第二神经网络;对所述用户候选集中的空间复用用户进行排序,获取用户调度结果。
另一方面,本申请实施例还提供一种处理器可读存储介质,所述处理器可读存储介质存储有计算机程序,所述计算机程序用于使所述处理器执行上述各实施例提供的方法的步骤,例如包括:获取基站端和待调度用户终端之间的信道状态数据;将所述信道状态数据输入到训练好的用户选择模型中,获取满足最大信道增益的用户候选集;其中,所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据,对神经网络进行训练得到的,所述训练好的用户选择模型包括第一神经网络和第二神经网络;对所述用户候选集中的空间复用用户进行排序,获取用户调度结果。
所述处理器可读存储介质可以是处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD))等。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种用户调度方法,其特征在于,包括:
获取基站端和待调度用户终端之间的信道状态数据;
将所述信道状态数据输入到训练好的用户选择模型中,获取满足最大信道增益的用户候选集;其中,所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据,对神经网络进行训练得到的,所述训练好的用户选择模型包括第一神经网络和第二神经网络;
对所述用户候选集中的空间复用用户进行排序,获取用户调度结果。
2.根据权利要求1所述的用户调度方法,其特征在于,所述训练好的用户选择模型通过以下步骤训练得到:
根据标注有用户终端与基站端之间波束强度标签的样本信道状态数据,构建第一训练样本集;
将所述第一训练样本集输入到第一神经网络中进行训练,获取虚拟用户信道和预训练的第一神经网络模型,所述虚拟用户信道为使用相同波束的用户组对应的信道;
根据所述虚拟用户信道,构建第二训练样本集;
将所述第二训练样本集输入到第二神经网络中进行训练,获取预训练的第二神经网络模型;
根据所述预训练的第一神经网络和所述预训练的第二神经网络,得到训练好的用户选择模型。
3.根据权利要求1所述的用户调度方法,其特征在于,所述根据所述预训练的第一神经网络和所述预训练的第二神经网络,得到训练好的用户选择模型,包括:
根据所述预训练的第一神经网络和所述预训练的第二神经网络,得到预训练的用户选择模型;
利用所述预训练的用户选择模型预测得到候选用户终端;基于预测得到的候选用户终端对应的波束强度标签与实际训练集的候选用户终端的波束强度标签进行比较,并根据比较结果进行反向传播,以对所述预训练的用户选择模型进行微调,获得训练好的用户选择模型。
4.根据权利要求1所述的用户调度方法,其特征在于,所述对所述用户候选集中的空间复用用户进行排序,获取用户调度结果,包括:
S1,根据所述用户候选集中用户终端的信道增益,对所述用户候选集中的空间复用用户进行降序排列,构建索引集合;
S2,根据所述索引集合中每个空间复用用户的最大强度波束索引,构建用户索引集合;
S3,根据所述用户索引集合,确定最大强度波束的空间复用用户的频率资源分配预测值;
S4,对所述频率资源分配预测值中每一个资源块分类概率值进行降序排列;
S5,重复S2至S4,直至所有用户终端分配对应的频率资源后,确定用户调度结果。
5.根据权利要求1所述的用户调度方法,其特征在于,在所述对所述用户候选集中的用户进行排序,获取用户调度结果之后,所述方法还包括:
对预编码码本进行逆快速傅里叶变换,并根据用户调度结果,获取模拟预编码;
根据所述模拟预编码和所述用户调度结果,获取数字预编码;
根据所述模拟预编码和所述数字预编码,对上下行信道进行用户调度。
6.根据权利要求5所述的用户调度方法,其特征在于,所述根据所述模拟预编码和所述数字预编码,对上下行信道进行用户调度,包括:
根据所述模拟预编码和所述数字预编码,获取系统速率总和;
根据信噪比最大准则和所述系统速率总和,对上下行信道进行用户调度;
所述系统速率总和计算公式包括:
Figure FDA0003136819120000031
Figure FDA0003136819120000032
其中,Rk,n表示第k个用户的第n个资源块可实现速率,Rsum表示系统速率总和,NRB表示资源块的个数,NRF表示射频链路的条数,Hk,n表示维度为Nr×Nt的毫米波大规模MIMO信道,sk,n表示维度为Ns×1的发射信号矢量,
Figure FDA0003136819120000033
表示维度为NRF×Ns的数字预编码器,
Figure FDA0003136819120000034
表示维度为Nt×NRF的模拟预编码器,Nt表示发射天线的根数,Ns表示基站端与用户终端之间进行的数据流通信的个数,σ2表示方差,RF表示模拟域,BB表示数字域,j表示第j个数据流。
7.一种用户调度系统,其特征在于,包括:
信道状态数据获取模块,用于:获取基站端和待调度用户终端之间的信道状态数据;
用户候选集获取模块,用于:将所述信道状态数据输入到训练好的用户选择模型中,获取满足最大信道增益的用户候选集;其中,所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据,对神经网络进行训练得到的,所述训练好的用户选择模型包括第一神经网络和第二神经网络;
用户调度模块,用于对所述用户候选集中的空间复用用户进行排序,获取用户调度结果。
8.根据权利要求7所述的用户调度系统,其特征在于,所述系统还包括:
第一训练样本集构建模块,用于:根据标注有用户终端与基站端之间波束强度标签的样本信道状态数据,构建第一训练样本集;
虚拟用户信道获取模块,用于:将所述第一训练样本集输入到第一神经网络中进行训练,获取虚拟用户信道和预训练的第一神经网络模型,所述虚拟用户信道为使用相同波束的用户组对应的信道;
第二训练样本集构建模块,用于:根据所述虚拟用户信道,构建第二训练样本集;
第二神经网络模型预训练模块,用于:将所述第二训练样本集输入到第二神经网络中进行训练,获取预训练的第二神经网络模型;
用户选择模型训练模块,用于:根据所述预训练的第一神经网络和所述预训练的第二神经网络,得到训练好的用户选择模型。
9.一种电子设备,包括处理器和存储有计算机程序的存储器,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一项所述用户调度方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述用户调度方法的步骤。
CN202110720878.2A 2021-06-28 2021-06-28 一种用户调度方法及系统 Pending CN115604824A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110720878.2A CN115604824A (zh) 2021-06-28 2021-06-28 一种用户调度方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110720878.2A CN115604824A (zh) 2021-06-28 2021-06-28 一种用户调度方法及系统

Publications (1)

Publication Number Publication Date
CN115604824A true CN115604824A (zh) 2023-01-13

Family

ID=84841340

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110720878.2A Pending CN115604824A (zh) 2021-06-28 2021-06-28 一种用户调度方法及系统

Country Status (1)

Country Link
CN (1) CN115604824A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117614502A (zh) * 2023-11-30 2024-02-27 智慧尘埃(上海)通信科技有限公司 一种用于模拟波束权值传输的方法、系统及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117614502A (zh) * 2023-11-30 2024-02-27 智慧尘埃(上海)通信科技有限公司 一种用于模拟波束权值传输的方法、系统及电子设备
CN117614502B (zh) * 2023-11-30 2024-06-07 智慧尘埃(上海)通信科技有限公司 一种用于模拟波束权值传输的方法、系统及电子设备

Similar Documents

Publication Publication Date Title
Xia et al. A deep learning framework for optimization of MISO downlink beamforming
Khalilsarai et al. FDD massive MIMO via UL/DL channel covariance extrapolation and active channel sparsification
CN113411110B (zh) 一种基于深度强化学习的毫米波通信波束训练方法
CN113965233B (zh) 一种基于深度学习的多用户宽带毫米波通信资源分配方法
US11832259B2 (en) Deep-learning for distributed channel feedback and precoding
Ahmed et al. Joint machine learning based resource allocation and hybrid beamforming design for massive MIMO systems
Ahmed et al. Machine learning based beam selection with low complexity hybrid beamforming design for 5G massive MIMO systems
Palhares et al. Iterative AP selection, MMSE precoding and power allocation in cell‐free massive MIMO systems
CN113287265B (zh) 能够进行模拟预编码和模拟组合的方法
CN114844545A (zh) 基于sub6GHz信道以及部分毫米波导频的通信波束选择方法
Fredj et al. Distributed uplink beamforming in cell-free networks using deep reinforcement learning
US11664859B2 (en) Method and device for switching transmission methods in massive MIMO system
Turan et al. A versatile low-complexity feedback scheme for FDD systems via generative modeling
CN115604824A (zh) 一种用户调度方法及系统
Yang et al. Dynamic neural network for MIMO detection
Ni et al. User association and hybrid beamforming designs for cooperative mmWave MIMO systems
Stylianopoulos et al. Online RIS configuration learning for arbitrary large numbers of 1-bit phase resolution elements
Bobrov et al. Machine learning methods for spectral efficiency prediction in massive mimo systems
CN111555785B (zh) 一种信号预编码方法、装置及电子设备
Sun et al. Modified bipartite matching for multiobjective optimization: Application to antenna assignments in MIMO systems
Neto et al. SDMA grouping based on unsupervised learning for multi-user MIMO systems
Sabat et al. A contemporary review on user scheduling techniques and feedback reduction strategies towards the development of 5G and beyond communications
Khorsandmanesh et al. Fronthaul Quantization-Aware MU-MIMO Precoding for Sum Rate Maximization
Zhang et al. Joint Port Selection Based Channel Acquisition for FDD Cell-Free Massive MIMO
Orhan et al. Graph Neural Networks to Enable Scalable MAC for Massive MIMO Wireless Infrastructure

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination