CN115604824A

CN115604824A - 一种用户调度方法及系统

Info

Publication number: CN115604824A
Application number: CN202110720878.2A
Authority: CN
Inventors: 王晓婧; 张伟; 朱宇昕
Original assignee: China Mobile Communications Group Co Ltd; China Mobile Xiongan ICT Co Ltd; China Mobile System Integration Co Ltd
Current assignee: China Mobile Communications Group Co Ltd; China Mobile Xiongan ICT Co Ltd; China Mobile System Integration Co Ltd
Priority date: 2021-06-28
Filing date: 2021-06-28
Publication date: 2023-01-13

Abstract

本发明提供一种用户调度方法及系统，该方法包括：获取基站端和待调度用户终端之间的信道状态数据；将所述信道状态数据输入到训练好的用户选择模型中，获取满足最大信道增益的用户候选集；其中，所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据，对神经网络进行训练得到的，所述训练好的用户选择模型包括第一神经网络和第二神经网络；对所述用户候选集中的空间复用用户进行排序，获取用户调度结果。本发明引入多任务学习，将两个神经网络对应的任务融合为一个整体的用户选择模型，减少了网络参数，降低了运算复杂度，提高了用户调度的性能。

Description

一种用户调度方法及系统

技术领域

本发明涉及无线通信技术领域，具体涉及一种用户调度方法及系统。

背景技术

5G通信系统建立在4G技术架构之上，由现有通信技术演进而来。它要求更快的传输速率，是4G的百倍甚至千倍。为了实现更高的传输速率，毫米波通信技术成为了5G通信技术中备受瞩目的研究方向。

在毫米波大规模多输入多输出(multiple input multiple output，简称MIMO)系统中，全数字预编码的复杂度随着天线数量的增加而急剧增加，导致在实际的通信系统中无法实施。另外，为每一根天线配置一条射频链路则会产生巨大的硬件成本和功耗。由于毫米波信道的超大带宽以及多径特性，其信道是频率选择性的，有必要采用正交频分多址(OFDMA)。因此，用户调度不再是简单的在时频域选择出待服务用户子集，同时还考虑模拟域的波束对选择问题。

现有的用户调度方案主要有以下几种，一、基于空时分多址(Spatial-TimeDivision Multiple Access，简称STDMA)的调度方案：首先引入了调整因子实现用户公平性和吞吐量之间的权衡，然后在此基础上设计了一种低复杂度的链路调度方案；二、兼顾用户间信道相关性和信道能量的两阶段用户调度方案：从信道正交性的角度对用户进行排序，之后在狭窄范围内进行用户和波束选择，以实现信道能量最大化；三、基于有限有效信道状态信息的模拟波束选择和用户调度的联合优化：联合模拟波束选择和用户调度(JBSUS)问题被公式化为非凸和组合优化问题，并且提出了基于DC过程和基于贪婪算法的低复杂度的联合优化方法来解决这个问题；四、基于Lyapunov漂移优化框架：制定了联合用户调度和波束选择的解决方案，并以封闭形式获得了最优调度策略。然而，目前的用户调度解决方案复杂度较高，且存在性能不佳的问题。因此，现在亟需一种用户调度方法及系统来解决上述问题。

发明内容

本发明提供一种用户调度方法及系统，用以解决现有的用户调度解决方案复杂度较高，且存在性能不佳的技术问题。

第一方面，本发明提供一种用户调度方法，包括：

获取基站端和待调度用户终端之间的信道状态数据；

将所述信道状态数据输入到训练好的用户选择模型中，获取满足最大信道增益的用户候选集；其中，所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据，对神经网络进行训练得到的，所述训练好的用户选择模型包括第一神经网络和第二神经网络；

对所述用户候选集中的空间复用用户进行排序，获取用户调度结果。

在一个实施例中，所述训练好的用户选择模型通过以下步骤训练得到：

根据标注有用户终端与基站端之间波束强度标签的样本信道状态数据，构建第一训练样本集；

将所述第一训练样本集输入到第一神经网络中进行训练，获取虚拟用户信道和预训练的第一神经网络模型，所述虚拟用户信道为使用相同波束的用户组对应的信道；

根据所述虚拟用户信道，构建第二训练样本集；

将所述第二训练样本集输入到第二神经网络中进行训练，获取预训练的第二神经网络模型；

根据所述预训练的第一神经网络和所述预训练的第二神经网络，得到训练好的用户选择模型。

在一个实施例中，所述根据所述预训练的第一神经网络和所述预训练的第二神经网络，得到训练好的用户选择模型，包括：

根据所述预训练的第一神经网络和所述预训练的第二神经网络，得到预训练的用户选择模型；

利用所述预训练的用户选择模型预测得到候选用户终端；基于预测得到的候选用户终端对应的波束强度标签与实际训练集的候选用户终端的波束强度标签进行比较，并根据比较结果进行反向传播，以对所述预训练的用户选择模型进行微调，获得训练好的用户选择模型。

在一个实施例中，所述对所述用户候选集中的空间复用用户进行排序，获取用户调度结果，包括：

S1，根据所述用户候选集中用户终端的信道增益，对所述用户候选集中的空间复用用户进行降序排列，构建索引集合；

S2，根据所述索引集合中每个空间复用用户的最大强度波束索引，构建用户索引集合；

S3，根据所述用户索引集合，确定最大强度波束的空间复用用户的频率资源分配预测值；

S4，对所述频率资源分配预测值中每一个资源块分类概率值进行降序排列；

S5，重复S2至S4，直至所有用户终端分配对应的频率资源后，确定用户调度结果。

在一个实施例中，在所述对所述用户候选集中的用户进行排序，获取用户调度结果之后，所述方法还包括：

对预编码码本进行逆快速傅里叶变换，并根据用户调度结果，获取模拟预编码；

根据所述模拟预编码和所述用户调度结果，获取数字预编码；

根据所述模拟预编码和所述数字预编码，对上下行信道进行用户调度。

在一个实施例中，所述根据所述模拟预编码和所述数字预编码，对上下行信道进行用户调度，包括：

根据所述模拟预编码和所述数字预编码，获取系统速率总和；

根据信噪比最大准则和所述系统速率总和，对上下行信道进行用户调度；

所述系统速率总和计算公式包括：

其中，R_k,n表示第k个用户的第n个资源块可实现速率，R_sum表示系统速率总和，N_RB表示资源块的个数，N_RF表示射频链路的条数，H_k,n表示维度为N_r×N_t的毫米波大规模MIMO信道，s_k,n表示维度为N_s×1的发射信号矢量，

表示维度为N_RF×N_s的数字预编码器，

表示维度为N_t×N_RF的模拟预编码器，N_t表示发射天线的根数，N_s表示基站端与用户终端之间进行的数据流通信的个数，σ²表示方差，RF表示模拟域，BB表示数字域，j表示第j个数据流。

第二方面，本发明提供一种用户调度系统，包括：

信道状态数据获取模块，用于获取基站端和待调度用户终端之间的信道状态数据；

用户候选集获取模块，用于将所述信道状态数据输入到训练好的用户选择模型中，获取满足最大信道增益的用户候选集；其中，所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据，对神经网络进行训练得到的，所述训练好的用户选择模型包括第一神经网络和第二神经网络；

用户调度模块，用于对所述用户候选集中的空间复用用户进行排序，获取用户调度结果。

在一个实施例中，所述系统还包括：

第一训练样本集构建模块，用于根据标注有用户终端与基站端之间波束强度标签的样本信道状态数据，构建第一训练样本集；

虚拟用户信道获取模块，用于将所述第一训练样本集输入到第一神经网络中进行训练，获取虚拟用户信道和预训练的第一神经网络模型，所述虚拟用户信道为使用相同波束的用户组对应的信道；

第二训练样本集构建模块，用于根据所述虚拟用户信道，构建第二训练样本集；

第二神经网络模型预训练模块，用于将所述第二训练样本集输入到第二神经网络中进行训练，获取预训练的第二神经网络模型；

用户选择模型训练模块，用于根据所述预训练的第一神经网络和所述预训练的第二神经网络，得到训练好的用户选择模型。

第三方面，本发明提供一种电子设备，包括存储器和存储有计算机程序的存储器，所述处理器执行所述程序时实现第一方面所述用户调度方法的步骤。

第四方面，本发明提供一种处理器可读存储介质，所述处理器可读存储介质存储有计算机程序，所述计算机程序用于使所述处理器执行第一方面所述用户调度方法的步骤。

本发明提供的用户调度方法及系统，通过标注有用户端与基站端之间波束强度标签的样本信道状态数据，对第一神经网络和第二神经网络进行训练，得到训练好的用户选择模型，通过引入多任务，将两个神经网络对应的任务融合为一个整体的用户选择模型，减少了网络参数，降低了运算复杂度；将基站端和待调度用户终端之间的信道状态数据输入到训练好的用户选择模型，获取满足最大信道增益的用户候选集，对用户候选集中的空间复用用户进行排序，以得到用户调度结果，提高了用户调度的性能。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的用户调度方法的流程示意图；

图2为本发明提供的用户调度系统的结构示意图；

图3为本发明提供的一种电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在毫米波MU-MIMO系统中，基站端配置有N_t根发射天线，并通过N_RF条射频链路与K个MU-MIMO空间复用用户进行通信，其中K≤N_RF。为了尽可能多的服务用户，K可以设置为最大值N_RF。另外，被服务的MU-MIMO空间复用用户是从N_all个用户中选择的，每个用户配置N_r根天线。为了实现基站端与用户端之间进行N_s个数据流通信，发射天线数和射频链路数应该满足N_s≤N_RF≤N_t。另外，毫米波MU-MIMO系统采用资源块来进行OFDMA传输，整个频带包含N_RB个资源块(RB)，每个资源块占用N_f个相邻的子载波和N_o个连续的OFDM符号。

图1为本发明提供的用户调度方法的流程示意图，如图1所示，本发明提供了一种用户调度方法，包括：

步骤101，获取基站端和待调度用户终端之间的信道状态数据。

在本发明中，获取基站端和待调度用户终端之间的信道状态数据，其中，信道状态数据为通信链路的信道属性，描述了信号在每条传输路径上的衰弱因子，包括信号散射、环境衰弱和距离衰减等。

步骤102，将所述信道状态数据输入到训练好的用户选择模型中，获取满足最大信道增益的用户候选集；其中，所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据，对神经网络进行训练得到的，所述训练好的用户选择模型包括第一神经网络和第二神经网络。

在本发明中，用户选择模型是通过第一神经网络和第二神经网络融合而成，其中，第一神经网络为RB网络，RB网络表示资源块网络；第二神经网络为RF网络，RF网络表示射频链路网络。

进一步地，用户终端与基站端之间波束强度标签为用户选择最强波束的标签，将标注有用户选择最强波束的标签的样本信道状态数据输入到融合后的神经网络中进行训练，得到训练好的用户选择模型。

进一步地，将所述信道状态数据输入到训练好的用户选择模型中，获取满足最大信道增益的用户候选集，其中，满足最大信道增益的用户需满足SNR信噪比最大条件，即为：

其中，n_k表示第i个候选用户的波束索引，σ²表示方差，

表示第i个候选用户波束所对应的信道。

步骤103，对所述用户候选集中的空间复用用户进行排序，获取用户调度结果。

在本发明中，对用户候选集中的空间复用用户进行排序，匹配用户选择最强波束的结果，以根据用户选择对应的波束进行用户调度。

本发明提供的用户调度方法，通过标注有用户端与基站端之间波束强度标签的样本信道状态数据，对第一神经网络和第二神经网络进行训练，得到训练好的用户选择模型，通过引入多任务，将两个神经网络对应的任务融合为一个整体的用户选择模型，减少了网络参数，降低了运算复杂度；将基站端和待调度用户终端之间的信道状态数据输入到训练好的用户选择模型，获取满足最大信道增益的用户候选集，对用户候选集中的空间复用用户进行排序，以得到用户调度结果，提高了用户调度的性能。

在上述实施例的基础上，所述训练好的用户选择模型通过以下步骤训练得到：

根据所述虚拟用户信道，构建第二训练样本集；

在本发明中，第一神经网络为RB网络，第二神经网络为RF网络。假设用户终端完美的信道状态信息是已知的，在该假设下，通过对信道状态信息做实数化处理，可获取RB网络的输入数据x_RB。

具体地，每个用户终端寻找与其最强波束相关性最大的码字并将其索引反馈给基站。基站端则建立维度为K_all×N_c的矩阵

来表示用户终端的波束选择情况，其中，若

则表示第i用户终端的最大强度波束为f_j，若

则表示用户终端未选择最大强度波束。另外，使用相同波束的所有用户组成一个OFDMA分组。

需要说明的是，为了保证使用同一波束的频率复用用户的和速率最大，应采取SNR最大准则进行频域调度。在第n_c个OFDMA分组中的第n个资源块上，用户k需满足SNR信噪比最大条件：

进一步地，n_c表示OFDMA分组序号，k表示用户，σ²表示方差，H_k表示用户k的信道。

进一步地，根据标注有用户终端与基站端之间波束强度标签的样本信道状态数据，构建得到第一训练样本集，用于输入RB网络并对RB网络进行训练，获取预训练的RB神经网络模型。令

作为训练RB网络所需的标签数据。在完成在频率资源分配之后，每一个OFDMA分组被看作一个虚拟用户，其信道是由该分组成员的信道合并而来。该信道反映了各个资源上的用户的空间特性。第n_c个虚拟用户的信道可以表示为：

其中，

表示第n_c个虚拟用户的信道，

表示第n_c个资源块中的第1链路的信道，

表示第n_c个资源块中的第2链路的信道，

表示第n_c个资源块中的第N_RB链路的信道。

进一步地，根据虚拟用户信道，构建第二训练样本集，即对虚拟用户的信道进行实数化处理，获得第二神经网络的输入数据

将输入数据x_RF输入到RF神经网络中进行训练，得到预训练的RF神经网络模型。

其中，

表示第一根天线经实数化处理后的用户信道矩阵，

表示第一根天线经实数化处理后的用户信道矩阵，

表示第N_t根天线经实数化处理后的用户信道矩阵，

表示第N_t根天线经实数化处理后的用户信道矩阵，Nt表示天线数量，n_c表示该虚拟用户的最大强度波束索引，l表示虚拟用户的数目，满足l≤N_c。所有的虚拟用户构成了空间复用用户候选集

进一步地，为了降低所选择空间复用用户的运算复杂度，需在候选集Ω中选择出信道增益最大用户，即满足SNR最大条件：

其中，n_k表示第i个候选用户的波束索引。令

作为训练RF网络的标签数据，

表示第n_k个波束对应的虚拟用户被选择为其中一个空间复用用户，剩余的空间复用用户则通过系统速率最大准则寻找。

进一步地，将预训练的RB神经网络模型和预训练的RF神经网络模型融合为一个网络模型，即得到训练好的用户选择模型。

本发明通过共享网络参数实现底层共享机制，该机制允许不同任务之间进行特征共享，以实现不同任务之间学习效果的互相促进以及提升系统性能的目的。同时，将两个神经网络融合为一个用户选择模型，减少了网络参数的数量，降低了运算复杂度。

在上述实施例的基础上，所述根据所述预训练的第一神经网络和所述预训练的第二神经网络，得到训练好的用户选择模型，包括：

在本发明中，将RB神经网络与RF神经网络融合，得到预训练的用户选择模型。通过预训练的用户选择模型预测得到候选用户终端，将预测得到的候选用户终端对应的波束强度标签与实际训练集的候选用户终端的波束强度标签进行比较，并计算预测准确率，其中，预测准确率可以用预测正确的标签数量除以训练集标签总数量求得。根据预测准确率结果，通过反向传播算法以及RMSProp(Root Mean Square Prop)优化算法对神经网络参数进行反向调整更新，获取用户选择模型的损失函数值，直至判断损失函数值满足收敛条件，获取训练好的用户选择模型。

在一个实施例中，由于用于神经网络训练的数据集很大，将全部的数据集直接用于迭代训练模型会严重降低学习的效率。因此，可以使用小批量(mini-batch)机制进行训练，并利用Dropout进一步提高学习效率，同时还能防止过拟合。多任务深度神经网络训练过程具体为：构建模型结构并初始化模型参数，初始学习率设置为0.001，丢弃率设置为0.5，迭代次数设置为100，批量大小设置为200；将每组训练数据划分为训练集和验证集，并将训练集和验证集输入到构建的网络模型中进行训练；每组训练数据训练完之后，确定预测数据的分类类别，然后将该预测数据的分类类别与训练集的真实标签进行比较并计算准确率，预测准确率是根据预测正确的标签数量除以训练集标签总数量求得；当完成一次小批量迭代后，通过反向传播算法以及RMSProp优化算法对网络参数进行反向调整更新；根据上述方法重复训练用户选择模型，直至训练损失值和预测损失值收敛；当训练损失值和测试损失值到达最小且收敛时用户选择模型训练完毕。然后保存当前的用户选择模型；最后，利用验证数据集对保存的用户选择模型进行测试。

进一步地，用验证数据集对保存的用户选择模型进行测试，可以通过处理预测数据得到用户调度结果，然后设计混合预编码，并统计系统和速率性能以及运算复杂度性能，与传统的用户调度算法做对比。

在上述实施例的基础上，所述对所述用户候选集中的空间复用用户进行排序，获取用户调度结果，包括：

在本发明中，通过神经网络对空间复用用户选择任务的预测输出值进行降序排列，预测输出值可以是用户候选集中用户终端的信道增益。前N_RF个码字所对应的虚拟用户将作为空间复用用户，并将其索引构建为集合

进一步地，根据索引集合中每个空间复用用户的最大强度波束索引，确定最大强度波束为

的所有用户，并构建用户索引集合

可以理解的是，最大强度的波束为选取的最佳波束。

进一步地，根据用户索引集合

确定最大强度波束为

的空间复用用户的频率资源分配预测值

进一步地，对索引集合中的空间复用用户在每一个资源块的分类概率值进行降序排序，即对

的每一列的和求均值，概率值大的用户将使用相应的频率资源。

进一步地，继续构建用户索引集合，确定最大强度波束的空间复用用户的频率资源分配预测值，并对频率资源分配预测值中每一个资源块分类概率值进行降序排列，直至确定最终所有用户终端分配对应的频率资源，得到最终的用户调度结果。

在上述实施例的基础上，在所述对所述用户候选集中的用户进行排序，获取用户调度结果之后，所述方法还包括：

在本发明中，预定的RF预编码码本可以表示为：

其中，N_c表示码字个数。第k个波束形成向量f_k是通过其时域形式A_k做逆快速傅里叶变换得到的，A_k可以表示为：

其中，N表示天线数量，φ_θ表示方位角量化精度，φ_θ可以设置为15。λ表示波长，d表示天线单元之间的距离。基于多任务神经网络空间复用用户选择任务的预测结果，在预定的RF预编码码本

中并行的选择N_RF码字构成模拟预编码矩阵，该模拟预编码矩阵可以表示为：

其中，

表示第l₁个波束形成的向量，

表示第

个波束形成的向量。

进一步地，基于用户调度结果和模拟预编码，得到数字预编码。数字预编码可以采用传统的线性预编码进行设计。首先，计算使用不同波束且复用同一个资源块的空间复用用户的模拟等效信道。其中，第n个资源块第k个空间复用用户的模拟等效信道可以表示为：

采用ZF预编码算法设计每个空间复用用户对应的数字预编码F_BB，可以表示为：

其中，

表示所有复用第n个资源块的用户的模拟等效信道矩阵。若将W表示为

则第k个空间复用用户在该资源块上的数字预编可以表示为F_BB＝W_k,n。

进一步地，根据获取到的模拟预编码参数和数字预编码参数，对用户调度结果中的多个调度信号进行混合预编码，以对上下行信道进行用户调度。

在上述实施例的基础上，所述根据所述模拟预编码和所述数字预编码，对上下行信道进行用户调度，包括：

根据信噪比最大准则和所述系统速率总和，对上下行信道进行用户调度。

在本发明中，当基站与用户通信时，发送数据需要依次经过数字预编码器F_BB和模拟预编码器F_RF处理。模拟预编码器

是通过模拟移相器实现的，仅能实现相位变化，满足条件

在本发明中，F_RF的列元素f_i是从码本

选择的，其中，N_c表示码字个数。为了满足基站发射功率的限制，模拟预编码器与数字预编码器需满足

第n个资源块中的第k个复用用户的接收信号Y_k,n的表达式为：

其中，s_k,n表示维度为N_s×1的发射信号矢量，并且满足

表示维度为N_RF×N_s的数字预编码器，F_RF表示维度为N_t×N_RF的模拟预编码器，H_k,n表示维度为N_r×N_t的毫米波大规模MIMO信道，n_k,n表示均值为零，方差为σ²的独立同分布加性复高斯噪声。根据上述用户接收信号表达式，其可实现速率可以表示为：

系统速率总和表达式为：

表示维度为N_RF×N_s的数字预编码器，

进一步地，基于上述原理，假设上下行信道互易性存在，即h_上行＝h^T _下行，(·)^T代表矩阵的转置。通过SNR信噪比最大准则对上下行道进行频域用户调度，从而保证使用同一波束的频率复用用户的和速率最大。

需要说明的是，本发明提供了基于多任务深度学习的用户调度及混合预编码算法。针对现有用户调度方案中的和速率性能损失问题以及训练时间复杂度高的问题，通过引入多任务学习将频率资源分配问题和空间复用用户选择这两个分类问题使用同一个神经网络模型解决，该模型采用了底层共享上层分支的网络结构，底层的共享机制是通过共享网络参数实现的。这种共享机制不仅能够使不同任务之间进行特征共享，以实现不同任务之间学习效果的互相促进，达到提升系统性能的目的，而且有效的减小了神经网络参数的规模。

图2为本发明提供的用户调度系统的结构示意图，如图2所示，本发明提供了一种用户调度系统，包括信道状态数据获取模块201、用户候选集获取模块202和用户调度模块203，其中，信道状态数据获取模块201用于获取基站端和待调度用户终端之间的信道状态数据；用户候选集获取模块202用于将所述信道状态数据输入到训练好的用户选择模型中，获取满足最大信道增益的用户候选集；其中，所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据，对神经网络进行训练得到的，所述训练好的用户选择模型包括第一神经网络和第二神经网络；用户调度模块203用于对所述用户候选集中的空间复用用户进行排序，获取用户调度结果。

本发明提供的用户调度系统，通过标注有用户端与基站端之间波束强度标签的样本信道状态数据，对第一神经网络和第二神经网络进行训练，得到训练好的用户选择模型，通过引入多任务，将两个神经网络对应的任务融合为一个整体的用户选择模型，减少了网络参数，降低了运算复杂度；将基站端和待调度用户终端之间的信道状态数据输入到训练好的用户选择模型，获取满足最大信道增益的用户候选集，对用户候选集中的空间复用用户进行排序，以得到用户调度结果，提高了用户调度的性能。

在上述实施例的基础上，所述系统还包括：

在上述实施例的基础上，所述用户选择模型训练模块还包括：

用户选择模型预训练单元，用于根据所述预训练的第一神经网络和所述预训练的第二神经网络，得到预训练的用户选择模型；

用户选择模型训练单元，用于利用所述预训练的用户选择模型预测得到候选用户终端；基于预测得到的候选用户终端对应的波束强度标签与实际训练集的候选用户终端的波束强度标签之间进行比较，并根据比较结果进行反向传播，以对所述预训练的用户选择模型进行微调，获得训练好的用户选择模型。

在上述实施例的基础上，所述用户调度模块还包括：

索引集合构建单元，用于根据所述用户候选集中用户终端的信道增益，对所述用户候选集中的空间复用用户进行降序排列，构建索引集合；

用户索引集合构建单元，用于根据所述索引集合中每个空间复用用户的最大强度波束索引，构建用户索引集合；

资源分配预测值确定单元，用于根据所述用户索引集合，确定最大强度波束的空间复用用户的频率资源分配预测值；

降序排列单元，用于对所述频率资源分配预测值中每一个资源块分类概率值进行降序排列；

用户调度结果确定单元，用于继续构建用户索引集合，确定最大强度波束的空间复用用户的频率资源分配预测值，并对频率资源分配预测值中每一个资源块分类概率值进行降序排列，直至所有用户终端分配对应的频率资源后，确定用户调度结果。

在上述实施例的基础上，所述系统还包括：

模拟预编码获取模块，用于对预编码码本进行逆快速傅里叶变换，并根据用户调度结果，获取模拟预编码；

数字预编码获取模块，用于根据所述模拟预编码和所述用户调度结果，获取数字预编码；

混合预编码模块，用于根据所述模拟预编码和所述数字预编码，对上下行信道进行用户调度。

在上述实施例的基础上，所述混合预编码模块还包括：

系统速率总和获取单元，用于根据所述模拟预编码和所述数字预编码，获取系统速率总和；

用户调度单元，用于根据信噪比最大准则和所述系统速率总和，对上下行信道进行用户调度。

本发明提供的系统是用于执行上述各方法实施例的，具体流程和详细内容请参照上述实施例，此处不再赘述。

图3为本发明提供的一种电子设备的结构示意图，如图3所示，该电子设备可以包括：处理器(processor)301、通信接口(Communication Interface)302、存储器(memory)303和通信总线304，其中，处理器301，通信接口302，存储器303通过通信总线304完成相互间的通信。处理器301可以调用存储器303中的计算机程序，以执行用户调度方法的步骤，例如包括：获取基站端和待调度用户终端之间的信道状态数据；将所述信道状态数据输入到训练好的用户选择模型中，获取满足最大信道增益的用户候选集；其中，所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据，对神经网络进行训练得到的，所述训练好的用户选择模型包括第一神经网络和第二神经网络；对所述用户候选集中的空间复用用户进行排序，获取用户调度结果。

此外，上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法所提供的用户调度方法的步骤，例如包括：获取基站端和待调度用户终端之间的信道状态数据；将所述信道状态数据输入到训练好的用户选择模型中，获取满足最大信道增益的用户候选集；其中，所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据，对神经网络进行训练得到的，所述训练好的用户选择模型包括第一神经网络和第二神经网络；对所述用户候选集中的空间复用用户进行排序，获取用户调度结果。

另一方面，本申请实施例还提供一种处理器可读存储介质，所述处理器可读存储介质存储有计算机程序，所述计算机程序用于使所述处理器执行上述各实施例提供的方法的步骤，例如包括：获取基站端和待调度用户终端之间的信道状态数据；将所述信道状态数据输入到训练好的用户选择模型中，获取满足最大信道增益的用户候选集；其中，所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据，对神经网络进行训练得到的，所述训练好的用户选择模型包括第一神经网络和第二神经网络；对所述用户候选集中的空间复用用户进行排序，获取用户调度结果。

所述处理器可读存储介质可以是处理器能够存取的任何可用介质或数据存储设备，包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD))等。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种用户调度方法，其特征在于，包括：

获取基站端和待调度用户终端之间的信道状态数据；

2.根据权利要求1所述的用户调度方法，其特征在于，所述训练好的用户选择模型通过以下步骤训练得到：

根据所述虚拟用户信道，构建第二训练样本集；

3.根据权利要求1所述的用户调度方法，其特征在于，所述根据所述预训练的第一神经网络和所述预训练的第二神经网络，得到训练好的用户选择模型，包括：

4.根据权利要求1所述的用户调度方法，其特征在于，所述对所述用户候选集中的空间复用用户进行排序，获取用户调度结果，包括：

5.根据权利要求1所述的用户调度方法，其特征在于，在所述对所述用户候选集中的用户进行排序，获取用户调度结果之后，所述方法还包括：

6.根据权利要求5所述的用户调度方法，其特征在于，所述根据所述模拟预编码和所述数字预编码，对上下行信道进行用户调度，包括：

所述系统速率总和计算公式包括：

其中，R_k,n表示第k个用户的第n个资源块可实现速率，R_sum表示系统速率总和，N_RB表示资源块的个数，N_RF表示射频链路的条数，H_k，n表示维度为N_r×N_t的毫米波大规模MIMO信道，s_k，n表示维度为N_s×1的发射信号矢量，

表示维度为N_RF×N_s的数字预编码器，

7.一种用户调度系统，其特征在于，包括：

信道状态数据获取模块，用于：获取基站端和待调度用户终端之间的信道状态数据；

用户候选集获取模块，用于：将所述信道状态数据输入到训练好的用户选择模型中，获取满足最大信道增益的用户候选集；其中，所述训练好的用户选择模型是由标注有用户终端与基站端之间波束强度标签的样本信道状态数据，对神经网络进行训练得到的，所述训练好的用户选择模型包括第一神经网络和第二神经网络；

8.根据权利要求7所述的用户调度系统，其特征在于，所述系统还包括：

第一训练样本集构建模块，用于：根据标注有用户终端与基站端之间波束强度标签的样本信道状态数据，构建第一训练样本集；

虚拟用户信道获取模块，用于：将所述第一训练样本集输入到第一神经网络中进行训练，获取虚拟用户信道和预训练的第一神经网络模型，所述虚拟用户信道为使用相同波束的用户组对应的信道；

第二训练样本集构建模块，用于：根据所述虚拟用户信道，构建第二训练样本集；

第二神经网络模型预训练模块，用于：将所述第二训练样本集输入到第二神经网络中进行训练，获取预训练的第二神经网络模型；

用户选择模型训练模块，用于：根据所述预训练的第一神经网络和所述预训练的第二神经网络，得到训练好的用户选择模型。

9.一种电子设备，包括处理器和存储有计算机程序的存储器，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6任一项所述用户调度方法的步骤。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述用户调度方法的步骤。