CN115250473A

CN115250473A - 基于图卷积神经网络的频谱共享方法、装置及计算设备

Info

Publication number: CN115250473A
Application number: CN202110455634.6A
Authority: CN
Inventors: 张炎炎; 王宝聪; 李欣; 韩延涛; 刘婧迪
Original assignee: China Mobile Communications Group Co Ltd; China Mobile Group Design Institute Co Ltd
Current assignee: China Mobile Communications Group Co Ltd; China Mobile Group Design Institute Co Ltd
Priority date: 2021-04-26
Filing date: 2021-04-26
Publication date: 2022-10-28

Abstract

本发明公开了一种基于图卷积神经网络的频谱共享方法、装置及计算设备，其中，该方法包括：步骤1，获取当前的网络状态信息，根据网络状态信息，建立无向图模型，生成环境矩阵；步骤2，利用决策模型对用户需求信息以及环境矩阵进行处理，得到信道选择向量和能量适应向量；步骤3，根据信道选择向量、能量适应向量以及环境矩阵，通过目标函数判断是否满足预设收敛条件；若是，则执行步骤4；若否，则执行步骤5；步骤4，依据当前的信道选择向量和能量适应向量进行频谱分配，方法结束；步骤5，更新决策模型的参数，而后跳转执行步骤2。该方案解决了现有技术中建立决策模型时存在的图结构不完善的问题，能够便捷地得到较优的频谱接入方案。

Description

基于图卷积神经网络的频谱共享方法、装置及计算设备

技术领域

本发明涉及频谱共享技术领域，具体涉及一种基于图卷积神经网络的频谱共享方法、装置及计算设备。

背景技术

频谱资源是无线业务的重要载体，发挥着愈加重要的作用。传统的频谱管理是由频谱管理机构为授权用户发放使用牌照，并将相应的频率使用信息录入频谱管理数据库，以保障用户使用的频率不会互相冲突。随着5G和物联网的快速发展，大量用频设备不断接入，无线频谱的共享和动态调配需求变得尤为迫切。现有技术中解决这些问题主要通过以下方法：基于Q学习的认知无线电网络频谱资源分配方法、基于深度学习的频谱资源分配方法以及基于图卷积神经网络的频谱策略构建方法。然而，这些方法存在着建立决策模型时图结构不完善以及基于卷积神经网络(CNN)模型的策略模型收敛速度慢等缺陷。

发明内容

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于图卷积神经网络的频谱共享方法、装置及计算设备。

根据本发明的一个方面，提供了一种基于图卷积神经网络的频谱共享方法，该方法包括：

步骤1，获取当前的网络状态信息，根据网络状态信息，建立无向图模型，并利用无向图模型生成环境矩阵；其中，无向图模型中的节点包括：基站节点和设备节点；

步骤2，利用决策模型对用户需求信息以及环境矩阵进行处理，得到信道选择向量和能量适应向量；

步骤3，根据信道选择向量、能量适应向量以及环境矩阵，通过目标函数判断是否满足预设收敛条件；若是，则执行步骤4；若否，则执行步骤5；

步骤4，依据当前的信道选择向量和能量适应向量进行频谱分配，该方法结束；

步骤5，更新决策模型的参数，而后跳转执行步骤2。

进一步地，基站节点和设备节点之间的边表示信号链路，设备节点之间的边表示干扰链路；

基站节点包括：主网络基站节点和室分设备覆盖范围中的基站节点；设备节点包括：主用户设备节点和次级用户设备节点。

进一步地，基站节点的节点信息包括：位置信息、运动方向、运动速度以及当前信道占用向量；

设备节点的节点信息包括：位置信息、运动方向、运动速度以及当前信道使用向量。

进一步地，利用无向图模型生成环境矩阵进一步包括：

对无向图模型进行分析，得到用户距离矩阵以及用户资源占用矩阵；

依据用户距离矩阵以及用户资源占用矩阵，生成环境矩阵。

进一步地，决策模型利用图卷积神经网络进行建立；决策模型包括：多个图卷积层、单隐层前馈神经网络以及softmax层。

进一步地，更新决策模型的参数进一步包括：

利用梯度下降算法对决策模型中的多个图卷积层的参数进行更新，利用近似求解算法对决策模型中的单隐层前馈神经网络的参数进行更新。

进一步地，预设收敛条件包括：所有次级用户设备节点的数据速率之和为最大值。

根据本发明的另一方面，提供了一种基于图卷积神经网络的频谱共享装置，该装置包括：

环境处理模块，适于获取当前的网络状态信息，根据网络状态信息，建立无向图模型，并利用无向图模型生成环境矩阵；其中，无向图模型中的节点包括：基站节点和设备节点；

决策处理模块，适于利用决策模型对用户需求信息以及环境矩阵进行处理，得到信道选择向量和能量适应向量；

判断模块，适于根据信道选择向量、能量适应向量以及环境矩阵，通过目标函数判断是否满足预设收敛条件；

频谱分配模块，适于若判断模块判断得到满足预设收敛条件，则依据当前的信道选择向量和能量适应向量进行频谱分配；

参数更新模块，适于若判断模块判断得到不满足预设收敛条件，则更新决策模型的参数，而后触发决策处理模块。

根据本发明的又一方面，提供了一种计算设备，包括：处理器、存储器、通信接口和通信总线，处理器、存储器和通信接口通过通信总线完成相互间的通信；

存储器用于存放至少一可执行指令，可执行指令使处理器执行上述基于图卷积神经网络的频谱共享方法对应的操作。

根据本发明的再一方面，提供了一种计算机存储介质，存储介质中存储有至少一可执行指令，可执行指令使处理器执行如上述基于图卷积神经网络的频谱共享方法对应的操作。

根据本发明提供的技术方案，在利用GCN构建的决策模型中引入了图学习方法，与现有技术相比，具有更强的适应能力；依据网络状态信息动态地建立无向图模型，并利用决策模型进行处理，有效地解决了现有技术中建立决策模型时存在的图结构不完善的问题；基于图卷积神经网络将无向图模型引入到强化学习过程，输出信道选择向量和能量适应向量，根据信道选择向量、能量适应向量以及环境矩阵，通过目标函数进行判断，能够快速、便捷地得到较优的频谱接入方案，完成了次级用户设备频谱共享功能，提高了频谱使用效率；并且在决策模型中将位置信息与其他特征信息分开进行考虑，保证了位置信息的特征不会因为其他信息的影响而导致在特征提取过程中造成信息丢失，提高了频谱共享的效率；另外，在实际使用中，可便捷地增加输入数据的特征，以得到最优的图结构，保证了本方案的可扩展性。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了根据本发明一个实施例的基于图卷积神经网络的频谱共享方法的流程示意图；

图2示出了一种网络架构的示意图；

图3示出了一种决策模型的示意图；

图4示出了基于图卷积神经网络的频谱共享方法的架构示意图；

图5示出了根据本发明一个实施例的基于图卷积神经网络的频谱共享装置的结构框图；

图6示出了根据本发明实施例的一种计算设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

图1示出了根据本发明一个实施例的基于图卷积神经网络的频谱共享方法的流程示意图，如图1所示，该方法包括如下步骤：

步骤S1，获取当前的网络状态信息，根据网络状态信息，建立无向图模型，并利用无向图模型生成环境矩阵。

在认知无线电场景下，可获取当前的网络状态信息，根据网络状态信息，识别当前网络架构中所包含的各个基站、各个设备、基站与设备之间的信号链路以及设备之间的干扰链路。如图2所示的网络架构的示意图，最外围的六边形表示的是主网络，主网络内的小六边形表示的是由于网络资源不足而建立的室分设备覆盖范围网络，其中，主网络是通过主网络基站而形成的，室分设备覆盖范围网络是通过室分设备覆盖范围中的基站而形成的。将在室分设备覆盖范围网络内的所有设备称为次级用户设备，将图2中的中间矩形中除了次级用户设备之外的其他用户设备称为主用户设备，在本实施例中，主网络基站可表示为PU，室分设备覆盖范围中的基站可表示为SBS，主用户设备可表示为PUs，次级用户设备可表示为SUs。

在步骤S1中，根据网络状态信息动态地建立无向图模型，无向图模型也可称为环境模型。无向图模型中的节点可包括：基站节点和设备节点，基站节点和设备节点之间的边表示信号链路，设备节点之间的边表示干扰链路。具体地，在建立无向图模型的过程中，根据当前的网络状态信息，将识别得到的基站作为基站节点、将设备作为设备节点，依据基站与设备之间的信号链路绘制基站节点与设备节点之间的边，依据设备之间的干扰链路绘制设备节点之间的边，从而完成无向图模型的建立。其中，基站节点可进一步包括主网络基站节点(即PU节点)和室分设备覆盖范围中的基站节点(即SBS 节点)，设备节点可进一步包括主用户设备节点(PUs节点)和次级用户设备节点(SUs节点)。无向图模型中的节点可通过PU节点、SBS节点、PUs 节点以及SUs节点进行表示。PU节点、SBS节点与PUs节点、SUs节点之间的边表示信号链路，边的权重可通过信道增益进行表示；PU节点与SBS节点之间的边表示干扰链路；PUs节点与SUs节点之间的边表示干扰链路。

在无向图模型中，基站节点的节点信息可包括：基站节点的位置信息、基站节点的运动方向、基站节点的运动速度以及当前信道占用向量，其中，基站节点的运动方向为0，基站节点的运动速度为0；设备节点的节点信息包括：设备节点的位置信息、设备节点的运动方向、设备节点的运动速度以及当前信道使用向量。

在完成无向图模型的建立之后，可对无向图模型进行分析，得到用户距离矩阵以及用户资源占用矩阵，然后依据用户距离矩阵以及用户资源占用矩阵，生成环境矩阵，环境矩阵可采用下列公式(1)进行表示：

S＝{D(t),R(t)} 公式(1)；

其中，S表示环境矩阵，具体为由无向图模型生成的图拉普拉斯矩阵；D(t) 表示用户距离矩阵，用于反映在当前环境下各个节点的位置矩阵；R(t)表示用户资源占用矩阵，用于反映在当前环境下各个信道资源占用矩阵。

步骤S2，利用决策模型对用户需求信息以及环境矩阵进行处理，得到信道选择向量和能量适应向量。

当SUs节点提出频谱共享需求时，可将用户需求信息以及利用无向图模型所生成的环境矩阵输入至决策模型中，利用决策模型对用户需求信息以及环境矩阵进行处理，输出信道选择向量和能量适应向量。其中，用户需求信息可包括：提出频谱共享需求的SUs节点的节点标识等。决策模型可为利用图卷积(GCN)神经网络进行建立的，具体可利用GCN-ELM(Extreme Learning Machine，极端学习机)神经网络进行建立。其中，决策模型可包括：多个图卷积层、单隐层前馈神经网络以及softmax层。ELM是一种快速机器学习算法，可应用于单隐层前馈神经网络的学习，具有结构简单，学习速度快，以及良好的泛化性能等优点。

图3示出了一种决策模型的示意图，如图3所示，决策模型包括：两个图卷积层、单隐层前馈神经网络以及softmax层，其中，这两个图卷积层分别称为图卷积层1和图卷积层2。将环境矩阵输入至决策模型之后，由决策模型中的图卷积层1首先对其进行处理，接着将图卷积层1的输出结果进行线性整流(ReLU)处理后输入至图卷积层2继续处理，将图卷积层2的输出结果进行线性整流处理后输入至单隐层前馈神经网络继续处理。在本实施例中，决策模型采用两层GCN结构进行特征提取，在特征提取后采用单隐层前馈神经网络进行决策处理，然后利用softmax方法对单隐层前馈神经网络输出的数据结果进行处理，得到信道选择向量和能量适应向量。

具体地，卷积层的卷积过程可采用下列公式(2)进行计算：

H^l＝σ(SH^l-1W^l) 公式(2)；

其中，H^l表示第l个卷积层的输出；σ表示激活函数；S表示由无向图模型生成的图拉普拉斯矩阵(即环境矩阵)；H^l-1表示第l-1个卷积层的输出；W^l表示连接第l-1个卷积层与第l个卷积层的参数矩阵。对于S，可采用下列公式(3)进行计算：

其中，x_i表示第i个节点的输入数据，x_j表示第j个节点的输入数据。

在本实施例中，采用的是由两个图卷积层组成的GCN网络，那么图卷积神经网络的输出可采用下列公式(4)进行计算：

GCN_output＝σ(Sσ(SXW⁰)W¹) 公式(4)；

其中，GCN_output表示图卷积神经网络的输出结果；S表示由无向图模型生成的图拉普拉斯矩阵；X表示当前时刻的行为矩阵或功率矩阵；W⁰表示输入层到第1个卷积层之间的参数矩阵；W¹表示第1个卷积层到第2个卷积层之间的参数矩阵。

进一步地，GCN-ELM结构的输出可采用下列公式(5)进行计算：

Policy_output＝softmax(σ(GCN_outputW₁+b)W₂) 公式(5)；

其中，Policy_output表示GCN-ELM结构的输出结果；W₁表示ELM网络(即图3中的单隐层前馈神经网络)中的输入层到隐层的参数矩阵；b表示隐层神经元偏执向量；W₂表示ELM网络中的隐层到输出层的参数矩阵。

步骤S3，根据信道选择向量、能量适应向量以及环境矩阵，通过目标函数判断是否满足预设收敛条件；若是，则执行步骤S4；若否，则执行步骤S5。

步骤S4，依据当前的信道选择向量和能量适应向量进行频谱分配。

在经步骤S3判断得到满足预设收敛条件的情况下，依据当前的信道选择向量和能量适应向量进行频谱分配，则该方法结束。依据满足预设收敛条件下的信道选择向量和能量适应向量进行频谱分配，能够得到较优的频谱接入方案，提高了频谱使用效率，便捷地完成了次级用户设备频谱共享功能。

步骤S5，更新决策模型的参数。

在经步骤S3判断得到不满足预设收敛条件的情况下，更新决策模型的参数，而后跳转执行步骤S2，继续利用决策模型对用户需求信息以及环境矩阵进行处理，得到新的信道选择向量和新的能量适应向量。在更新决策模型的参数的过程中，可基于目标函数利用梯度下降算法对决策模型中的多个图卷积层的参数进行更新，利用近似求解算法对决策模型中的单隐层前馈神经网络的参数进行更新。

图4示出了基于图卷积神经网络的频谱共享方法的架构示意图，如图4 所示，当SUs节点提出频谱共享需求时，可将用户需求信息以及利用无向图模型所生成的环境矩阵输入至决策模型中，利用决策模型对用户需求信息以及环境矩阵进行处理，输出信道选择向量和能量适应向量，而后根据信道选择向量、能量适应向量以及环境矩阵，通过目标函数判断是否满足预设收敛条件，其中，目标函数中包括反馈函数r(t)。预设收敛条件可包括：所有次级用户设备节点的数据速率之和为最大值。若不满足预设收敛条件，则基于反馈函数、信道选择向量以及能量适应向量组成的代价函数对决策模型的网络结构进行优化，更新决策模型的参数。通过强化学习过程，最终满足预设收敛条件，输出最大网络速率的频谱接入方法，从而有效地提高了频谱使用效率。其中，本领域技术人员还可根据实际需要对预设收敛条件进行设置，此处不做限定。通过上述处理方式，能够便捷地最终得到保证最大数据速率的频谱共享方案。

反馈函数r(t)可采用下列公式(6)进行计算：

其中，S表示PU节点的总数；V表示SBS节点的总数；C_sv表示每一个 SUs节点的数据速率。C_sv可采用下列公式(7)进行计算：

其中，C_s,v[n]表示第n个SUs节点的数据速率；

为一个二元指标，表示对第n个信道是否进行分配与占用；W表示信道带宽；N表示信道数量；ξ_s,v[n]表示第n个信道的信噪比。ξ_s,v[n]可采用下列公式(8)进行计算：

其中，h_s,v[n]表示s与v之间的信道增益；P_s,v[n]表示s与v之间的干扰链路的功率；σ²为高斯白噪声；I_s,v[n]表示受到的所有链路的干扰。I_s,v[n]可采用下列公式(9)进行计算：

其中，U表示PUs节点的数量；

表示PUs节点与SBS节点之间的信道增益；

表示PUs节点与SUs节点在相同信道中干扰链路的传输功率；

表示SBS节点与SUs节点之间的信道增益；

表示在同一SBS节点的覆盖下，相同信道中来自于其他SUs节点的干扰链路的传输功率。

进一步地，对GCN-ELM模型训练方式交替优化策略进行优化，并且在图特征提取后根据不同需要的目标函数进行参数优化。其中，目标函数还可包括：信道选择向量对应的目标函数和能量适应向量对应的目标函数。对于信道选择向量对应的目标函数Loss₁和能量适应向量对应的目标函数Loss₂可分别采用下列公式(10)和公式(11)进行表示：

其中，Z表示总的节点个数；T表示时刻的总数；

表示在t时刻时的行为向量的反馈函数值；

表示在t时刻时的功率向量的反馈函数值；t表示某一时刻；r^a表示所有时刻以及节点计算，基于行为矩阵所得出的反馈函数值组成的矩阵；r^p表示所有时刻以及节点计算，基于功率矩阵所得出的反馈函数值组成的矩阵；L表示图结构生成的拉普拉斯矩阵，即环境矩阵。

根据本实施例提供的基于图卷积神经网络的频谱共享方法，在利用GCN 构建的决策模型中引入了图学习方法，与现有技术相比，具有更强的适应能力；依据网络状态信息动态地建立无向图模型，并利用决策模型进行处理，有效地解决了现有技术中建立决策模型时存在的图结构不完善的问题；基于图卷积神经网络将无向图模型引入到强化学习过程，输出信道选择向量和能量适应向量，根据信道选择向量、能量适应向量以及环境矩阵，通过目标函数进行判断，能够快速、便捷地得到较优的频谱接入方案，完成了次级用户设备频谱共享功能，提高了频谱使用效率；并且在决策模型中将位置信息与其他特征信息分开进行考虑，保证了位置信息的特征不会因为其他信息的影响而导致在特征提取过程中造成信息丢失，提高了频谱共享的效率；另外，在实际使用中，可便捷地增加输入数据的特征，以得到最优的图结构，保证了本方案的可扩展性。

图5示出了根据本发明一个实施例的基于图卷积神经网络的频谱共享装置的结构框图，如图5所示，该装置包括：环境处理模块501、决策处理模块 502、判断模块503、频谱分配模块504以及参数更新模块505。

环境处理模块501适于：获取当前的网络状态信息，根据网络状态信息，建立无向图模型，并利用无向图模型生成环境矩阵。

其中，无向图模型中的节点包括：基站节点和设备节点。

决策处理模块502适于：利用决策模型对用户需求信息以及环境矩阵进行处理，得到信道选择向量和能量适应向量。

判断模块503适于：根据信道选择向量、能量适应向量以及环境矩阵，通过目标函数判断是否满足预设收敛条件。

频谱分配模块504适于：若判断模块503判断得到满足预设收敛条件，则依据当前的信道选择向量和能量适应向量进行频谱分配。

参数更新模块505适于：若判断模块503判断得到不满足预设收敛条件，则更新决策模型的参数，而后触发决策处理模块502。

可选地，基站节点和设备节点之间的边表示信号链路，设备节点之间的边表示干扰链路；基站节点包括：主网络基站节点和室分设备覆盖范围中的基站节点；设备节点包括：主用户设备节点和次级用户设备节点。

可选地，基站节点的节点信息包括：位置信息、运动方向、运动速度以及当前信道占用向量；设备节点的节点信息包括：位置信息、运动方向、运动速度以及当前信道使用向量。

可选地，环境处理模块501进一步适于：对无向图模型进行分析，得到用户距离矩阵以及用户资源占用矩阵；依据用户距离矩阵以及用户资源占用矩阵，生成环境矩阵。

可选地，决策模型利用图卷积神经网络进行建立；决策模型包括：多个图卷积层、单隐层前馈神经网络以及softmax层。

可选地，参数更新模块505进一步适于：利用梯度下降算法对决策模型中的多个图卷积层的参数进行更新，利用近似求解算法对决策模型中的单隐层前馈神经网络的参数进行更新。

可选地，预设收敛条件包括：所有次级用户设备节点的数据速率之和为最大值。

根据本实施例提供的基于图卷积神经网络的频谱共享装置，在利用GCN 构建的决策模型中引入了图学习方法，与现有技术相比，具有更强的适应能力；依据网络状态信息动态地建立无向图模型，并利用决策模型进行处理，有效地解决了现有技术中建立决策模型时存在的图结构不完善的问题；基于图卷积神经网络将无向图模型引入到强化学习过程，输出信道选择向量和能量适应向量，根据信道选择向量、能量适应向量以及环境矩阵，通过目标函数进行判断，能够快速、便捷地得到较优的频谱接入方案，完成了次级用户设备频谱共享功能，提高了频谱使用效率；并且在决策模型中将位置信息与其他特征信息分开进行考虑，保证了位置信息的特征不会因为其他信息的影响而导致在特征提取过程中造成信息丢失，提高了频谱共享的效率；另外，在实际使用中，可便捷地增加输入数据的特征，以得到最优的图结构，保证了本方案的可扩展性。

本发明还提供了一种非易失性计算机存储介质，计算机存储介质存储有至少一可执行指令，可执行指令可执行上述任意方法实施例中的基于图卷积神经网络的频谱共享方法。

图6示出了根据本发明实施例的一种计算设备的结构示意图，本发明具体实施例并不对计算设备的具体实现做限定。

如图6所示，该计算设备可以包括：处理器(processor)602、通信接口(Communications Interface)604、存储器(memory)606、以及通信总线608。

其中：

处理器602、通信接口604、以及存储器606通过通信总线608完成相互间的通信。

通信接口604，用于与其它设备比如客户端或其它服务器等的网元通信。

处理器602，用于执行程序610，具体可以执行上述基于图卷积神经网络的频谱共享方法实施例中的相关步骤。

具体地，程序610可以包括程序代码，该程序代码包括计算机操作指令。

处理器602可能是中央处理器CPU，或者是特定集成电路ASIC (ApplicationSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器606，用于存放程序610。存储器606可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序610具体可以用于使得处理器602执行上述任意方法实施例中的基于图卷积神经网络的频谱共享方法。程序610中各步骤的具体实现可以参见上述基于图卷积神经网络的频谱共享实施例中的相应步骤和单元中对应的描述，在此不赘述。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的设备和模块的具体工作过程，可以参考前述方法实施例中的对应过程描述，在此不再赘述。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims

1.一种基于图卷积神经网络的频谱共享方法，其特征在于，所述方法包括：

步骤S1，获取当前的网络状态信息，根据所述网络状态信息，建立无向图模型，并利用所述无向图模型生成环境矩阵；其中，所述无向图模型中的节点包括：基站节点和设备节点；

步骤S2，利用决策模型对用户需求信息以及所述环境矩阵进行处理，得到信道选择向量和能量适应向量；

步骤S3，根据所述信道选择向量、所述能量适应向量以及所述环境矩阵，通过目标函数判断是否满足预设收敛条件；若是，则执行步骤S4；若否，则执行步骤S5；

步骤S4，依据当前的信道选择向量和能量适应向量进行频谱分配，所述方法结束；

步骤S5，更新所述决策模型的参数，而后跳转执行步骤S2。

2.根据权利要求1所述的方法，其特征在于，所述基站节点和所述设备节点之间的边表示信号链路，所述设备节点之间的边表示干扰链路；

所述基站节点包括：主网络基站节点和室分设备覆盖范围中的基站节点；所述设备节点包括：主用户设备节点和次级用户设备节点。

3.根据权利要求1所述的方法，其特征在于，所述基站节点的节点信息包括：位置信息、运动方向、运动速度以及当前信道占用向量；

所述设备节点的节点信息包括：位置信息、运动方向、运动速度以及当前信道使用向量。

4.根据权利要求1所述的方法，其特征在于，所述利用所述无向图模型生成环境矩阵进一步包括：

对所述无向图模型进行分析，得到用户距离矩阵以及用户资源占用矩阵；

依据所述用户距离矩阵以及所述用户资源占用矩阵，生成环境矩阵。

5.根据权利要求1所述的方法，其特征在于，所述决策模型利用图卷积神经网络进行建立；所述决策模型包括：多个图卷积层、单隐层前馈神经网络以及softmax层。

6.根据权利要求5所述的方法，其特征在于，所述更新所述决策模型的参数进一步包括：

利用梯度下降算法对所述决策模型中的多个图卷积层的参数进行更新，利用近似求解算法对所述决策模型中的单隐层前馈神经网络的参数进行更新。

7.根据权利要求1-6任一项所述的方法，其特征在于，所述预设收敛条件包括：所有次级用户设备节点的数据速率之和为最大值。

8.一种基于图卷积神经网络的频谱共享装置，其特征在于，所述装置包括：

环境处理模块，适于获取当前的网络状态信息，根据所述网络状态信息，建立无向图模型，并利用所述无向图模型生成环境矩阵；其中，所述无向图模型中的节点包括：基站节点和设备节点；

决策处理模块，适于利用决策模型对用户需求信息以及所述环境矩阵进行处理，得到信道选择向量和能量适应向量；

判断模块，适于根据所述信道选择向量、所述能量适应向量以及所述环境矩阵，通过目标函数判断是否满足预设收敛条件；

频谱分配模块，适于若所述判断模块判断得到满足预设收敛条件，则依据当前的信道选择向量和能量适应向量进行频谱分配；

参数更新模块，适于若所述判断模块判断得到不满足预设收敛条件，则更新所述决策模型的参数，而后触发所述决策处理模块。

9.一种计算设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的基于图卷积神经网络的频谱共享方法对应的操作。

10.一种计算机存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使处理器执行如权利要求1-7中任一项所述的基于图卷积神经网络的频谱共享方法对应的操作。