CN117240331A - 一种基于图神经网络的无蜂窝网络下行预编码设计方法 - Google Patents
一种基于图神经网络的无蜂窝网络下行预编码设计方法 Download PDFInfo
- Publication number
- CN117240331A CN117240331A CN202311206864.4A CN202311206864A CN117240331A CN 117240331 A CN117240331 A CN 117240331A CN 202311206864 A CN202311206864 A CN 202311206864A CN 117240331 A CN117240331 A CN 117240331A
- Authority
- CN
- China
- Prior art keywords
- base station
- node
- representing
- neural network
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 118
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 42
- 238000013461 design Methods 0.000 title claims abstract description 24
- 239000011159 matrix material Substances 0.000 claims abstract description 61
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 37
- 238000005457 optimization Methods 0.000 claims abstract description 28
- 230000001413 cellular effect Effects 0.000 claims abstract description 23
- 238000004891 communication Methods 0.000 claims abstract description 14
- 238000012545 processing Methods 0.000 claims abstract description 10
- 238000011480 coordinate descent method Methods 0.000 claims abstract description 3
- 230000006870 function Effects 0.000 claims description 50
- 238000012549 training Methods 0.000 claims description 23
- 239000013598 vector Substances 0.000 claims description 22
- 239000010410 layer Substances 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 13
- 102100031620 Cysteine and glycine-rich protein 3 Human genes 0.000 claims description 10
- 230000014509 gene expression Effects 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 4
- 238000003062 neural network model Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000009977 dual effect Effects 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 238000012805 post-processing Methods 0.000 claims description 3
- 239000002356 single layer Substances 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 2
- 102100038687 5'-nucleotidase domain-containing protein 3 Human genes 0.000 description 24
- 238000004364 calculation method Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Mobile Radio Communication Systems (AREA)
Abstract
本发明提供了一种基于图神经网络的无蜂窝网络下行预编码设计方法,包括:步骤1,建立无蜂窝网络中用户终端设备的总速率优化问题;步骤2,对步骤1中的优化问题重新进行转换;步骤3,通过连续凸近似SCA方法求解子问题;步骤4,使用块坐标下降法BCD方法处理步骤2得到的转换后的问题;步骤5,建立用于无线通信的基于图神经网络的学习框架;步骤6,使用基于图神经网络的监督学习方法对基站与用户间天线连接关系进行预测;步骤7,根据已有基站与用户间天线连接关系进行预编码矩阵设计。通过使用先进的预编码算法、图神经网络算法,考虑前程容量约束,本发明提出的方案可以为实现高性能无蜂窝大规模MIMO网络提供实用解决方案。
Description
技术领域
本发明涉及一种基于图神经网络的无蜂窝网络下行预编码设计方法。
背景技术
通常,蜂窝网络的性能受到小区间干扰的限制。特别的,靠近小区边界的用户会受到强烈的干扰(相对于他们所需信号功率而言)。多输入多输出(Multi Input MultiOutput,MIMO)无线通信系统(以及分布式MIMO、协调多点传输和分布式天线系统)可以通过基站之间的协同合作来减少这种小区间干扰。在上述网络中,基站可以通过前程、回程链路进行合作,在下行链路上联合发送信号,在上行链路上联合检测信号。然而,研究表明,基站之间的合作存在根本性局限性,即使在基站之间实现了完全合作,在发射功率趋向无穷大时,频谱效率也仅有有限的上界。但是,与忽略干扰情况相比,仍然可以产生显著更高的频谱效率。实现分布式MIMO的主要挑战是需要大量回程开销、高部署成本和足够强大的中央处理单元。特别地,在预编码信号和信道状态信息(CSI)需要在基站之间共享的情况下,需要考虑这些问题。最近,无蜂窝大规模MIMO被引入作为网络MIMO概念的实用和有用体现。
在无蜂窝大规模MIMO中,配备单个或多个天线的大量基站(或称无线接入点)分布在一个大区域内,以相干方式为许多用户提供服务。与(蜂窝)集中式大规模MIMO一样,无蜂窝大规模MIMO利用有利传播和信道硬化特性,在同一时间频率资源上复用许多用户,并产生小的用户间干扰。因此,它可以提供巨大的频谱效率和简单的信号处理。更重要的是,在无蜂窝大规模MIMO配置中,服务天线靠近用户,这产生了更低的路径损耗;因此,许多用户可以同时得到统一良好的服务质量。然而,由于所有BS都通过前程链路(此处的前程与分布式MIMO中的回程类似)连接到CPU上,这可能会导致前程链路负载非常重。一旦活动天线过多,则前程容量不能满足通信需求。许多学者已经优化了协同多点传输(CoordinateMultipoint transimission,CoMP)网络中回程链路容量问题,在无蜂窝网络中这仍然是必须考虑的问题之一。需要注意的是,许多学者在无蜂窝模型的波束成形设计中假定前向容量为无限大,这可能会随着大规模分布的发展而更加偏离现实。因此,需要设计一种联合优化方案,以便在满足前程链路容量的条件下进行预编码矩阵设计。
在目前对无蜂窝网络的研究中,许多学者采用了迫零均衡(Zero Forcing,ZF)和最大比传输等预编码设计方案。虽然这具有极低的计算复杂度,但它会带来显著的性能损失,并限制对前程链路进行优化操作。
值得注意的是,当前应用于通信场景中的各类数学优化算法往往有较高的时间复杂度,对于天线数量或用户数量较多的通信场景会带来较高的计算时间,可能不适用于实际生产环境。
图神经网络(Graph Neural Networks,GNN)是一种用于处理图结构数据的机器学习模型。与传统的神经网络主要关注欧几里得空间中的数据不同,GNN能够有效地捕捉和分析具有复杂连接关系的非欧几里得数据,通过将通信场景中的天线建模为节点、天线之间的连接建模为边来构建图数据,并利用其位置、信道状态信息等属性作为节点、边特征,可以在GNN模型下进行学习和优化。GNN可以捕捉天线之间的空间关系、干扰与协同效应,并生成最佳权重配置来实现更好的系统性能。近期已经在通信领域展现出良好的性能表现。
基于图神经网络的学习方法有着优秀的运算速度,虽然网络的训练时间较长,但是训练完成后的网络在不同的信道环境下能迅速输出预编码矩阵。同时对于泛化性能良好的网络结构,BS、UE数量的小幅度变化不会带来明显的性能损失。在相对稳定的通信环境中更能贴近生产环境。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种基于图神经网络的无蜂窝网络下行预编码设计方法,具体包括以下步骤:
步骤1,建立无蜂窝网络中用户终端设备的总速率优化问题;
步骤2,建立一种基于分数规划(Fractional Programming,FP)算法的迭代策略以联合优化总速率和前程容量,对步骤1中的优化问题重新进行转换;
步骤3,得到优化问题的子问题,通过连续凸近似(Successive ConvexApproximation,SCA)方法求解子问题;
步骤4,使用块坐标下降法(Block Coordinate Descent,BCD)方法处理步骤2得到的转换后的问题;
步骤5,建立用于无线通信的基于图神经网络的学习框架;
步骤6,使用基于图神经网络的监督学习方法对基站与用户间天线连接关系进行预测;
步骤7,使用基于图神经网络的无监督学习方法,根据已有基站与用户间天线连接关系进行预编码矩阵设计。
步骤1包括:设定无蜂窝网络包括B个基站(Base Station,BS)和K个用户终端(User Equipment,UE),其中B个基站同时向K个用户终端设备在下行链路传输数据符号,信号首先从中央处理单元(Central Processing Unit,CPU)通过前程链路传输到基站,然后再由基站天线传输给用户终端设备;设定每个基站都有M个天线,每个用户终端设备都有一个天线;
所有用户终端设备UE的数据符号s表示为其中E(s·sH)=IK;从第i个BS到所有用户终端设备UE的信道表示为/>从所有基站BS到所有用户的信道表示为
CPU确定每个基站的实际预编码向量,CPU分别传输数据符号s和预编码矩阵Vi,将第i个基站处的预编码矩阵表示为则第i个基站处发送的符号向量为:
xi=Vis (1)
将第i个基站到第k个用户终端设备的信道表示为它也是Hi的第k行,则第k个UE接收到的信号yk表示为:
第k个用户终端设备接收到的信干噪比SINRk表示为:
其中,表示第k个用户处的高斯白噪声;
用户终端设备的总速率优化问题为:
其中s.t.表示优化问题所受的约束集,i表示指示函数,其表达式为
||·||F表示向量的F范数,/>表示第i个BS的最大发射功率,表示所有BS的最大前程链路容量。
本发明中使用大写加粗字母表示矩阵,小写加粗字母表示向量,小写字母表示标量。Hi表示矩阵H的第i列,Hi,j表示矩阵H的第i列,第j行元素。hi表示向量h的第i个元素。E(·)表示期望,表示维度为A*B的复数域,diag(A)表示由A的对角元素组成的向量,IK表示K维的单位矩阵,上标T、H分别表示矩阵的转置、共轭转置,上标*、t分别表示变量的最优解和第t次迭代值。反斜杠\表示从集合中排除。
步骤2包括:通过将SINRk替换为γk,并增加等式约束,此时的问题表示为:
使用拉格朗日乘数法来处理问题(5)中的等式约束:
根据拉格朗日定理,得到λ的最优闭合形式解为:
将最优的拉格朗日乘数代入拉格朗日对偶函数中,得到如下公式:
在找到表达式的公共分母后,得到以下方程:
现在目标函数具有以下形式:
根据分式规划方法,公式(9)中的复杂分式进行等价变换,得到如下目标函数:
其中yk是引入的辅助变量;
则步骤1中的问题被重新表述为:
步骤3包括:
对于公式(12)中的前程链路约束中的指示函数I,使用平滑指示函数进行近似,平滑指示函数为:
虽然该函数已经为平滑函数,但是该约束仍为非凸,为了使其在凸优化中可行,对于给定任意点对其进行一阶泰勒展开得到:
其中上标’表示导函数;
对于固定的γ和y,得到子问题(15):
采用SCA方法求解子问题(15)。
步骤3中,所述采用SCA方法求解子问题(15),具体包括如下步骤:
输入为:精度ε,可行的波束成形矩阵V0,最大迭代次数N;
输出为:最优波束成形矩阵V*;
步骤a1,设置t=1并初始化f3(V0);
步骤a2,如果t≤N,执行步骤a3;否则执行步骤a7;
步骤a3,使用固定的γt和yt,使用凸优化算法解决问题(15),以获得Vt;
步骤a4,更新f3(Vt);
步骤a5,如果|f3(Vt)-f3(Vt-1)|>ε|,则设置t=t+1并转到步骤2,否则返回最优波束成形矩阵V*=Vt;
步骤a6,结束。
步骤4包括:
步骤4-1,在固定V和y的情况下优化γ,是一个标准的凸问题,将其一阶导数设为0:
然后得到γ的最优解:
步骤4-2,在固定V和γ的情况下优化y,是一个标准的凸问题,将其一阶导数设为0:
然后得到y的最优解:
步骤4-3,在固定y和γ的情况下优化V,使用BCD方法处理问题(12)。
步骤4-3中,所述使用BCD方法处理问题(12),具体包括如下步骤:
步骤b1,初始化精度ε,可行波束成形矩阵V0,迭代次数t=1;
步骤b 2,使用公式(17)计算γ0;
步骤b 3,使用公式(19)计算yo;
步骤b 4,计算问题(15)目标函数值作为f(t-1);
步骤b 5,给定Vt-1、γt-1、yt-1,使用步骤3中所述后向链路优化的SCA方法解决问题(15);
步骤b 6,更新Vt、γt、yt和f(t);
步骤b7,如果f(t)-f(t-1)>ε,则t=t+1并转到步骤b5;否则,返回V*、γ*和y*。
步骤5-1包括:利用图神经网络,将各类通信问题建模为如下形式:
其中TX节点对应异构图中的发射节点,RX节点对应异构图中的接收节点,STX=[sTX,1,…,sTX,M]T和SRX=[sRX,1,…,sRX,K]T表示TX节点和RX节点上的变量,和/>表示TX节点和RX节点的特征矩阵;/>表示边的特征,/>表示边上的变量;dTX、dRX和dE分别表示特征维度。
步骤5-2包括:构建如下结构的图神经网络模型:
图神经网络模型由预处理层、多个更新层、后处理层组成,其中预处理层结构首先将复数的特征(FTX,FRX,E)转换为实数特征
其中表示实部,/>表示虚部;用一个以整流线性单元(Rectified Linear Unit,ReLU)作为激活函数的单层MLP对TX节点、RX节点和边的初始表示进行变换:
其中都是可学习的参数;
在更新层中,对于TX节点特征的更新策略为:
其中是/>的第m行,/>是/>的第k行,/>表示第m个TX节点的邻居RX节点集合,AGG表示池化函数,/>是两个不同的MLP;
对于RX节点特征的更新策略为:
对于边特征的更新策略为:
其中是E(l-1)的第(m,k)个元素,/>是三个不同的MLP;
在后处理层中将图中的特征表示(FTX,FRX,E)映射为输出变量具体为:
其中是可训练的参数;之后对输出变量/>进行归一化为(STX,SRX,Ξ)使得其满足约束。
步骤6包括:
利用提出的FP-SCA方法,为该网络准备训练数据;将FP-SCA方法输出的波束成形矩阵转换为0-1二分类矩阵,其中元素模值小于阈值的置零(表示TX-RX天线之间无连接),元素模值大于阈值的置一(表示TX-RX天线之间有连接);获取大量样本数据作为训练集和测试集,数据集的输入为信道信息、基站发射功率约束、基站最大前程容量约束,输出为BS端天线与UE之间的连接关系;用Y来表示已知连接关系矩阵,用X表示神经网络的预测连接矩阵,并通过二分类交叉熵损失函数作为目标函数,具体问题表述如下:
其中Sigmoid是一种S型的激活函数,p是基站的最大发射功率向量,σ是用户端噪声向量,c是基站的最大前程链路容量向量,H是基站与用户间的信道矩阵;在步骤6中将TX节点特征设定为BS端最大前程容量和最大发射功率,将RX节点特征设定为用户端噪声,将边特征设定为TX-RX节点之间的信道信息;
步骤7包括:
将该图神经网络框架应用到上文提出的最大化用户和速率问题中,可以得到如下问题表述:
在该问题(28)中,将TX节点特征设置为基站发射功率,将RX节点特征设置为用户端噪声,将边特征设置为天线之间的信道信息;将步骤6中网络输出的连接矩阵应用到该问题(28)中,输出预编码矩阵次优解。
无蜂窝大规模MIMO技术被认为是超5G/6G时代的通信技术。大量分布式无线接入点不仅打破了小区边界,消除了边缘干扰,而且显著提高了频谱效率。然而,大量接入点连接到CPU会带来沉重的前程传输负载。在发射机预编码设计中,前程链路容量约束成为一个不可避免的问题。本发明提出一种数学优化方案,通过将分数规划算法(FractionalProgramming,FP)和SCA算法相结合(下文称FP-SCA方法)来解决下行传输中的预编码设计问题,并将以上数学优化方法成果与图神经网络相结合,提供一种次优设计方案,保证近似性能的同时大大降低计算时间。在本发明中,提出FP-SCA方法和基于图神经网络的机器学习方法,通过仿真验证,本发明方法具有良好的性能,并且可以在有限前程链路容量下最大化用户和速率。
有益效果:目前在无蜂窝网络中广泛使用的迫零均衡方案不能够实现令人满意的用户和速率性能,并且不能对于前程链路容量进行限制。本发明提出的FP-SCA方法和图神经网络方法相比于迫零均衡方案,可以带来更好的性能表现。本发明提出的图神经网络学习方法相比于以上FP-SCA方法有着近似性能、更低的计算时间,同时有良好的泛化性能,训练好的模型能够良好适应BS数量、UE数量的变化。
总之,本发明的贡献旨在解决实施无蜂窝大规模MIMO系统中的一些关键挑战,如前程负载和预编码设计。通过使用先进的预编码算法、图神经网络算法,考虑前程容量约束,本发明提出的方案可以为实现高性能无蜂窝大规模MIMO网络提供实用解决方案。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1是本发明方法的使用场景模拟图。
图2是本发明网络结构的拓扑示意图。
图3是本发明方法的累计分布函数对比示意图。
图4是本发明方法中针对BS数量的泛化能力示意图。
图5是本发明方法中针对BS数量的平均计算时间对比示意图。
图6是本发明方法中针对UE数量的泛化能力示意图。
图7是本发明方法中针对UE数量的平均计算时间对比示意图。
图8是本发明方法中对于不同前程链路容量的性能对比示意图。
图9是整体的GNN架构示意图。
具体实施方式
本发明提供了一种基于图神经网络的无蜂窝网络下行预编码设计方法,包括如下步骤:
步骤1,问题描述:
考虑如图2所示的无蜂窝网络,其中B个基站(BS)同时向K个用户终端设备UE在下行链路传输数据符号。信号首先通过前程链路传输到基站BS,然后再传输给用户终端设备UE。设定每个基站BS都有M个天线,每个用户终端设备UE都有一个天线。
所有用户终端设备UE的数据符号s表示为其中E(s·sH)=IK;从第i个BS到所有用户终端设备UE的信道表示为/>从所有基站BS到所有用户的信道表示为
CPU确定每个基站BS的实际波束成形向量,并希望使其稀疏化。也即CPU分别传输数据符号s和预编码矩阵Vi(假设,信道变化不是很快)将第i个基站处的预编码矩阵表示为则第i个基站处发送的符号向量为:
xi=Vis (1)
将第i个基站到第k个用户终端设备的信道表示为它也是Hi的第k行,则第k个UE接收到的信号yk表示为:
第k个用户终端设备接收到的信噪比SINRk表示为:
其中,表示第k个用户处的高斯白噪声。
为了在尽可能少地传输预编码数据符号的情况下提高用户的总速率,本发明方法制定了以下问题:
其中s.t.表示该优化问题所受的约束集,I表示指示函数,其表达式为
||·||F表示向量的F范数,/>表示第i个BS的最大发射功率,表示第i个BS的最大前程链路容量。Vi表示第i个BS的波束成型矩阵,第一个约束条件确保每个UE的发射功率不超过其最大功率限制。第二个约束条件限制网络的前程链路容量,这意味着每个BS只能服务于有限的用户,并且被所服务用户的当前接收速率限制。
步骤2,分数规划优化设计:在本步骤中,提出了一种迭代策略以联合优化总速率和回程容量,来解决步骤1中的问题。
用户总速率的优化:这里主要关注优化矩阵V以提高总速率。为简化问题的求解,引入新变量γk,通过将SINRk替换为γk,目标问题为:
首先,使用拉格朗日乘数法来处理方程中的等式约束:
根据拉格朗日定理,得到λ的最优闭式解为:
将最优的拉格朗日乘数代入拉格朗日对偶函数中,得到如下公式:
在找到表达式的公共分母后,得到以下方程:
现在目标函数具有以下形式:
注意到目标函数f2中的复杂分数很难处理,本发明使用分式规划来简化。
引理1:对以下形式的非凸分数规划问题,可以进行等价变换:
/>
这种形式可以被等效转换为:
其中y是本发明引入的辅助变量,直接得到y的闭式解:
应用引理1到本发明的问题中,得到如下目标函数:
到目前为止,问题被重新表述为:
步骤3,前程链路优化的SCA方法
上述问题中的指示函数函数使得优化问题变得具有挑战性。一个潜在的解决方案是采用穷举搜索方法,其中检查所有可能的选定链路组合,并选择产生最大总速率的特定链路集。然而,链路的总数是B*M*K,由于无蜂窝系统中巨大的天线数量,计算复杂度非常高,这对于实际应用来说是无法承受的。
接下来,提出了一种低复杂度算法来处理非平滑指示函数,通过将其近似为一个凸连续光滑函数i。特别地,考虑以下常用的光滑凸函数:
虽然该函数已经为平滑函数,但是该约束仍为非凸,为了使其在凸优化中可行,对于给定任意点对其进行一阶泰勒展开得到:
其中上标’表示导函数。
对于固定的γ和y,得到子问题:
总结SCA方法的算法如下(Algorithm 1):
算法1:SCA方法解决上述问题;
输入为:精度ε,可行的波束成形矩阵V0,最大迭代次数N;
输出为:最优波束成形矩阵V*;
步骤a1,设置t=1并初始化f3(V0)。
步骤a2,如果t≤N,执行步骤a3;否则执行步骤a7;
步骤a3,使用固定的γt和yt,使用凸优化算法解决问题(18),以获得Vt;
步骤a4,更新f3(Vt);
步骤a5,如果|f3(Vt)-f3(Vt-1)|>ε|,则设置t=t+1并转到步骤2,否则返回最优波束成形矩阵V*=Vt;
步骤4,使用BCD方法进行总速率优化:使用BCD方法处理转换后的问题(15)。
阶段1:在固定V和y的情况下优化γ,这是一个标准的凸问题,将其一阶导数设为0:
然后得到γ的最优解:
阶段2:在固定V和γ的情况下优化y,这是一个标准的凸问题,将其一阶导数设为0:
然后得到y的最优解:
阶段3:在固定y和γ的情况下优化V。已经在步骤3中讨论了这个问题,并且可以使用标准凸优化算法高效地解决这个问题。解决问题(15)的整体BCD方法总结在算法2中。
算法2解决问题(15)的分数规划方法:
步骤b1,初始化精度ε,可行波束成形矩阵V0,迭代次数t=1;
步骤b 2,使用公式(20)计算γ0;
步骤b 3,使用公式(22)计算y0;
步骤b 4,计算问题目标函数值作为f(t-1);
步骤b 5,给定Vt-1、γt-1、yt-1,使用步骤3中所述SCA方法解决问题(18);
步骤b 6,更新Vt、γt、yt和f(t);
步骤b7,如果f(t)-f(t-1)>ε,则t=t+1并转到步骤b5;否则,返回V*、γ*和y*。
步骤5:建立基于图神经网络的机器学习框架。
异构图神经网络中的符号表示如下:TX节点对应异构图中的发射节点,RX节点对应异构图中的接收节点。表示第i个TX节点和第k个RX节点上的特征向量为其中,dTX和dRX分别表示对应的特征维度。因此,TX节点和RX节点的特征矩阵可以表示为/>同样地,也可以用一个张量来表示边的特征/>其中dE是边特征维度。另一方面,tx节点和rx节点上的变量可以表示为STX=[sTX,1,…,sTX,M]T和SRX=[sRX,1,…,sRX,K]T其中表示第i个TX节点和第k个RX节点上的变量,d′TX,d′RX分别表示相应的变量特征维度。同样地,边变量被表示为:/>d′E表示边变量的维度。
对于一个异构图问题,将其建模为如下问题形式:
其中φ是特征到变量的映射函数。
整体的GNN架构如下图9所示;
其中预处理层将输入特征转换为初始的节点和边缘特征表示,这些表示将根据L个更新层中的节点和边缘更新机制进行更新,在更新过程中各特征的维度保持不变,最后由后处理层将特征表示转换为变量并进行输出。
在预处理层中,由于当前的神经网络不适合处理复数,首先要将可能为复数的特征(FTX,FRX,E)转换为实数特征具体的,将复数的实部和虚部进行提取并拼接,得到如下表示:
其中表示实部,/>表示虚部。之后用一个以整流线性单元(Rectified LinearUnit,ReLU)作为激活函数的单层MLP对TX节点、RX节点和边的初始表示进行变换:
其中都是可学习的参数。
在更新层中,对于TX节点特征的更新策略为:
其中是/>的第m行,/>是/>的第k行,/>表示第m个TX节点的邻居RX节点集合,AGG表示池化函数,/>是两个不同的MLP。
对于RX节点特征的更新策略为:
对于边特征的更新策略为:
其中是E(l-1)的第fm,k)个元素,/>是三个不同的MLP。以上三种图神经网络中的更新策略已被现有工作证明具有置换同变性,能大大减少训练样本数量。
在后处理层中将图中的特征表示(FTX,FRX,E)映射为输出变量具体如下:
其中是可训练的参数。之后对输出变量/>进行归一化为(STX,SRX,Ξ)使得其满足约束。
步骤6,使用基于图神经网络的监督学习方法对基站与用户间天线连接关系进行预测。
将前程链路约束下的波束成形设计问题用两个串行网络来解决。由于前程链路约束体现在限制了BS端天线与UE之间的连接数量,首先在步骤6中利用以上图神经网络框架得出TX-RX之间的连接关系(下文称连接预测网络)。并在步骤7中根据该连接关系构建异构图,从而求解出预编码矩阵(下文称预编码设计网络)。
利用本发明中提出的FP-SCA方法,为该网络准备训练数据。将FP-SCA方法输出的波束成形矩阵转换为0-1二分类矩阵,其中元素模值小于阈值的置零(表示TX-RX天线之间无连接),元素模值大于阈值的置一(表示TX-RX天线之间有连接)。可以获取大量样本数据作为训练集和测试集,数据集的输入为信道信息、基站发射功率约束、基站最大前程容量约束,输出为BS端天线与UE之间的连接关系。用Y来表示已知连接关系矩阵,用X表示神经网络的预测连接矩阵,并通过二分类交叉熵损失函数作为目标函数,具体问题表述如下:
其中Sigmoid是一种S型的激活函数,p是基站的最大发射功率向量,σ是用户端噪声向量,c是基站的最大前程链路容量向量,H是基站与用户间的信道矩阵。在该步骤中将TX节点特征设定为BS端最大前程容量和最大发射功率,将RX节点特征设定为用户端噪声,将边特征设定为TX-RX节点之间的信道信息。经过训练,通过该网络可以迅速地根据基站端前程链路约束与信道信息获取天线之间的连接矩阵,并直接应用于步骤7中异构图的构建,从而输出满足于前程链路约束下的预编码矩阵。
步骤7,使用基于图神经网络的无监督学习方法,根据已有基站与用户间天线连接关系进行预编码矩阵设计。
将该图神经网络框架应用到上文提出的最大化用户和速率问题中,可以得到如下问题表述:
在该问题中,将TX节点特征设置为基站发射功率,将RX节点特征设置为用户端噪声,将边特征设置为天线之间的信道信息。经过训练,该网络能够产生上文提出的FP-SCA方法的近似性能,并且该网络有着良好的泛化能力,对于UE、BS数量的改变,以及二者之间的连接改变能够良好适配。将步骤6中网络输出的连接矩阵应用到该问题中,输出预编码矩阵次优解。
性能评估:本节介绍数值结果以证明所提出的无蜂窝MIMO通信系统的有效性。具体仿真参数如下:考虑一个在2×2km2区域的下行无无蜂窝网络,其中BSs和UEs是均匀分布的。路径损失为30.5+36.7log10(d)dB,其中d为收发天线之间的距离。每个基站的最大发射功率为30dBm,小尺度信道遵循瑞利衰落,噪声功率为-99dBm。在未提及修改参数时,我们默认在以下参数设定中进行网络训练和仿真测试:基站数量为4,每个基站的天线数量为2,用户数量为4,每个用户为单天线。
对于图神经网络方法,所有的聚合函数都使用最大聚合函数实现,所有的MLP都由三个线性层实现,每个层之后都有一个ReLU激活函数。设定更新层数量为2。在训练过程中,epoch的数量设置为500,批大小设置为256,其中连接预测网络的训练集大小为10000,预编码设计网络的训练集大小为25600,学习率设置为10-4,并且采用Adam优化器。所有实验都在Intel Core i7-11800H(2.30GHz)和NVIDIA GeForce RTX 3060 GPU(12GB)上使用Pytorch实现。
连接预测网络的训练:首先通过FP-SCA方法获取连接预测网络的数据集,其中对于10200个不同的信道实现,设置基站的最大前程链路容量为[0,10]bps/Hz,获取每个实现的连接矩阵并存储,之后使用大小为10000的训练集和大小为200的测试集对连接预测网络进行训练。经过仿真测试,具体性能如下表1所示。对于基站数为4、用户数为4的测试集中的200个实现的平均预测准确率为96.5%,为测试该网络的泛化性能,分别在基站数为8、用户数为4和基站数为4,用户数为8的200个随机前程容量样本下进行测试,得到的平均预测准确率分别为95.5%和95.0%。可以看出该网络的预测准确率较高,并且泛化能力良好,能够适应基站、用户数量的变化,所输出的连接矩阵能为后续满足容量约束的预编码矩阵设计奠定良好基础。
表1
基站数 | 用户数 | 样本大小(个) | Cmax(bps/Hz) | 预测准确率 |
4 | 4 | 200 | [0,10]随机值 | 96.5% |
8 | 4 | 200 | [0,10]随机值 | 95.5% |
4 | 8 | 200 | [0,10]随机值 | 95.0% |
下文统称两个网络的整体结构为GNN方法。
图3展示了FP-SCA方法与GNN方法的整体性能对比,以迫零均衡算法为基准,绘制三者对于200个随机实现的累积分布曲线,其中横坐标为用户和速率,纵坐标为累积分布概率。在图中可以看出,FP-SCA与GNN相比于ZF能产生更高的用户和速率,其中GNN算法的平均用户和速率为FP-SCA算法的95.45%,ZF算法的平均用户和速率为FP-SCA算法的86.02%。对于GNN方法输出的预编码矩阵,对其进行前程链路约束的满足率验证,在200个信道实现中,GNN方法满足前程链路约束的概率为97.5%,该准确率略高于连接预测准确率的原因是,对于预测错误的信道实现,仍有较大概率输出满足约束的预编码解。
图4和图5展示了GNN方法对于BS数量改变的泛化性能,在BS数量为4的训练集下进行训练,并分别测试BS数量为5/6/7/8下的测试集的性能。在图4中,横坐标为BS数量,纵坐标为用户和速率。在图4中可以看出,GNN算法有着良好的泛化性能,对于不同的BS数量能够产生FP-SCA算法的近似性能。在图5中,横坐标为BS数量,纵坐标为平均计算时间,在图5中可以看出,针对不同的BS数量,GNN算法相比于FP-SCA有着更快的运算速度(忽略训练时间)。以BS数量为8为例,GNN算法相比于FP-SCA仅用了0.63%的运算时间,得到了94.51%的用户和速率。可以看出,本发明提出的GNN方法能够在产生次优解的情况下大大减少运算时间,在大规模MIMO的实际应用中,更能贴合生产环境的需要。
图6和图7展示了GNN方法对于UE数量改变的泛化性能,在UE数量为4的训练集下进行训练,并分别测试UE数量为5/6/7/8下的测试集的性能。在图6中,横坐标为UE数量,纵坐标为用户和速率。在图6中可以看出,GNN算法有着良好的泛化性能,对于不同的UE数量能够产生FP-SCA算法的近似性能。在图7中,横坐标为UE数量,纵坐标为平均计算时间,在图7中可以看出,针对不同的UE数量,GNN算法相比于FP-SCA有着更快的运算速度(忽略训练时间)。以UE数量为8为例,GNN算法相比于FP-SCA仅用了0.55%的运算时间,得到了94.34%的用户和速率可以看出,本发明提出的GNN方法能够在产生次优解的情况下大大减少运算时间,在大规模MIMO的实际应用中,更能贴合生产环境的需要。
图8展示了本发明提出的FP-SCA算法与GNN算法解决前程链路容量约束问题的性能。其中横坐标为前程链路容量,纵坐标为用户和速率。可以看出,随着前程链路容量的提升,GNN算法能产生FP-SCA算法的近似性能,并在前程链路的容量约束下最大化用户和速率。在前程链路容量大于BS服务所有用户所需的容量时(对应图中横坐标8-10),用户和速率不再提升,这与预期相符。
本发明提供了一种基于图神经网络的无蜂窝网络下行预编码设计方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (10)
1.一种基于图神经网络的无蜂窝网络下行预编码设计方法,其特征在于,包括以下步骤:
步骤1,建立无蜂窝网络中用户终端设备的总速率优化问题;
步骤2,建立一种基于分数规划FP算法的迭代策略以联合优化总速率和前程容量,对步骤1中的优化问题重新进行转换;
步骤3,得到优化问题的子问题,通过连续凸近似SCA方法求解子问题;
步骤4,使用块坐标下降法BCD方法处理步骤2得到的转换后的问题;
步骤5,建立用于无线通信的基于图神经网络的学习框架;
步骤6,使用基于图神经网络的监督学习方法对基站与用户间天线连接关系进行预测;
步骤7,使用基于图神经网络的无监督学习方法,根据已有基站与用户间天线连接关系进行预编码矩阵设计。
2.根据权利要求1所述的方法,其特征在于,步骤1包括:设定无蜂窝网络包括B个基站BS和K个用户终端UE,其中B个基站同时向K个用户终端设备在下行链路传输数据符号,信号首先从中央处理单元CPU通过前程链路传输到基站,然后再由基站天线传输给用户终端设备;设定每个基站都有M个天线,每个用户终端设备都有一个天线;
所有用户终端设备UE的数据符号s表示为其中E(s·sH)=Ik;从第i个BS到所有用户终端设备UE的信道表示为/>从所有基站BS到所有用户的信道表示为
CPU确定每个基站的实际预编码向量,CPU分别传输数据符号s和预编码矩阵Vi,将第i个基站处的预编码矩阵表示为则第i个基站处发送的符号向量为:
xi=Vis (1)
将第i个基站到第k个用户终端设备的信道表示为它也是Hi的第k行,则第k个UE接收到的信号yk表示为:
第k个用户终端设备接收到的信干噪比SINRk表示为:
其中,表示第k个用户处的高斯白噪声;
用户终端设备的总速率优化问题为:
其中s.t.表示优化问题所受的约束集,I表示指示函数,其表达式为||•||F表示向量的F范数,/>表示第i个BS的最大发射功率,/>表示所有BS的最大前程链路容量。
3.根据权利要求2所述的方法,其特征在于,步骤2包括:通过将SINRk替换为γk,并增加等式约束,此时的问题表示为:
使用拉格朗日乘数法来处理问题(5)中的等式约束:
根据拉格朗日定理,得到λ的最优闭合形式解为:
将最优的拉格朗日乘数代入拉格朗日对偶函数中,得到如下公式:
在找到表达式的公共分母后,得到以下方程:
现在目标函数具有以下形式:
根据分式规划方法,公式(9)中的复杂分式进行等价变换,得到如下目标函数:
其中yk是引入的辅助变量;
则步骤1中的问题被重新表述为:
4.根据权利要求3所述的方法,其特征在于,步骤3包括:
对于公式(12)中的前程链路约束中的指示函数I,使用平滑指示函数进行近似,平滑指示函数为:
对于给定任意点对其进行一阶泰勒展开得到:
其中上标’表示导函数;
对于固定的γ和y,得到子问题(15):
采用SCA方法求解子问题(15)。
5.根据权利要求4所述的方法,其特征在于,步骤3中,所述采用SCA方法求解子问题(15),具体包括如下步骤:
输入为:精度ε,可行的波束成形矩阵V0,最大迭代次数N;
输出为:最优波束成形矩阵V*;
步骤a1,设置t=1并初始化f3(V0);
步骤a2,如果t≤N,执行步骤a3;否则执行步骤a7;
步骤a3,使用固定的γt和yt,使用凸优化算法解决问题(15),以获得Vt;
步骤a4,更新f3(Vt);
步骤a5,如果|f3(Vt)-f3(Vt-1)|>ε|,则设置t=t+1并转到步骤2,否则返回最优波束成形矩阵V*=Vt;
步骤a6,结束。
6.根据权利要求5所述的方法,其特征在于,步骤4包括:
步骤4-1,在固定V和y的情况下优化γ,将其一阶导数设为0:
然后得到γ的最优解:
步骤4-2,在固定V和γ的情况下优化y,将其一阶导数设为0:
然后得到y的最优解:
步骤4-3,在固定y和γ的情况下优化V,使用BCD方法处理问题(12)。
7.根据权利要求6所述的方法,其特征在于,步骤4-3中,所述使用BCD方法处理问题(12),具体包括如下步骤:
步骤b1,初始化精度ε,可行波束成形矩阵V0,迭代次数t=1;
步骤b2,使用公式(17)计算γ0;
步骤b3,使用公式(19)计算y0;
步骤b4,计算问题(15)目标函数值作为f(t-1);
步骤b5,给定vt-1、γt-1、yt-1,使用步骤3中所述后向链路优化的SCA方法解决问题(15);
步骤b6,更新Vt、γt、yt和f(t);
步骤b7,如果f(t)-f(t-1)>ε,则t=t+1并转到步骤b5;否则,返回V*、γ*和y*。
8.根据权利要求7所述的方法,其特征在于,步骤5-1包括:利用图神经网络,将各类通信问题建模为如下形式:
其中TX节点对应异构图中的发射节点,RX节点对应异构图中的接收节点,STX=[sTX,1,…,sTX,M]T和SRX=[sRX,1,…,sRX,K]T表示TX节点和RX节点上的变量,和/>表示TX节点和RX节点的特征矩阵;/>表示边的特征,/>表示边上的变量;dTX、dRX和dE分别表示特征维度。
9.根据权利要求8所述的方法,其特征在于,步骤5-2包括:构建如下结构的图神经网络模型:
图神经网络模型由预处理层、多个更新层、后处理层组成,其中预处理层结构首先将复数的特征(FTX,FRX,E)转换为实数特征
其中表示实部,/>表示虚部;用一个以整流线性单元ReLU作为激活函数的单层MLP对TX节点、RX节点和边的初始表示进行变换:
其中都是可学习的参数;
在更新层中,对于TX节点特征的更新策略为:
其中是/>的第m行,/>是/>的第k行,/>表示第m个TX节点的邻居RX节点集合,AGG表示池化函数,/>是两个不同的MLP;
对于RX节点特征的更新策略为:
对于边特征的更新策略为:
其中是E(l-1)的第(m,k)个元素,/>是三个不同的MLP;
在后处理层中将图中的特征表示(FTX,FRX,E)映射为输出变量具体为:
其中是可训练的参数;之后对输出变量/>进行归一化为(STX,SRX,Ξ)使得其满足约束。
10.根据权利要求9所述的方法,其特征在于,步骤6包括:
利用FP-SCA方法,为网络准备训练数据;将FP-SCA方法输出的波束成形矩阵转换为0-1二分类矩阵,其中元素模值小于阈值的置零,元素模值大于阈值的置一;获取样本数据作为训练集和测试集,数据集的输入为信道信息、基站发射功率约束、基站最大前程容量约束,输出为BS端天线与UE之间的连接关系;用Y来表示已知连接关系矩阵,用X表示神经网络的预测连接矩阵,并通过二分类交叉熵损失函数作为目标函数,具体问题表述如下:
其中Sigmoid是一种S型的激活函数,p是基站的最大发射功率向量,σ是用户端噪声向量,c是基站的最大前程链路容量向量,H是基站与用户间的信道矩阵;在步骤6中将TX节点特征设定为BS端最大前程容量和最大发射功率,将RX节点特征设定为用户端噪声,将边特征设定为TX-RX节点之间的信道信息;
步骤7包括:
将图神经网络框架应用到最大化用户和速率问题中,得到如下问题表述:
在该问题(28)中,将TX节点特征设置为基站发射功率,将RX节点特征设置为用户端噪声,将边特征设置为天线之间的信道信息;将步骤6中网络输出的连接矩阵应用到该问题(28)中,输出预编码矩阵次优解。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311206864.4A CN117240331A (zh) | 2023-09-19 | 2023-09-19 | 一种基于图神经网络的无蜂窝网络下行预编码设计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311206864.4A CN117240331A (zh) | 2023-09-19 | 2023-09-19 | 一种基于图神经网络的无蜂窝网络下行预编码设计方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117240331A true CN117240331A (zh) | 2023-12-15 |
Family
ID=89089084
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311206864.4A Pending CN117240331A (zh) | 2023-09-19 | 2023-09-19 | 一种基于图神经网络的无蜂窝网络下行预编码设计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117240331A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117560043A (zh) * | 2024-01-11 | 2024-02-13 | 大连海事大学 | 一种基于图神经网络的无蜂窝网络功率控制方法 |
-
2023
- 2023-09-19 CN CN202311206864.4A patent/CN117240331A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117560043A (zh) * | 2024-01-11 | 2024-02-13 | 大连海事大学 | 一种基于图神经网络的无蜂窝网络功率控制方法 |
CN117560043B (zh) * | 2024-01-11 | 2024-03-19 | 大连海事大学 | 一种基于图神经网络的无蜂窝网络功率控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Qi et al. | Integrating sensing, computing, and communication in 6G wireless networks: Design and optimization | |
CN107332598A (zh) | 一种基于深度学习的mimo系统联合预编码和天线选择方法 | |
CN102484489B (zh) | 主动式消除干扰信号系统、方法 | |
CN110492915A (zh) | 一种基于mimo-noma短包传输的功率分配方法 | |
Luo et al. | Downlink power control for cell-free massive MIMO with deep reinforcement learning | |
Zhao et al. | Learning precoding policy: CNN or GNN? | |
KR102510513B1 (ko) | 심층 학습 기반의 빔포밍 방법 및 이를 위한 장치 | |
CN113193893B (zh) | 毫米波大规模mimo智能混合波束成形设计方法 | |
Palhares et al. | Iterative AP selection, MMSE precoding and power allocation in cell‐free massive MIMO systems | |
CN117240331A (zh) | 一种基于图神经网络的无蜂窝网络下行预编码设计方法 | |
Banoori et al. | Pilot contamination mitigation under smart pilot allocation strategies within massive MIMO-5G system | |
Balevi et al. | Unfolded hybrid beamforming with GAN compressed ultra-low feedback overhead | |
CN109067446B (zh) | 一种多天线多用户大规模天线的混合预编码方法 | |
Chen et al. | Deep reinforcement learning for resource allocation in massive MIMO | |
Ni et al. | User association and hybrid beamforming designs for cooperative mmWave MIMO systems | |
CN109936399A (zh) | 一种基于深度神经网络的不可信中继网络天线选择方法 | |
TW202145005A (zh) | 多輸入輸出系統之參數估測方法 | |
Wijaya et al. | Neural network based transmit power control and interference cancellation for MIMO small cell networks | |
Zhang et al. | Hybrid precoding design based on dual-layer deep-unfolding neural network | |
CN107733487B (zh) | 一种大规模多输入多输出系统的信号检测方法及装置 | |
Huang et al. | Self-attention reinforcement learning for multi-beam combining in mmWave 3D-MIMO systems | |
Yan et al. | BS-UE association and power allocation in heterogeneous massive MIMO systems | |
Bobrov et al. | Machine learning methods for spectral efficiency prediction in massive mimo systems | |
CN115065392A (zh) | 脏纸编码条件下实现miso下行总和速率最大化的波束形成设计方法 | |
Kumar et al. | Multi-user mmWave massive-MIMO hybrid beamforming: A quantize deep learning approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |