CN114944999B

CN114944999B - 一种基于gpu和粒子群优化算法的高速路由通信系统及方法

Info

Publication number: CN114944999B
Application number: CN202210364640.5A
Authority: CN
Inventors: 李正岱; 张爱丽; 王晓婷; 张利民; 齐廷宇; 尚山; 赵伟
Original assignee: Beijing Research Institute of Telemetry; Aerospace Long March Launch Vehicle Technology Co Ltd
Current assignee: Beijing Research Institute of Telemetry; Aerospace Long March Launch Vehicle Technology Co Ltd
Priority date: 2022-04-08
Filing date: 2022-04-08
Publication date: 2023-10-10
Anticipated expiration: 2042-04-08
Also published as: CN114944999A

Abstract

本发明提供一种基于GPU和粒子群优化算法的高速路由通信系统及方法，通过采用大量GPU并行处理单元及DDR/GDDR5宽带高速存储器的直接操作，解决了基于传统CPU类纯软件处理路由数据交换与转发时，存在数据交换速率受限等问题，提升了高速路由器网络数据交换的数据交换吞吐量和并行处理能力；本发明通过采用基于粒子群优化算法优结合GPU大规模并行计算处理特点，实现了对网络拓扑中，最优路径的快速搜索与更新，提升了路由器路由规划性能。本发明通过采用一种基于FFT系数相对称的查找表优化方法，压缩了高速路由通信系统频谱带宽，提升了系统传输的微波射频频谱效能。

Description

一种基于GPU和粒子群优化算法的高速路由通信系统及方法

技术领域

本发明涉及通信技术领域，具体涉及一种基于GPU和粒子群优化算法的高速路由通信系统及方法。

背景技术

近十年来，GPU越来越受到计算机、大数据和通信等领域的密切关注，而各种数据也表明GPU大规模计算，特别是并行计算和浮点运算方面，有着极大的优势，虽然CPU与GPU在结构上来说既有差异，又有类似。它所提供的性能是CPU的数十倍乃至于上百倍，虽然从成分构成上来看，CPU与GPU包含的部分基本相同，但是相比于传统CPU而言，GPU中包含的并行计算单元核数量，要远超CPU，这也是GPU在大规模并行数据处理和计算性能上，拥有巨大优势原因。

最短路径规划在工作时，要求根据某一准则(如网络拓扑传递最短、能量消耗最小等)，在网络拓扑链接中沿最优(或次优)路径行走。在拓扑信息完全已知时，目前已经有许多解决方法，势场法、Dijkstra最短路径、可视图法等网络拓扑最短路径规划等。但势场法存在陷阱区，在相近的障碍物面前不能发现路径和在障碍物面前振荡等。Dijkstra最短路径、可视图法则有搜索路径复杂、无法引入大规模并行处理，效率不高等问题。

在追求高频谱效率的通信系统中，超乃奎斯特压缩(FTN)波形是近年来关注的热点。欧洲在“下一代卫星通信先进波形技术”项目中对时频二维压缩(TFP)波形进行了研究，认为TFP能够有效提升频谱效率。另外，TFP也是第二代数字卫星广播扩展型(DVB-S2X)和第五代移动通信(5G)系统中的备选波形。从时频网格图上可以看出，压缩将引入码间串扰(ISI)和载波间干扰(ICI)。但是已有研究工作证明，只要压缩因子不超过时频Mazo极限，则信号的最小欧式距离不发生变化，因此接收机能够获得相同的误码率性能。对传输的波形进行时间压缩后(压缩因子0.8)，信号的传输速率增大，频谱效率提升25％左右。当然，传统的奈奎斯特信号在最佳采样点处不存在码间串扰(ISI)，而时间压缩后的信号则存在ISI，需要在接收端采用均衡技术进行消除。

发明内容

本发明是为了解决路由通信系统效率提升的问题，提供一种基于GPU和粒子群优化算法的高速路由通信系统，通过采用大量GPU并行处理单元及DDR5/GDDR5宽带高速存储器的直接互联设计、采用基于粒子群优化算法优结合GPU大规模并行计算、采用一种基于FFT系数对称特性的查找表优化方法等方法，提升了高速路由器网络数据交换的数据交换吞吐量和并行处理能力，提高了最优路径的快速搜索更新及网络交换路径规划能力，压缩减小了通信系统的频谱占用带宽，实现了系统频谱效能提升目标。

本发明提供一种基于GPU和粒子群优化算法的高速路由通信系统，包括通过互联网总线连接的通信收发单元、路由管理与数据交换单元和电源单元；

通信收发单元包括通过数据线连接的收发射频模块、基带收发模块和时钟管理模块；

路由管理与数据交换单元包括通过数据线连接的综合接口模块、综合控制与管理模块、GPU模块和数据分发模块；

综合控制与管理模块包括CPU处理器，GPU模块包括至少2个并行的GPU核处理器，数据分发模块包括电连接的FPGA芯片和DDR/GDDR5宽带高速存储器，CPU处理器、FPGA芯片和DDR/GDDR5宽带高速存储器均通过数据线连接；

GPU模块用于通过至少2个并行的GPU核处理器对数据进行并行协议解析、拆帧组帧、拆包组包和并行交换，GPU核处理器用于规划网络拓扑结构最优路径、开启并行粒子群优化运算并获得网络拓扑下的全局最优路径；

CPU处理器与FPGA芯片用于进行网络数据高速路由与交换。

本发明所述的一种基于GPU和粒子群优化算法的高速路由通信系统，作为优选方式，DDR/GDDR5宽带高速存储器包括本地接收区域和非本地转发区域；

基带收发模块使用FTN信号，基带收发模块使用基于FFT系数对称特性的查找表优化算法。

本发明所述的一种基于GPU和粒子群优化算法的高速路由通信系统，作为优选方式，CPU处理器用于通过之前接收到的全网网络控制面数据包信息，随时更新网络拓扑信息，并设定粒子群优化算法参数、搜索群规模和粒子向量维度后传递给FPGA芯片。

本发明提供一种基于GPU和粒子群优化算法的高速路由通信方法，包括以下步骤：

S1、信号接收：微波信号经收发射频模块的天线接收、低噪信号放大、信号下变频后得到基带信号输出至基带收发模块，基带信号经过信号滤波、信号采集后变为数字信号，再经过多普勒频偏补偿、载波捕获跟踪、扩频码同步、解括、解调、位同步、帧同步后，得到一帧高度传输数据，高度传输通过数据总线输出至路由管理与数据交换单元；

S2、高速数据接收与转发：高速传输数据由高速总线送至接口缓存，FPGA芯片按照DDR/GDDR5宽带高速存储器的时序，快速将接口缓存内数据存入DDR/GDDR5宽带高速存储器中；

S3、GPU模块判断需求是否为特定数据类型转发需求，如果否，进入步骤S4，如果是，进入步骤S5，特定数据类型的判断标准为每帧中包含的短包数据数量；

S4、高速数据拆帧接收：GPU模块开启N个并行的GPU核处理器进行处理，按照每个GPU核处理器处理一帧的分配，并行处理N帧AOS帧拆帧、N*M个MPDU拆包工作，并行获取N帧中M个包IP地址，进入步骤S6；

S5、特定数据类型拆帧接收：GPU模块首先开启N个并行的GPU核处理器进行处理，按照每个处理器处理一帧的分配，并行处理N帧AOS帧拆帧，然后继续开启M个并行的GPU核处理器继续完成每帧中M个MPDU拆包工作，获取N帧中M个包IP地址；

S6、网络路由表更新：CPU处理器定期向GPU模块发送网络路由表更新计算请求，GPU模块收到请求后，通过N个并行的GPU核处理器启动粒子群优化算法对最短路径并行查找，更新最短路径路由表后留存于查找表存储空间内；

S7、比对判断：GPU核处理器将数据IP与查找表比对，判断数据包是否为本地数据包，如果是，则将本地数据包快速存储至GPU核处理器的本地接收区域，然后FPGA芯片并行快速转发到本地数据接收总线上；如果否，则为非本地数据包，GPU核处理器将非本地数据包快速存储GPU核处理器的非本地转发区域，并由FPGA芯片快速分发到基带收发模块的发送链路上；

S8、数据发送：数字信号由数据总线发送到通信收发单元，经过调制、编码和扩频后，通过数模转换变成基带模拟信号输出至收发射频模块，再经过上变频、功率放大后转换为微波信号发往天线设备向外发送。

本发明所述的一种基于GPU和粒子群优化算法的高速路由通信方法，作为优选方式，步骤S6中，粒子群优化算法包括以下步骤：

SⅠ、CPU处理器选取起点S到目标点T的路径长度作为粒子适应值；

SⅡ、CPU处理器初始化粒子的维数n、粒子数p，初始化粒子Xi，每个粒子的历史最优值p_Besti为粒子本身，由适应度函数公式计算每个粒子的适应度值，选取适应值最小的粒子记为g_Best；

SⅢ、GPU核处理器并行计算粒子群优化算法速度更新公式，将粒子的速度进行更新，若当前粒子速度v_id＜-粒子最大速度V_maxxd，则当前粒子速度v_id＝-粒子最大速度V_maxxd；若当前粒子速度v_id＞粒子最大速度V_maxxd，则当前粒子速度v_id＝粒子最大速度V_maxxd；

SⅣ、GPU核处理器并行计算粒子群优化算法位置更新公式，将粒子的位置进行更新，若当前粒子位置x_id＜粒子最小位置X_minxd，则当前粒子位置x_id＝粒子最小位置X_minxd；若当前粒子位置x_id＞粒子最大位置X_maxxd，则当前粒子位置x_id＝粒子最大位置X_maxxd；

SⅤ、CPU处理器通过FPGA芯片从DDR/GDDR5宽带高速存储器中得到所有粒子X_i结果，对每个粒子X_i根据粒子群优化位置更新公式，计算适应值，若其适应值小于历史最优值p_Besti的适应值，则历史最优值p_Besti＝粒子X_i；

并行GPU核处理器，返回步骤SⅢ进行迭代，直到粒子群优化算法达到最大迭代次数或满足精度要求，CPU处理器从DDR/GDDR5宽带高速存储器中获取所有粒子X_i结果，并通过计算获得最后的最优适应值和全局最优最短路径结果，粒子群优化算法结束。

本发明所述的一种基于GPU和粒子群优化算法的高速路由通信方法，作为优选方式，步骤S1、S8中，基带收发模块使用FTN信号，基带收发模块使用基于FFT系数对称特性的查找表优化算法。

本发明所述的一种基于GPU和粒子群优化算法的高速路由通信方法，作为优选方式，基于FFT系数对称特性的查找表优化算法包括以下步骤：

Sa、当信噪比Eb/N0≤T_分割值dB时，由于查找表T(i)_table数值分布大小变化较为陡峭，因此在此区间范围内，各查找表维持原样，查找表数值不进行近似优化处理；

Sb、当信噪比Eb/N0＞T_分割值dB时，根据数值变化规律进行适当的查找表数值分段共用，以缩减查找表大小。

本发明所述的一种基于GPU和粒子群优化算法的高速路由通信方法，作为优选方式，步骤Sb包括以下步骤：

Sb1、当Eb/N0≥T₁dB且Eb/N0≤T₂dB时，Eb/N0相对均方误差较小，在Eb/N0＝T₁与Eb/N0＝T₂的表格系数实现近似共用Eb/N0＝T₁系数，T_分割值、T₁和T₂均为阈值，且T₁＜T₂＜T_分割值；

Sb2、当Eb/N0≥T₃dB且Eb/N0≤T₄dB时，FFT系数查找表内部系数实现共用T₃对应的系数，T₃和T₄均为阈值，且T₃＜T₄＜T₂。

本发明所述的一种基于GPU和粒子群优化算法的高速路由通信方法，作为优选方式，步骤Sa、Sb中，T_分割值为25，T1为5，T2为20，T3为7，T4为10。

本发明所述的一种基于GPU和粒子群优化算法的高速路由通信方法，作为优选方式，FTN信号包括FTN基带发送信号，FTN基带发送信号的产生方法为：基带收发模块对信源的比特数据进行交织，经过QPSK调制后，在调制信号后插入2Np个循环后缀，Np为基带收发模块中干扰截短长度，并进入成形滤波器，得到FTN基带发送信号。

一种基于GPU和粒子群优化算法的高速路由通信系统及方法，其特征在于：包括通信收发单元、路由管理与数据交换单元、电源单元；其中通信收发单元包括收发射频模块、基带收发模块、时钟管理模块；路由管理数与据交换单元包括综合接口模块、综合控制与管理模块、GPU模块、数据分发模块；

上述各部分连接关系如下：收发射频模块、基带收发模块、时钟管理模块通过数据线实现板内链接；综合接口模块、综合控制与管理模块、数据路由与分发模块通过数据线实现板内链接；通信收发单元、路由管理与数据交换单元、电源单元，通过板间互联总线实现板间链接。

GPU模块，利用大量GPU的核处理器，并行完成对大量数据的协议解析、拆帧组帧、拆包组包，并行交换等功能。对网络拓扑结构最优路径，开启并行粒子群优化运算，获得网络拓扑下的全局最优路径等功能。

基于GPU和粒子群优化算法的高速路由通信系统其硬件连接关系如下：采用大量GPU并行核处理器、FPGA芯片分别与DDR/GDDR5宽带高速存储器的直接互联，CPU与FPGA相连接结构，用于完成网络数据高速路由与交换功能。

一种基于GPU和粒子群优化算法的高速路由通信系统及方法其接收与转发流程步骤如下：

步骤1:在所述的高速数据接收与转发流程中，首先高速传输数据由高速总线送至接口缓存，FPGA按照DDR/GDDR5时序，快速将接口缓存内数据，存入DDR/GDDR5宽带存储器中。

步骤2:GPU开启N个并行核处理，按照每个处理器处理一帧的分配，并行处理N帧AOS帧拆帧、N*M个MPDU拆包工作，并行获取N帧中M个包IP地址，并将本地数据包快速存储DDR/GDDR5存储器本地接收区域。

步骤3:交换FPGA并行快速转发到本地数据接收总线上，将非本地数据包快速存储DDR/GDDR5存储器非本地转发区域，并由FPGA快速分发到基带发送链路上。

一种基于GPU和粒子群优化算法的高速路由通信系统及方法其高速数据发送流程步骤如下：

步骤1：首先高速传输数据由高速总线送至接口缓存，FPGA按照DDR/GDDR5时序，快速将接口缓存内数据，存入DDR/GDDR5宽带存储器中。

步骤2：GPU开启N个并行核处理，按照每个处理器处理一帧的分配，并行完成N*M个MPDU组包和N帧AOS帧组帧工作。

步骤3：完成查找表后，根据转发通道表示，将发送N帧AOS并行存储于不通转发通道的DDR/GDDR5存储器区域，并由FPGA根据通道快速转发到不同的数据发送端口，准备发送。

一种基于GPU和粒子群优化算法的高速路由通信系统及方法其高速数据针对特定数据类型转发需求步骤如下：

步骤1：当每帧中包含的短包数据较多时，高速数据在接收与转发流程中，首先高速传输数据由高速总线送至接口缓存，FPGA按照DDR/GDDR5时序，快速将接口缓存内数据，存入DDR/GDDR5宽带存储器中。

步骤2：GPU首先开启N个并行核处理，按照每个处理器处理一帧的分配，并行处理N帧AOS帧拆帧。然后继续开启M个并行核处理器，继续完成每帧中M个MPDU拆包工作，从而并行获取N帧中M个包IP地址，并将本地数据包快速存储DDR/GDDR5存储器本地接收区域。

步骤3：并由FPGA快速转发到本地数据接收总线上；将非本地数据包快速存储DDR/GDDR5存储器非本地转发区域，并由FPGA快速分发到基带转发送链路上。

一种基于GPU和粒子群优化算法的高速路由通信系统及方法，其特征在于，通过以下步骤，实现粒子群优化算法对最短路径并行查找功能：

步骤1，选取起点S到目标点T的路径长度作为粒子适应值，适应值越小，所得解越优。

步骤2，初始化粒子的维数n，粒子数p。初始化粒子Xi(粒子每维的位置、速度在解空间范围内随即初始化)，每个粒子的历史最优值p_Besti即为其本身。由适应度函数式公式计算每个粒子的适应度值，选取适应值最小的粒子记为g_Best；

步骤3，通过GPU模块内部核处理器，并行计算粒子群优化算法的速度更新公式，更新粒子的速度，若v_id＜-V_maxxd，则v_id＝-V_maxxd；若v_id＞V_maxxd，则v_id＝V_maxxd；

步骤4，通过GPU模块内部核处理器，并行计算粒子群优化算法的位置更新公式，更新粒子的位置，若x_id＜X_minxd，则x_id＝X_minxd；若x_id＞X_maxxd，则x_id＝X_maxxd；

步骤5，对每个粒子X_i，根据式(5)计算其适应值，若其适应值小于p_Besti的适应值，则p_Besti＝X_i；

步骤6转步骤3进行迭代，直到算法达到最大迭代次数或满足精度要求时结束。

一种基于GPU和粒子群优化算法的高速路由通信系统及方法，其特征在于,一种基于FFT系数对称特性的查找表优化算法具体通过以下步骤实现：

步骤1，当信噪比Eb/N0≤T_分割值dB时，由于查找表T(i)_table数值分布大小变化较为陡峭，因此在此区间范围内，各查找表维持原样，即查找表数值不进行近似优化处理。

步骤2，当信噪比Eb/N0＞T_分割值dB时，根据数值变化规律进行适当的查找表数值分段共用，以此来缩减查找表大小，具体如下：

a)Eb/N0≥T₁dB且Eb/N0≤T₂dB时，通过分析可知Eb/N0相对均方误差较小，因此在Eb/N0＝T₁与Eb/N0＝T₂的表格系数实现近似共用Eb/N0＝T₁系数；

b)Eb/N0≥T₃dB且Eb/N0≤T₄dB时，FFT系数查找表内部系数实现共用T₃对应的系数；

本发明通过引入粒子群优化算法，得到网络拓扑全局最优路径。并且粒子群算法的引入利于充分调用GPU、AI芯片等多核并行计算性芯片的综合效能，实现比现有规划算法求解更优路径和更好的效果。

本发明具有以下优点：

(1)通过采用大量GPU并行处理单元及DDR/GDDR5宽带高速存储器的直接操作，解决了基于传统CPU类纯软件处理路由数据交换与转发时，存在数据交换速率受限等问题，提升了高速路由器网络数据交换的数据交换吞吐量和并行处理能力；

(2)通过采用基于粒子群优化算法优结合GPU大规模并行计算处理特点，实现了对网络拓扑中，最优路径的快速搜索与更新，提升了路由器路由规划性能。

(3)通过采用一种基于FFT系数对称特性的查找表优化方法，压缩了高速路由通信系统频谱带宽，提升了系统传输的微波射频频谱效能。

附图说明

图1为一种基于GPU和粒子群优化算法的高速路由通信系统结构示意图；

图2为一种基于GPU和粒子群优化算法的高速路由通信系统高速路由管理与控制单元系统框图；

图3为一种基于GPU和粒子群优化算法的高速路由通信方法流程图；

图4为一种基于GPU和粒子群优化算法的高速路由通信方法实施例3流程图；

图5为一种基于GPU和粒子群优化算法的高速路由通信方法的超乃奎斯特压缩(FTN)系统框图；

图6为一种基于GPU和粒子群优化算法的高速路由通信方法的FFT系数查找表优化算法系数矩阵W近似数值与原有数值的误差分析图；

图7为一种基于GPU和粒子群优化算法的高速路由通信方法的FFT系数查找表二维近似优化W矩阵数值误差分析图；

图8为一种基于GPU和粒子群优化算法的高速路由通信方法基于综合查找表优化算法下频域均衡算法的误码率性能(β＝0.5)；

图9为一种基于GPU和粒子群优化算法的高速路由通信方法FTN算法实际环境测试图。

附图标记：

1、通信收发单元；11、收发射频模块；12、基带收发模块；13、时钟管理模块；2、路由管理与数据交换单元；21、综合接口模块；22、综合控制与管理模块；221、CPU处理器；23、GPU模块；231、GPU核处理器；24、数据分发模块；241、FPGA芯片；242、DDR/GDDR5宽带高速存储器。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。

实施例1

如图1-2所示，一种基于GPU和粒子群优化算法的高速路由通信系统，包括通过互联网总线连接的通信收发单元1、路由管理与数据交换单元2和电源单元3；

通信收发单元1包括通过数据线连接的收发射频模块11、基带收发模块12和时钟管理模块13；

路由管理与数据交换单元2包括通过数据线连接的综合接口模块21、综合控制与管理模块22、GPU模块23和数据分发模块24；

综合控制与管理模块22包括CPU处理器221，GPU模块23包括至少2个并行的GPU核处理器231，数据分发模块24包括电连接的FPGA芯片241和DDR/GDDR5宽带高速存储器242，CPU处理器221、FPGA芯片241和DDR/GDDR5宽带高速存储器242均通过数据线连接；

GPU模块23用于通过至少2个并行的GPU核处理器231对数据进行并行协议解析、拆帧组帧、拆包组包和并行交换，GPU核处理器231用于规划网络拓扑结构最优路径、开启并行粒子群优化运算并获得网络拓扑下的全局最优路径；

CPU处理器221与FPGA芯片241用于进行网络数据高速路由与交换；

DDR/GDDR5宽带高速存储器242包括本地接收区域和非本地转发区域；

基带收发模块12使用FTN信号，基带收发模块12使用基于FFT系数对称特性的查找表优化算法；

CPU处理器221用于通过之前接收到的全网网络控制面数据包信息，随时更新网络拓扑信息，并设定粒子群优化算法参数、搜索群规模和粒子向量维度后传递给FPGA芯片241。

实施例2

如图3所示，一种基于GPU和粒子群优化算法的高速路由通信方法，包括以下步骤：

S1、信号接收：微波信号经收发射频模块11的天线接收、低噪信号放大、信号下变频后得到基带信号输出至基带收发模块12，基带信号经过信号滤波、信号采集后变为数字信号，再经过多普勒频偏补偿、载波捕获跟踪、扩频码同步、解括、解调、位同步、帧同步后，得到一帧高度传输数据，高度传输通过数据总线输出至路由管理与数据交换单元2；

S2、高速数据接收与转发：高速传输数据由高速总线送至接口缓存，FPGA芯片241按照DDR/GDDR5宽带高速存储器242的时序，快速将接口缓存内数据存入DDR/GDDR5宽带高速存储器242中；

S3、GPU模块23判断需求是否为特定数据类型转发需求，如果否，进入步骤S4，如果是，进入步骤S5，特定数据类型的判断标准为每帧中包含的短包数据数量；

S4、高速数据拆帧接收：GPU模块23开启N个并行的GPU核处理器231进行处理，按照每个GPU核处理器231处理一帧的分配，并行处理N帧AOS帧拆帧、N*M个MPDU拆包工作，并行获取N帧中M个包IP地址，进入步骤S6；

S5、特定数据类型拆帧接收：GPU模块23首先开启N个并行的GPU核处理器231进行处理，按照每个处理器处理一帧的分配，并行处理N帧AOS帧拆帧，然后继续开启M个并行的GPU核处理器231继续完成每帧中M个MPDU拆包工作，获取N帧中M个包IP地址；

S6、网络路由表更新：CPU处理器221定期向GPU模块23发送网络路由表更新计算请求，GPU模块23收到请求后，通过N个并行的GPU核处理器231启动粒子群优化算法对最短路径并行查找，更新最短路径路由表后留存于查找表存储空间内；

粒子群优化算法包括以下步骤：

SⅠ、CPU处理器221选取起点S到目标点T的路径长度作为粒子适应值；

SⅡ、CPU处理器221初始化粒子的维数n、粒子数p，初始化粒子Xi，每个粒子的历史最优值p_Besti为粒子本身，由适应度函数公式计算每个粒子的适应度值，选取适应值最小的粒子记为g_Best；

SⅢ、GPU核处理器231并行计算粒子群优化算法速度更新公式，将粒子的速度进行更新，若当前粒子速度v_id＜-粒子最大速度V_maxxd，则当前粒子速度v_id＝-粒子最大速度V_maxxd；若当前粒子速度v_id＞粒子最大速度V_maxxd，则当前粒子速度v_id＝粒子最大速度V_maxxd；

SⅣ、GPU核处理器231并行计算粒子群优化算法位置更新公式，将粒子的位置进行更新，若当前粒子位置x_id＜粒子最小位置X_minxd，则当前粒子位置x_id＝粒子最小位置X_minxd；若当前粒子位置x_id＞粒子最大位置X_maxxd，则当前粒子位置x_id＝粒子最大位置X_maxxd；

SⅤ、CPU处理器221通过FPGA芯片241从DDR/GDDR5宽带高速存储器242中得到所有粒子X_i结果，对每个粒子X_i根据粒子群优化位置更新公式，计算适应值，若其适应值小于历史最优值p_Besti的适应值，则历史最优值p_Besti＝粒子X_i；

并行GPU核处理器231，返回步骤SⅢ进行迭代，直到粒子群优化算法达到最大迭代次数或满足精度要求，CPU处理器221从DDR/GDDR5宽带高速存储器242中获取所有粒子X_i结果，并通过计算获得最后的最优适应值和全局最优最短路径结果，粒子群优化算法结束；

S7、比对判断：GPU核处理器231将数据IP与查找表比对，判断数据包是否为本地数据包，如果是，则将本地数据包快速存储至GPU核处理器231的本地接收区域，然后FPGA芯片241并行快速转发到本地数据接收总线上；如果否，则为非本地数据包，GPU核处理器231将非本地数据包快速存储GPU核处理器231的非本地转发区域，并由FPGA芯片241快速分发到基带收发模块12的发送链路上；

S8、数据发送：数字信号由数据总线发送到通信收发单元1，经过调制、编码和扩频后，通过数模转换变成基带模拟信号输出至收发射频模块11，再经过上变频、功率放大后转换为微波信号发往天线设备向外发送；

步骤S1、S8中，基带收发模块12使用FTN信号，基带收发模块12使用基于FFT系数对称特性的查找表优化算法；

基于FFT系数对称特性的查找表优化算法包括以下步骤：

Sb、当信噪比Eb/N0＞T_分割值dB时，根据数值变化规律进行适当的查找表数值分段共用，以缩减查找表大小；

Sb2、当Eb/N0≥T₃dB且Eb/N0≤T₄dB时，FFT系数查找表内部系数实现共用T₃对应的系数，T₃和T₄均为阈值，且T₃＜T₄＜T₂；

步骤Sa、Sb中，T_分割值为25，T1为5，T2为20，T3为7，T4为10；

FTN信号包括FTN基带发送信号，FTN基带发送信号的产生方法为：基带收发模块12对信源的比特数据进行交织，经过QPSK调制后，在调制信号后插入2Np个循环后缀，Np为基带收发模块12中干扰截短长度，并进入成形滤波器，得到FTN基带发送信号。

实施例3

如图4所示，一种基于GPU和粒子群优化算法的高速路由通信系统及方法，完整的数据高速路由与交换，同时包含数据直接产生发送和数据接收转发，本实以此为例，介绍实例流程和具体步骤。

首先，为本地数据产生、查找表产生和数据发送流程：

步骤1:在所述的高速数据接收与转发流程中，首先本地计算机将产生并需要发送给网络中，其他单机的高速传输数据，先由高速总线送至接口缓存，FPGA芯片241按照DDR/GDDR5宽带高速存储器242时序，快速将接口缓存内数据，存入DDR/GDDR5宽带高速存储器242宽带存储器中。

步骤2：由图1、图2可知，路由管理与数据交换单元2中，主控CPU处理器221通过之前接收到的全网网络控制面数据包信息，随时更新网络拓扑信息，并设定粒子群优化算法参数，并设置好搜索群规模，粒子向量维度等信息，并传递给路由FPGA芯片241，用于存放至DDR/GDDR5宽带高速存储器242模块中，并尝试启动基于粒子群优化算法的路由表更新计算。

步骤3：GPU根据CPU处理器221提供的粒子群优化算法的并行计算设计和粒子群优化算法的关键参数信息等，启动并行核处理器，完成基于粒子群优化算法的动态路由表更新计算，并将路由查找表的结果存于特定存储区域，以备数据高速交换时的查表使用。

步骤4:GPU开启N个并行核处理，按照每个处理器处理一帧的分配，并行处理N帧AOS帧拆帧、N*M个MPDU拆包工作，并行获取N帧中M个包IP地址，并根据查找表结果，将本地数据帧根据转发链路端口号，将代发数据快速存储于各自链路的DDR/GDDR5宽带高速存储器242存储器数据代发区域。

步骤5:路由单元中的，交换FPGA芯片241并行快速转发到本地数据接收总线上，将非本地数据包快速存储DDR/GDDR5宽带高速存储器242存储器非本地转发区域，并由FPGA芯片241快速分发到路由通信系统的路由通信基带单元，并完成不通链路上，发送数据的调制编码等工作。

其次，为高速数据接收与转发流程流程：

步骤1：当网络中某台计算机发来数据，并通过读取IP地址可知，数据包需要传送给其他网络中的计算机时，通信系统，首先通过高速总线将接收到其他计算机的高速数据发送并缓存到路由管理与数据交换单元2的接口缓存，FPGA芯片241按照DDR/GDDR5宽带高速存储器242时序，快速将接口缓存内数据，存入DDR/GDDR5宽带高速存储器242宽带存储器中。

步骤2：在传统模式下，路由管理与数据交换单元2中的GPU模块23，随即开启N个并行核处理，按照每个处理器处理一帧的分配，并行完成N*M个MPDU组包和N帧AOS帧组帧工作。

若为帧内短包较多的特定传输模式下，GPU则首先开启N个并行核处理，按照每个处理器处理一帧的分配，并行处理N帧AOS帧拆帧。然后继续开启M个并行核处理器，继续完成每帧中M个MPDU拆包工作，从而并行获取N帧中M个包IP地址，并将本地数据包快速存储DDR/GDDR5宽带高速存储器242存储器本地接收区域。

步骤3：由图2可知，路由管理与数据交换单元2中，主控CPU处理器221通过之前接收到的全网网络控制面数据包信息，随时更新网络拓扑信息，并设定粒子群优化算法参数，并设置好搜索群规模，粒子向量维度等信息，并传递给路由FPGA芯片241，用于存放至DDR/GDDR5宽带高速存储器242模块中，并尝试启动基于粒子群优化算法的路由表更新计算。

步骤4：GPU根据CPU处理器221提供的粒子群优化算法的并行计算设计和粒子群优化算法的关键参数信息等，启动并行核处理器，完成基于粒子群优化算法的动态路由表更新计算，并将路由查找表的结果存于特定存储区域，以备数据高速交换时的查表使用。

步骤5：GPU中用于高速数据路由交换的核处理器，根据最新路由表查询结果，将高速数据根据查找表中的转发通道要求，按序将N帧AOS并行存储于不通转发通道的DDR/GDDR5宽带高速存储器242存储器区域，并由FPGA芯片241根据通道快速转发到不同的数据发送端口，完成数据高速发送流程。

实施例4

一种基于GPU和粒子群优化算法的高速路由通信系统及方法，微波信号捕获跟踪和解扩(如有)/解调译码流程如下：

步骤1：在接收过程中，微波信号，经过天线接收、低噪信号放大、信号下变频后得到IQ两路基带信号。

步骤2：基带信号再经过信号滤波、信号采集后，变为数字量。

步骤3：数字信号在经过，多普勒频偏补偿、载波捕获跟踪、扩频码同步、解扩(如有)、解调、位同步、帧同步后，获得一帧数据Z(n)。

步骤4：通信模块解调FPGA芯片241，完成串并转后，将数据通过数据总线，发往路由管理与数据交换单元2。

一种基于GPU和粒子群优化算法的高速路由通信系统及方法，微波信号调制编码流程如下：

步骤1：在数据发送过程中，数字信号由数据总线发送到通信收发单元1，并由核心调制解调FPGA芯片241完成数字信号调制、编码和扩频(如有)等工作。

步骤2：数字信号，通过DA芯片，实现数模转换工作，完成基带模拟信号。

步骤3：基带信号，经过上变频、功率放大后，微波信号发往天线设备向外发送。

实施例5

一种基于GPU和粒子群优化算法的高速路由通信系统及方法中，基于粒子群优化算法的网络拓扑，最短路径并行查找算法的步骤如下：

步骤1，路由管理与数据交换单元2中，CPU处理器221启动路径选择，设定选取起点S到目标点T的路径长度作为粒子适应值，适应值越小，所得解越优。

步骤2，CPU处理器221初始化粒子的维数n，粒子数p。初始化粒子Xi(粒子每维的位置、速度在解空间范围内随即初始化)，每个粒子的历史最优值pBesti即为其本身。由适应度函数式(5)计算每个粒子的适应度值，选取适应值最小的粒子记为gBest；

步骤3，通过GPU模块23内部核处理器，并行计算式粒子群优化速度更新公式，更新粒子的速度，若v_id＜-V_maxxd，则v_id＝-V_maxxd；若v_id＞V_maxxd，则v_id＝V_maxxd；

步骤3，通过GPU模块23内部核处理器，并行计算式(4)更新粒子的位置，若x_id＜X_minxd，则x_id＝X_minxd；若x_id＞X_maxxd，则x_id＝X_maxxd；

步骤4，CPU处理器221通过FPGA芯片241从DDR/GDDR5宽带高速存储器242中得到所有粒子X_i结果，对每个粒子X_i，根据式粒子群优化位置更新公式，计算其适应值，若其适应值小于pBesti的适应值，则p_Besti＝X_i；

步骤5GPU并行核处理器231，转步骤3进行迭代，直到算法达到最大迭代次数或满足精度要求时结束。

步骤6：CPU处理器221从DDR/GDDR5宽带高速存储器242中获取所有粒子X_i结果，并通过计算获得最后的最优适应值和全局最优最短路径结果。

实施例6

在相同频带资源下，通过压缩成形脉冲间隔，超奈奎斯特(FTN)信号能够有效提高系统的传输速率。基于频域均衡的FTN系统如图5所示。在发射机中，对信源的比特数据进行交织，经过QPSK调制后，在调制信号后插入2Np个循环后缀(Np为接收机中干扰截短长度)，并进入成形滤波器h(t)，得到FTN基带发送信号。其中，脉冲成形的符号间隔为T＝αT0，0<α≤1为FTN信号的时域压缩因子，且α越小对应的系统传输速率越高。一种基于GPU和粒子群优化算法的高速路由通信系统及方法中，一种基于FFT系数对称特性的查找表优化算法具体通过以下步骤实现：

步骤1：本发明中，接收基带信号Eb/N0取值为0～25dB内对比分析，根据FFT查找表数值分布特性分析可知：①在信噪比Eb/N0≤T₁(5dB)时，数值最高峰变化斜率较大，当Eb/N0为T₁(5dB)～T₂(20dB)时，数值变换较为平缓。②当快速傅里叶变换点为NFFT＝

(1,50)和NFFT＝(451,512)时，查找表计算值变化较小。因此，本方法根据上述分布特性，提出如下优化策略：

当信噪比Eb/N0≤T₁时，由于查找表T(i)_table数值分布大小变化较为陡峭，因此在此区间范围内，各查找表维持原样，即查找表数值不进行近似优化处理。

当信噪比Eb/N0＞T₁dB时，根据数值变化规律进行适当的查找表数值分段共用，以此来缩减查找表大小，具体如下：

Eb/N0≥T₃(7dB)且Eb/N0≤T₄(10dB)时，通过分析可知相对均方误差较小，因此在T₃～T₄段内，Eb/N0表格系数实现近似共用Eb/N0＝T₃系数；

同理，Eb/N0≥T₅(11dB)且Eb/N0≤T₆(15dB)时，表格系数实现共用T₆dB的系数；

系数矩阵W的近似优化后，近似数值与原有数值的误差分析，见图6所示。最大误差出现Eb/N0＝T₃(7dB)dB时，约为绝对值约为0.08，后续最大误差峰值逐渐减小。

步骤2：针对分布特性②当快速傅里叶变换点为NFFT＝(1,50)和NFFT＝(451,512)时，查找表计算值变化较小。本方法根据Eb/N0的分布分析，进行了在NFFT变换点数域中，对W系数查找表进行了进一步压缩设计，策略如下：

当Eb/N0≤T₃(7dB)dB时，查找表NFFT轴维持表中数值不变，不进行查找表优化

当Eb/N0≥T₃(7dB)dB且Eb/N0≤T₇(20)dB时，查找表在当快速傅里叶变换点为NFFT＝(1,50)和NFFT＝(451,512)范围处，进行二维近似优化，选用上述二维范围内的均值，统一替代原有数值。

系数矩阵W的二维近似优化后，近似数值与原有数值的误差分析，见图7所示。二维边带处绝对值误差控制在0.04以内。

通过上述两个步骤后，由图7给出了基于FFT系数对称特性的查找表优化设计和基于系数矩阵二维数值近似分布特性的查找表优化设计，两种方法融合后的综合优化设计仿真图，由图8可知，再压缩因子τ＝0.9,干扰截短长度Np＝1,成形系数beta＝0.5时，基于上述两种优化方法下的综合优化设计算法，频域均衡算法的误码率性能与未采用查找表形式的传统优化算法(τ＝0.8、Np＝1、beta＝0.5)时，算法误码率性能一致，新算法采用的有限近似损失，未对解调性能造成影响，综合性能损失小于0.15dB。通过优化改进，新算法计算复杂度降低50％以上,查找表的存储空间降低为原有规模的25％，算法优化效果明显。

本发明开展了FTN算法实际环境测试，通过将上述算法程序移植到是德科技M9010A矢量信号一体化测试平台中，开展了通信系统半实物测试工作。图9分别给出了，当成型系数β＝0.5、干扰截短长度NP＝1时，信号压缩因子τ分别为(曲线由里向外)：τ＝0.5、0.7、0.75、0.8、0.9时的，信号频谱实测图，由图可知，在相同的传输码率下(300Mbps)，传输信号物理带宽，压缩显著，以常用的τ＝0.8时为例，系统物理带宽提升≥25％，FTN算法的实测性能，与算法理论仿真与性能分析结果一致，系统综合频谱效率得到显著提升。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于GPU和粒子群优化算法的高速路由通信方法，其特征在于：包括以下步骤：

S1、信号接收：微波信号经收发射频模块(11)的天线接收、低噪信号放大、信号下变频后得到基带信号输出至基带收发模块(12)，所述基带信号经过信号滤波、信号采集后变为数字信号，再经过多普勒频偏补偿、载波捕获跟踪、扩频码同步、解括、解调、位同步、帧同步后，得到一帧高速传输数据，所述高速传输数据通过数据总线输出至路由管理与数据交换单元(2)；

S2、数据接收与转发：所述高速传输数据由高速总线送至接口缓存，FPGA芯片(241)按照DDR/GDDR5宽带高速存储器(242)的时序，快速将接口缓存内数据存入所述DDR/GDDR5宽带高速存储器(242)中；

S3、GPU模块(23)判断需求是否为特定数据类型转发需求，如果否，进入步骤S4，如果是，进入步骤S5，所述特定数据类型的判断标准为每帧中包含的短包数据数量；

S4、高速数据拆帧接收：GPU模块(23)开启N个并行的GPU核处理器(231)进行处理，按照每个所述GPU核处理器(231)处理一帧的分配，并行处理N帧AOS帧拆帧、N*M个MPDU拆包工作，并行获取N帧中M个包IP地址，进入步骤S6；

S5、特定数据类型拆帧接收：GPU模块(23)首先开启N个并行的所述GPU核处理器(231)进行处理，按照每个处理器处理一帧的分配，并行处理N帧AOS帧拆帧，然后继续开启M个并行的所述GPU核处理器(231)继续完成每帧中M个MPDU拆包工作，获取N帧中M个包IP地址；

S6、网络路由表更新：CPU处理器(221)定期向GPU模块(23)发送网络路由表更新计算请求，所述GPU模块(23)收到请求后，通过N个并行的GPU核处理器(231)启动粒子群优化算法对最短路径并行查找，更新最短路径路由表后留存于查找表存储空间内；

S7、比对判断：所述GPU核处理器(231)将数据IP与查找表比对，判断数据包是否为本地数据包，如果是，则将所述本地数据包快速存储至所述GPU核处理器(231)的本地接收区域，然后所述FPGA芯片(241)并行快速转发到本地数据接收总线上；如果否，则为非本地数据包，所述GPU核处理器(231)将所述非本地数据包快速存储所述GPU核处理器(231)的非本地转发区域，并由所述FPGA芯片(241)快速分发到基带收发模块(12)的发送链路上；

S8、数据发送：数字信号由数据总线发送到通信收发单元(1)，经过调制、编码和扩频后，通过数模转换变成基带模拟信号输出至所述收发射频模块(11)，再经过上变频、功率放大后转换为微波信号发往天线设备向外发送。

2.根据权利要求1所述的一种基于GPU和粒子群优化算法的高速路由通信方法，其特征在于：步骤S6中，所述粒子群优化算法包括以下步骤：

SⅠ、所述CPU处理器(221)选取起点S到目标点T的路径长度作为粒子适应值；

SⅡ、所述CPU处理器(221)初始化粒子的维数n、粒子数p，初始化粒子Xi，每个粒子的历史最优值p_Besti为粒子本身，由适应度函数公式计算每个粒子的适应度值，选取适应值最小的粒子记为g_Best；

SⅢ、所述GPU核处理器(231)并行计算粒子群优化算法速度更新公式，将粒子的速度进行更新，若当前粒子速度v_id＜-粒子最大速度V_maxxd，则当前粒子速度v_id＝-粒子最大速度V_maxxd；若当前粒子速度v_id＞粒子最大速度V_maxxd，则当前粒子速度v_id＝粒子最大速度V_maxxd；

SⅣ、所述GPU核处理器(231)并行计算粒子群优化算法位置更新公式，将粒子的位置进行更新，若当前粒子位置x_id＜粒子最小位置X_minxd，则当前粒子位置x_id＝粒子最小位置X_minxd；若当前粒子位置x_id＞粒子最大位置X_maxxd，则当前粒子位置x_id＝粒子最大位置X_maxxd；

SⅤ、所述CPU处理器(221)通过所述FPGA芯片(241)从所述DDR/GDDR5宽带高速存储器(242)中得到所有粒子X_i结果，对每个粒子X_i根据粒子群优化位置更新公式，计算适应值，若其适应值小于历史最优值p_Besti的适应值，则历史最优值p_Besti＝粒子X_i；

并行所述GPU核处理器(231)，返回步骤SⅢ进行迭代，直到所述粒子群优化算法达到最大迭代次数或满足精度要求，所述CPU处理器(221)从所述DDR/GDDR5宽带高速存储器(242)中获取所有粒子X_i结果，并通过计算获得最后的最优适应值和全局最优最短路径结果，所述粒子群优化算法结束。

3.根据权利要求1所述的一种基于GPU和粒子群优化算法的高速路由通信方法，其特征在于：步骤S1、S8中，所述基带收发模块(12)使用FTN信号，所述基带收发模块(12)使用基于FFT系数对称特性的查找表优化算法。

4.根据权利要求3所述的一种基于GPU和粒子群优化算法的高速路由通信方法，其特征在于：基于FFT系数对称特性的查找表优化算法包括以下步骤：

Sa、当信噪比Eb/N0≤T₁dB时，由于查找表T(i)_table数值分布大小变化陡峭，因此在此区间范围内，各查找表维持原样，查找表数值不进行近似优化处理；

Sb、当信噪比Eb/N0＞T₁dB时，根据数值变化规律进行适当的查找表数值分段共用，以缩减查找表大小。

5.根据权利要求4所述的一种基于GPU和粒子群优化算法的高速路由通信方法，其特征在于：步骤Sb包括以下步骤：

Sb1、当Eb/N0≥T₃dB且Eb/N0≤T₄dB时，Eb/N0相对均方误差小，在T₃～T₄段内，Eb/N0表格系数实现近似共用Eb/N0＝T₃系数；

Sb2、当Eb/N0≥T₅dB且Eb/N0≤T₆dB时，FFT系数查找表内部系数实现共用T₆对应的系数；

步骤Sa、Sb中，T1为5，T3为7，T4为10，T5为11，T6为15。

6.根据权利要求3所述的一种基于GPU和粒子群优化算法的高速路由通信方法，其特征在于：所述FTN信号包括FTN基带发送信号，所述FTN基带发送信号的产生方法为：基带收发模块(12)对信源的比特数据进行交织，经过QPSK调制后，在调制信号后插入2Np个循环后缀，Np为所述基带收发模块(12)中干扰截短长度，并进入成形滤波器，得到所述FTN基带发送信号。

7.根据权利要求1所述的一种基于GPU和粒子群优化算法的高速路由通信方法的通信系统，其特征在于：包括通过互联网总线连接的通信收发单元(1)、路由管理与数据交换单元(2)和电源单元(3)；

所述通信收发单元(1)包括通过数据线连接的收发射频模块(11)、基带收发模块(12)和时钟管理模块(13)；

所述路由管理与数据交换单元(2)包括通过数据线连接的综合接口模块(21)、综合控制与管理模块(22)、GPU模块(23)和数据分发模块(24)；

所述综合控制与管理模块(22)包括CPU处理器(221)，所述GPU模块(23)包括至少2个并行的GPU核处理器(231)，所述数据分发模块(24)包括电连接的FPGA芯片(241)和DDR/GDDR5宽带高速存储器(242)，所述CPU处理器(221)、所述FPGA芯片(241)和所述DDR/GDDR5宽带高速存储器(242)均通过数据线连接；

所述GPU模块(23)用于通过至少2个并行的所述GPU核处理器(231)对数据进行并行协议解析、拆帧组帧、拆包组包和并行交换，所述GPU核处理器(231)用于规划网络拓扑结构最优路径、开启并行粒子群优化运算并获得网络拓扑下的全局最优路径；

所述CPU处理器(221)与所述FPGA芯片(241)用于进行网络数据高速路由与交换。

8.根据权利要求7所述的一种基于GPU和粒子群优化算法的高速路由通信系统，其特征在于：所述DDR/GDDR5宽带高速存储器(242)包括本地接收区域和非本地转发区域；

所述基带收发模块(12)使用FTN信号，所述基带收发模块(12)使用基于FFT系数对称特性的查找表优化算法。

9.根据权利要求1所述的一种基于GPU和粒子群优化算法的高速路由通信系统，其特征在于：所述CPU处理器(221)用于通过之前接收到的全网网络控制面数据包信息，随时更新网络拓扑信息，并设定粒子群优化算法参数、搜索群规模和粒子向量维度后传递给所述FPGA芯片(241)。