CN111597141B

CN111597141B - 一种面向超高阶互连芯片的分级交换结构及死锁避免方法

Info

Publication number: CN111597141B
Application number: CN202010402657.6A
Authority: CN
Inventors: 卢凯; 王强; 赖明澈; 常俊胜; 陆平静; 齐星云; 戴艺; 吕方旭; 徐佳庆; 曹继军; 肖灿文; 刘路
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2020-05-13
Filing date: 2020-05-13
Publication date: 2022-02-08
Anticipated expiration: 2040-05-13
Also published as: US20210359958A1; CN111597141A; US11343203B2

Abstract

本发明公开了一种面向超高阶互连芯片的分级交换结构及死锁避免方法，本发明的分级交换结构包括片上网络和K个多端口组件，多端口组件包括：端口模块，用于通过高速串行/解串器接收报文、对报文进行编码和格式转换后发送至对应的报文检查模块，以及将报文检查模块发送的报文发送到网络中；报文检查模块，用于对接收到的数据链路层的报文进行协议处理，丢弃非法报文，将合法报文转发给片上网络，以及用于对从片上网络接收到的报文进行数据校验、格式转换和通道映射，并报文发送至对应的端口模块。本发明能够提高网络交换效率，降低报文交换延迟，有效避免超高阶互连芯片中的报文交换中的死锁问题，可广泛用于超高阶芯片设计中。

Description

一种面向超高阶互连芯片的分级交换结构及死锁避免方法

技术领域

本发明涉及互连芯片技术，具体涉及一种面向超高阶互连芯片的分级交换结构及死锁避免方法。

背景技术

高速互连网络属于高性能计算系统核心关键部件，是影响性能和规模均衡扩展的最重要因素之一。高性能计算机性能提升主要通过提高系统并行性来实现。由于受到摩尔定律影响处理器发展速率放缓，E级高性能计算系统中计算核数势必按照指数增长，这将给高性能互连网络性能功耗都带来了巨大挑战。未来E量级计算机系统互连功耗预算约3～4兆瓦，结点注入速率400Gbps，网络规模支持10～20万结点。如果采用传统高速互连技术将无法满足上述指标需求，将面临系统成本功耗难以承受、互连网络工程化密度难以提高等多方面挑战。

在高性能系统互连网络中，要想获得更低的网络延迟，网络中路由器的最佳阶数k将随着高性能计算机技术进步而增长，k将不断向更高阶方向发展。现基于高阶路由器交换芯片的高性能互连网络已成为主流趋势，互连芯片向更高阶方向发展是实现低功耗、高密度互连网络的必然选择。目前互连网络技术以高速串行/解串器（SerDes）速率为代际特征持续发展，使路由器片上集成SerDes速率和数量进一步增加，未来互连芯片朝向更高阶方向发展成为一种趋势。2013年克雷公司XC系列高速网络配置了48端口互连交换芯片Aries，单个端口速率3通道×14Gbps。2014年天河高性能计算机高速互连网络配置了24端口网络交换芯片，SerDes速率14Gbps，相对天河一号网络交换芯片16端口和10Gbps SerDes速率显著改善；2015年天河二号升级新一代全自主高阶增强倍速（Enhanced Data Rate，简称EDR）互连网络，端口数量达到48。Menallox公司在2015年推出了36 端口EDR无限带宽（InfiniBand）高速网络，2019年再次推出了多达80端口的HDR交换芯片。IBM 公司则将高阶理念发挥至极致，研究了单端口1Lane×25Gbps，集成136端口的鹞式网络。上述克雷公司也在2016年在XC超级计算机网络配置了48端口互连交换芯片Aries，2020年再次推出Slingshot互连芯片，端口数量多达64，聚合带宽到达12.8Tbps。

随着超高阶互连芯片（High radix Network Router，简称NR）中交换端口数量的增加，导致交换端口占用网络资源过多、交换延迟高、缓冲区资源不足，进而可能导致出现芯片死锁。因此基于系统互连网络超高阶交换芯片设计的主流趋势，如何面向超高阶互连芯片的分级交换结构，并设计分级交换结构中的死锁避免方法，来满足未来低成本、低功耗、高密度系统互连网络搭建需求，已经成为一项亟待解决的关键技术问题。

发明内容

本发明要解决的技术问题：针对现有的超高阶互连芯片中交换端口多导致的占用网络资源过多、交换延迟高、缓冲区资源不足可能导致出现芯片死锁等特点，提供一种面向超高阶互连芯片的分级交换结构及死锁避免方法，本发明能够提高网络交换效率，降低报文交换延迟，有效避免超高阶互连芯片中的报文交换中的死锁问题，可广泛用于超高级芯片设计中。

为了解决上述技术问题，本发明采用的技术方案为：

一种面向超高阶互连芯片的分级交换结构，包括片上网络和K个用于汇聚多个交换端口的多端口组件，所述多端口组件包括：端口模块，用于通过高速串行/解串器接收来自网络中的报文，对报文进行编码和格式转换后发送至对应的报文检查模块，以及将对应的报文检查模块发送的报文通过高速串行/解串器发送到网络中；报文检查模块，用于对接收到的数据链路层的报文进行协议处理，丢弃非法报文，将合法报文转发给片上网络进行交换，以及用于对从片上网络接收到的报文进行数据校验、格式转换和通道映射，并将报文发送至对应的端口模块。

可选地，所述端口模块包括物理编码子层子模块和M个数据链路层协议子模块，所述物理编码子层子模块通过高速串行/解串器与网络相连、且分别通过M个数据链路层协议子模块与报文检查模块相连，所述物理编码子层子模块用于对报文数据进行对齐和重组，所述数据链路层协议子模块用于对报文格式转换和协议处理。

可选地，所述报文检查模块包括输入报文检查逻辑和输出报文检查逻辑，所述输入报文检查逻辑包括M个完全相同的端口协议处理逻辑、第一选择器部件、动态分配多队列部件以及第二选择器部件，所述端口协议处理逻辑包括报文检查部件、路由计算部件、ECC校验部件、先进先出队列缓冲，所述报文检查部件、路由计算部件两者并联后再通过ECC校验部件与先进先出队列缓冲的输入端相连，来自端口模块的报文比输入到对应的端口协议处理逻辑中，第一选择器部件轮流选择各个端口协议处理逻辑中的报文并存储在动态分配多队列部件中，所述第二选择器部件用于将动态分配多队列部件中存储的报文输出至片上网络。

可选地，所述输出报文检查逻辑包括数据校验部件、虚通道映射部件和M个完全相同的报文格式转换部件，来自片上网络的报文依次通过数据校验部件、虚通道映射部件后通过报文格式转换部件输出至端口模块。

可选地，所述报文检查部件包括依次相连的报文分区检查逻辑、序列报文检查逻辑和报文正确性检查逻辑。

可选地，所述路由计算部件包括依次相连的路由地址计算逻辑、路由地址查表逻辑、路由地址校验逻辑以及路由方式选择逻辑。

可选地，所述动态分配多队列部件为由16虚通道共享缓冲的存储器构成，且设置每两个端口协议处理逻辑共享1个16虚通道共享缓冲的存储器。

可选地，每一个动态分配多队列部件包含用于记录报文尾切片是否到达和到达时的异常检测信息的尾切片队列、用于记录头切片信息和头切片到达时的异常检测信息即路由计算信息的控制队列、以及用于记录数据有效载荷以及ECC数据保护信息的数据队列。

此外，本发明还提供一种前述面向超高阶互连芯片的分级交换结构的死锁避免方法，实施步骤包括：

1）第u个多端口组件的端口模块PORT_u通过高速串行/解串器接收来自网络中的报文；

2）所述端口模块PORT_u对报文进行编码和格式转换后发送至第u个多端口组件的报文检查模块HP_u；所述报文检查模块HP_u对接收到的数据链路层的报文进行协议处理，丢弃非法报文，将合法报文转发给片上网络进行交换；

3）片上网络对从报文检查模块HP_u接收到的报文根据报文的控制信息进行行列交换，将报文发送至对应的第v个多端口组件的报文检查模块HP_v；

4）所述报文检查模块HP_v对从片上网络接收到的报文进行数据校验、格式转换和通道映射，并将报文发送至第v个多端口组件的端口模块PORT_v；所述端口模块PORT_v对报文进行格式转换和协议处理后将报文通过高速串行/解串器发送至下一级网络交换芯片或者网络接口芯片。

可选地，步骤2）的详细步骤包括：端口模块PORT_u的物理编码子层子模块对接收报文进行重组和对齐并转发给对应的数据链路层协议子模块LLP_x处理；所述数据链路层协议子模块处理LLP_x对报文进行编码、校验并发送给第u个多端口组件的报文检查模块HP_u中对应的端口协议处理逻辑HPORT_x；所述端口协议处理逻辑HPORT_x根据报文的虚通道号s向片上网络的接收端虚通道的第x*M*P+x*P+s个虚通道共享缓冲发送报文，其中x和s为整数，且满足0≤x≤M-1，0≤s≤P-1，其中P为每个缓冲区对应的虚通道数目，即每个报文可选择从P个虚通道之一进行发送或接收；步骤3）的详细步骤包括：片上网络从接收端虚通道缓冲区提取报文进行行列交换，然后存储至片上网络的发送端虚通道缓冲区，片上网络从第t个发送端虚通道缓冲区VC_t抽取报文向第v个多端口组件的报文检查模块HP_v内的报文格式转换部件GB_y发送报文，其中t与y均为整数，0≤t≤M*M*P-1，0≤y≤M-1，y=t%(M*P)，y为t除以M* P的余数；步骤4）的详细步骤包括：所述报文检查模块HP_v对接收的片上网络报文进行校验、通道映射并通过第y个报文格式转换部件GB _y转换为数据链路层协议报文，将该报文发送给第v个多端口组件的端口模块PORT_v中的数据链路层协议子模块LLP_y；所述数据链路层协议子模块LLP_y对报文进行解析后发往所述端口模块PORT_v中的物理编码子层子模块；所述物理编码子层子模块对报文进行重组和对齐处理后通过高速串行/解串器发往高速网络中的下一级网络交换芯片或者网络接口芯片。

和现有技术相比，本发明具有下述优点：

1、本发明在超高阶互连芯片内部设置多端口组件和片上网络两级交换结构；多端口组件中的交换采用了报文检查和路由计算的并行处理方式，报文的检查可以在一个时钟周期内完成，路由计算可以在3个时钟周期内完成，使用本发明的设计可以实现报文检查和路由计算的并行执行，可有效减少报文协议解析的时序路径长度，节约硬件资源。

2、本发明能够在网络交换中的多端口组件和片上网络中无死锁交换，避免网络交换芯片中数据拥堵导致的死锁问题，实现了网络交换芯片中网络报文高带宽、低延迟的数据传输；

附图说明

图1是本发明实施例中的分级交换总体结构示意图。

图2是本发明实施例中的多端口组件的结构示意图。

图3是本发明实施例中的报文检查模块的入口协议处理结构。

图4是本发明实施例中的网络交换芯片的死锁避免方法的流程图。

具体实施方式

如图1所示，本实施例中面向超高阶互连芯片的分级交换结构包括片上网络和K个用于汇聚多个交换端口的多端口组件（第0 MPORT模块,…,第k MPORT模块,…,第K-1MPORT模块）。记超高阶互连芯片的交换端口数目为N，每M个交换端口汇聚为一个多端口组件，K个多端口组件的报文通过片上网络（Network On Chip，简称NOC）进行全交换，K个多端口组件结构完全相同，M、N、K、k为整数，M为N的因子，即N可被M整除，K=N/M，0≤k≤K-1。网络交换芯片中报文交换可分为两级：多端口组件内的报文交换和片上网络中的报文交换。

如图2所示，多端口组件包括：

端口模块（简称PORT模块），用于通过高速串行/解串器（即SerDes）接收来自网络中的报文，对报文进行编码和格式转换后发送至对应的报文检查模块，以及将对应的报文检查模块发送的报文通过高速串行/解串器发送到网络中；

报文检查模块（简称HP模块），用于对接收到的数据链路层的报文进行协议处理，丢弃非法报文，将合法报文转发给片上网络进行交换，以及用于对从片上网络接收到的报文进行数据校验、格式转换和通道映射，并将报文发送至对应的端口模块。

记第k个多端口组件中的端口模块和报文检查模块分别为PORT_k和HP_k。若第u个多端口组件为输入端口、第v个多端口组件为输出端口，则有：第u个多端口组件中的端口模块PORT_u通过高速串行/解串器接收来自网络中的报文，对报文进行编码和格式转换后发送至报文检查模块HP_u。报文检查模块HP_u对接收到的数据链路层的报文进行协议处理，丢弃非法报文，将合法报文转发给片上网络进行交换。片上网络对从报文检查模块HP_u收到的报文根据报文的控制信息进行行列交换，将报文发送至对应的第v个多端口组件中的报文检查模块HP_v。报文检查模块HP_v对从片上网络接收到的报文进行数据校验、格式转换和通道映射，并将报文发送至端口模块PORT_v。端口模块PORT_v对报文进行格式转换和协议处理后将报文通过高速串行/解串器发送至下一级NR芯片进行交换。其中，u、v为整数，0≤u≤K-1，0≤v≤K-1。

如图2所示，端口模块包括物理编码子层（Physical Coding Sublayer，简称PCS）子模块和M个数据链路层协议（Link Level Protocol，简称LLP）子模块（LLP₀～LLP_M-1），物理编码子层子模块通过高速串行/解串器与网络相连、且分别通过M个数据链路层协议子模块（LLP₀～LLP_M-1）与报文检查模块相连，物理编码子层子模块用于对报文数据进行对齐和重组，数据链路层协议子模块（LLP₀～LLP_M-1）用于对报文格式转换和协议处理。

如图2所示，报文检查模块包括输入报文检查逻辑（HP_Ingress）和输出报文检查逻辑（HP_Egress），输入报文检查逻辑（HP_Ingress）用于从端口模块的数据链路层协议子模块接收数据链路层协议报文，对高速报文协议进行处理，负责进行报文合法性检查、分区检查、跳步数检查、通道切换、路由计算以及报文的格式转换，丢弃非法报文，做好相关记录，将合法报文转发给片上网络进行交换，最后通过片上网络将合法报文传递到数据链路层协议端口发送给下一级网络交换芯片（NR芯片）；输出报文检查逻辑（HP_Egress）用于从片上网络接收报文，对片上网络报文进行数据校验、通道映射以及格式转换，将片上网络报文转换为数据链路层协议报文，提交给端口模块中的数据链路层协议子模块。

如图2和图3所示，输入报文检查逻辑（HP_Ingress）包括M个完全相同的端口协议处理逻辑（HPORT₀～HPORT_M-1）、第一选择器部件（Mux4）、动态分配多队列(DynamicAllocated Multi-Queue, 简称DAMQ)部件以及第二选择器部件（Mux32），以HPORT_i表示第i个端口协议处理逻辑，i为整数且0≤i≤M-1。

如图2和图3所示，端口协议处理逻辑包括报文检查部件、路由计算部件（RoutingComputing，简称RC）、ECC校验部件（Error Correcting Code Generator，简称ECC_GEN）、先进先出队列缓冲（First In First Out，简称FIFO），报文检查部件、路由计算部件两者并联后再通过ECC校验部件与先进先出队列缓冲的输入端相连，来自端口模块的报文比输入到对应的端口协议处理逻辑中，第一选择器部件轮流选择各个端口协议处理逻辑中的报文并存储在动态分配多队列部件中，第二选择器部件用于将动态分配多队列部件中存储的报文输出至片上网络。

如图2和图3所示，输出报文检查逻辑（HP_Egress）包括数据校验部件（Data ErrorCorrecting，简称DEC）、虚通道映射部件（Virtual Channel to Virtual Channel，简称VC2VC）和M个完全相同的报文格式转换部件（GearBox，简称GB），来自片上网络的报文依次通过数据校验部件、虚通道映射部件后通过报文格式转换部件输出至端口模块。

如图3所示，报文检查部件包括依次相连的报文分区检查逻辑（Partition KeyChecking，简称PKC）、序列报文检查逻辑（Sequence Packet Checking，简称SPC）和报文正确性检查逻辑（Packet Checking，简称PC）。需要说明的是，报文正确性检查、报文分区检查均为对报文的格式进行校验，序列报文检查为对报文的序号连续性进行检查，上述检查均为现有技术，故在此不再赘述。

如图3所示，路由计算部件包括依次相连的路由地址计算逻辑rtb_addr_gen、路由地址查表逻辑rtb_mem、路由地址校验逻辑rtb_ecc_chk以及路由方式选择逻辑rtb_port_select。需要说明的是，路由地址计算、路由地址查表、路由地址校验、路由方式选择均为路径路径处理的常规方式，故在此不再详述。

参见前文可知，本实施例中每个端口协议处理逻辑中采用报文检查和路由计算的并行处理方式。每个端口协议处理逻辑从端口模块接收报文，报文检查部件和路由计算部件并行进行报文检查和路由计算后，将合法报文和路由计算结果发送给ECC校验逻辑。ECC校验逻辑对报文关键信息进行保护，将报文数据信息、控制信息以及校验信息存入端口协议处理逻辑的先进先出队列缓冲，随后第一选择器部件循环读取各个端口协议处理逻辑的先进先出队列缓冲中数据并存入动态分配多队列部件的缓冲区中。

本实施例中，动态分配多队列部件为由16虚通道共享缓冲的存储器构成，且设置每两个端口协议处理逻辑共享1个16 虚通道共享缓冲的存储器。记NR芯片核心时钟频率为C MHZ，LLP报文长度为W ₁ bits，单个DAMQ输入数据宽度为W ₂ bits，则LLP输入最大带宽为W ₁ *C bps，动态分配多队列部件的最大输入带宽为W ₂ *C bps。C、W ₁ 、W ₂为正整数，并且2*W ₁ ≤ W ₂。为了避免网络拥塞，本实施例中设置每两个端口协议处理逻辑共享1个16虚通道共享缓冲的存储器。第一选择器部件通过无缝隙的对来自不同端口协议处理逻辑组合的报文切片进行循环优先级调度，来确保各个端口协议处理逻辑内部的先进先出队列缓冲的缓冲区不会出现异常。

如图3所示，每一个动态分配多队列部件包含用于记录报文尾切片是否到达和到达时的异常检测信息的尾切片队列（简称TAIL DAMQ）、用于记录头切片信息和头切片到达时的异常检测信息即路由计算信息的控制队列（简称CRTL DAMQ）、以及用于记录数据有效载荷以及ECC数据保护信息的数据队列（简称DATA DAMQ）。在网络交换芯片内对数据通路的数据进行ECC保护，数据通路内一共有3类缓冲：输入缓冲、行缓冲和列缓冲。所有的缓冲都带ECC编码，又分为数据缓冲和控制缓冲。行缓冲区的值包括头尾、虚通道、目的Tile的行号、目的端口号、是否保序、是否转维信息用于仲裁，数据缓冲根据仲裁结果传递数据。针对控制缓冲为了保证数据正确性，每次读写都会进行ECC校验操作；针对数据缓冲，进入输入缓冲进行ECC编码操作，从列缓冲读出数据进行ECC解码操作。对于CRTL DAMQ和TAIL DAMQ都具有ECC编码保护，但是对于DATA DAMQ在HP输入端口进行ECC计算，在HP的输出端口进行分ECC校验。由于DATA DAMQ宽度比较大，将DAMQ分为TAIL DAMQ、CRTL DAMQ和DATA DAMQ，并且DATA DAMQ在报文检查模块的输入端口进行ECC计算，在报文检查模块的输出端口进行分ECC校验，这样做的好处在于可以全芯片保护数据，但可以有效节省硬件资源，避免出现不必要的时序关键路径。

第一选择器部件（Mux4）用于从动态分配多队列部件的缓冲区中读取报文，根据报文的目的端口号和报文的虚通道号产生片上网络报文发送给片上网络进行交换。发往片上网络的报文根据报文中的控制信息字段选择在片上网络中将报文进行行列交换，并将报文传送至对应的片上网络输出端口发送给网络交换芯片中的其他多端口部件。

在网络交换芯片中采用基于信用控制的方式进行报文的传输，该方式具有传输速率高、传输延迟低、无丢失数据包等优势。但是，当交换节点或者目的节点的负载超过网络最大处理能力时网络拥塞将发生，产生芯片死锁，从而降低网络整体性能。为了实现N个端口的报文无死锁交换，本实施例进一步提供一种采用上述分级交换结构进行死锁避免的方法，用于在网络交换芯片中的报文检查和片上网络中实现无死锁交换，避免网络交换芯片中由于数据拥堵导致的死锁问题。如前文所记，在每个报文检查模块内有M个交换端口，每个端口模块内有M个数据链路层协议子模块。网络报文通过P个VC传输，在片上网络中设定M*M*P个接收端VC缓冲和发送端VC缓冲，P为正整数。如图4所示，本实施例还提供的面向超高阶互连芯片的分级交换结构的死锁避免方法的实施步骤包括：

2）端口模块PORT_u对报文进行编码和格式转换后发送至第u个多端口组件的报文检查模块HP_u；报文检查模块HP_u对接收到的数据链路层的报文进行协议处理，丢弃非法报文，将合法报文转发给片上网络进行交换；

4）报文检查模块HP_v对从片上网络接收到的报文进行数据校验、格式转换和通道映射，并将报文发送至第v个多端口组件的端口模块PORT_v；端口模块PORT_v对报文进行格式转换和协议处理后将报文通过高速串行/解串器发送至下一级网络交换芯片或者网络接口芯片。

本实施例中，步骤2）的详细步骤包括：端口模块PORT_u的物理编码子层子模块对接收报文进行重组和对齐并转发给对应的数据链路层协议子模块LLP_x处理；所述数据链路层协议子模块处理LLP_x对报文进行编码、校验并发送给第u个多端口组件的报文检查模块HP_u中对应的端口协议处理逻辑HPORT_x；所述端口协议处理逻辑HPORT_x根据报文的虚通道号s向片上网络的接收端虚通道的第x*M*P+x*P+s个虚通道共享缓冲发送报文，其中x和s为整数，且满足0≤x≤M-1，0≤s≤P-1，其中P为每个缓冲区对应的虚通道数目，即每个报文可选择从P个虚通道之一进行发送或接收。

本实施例中，步骤3）的详细步骤包括：片上网络从接收端虚通道缓冲区提取报文进行行列交换，然后存储至片上网络的发送端虚通道缓冲区，片上网络从第t个发送端虚通道缓冲区VC_t抽取报文向第v个多端口组件的报文检查模块HP_v内的报文格式转换部件GB_y发送报文，其中t与y均为整数，0≤t≤M*M*P-1，0≤y≤M-1，y=t%(M*P)，y为t除以M*P的余数。

本实施例中，步骤4）的详细步骤包括：所述报文检查模块HP_v对接收的片上网络报文进行校验、通道映射并通过第y个报文格式转换部件GB _y转换为数据链路层协议报文，将该报文发送给第v个多端口组件的端口模块PORT_v中的数据链路层协议子模块LLP_y；所述数据链路层协议子模块LLP_y对报文进行解析后发往所述端口模块PORT_v中的物理编码子层子模块；所述物理编码子层子模块对报文进行重组和对齐处理后通过高速串行/解串器发往高速网络中的下一级网络交换芯片或者网络接口芯片。

以上所述仅是本发明的优选实施方式，本发明的保护范围并不仅局限于上述实施例，凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理前提下的若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种面向超高阶互连芯片的分级交换结构，其特征在于，包括片上网络和K个用于汇聚多个交换端口的多端口组件，所述多端口组件包括：端口模块，用于通过高速串行/解串器接收来自网络中的报文，对报文进行编码和格式转换后发送至对应的报文检查模块，以及将对应的报文检查模块发送的报文通过高速串行/解串器发送到网络中；报文检查模块，用于对接收到的数据链路层的报文进行协议处理，丢弃非法报文，将合法报文转发给片上网络进行交换，以及用于对从片上网络接收到的报文进行数据校验、格式转换和通道映射，并将报文发送至对应的端口模块。

2.根据权利要求1所述的面向超高阶互连芯片的分级交换结构，其特征在于，所述端口模块包括物理编码子层子模块和M个数据链路层协议子模块，所述物理编码子层子模块通过高速串行/解串器与网络相连、且分别通过M个数据链路层协议子模块与报文检查模块相连，所述物理编码子层子模块用于对报文数据进行对齐和重组，所述数据链路层协议子模块用于对报文格式转换和协议处理。

3.根据权利要求2所述的面向超高阶互连芯片的分级交换结构，其特征在于，所述报文检查模块包括输入报文检查逻辑和输出报文检查逻辑，所述输入报文检查逻辑包括M个完全相同的端口协议处理逻辑、第一选择器部件、动态分配多队列部件以及第二选择器部件，所述端口协议处理逻辑包括报文检查部件、路由计算部件、ECC校验部件、先进先出队列缓冲，所述报文检查部件、路由计算部件两者并联后再通过ECC校验部件与先进先出队列缓冲的输入端相连，来自端口模块的报文比输入到对应的端口协议处理逻辑中，第一选择器部件轮流选择各个端口协议处理逻辑中的报文并存储在动态分配多队列部件中，所述第二选择器部件用于将动态分配多队列部件中存储的报文输出至片上网络。

4.根据权利要求3所述的面向超高阶互连芯片的分级交换结构，其特征在于，所述输出报文检查逻辑包括数据校验部件、虚通道映射部件和M个完全相同的报文格式转换部件，来自片上网络的报文依次通过数据校验部件、虚通道映射部件后通过报文格式转换部件输出至端口模块。

5.根据权利要求3所述的面向超高阶互连芯片的分级交换结构，其特征在于，所述报文检查部件包括依次相连的报文分区检查逻辑、序列报文检查逻辑和报文正确性检查逻辑。

6.根据权利要求3所述的面向超高阶互连芯片的分级交换结构，其特征在于，所述路由计算部件包括依次相连的路由地址计算逻辑、路由地址查表逻辑、路由地址校验逻辑以及路由方式选择逻辑。

7.根据权利要求3所述的面向超高阶互连芯片的分级交换结构，其特征在于，所述动态分配多队列部件由16虚通道共享缓冲的存储器构成，且设置每两个端口协议处理逻辑共享1个16虚通道共享缓冲的存储器。

8.根据权利要求3所述的面向超高阶互连芯片的分级交换结构，其特征在于，每一个动态分配多队列部件包含用于记录报文尾切片是否到达和到达时的异常检测信息的尾切片队列、用于记录头切片信息和头切片到达时的异常检测信息即路由计算信息的控制队列、以及用于记录数据有效载荷以及ECC数据保护信息的数据队列。

9.一种权利要求1～8中任意一项所述的面向超高阶互连芯片的分级交换结构的死锁避免方法，其特征在于实施步骤包括：

10.根据权利要求9所述的面向超高阶互连芯片的分级交换结构的死锁避免方法，其特征在于，步骤2）的详细步骤包括：端口模块PORT_u的物理编码子层子模块对接收报文进行重组和对齐并转发给对应的数据链路层协议子模块LLP_x处理；所述数据链路层协议子模块处理LLP_x对报文进行编码、校验并发送给第u个多端口组件的报文检查模块HP_u中对应的端口协议处理逻辑HPORT_x；所述端口协议处理逻辑HPORT_x根据报文的虚通道号s向片上网络的接收端虚通道的第x*M*P+x*P+s个虚通道共享缓冲发送报文，其中x和s为整数，且满足0≤x≤M-1，0≤s≤P-1，其中P为每个缓冲区对应的虚通道数目，即每个报文可选择从P个虚通道之一进行发送或接收；步骤3）的详细步骤包括：片上网络从接收端虚通道缓冲区提取报文进行行列交换，然后存储至片上网络的发送端虚通道缓冲区，片上网络从第t个发送端虚通道缓冲区VC_t抽取报文向第v个多端口组件的报文检查模块HP_v内的报文格式转换部件GB_y发送报文，其中t与y均为整数，0≤t≤M*M*P-1，0≤y≤M-1，y=t%(M*P)，y为t除以M*P的余数；步骤4）的详细步骤包括：所述报文检查模块HP_v对接收的片上网络报文进行校验、通道映射并通过第y个报文格式转换部件GB _y转换为数据链路层协议报文，将该报文发送给第v个多端口组件的端口模块PORT_v中的数据链路层协议子模块LLP_y；所述数据链路层协议子模块LLP_y对报文进行解析后发往所述端口模块PORT_v中的物理编码子层子模块；所述物理编码子层子模块对报文进行重组和对齐处理后通过高速串行/解串器发往高速网络中的下一级网络交换芯片或者网络接口芯片。