CN110247970A

CN110247970A - 一种互连芯片动态共享缓冲装置

Info

Publication number: CN110247970A
Application number: CN201910520343.3A
Authority: CN
Inventors: 肖立权; 黎渊; 常俊胜; 赖明澈; 齐星云; 戴艺; 肖灿文; 徐金波; 孙岩; 欧洋; 熊泽宇
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2019-06-17
Filing date: 2019-06-17
Publication date: 2019-09-17
Anticipated expiration: 2039-06-17
Also published as: CN110247970B

Abstract

针对现有超级计算机高速互连网络交换机中高数据位宽DAMQ在后端物理设计复杂性过大的技术问题，本发明提供一种互连芯片动态共享缓冲装置，包括：报文拆分逻辑、控制码组合逻辑、数据DAMQ和控制DAMQ，一个数据输入端口、一个读请求输入端口和一个数据输出端口；记控制DAMQ为DAMQ_CTRL，数据DAMQ为DAMQ_DATA。本发明通过将报文中的控制信息与数据分离，报文写入DAMQ时会被拆分成两部分，其中报文数据部分被写入DAMQ_DATA，报文的控制信息以及报文数据存储在DAMQ_DATA中的地址则被组合起来写入DAMQ_CTRL，DAMQ_CTRL通过控制码中的地址从DAMQ_DATA读出报文数据。本发明可以将DAMQ所需的寄存器数量降低为现有技术的2％左右，大幅降低后端布局布线困难，并降低物理设计成本。

Description

一种互连芯片动态共享缓冲装置

技术领域

本发明涉及超级计算机高速互连网络交换机输入端口的输入缓冲区，特别是一种互连芯片动态共享缓冲装置。

背景技术

互连网络是超级计算机的关键部件，用于实现超级计算机中的计算节点、输入输出节点、服务节点之间的高速数据传输与交换。

交换机是高速互连网络的核心设备，一般采用交叉开关来实现。交换机的内部结构主要包括数据缓冲区和交叉开关，数据缓冲区用于缓存不能及时处理的数据，交叉开关用于在不同的网络端口之间交换数据。交换机常用的数据缓冲方式有：输入缓冲，输出缓冲，输入输出联合缓冲，交叉点缓冲等。由于输入缓冲实现简单，成为交叉开关普遍采用的缓冲方式。随着交换机端口数目的增加，交换机采用多级交换结构，每一个输入端口和每一级交换的输入端口都需要缓冲区缓存报文，导致交换机中缓冲区的数目急剧增加。为了减小缓冲区占用的芯片面积，降低实现缓冲区的存储器带来的功耗开销，交换机中采用动态分配共享缓冲区管理方法，提高缓冲区利用率，减小缓冲区深度。具体做法是，为交换机每个输入端口设置一个缓冲区，由所有虚信道(Virtual Channel，VC)共享，输入端口接收到的数据被随机地缓存在共享缓冲区中，通过地址管理保证数据能够被正确的写入和读出。采用动态分配共享缓冲区可以提高缓冲区利用率，只要缓冲区中有空闲空间就可以接收任何一个VC的数据。我们将这种缓冲区称作多VC动态共享缓冲区。为了提高链路利用率，互连网络中的物理链路被划分为多个虚信道。在交换机的输入缓冲区中，设置与VC数目相同的虚拟数据队列，相同VC的数据被组织为虚拟链表，存取方式为先进先出(First In FirstOut，FIFO)。在有些交换机中，为了消除头部阻塞问题，设置与交换机输出端口数目相同的虚拟队列，输出到同一个输出端口的数据被保存在一个队列中，组织为链表方式，存取方式也为FIFO。

记VC数目为N(N为正整数)，现有多VC动态共享缓冲区如图1所述，包含一个1个数据输入端口、1个读请求输入端口、1个数据输出端口，由VC号识别模块、N个读写地址管理模块即VC₀到VC_N-1读写地址管理模块、第一写请求与写地址选择模块、第一读请求与读地址选择模块、第二写请求与写数据选择模块、第二读请求选择模块、第一数据缓冲区、地址缓冲区、空闲地址缓冲区、第二读写地址管理模块、N个VC顶部缓冲区即VC₀到VC_N-1FIFO_TOP、以及N选1多路选择器组成。

数据输入端口与VC号识别模块、第一数据缓冲区、N个VC顶部缓冲区即VC₀到VC_N- ₁FIFO-TOP相连，将N个VC的数据串行输入到VC号识别模块，同时，如果VC₀到VC_N-1的顶部缓冲区可以接收旁路数据，将数据直接旁路写入VC₀到VC_N-1的顶部缓冲区；否则，将数据写入第一数据缓冲区。

VC号识别模块与数据输入端口、VC₀到VC_N-1读写地址管理模块相连，从数据输入端口输入的数据中提取该数据的VC号i(0≤i≤N-1)，生成VC_i写请求，发送到VC_i读写地址管理模块。

VC_i读写地址管理模块与VC号识别模块、VC_i顶部缓冲区即VC_i FIFO_TOP、第一写请求与写地址选择模块、第一读请求与读地址选择模块、第二写请求与写数据选择模块、第二读请求选择模块、地址缓冲区和空闲地址缓冲区相连，从VC号识别模块接收VC_i写请求，生成读空闲地址缓冲区的VC_i第二读请求，发送到第二读请求选择模块；VC_i读写地址管理模块接收从空闲地址缓冲区读出的空闲地址，将该地址保存为VC_i写地址，生成VC_i第一写请求，将VC_i第一写请求与写地址发送到第一写请求与写地址选择模块。VC_i读写地址管理模块从VC_iFIFO_TOP接收对VC_i的读请求，将VC_i的读请求和读地址作为VC_i第一读请求与读地址发送到第一读请求与读地址选择模块；生成VC_i第二写请求，将VC_i的读地址作为写数据，送给第二写请求与写数据选择模块。VC_i读写地址管理模块接收从地址缓冲区读出的地址，将VC_i的读地址更新为该地址。

第一写请求与写地址选择模块与VC₁到VC_N读写地址管理模块、数据缓冲区和地址缓冲区相连，串行接收VC_i读写地址管理模块发出的VC_i第一写请求与写地址，选择有效的写请求及其写地址分别生成第一写请求和第一写地址，发送给第一数据缓冲区和地址缓冲区。

第一读请求与读地址选择模块与VC₀到VC_N-1读写地址管理模块、第一数据缓冲区和地址缓冲区相连，串行接收VC_i读写地址管理模块发出的VC_i第一读请求与读地址，选择有效的读请求及其读地址分别生成第一读请求和第一读地址，发送给第一数据缓冲区和地址缓冲区。

第一数据缓冲区是具有独立的读写端口的双端口静态随机访问存储器SRAM(Static Random Access Memory)，与数据输入端口、第一写请求与写地址选择模块、第一读请求与读地址选择模块、VC₀到VC_N-1顶部缓冲区相连，接收第一写请求与写地址选择模块发送的第一写请求和第一写地址，从数据输入端口接收数据并将其写入到第一写地址指向的存储器空间；第一数据缓冲区接收第一读请求与读地址选择模块发送的第一读请求和第一读地址，从第一读地址指向的存储器空间输出数据到VC₀到VC_N-1顶部缓冲区。

地址缓冲区是具有独立的读写端口的双端口SRAM或者寄存器组，与第一写请求与写地址选择模块、第一读请求与读地址选择模块、VC₀到VC_N-1读写地址管理模块、空闲地址缓冲区相连，接收第一写请求与写地址选择模块发送的第一写请求和第一写地址，从空闲地址缓冲区接收空闲地址并将其写入到第一写地址指向的存储器空间；接收第一读请求与读地址选择模块发送的第一读请求和第一读地址，从第一读地址指向的存储器空间输出数据作为读出的地址，发送到VC₀到VC_N-1读写地址管理模块。

第二写请求与写数据选择模块与VC₀到VC_N-1读写地址管理模块、第二读写地址管理模块、空闲地址缓冲区相连，串行接收VC_i读写地址管理模块发送的第二写请求与写数据，选择有效的写请求，生成第二写请求，发送到第二读写地址管理模块和空闲地址缓冲区，选择有效的写数据作为写入的空闲地址写入到空闲地址缓冲区。

第二读请求选择模块与VC₀到VC_N-1读写地址管理模块、第二读写地址管理模块、空闲地址缓冲区相连，串行接收VC_i读写地址管理模块发送的第二读请求，选择有效的读请求作为第二读请求发送到第二读写地址管理模块和空闲地址缓冲区。

第二读写地址管理模块与第二写请求与写数据选择模块、第二读请求选择模块、空闲地址缓冲区相连，接收第二写请求与写数据选择模块发送的第二写请求，将第二写地址加一，发送到空闲地址缓冲区；第二读写地址管理模块接收第二读请求选择模块发送的第二读请求，将第二读地址加一，发送到空闲地址缓冲区。

空闲地址缓冲区是具有独立的读写端口的双端口SRAM或者寄存器组，与第二写请求与写数据选择模块、第二读请求选择模块、第二读写地址管理模块相连，接收第二写请求，将写入的空闲地址写到第二写地址指向的位置；空闲地址缓冲区接收第二读请求，从第二读地址指向的位置输出数据作为读出的空闲地址，发送到地址缓冲区和VC₀到VC_N-1读写地址管理模块。

VC_i FIFO_TOP由寄存器组组成。VC_i FIFO_TOP与数据输入端口、第一数据缓冲区、VC_i读写地址管理模块、N选1多路选择器相连，如果VC_i FIFO_TOP可以接收旁路数据，将数据输入端口的数据直接旁路写入VC_i FIFO_TOP。从读请求输入接口接收到VC_i读请求输入，将数据从VC_i FIFO_TOP读出输出给N选1多路选择器，然后，向VC_i读写地址管理模块发出VC_i读请求。VC_i FIFO_TOP从第一数据缓冲区接收数据，缓存至VC_i FIFO_TOP。

N选1多路选择器与VC₀到VC_N-1顶部缓冲区相连，从VC₀到VC_N-1顶部缓冲区相连接收VC₀到VC_N-1读出数据，然后选择其中一个数据通过数据输出端口输出。

在上述结构中，第一数据缓冲区和VC₀到VC_N-1顶部缓冲区中保存的数据为固定长度的报文切片，称为flit。报文在端节点被切分为flit，然后在网络中传输。不同长度的报文包含的flit数目不同。第一数据缓冲区的存储单元宽度与flit宽度相同，每个存储单元保存一个flit。第一数据缓冲区的深度由上一级发送端与缓冲区之间的链路传输延迟和链路带宽共同决定。VC_i FIFO_TOP的存储单元宽度与flit宽度相同，深度根据设计需求设置，一般为3-5即可。

随着超级计算机系统峰值性能的快速提高，需要提高系统组装密度以避免系统中机柜数的爆炸式增长，要求互连网络中的交换芯片集成更多的网络端口。目前交换芯片的网络端口普遍超过16个，有的达到48个或64个，甚至超过100个，端口的VC数也从以前的2个或4个增加到32个或更多，每个交换芯片中可能包含高达300个左右的DAMQ。Flit的位宽也增加至高达600位以上。以32个VC，每个flit位宽为600位，VC_i FIFO_TOP深度为3为例，则一个交换芯片中顶部缓冲区使用的寄存器大小将为300*32*600*3＝17280000位。数量如此之大，将对后端的布局布线造成极大困难。

发明内容

为了降低高数据位宽DAMQ在后端物理设计复杂性，本发明提供了一种互连芯片动态共享缓冲装置，通过将报文中的控制信息与数据分离，大幅降低DAMQ所需的寄存器数量，降低后端布局布线困难，并降低物理设计成本。

本发明互连芯片动态共享缓冲装置包括：报文拆分逻辑、控制码组合逻辑、数据DAMQ和控制DAMQ，一个数据输入端口、一个读请求输入端口和一个数据输出端口；记控制DAMQ为DAMQ_CTRL，数据DAMQ为DAMQ_DATA。

报文拆分逻辑与数据输入端口、控制码组合逻辑、DAMQ_DATA相连，从数据输入端口接收报文，将报文拆分成报文数据和报文控制信息，然后，将报文数据输出给DAMQ_DATA，将报文控制信息输出给控制码组合逻辑。

控制码组合逻辑与报文拆分逻辑、DAMQ_DATA、DAMQ_CTRL相连，从报文拆分逻辑接收报文控制信息即报文中的控制位，从DAMQ_DATA接收报文数据存储在DAMQ_DATA中的地址即写缓冲地址，将报文控制信息和写缓冲地址组合成控制码，并将控制码输出给DAMQ_CTRL。

DAMQ_DATA与报文拆分逻辑、报文组合逻辑、DAMQ_CTRL以及数据输出端相连。DAMA_DATA从报文拆分逻辑接收报文数据，将报文数据缓存至DAMQ_DATA，将报文数据在DAMQ_DATA中的存放地址记为写缓冲地址wt_addr，然后，将写缓冲地址wt_addr发送给控制码组合逻辑；DAMQ_DATA从DAMQ_CTRL接收控制码中的地址位即读缓冲地址，通过读缓冲地址从DAMQ_DATA读出报文数据，通过报文输出端口将报文数据输出。

DAMQ_CTRL与读请求输入端口、控制码组合逻辑、DAMQ_DATA相连，从控制码组合逻辑接收控制码，对N个VC的控制码动态共享存储，从读请求输入端接收到读请求，根据控制码得到读缓冲地址，然后将读缓冲地址发送给DAMQ_DATA。

作为本发明技术方案的进一步改进，DAMQ_CTRL由VC号识别模块、N个读写地址管理模块即VC₀到VC_N-1读写地址管理模块、第一写请求与写地址选择模块、第一读请求与读地址选择模块、第二写请求与写数据选择模块、第二读请求选择模块、第三数据缓冲区、地址缓冲区、空闲地址缓冲区、第二读写地址管理模块、N个第二VC顶部缓冲区即第二VC₀到VC_N- ₁FIFO_TOP、以及N选1多路选择器组成。DAMQ_CTRL包含有1个数据输入端口，一个读请求输入端口，和1个数据输出端口。

数据输入端口与VC号识别模块、第三数据缓冲区、N个第二VC顶部缓冲区即第二VC₀到VC_N-1FIFO-TOP相连，DAMQ_CTRL通过数据输入端口将从控制码组合逻辑接收的控制码输入到VC号识别模块，同时，如果第二VC₀到VC_N-1的顶部缓冲区可以接收旁路数据，将控制码直接旁路写入第二VC₀到VC_N-1的顶部缓冲区；否则，将控制码写入第三数据缓冲区。

VC号识别模块与数据输入端口、VC₀到VC_N-1读写地址管理模块相连，从数据输入端口输入的控制码中提取该控制码的VC号i，生成VC_i写请求，发送到VC_i读写地址管理模块，0≤i≤N-1，i为整数。

第一写请求与写地址选择模块与VC₁到VC_N读写地址管理模块、数据缓冲区和地址缓冲区相连，串行接收VC_i读写地址管理模块发出的VC_i第一写请求与写地址，选择有效的写请求及其写地址分别生成第一写请求和第一写地址，发送给第三数据缓冲区和地址缓冲区。

第一读请求与读地址选择模块与VC₀到VC_N-1读写地址管理模块、第三数据缓冲区和地址缓冲区相连，串行接收VC_i读写地址管理模块发出的VC_i第一读请求与读地址，选择有效的读请求及其读地址分别生成第一读请求和第一读地址，发送给第三数据缓冲区和地址缓冲区。

第三数据缓冲区是具有独立的读写端口的双端口静态随机访问存储器SRAM，与数据输入端口、第一写请求与写地址选择模块、第一读请求与读地址选择模块、第二VC₀到VC_N-1顶部缓冲区相连，接收第一写请求与写地址选择模块发送的第一写请求和第一写地址，从数据输入端口接收控制码并将其写入到第一写地址指向的存储器空间；第三数据缓冲区接收第一读请求与读地址选择模块发送的第一读请求和第一读地址，从第一读地址指向的存储器空间输出数据到第二VC₀到VC_N-1顶部缓冲区。

第二VC_i FIFO_TOP由寄存器组组成。第二VC_i FIFO_TOP与数据输入端口、第三数据缓冲区、VC_i读写地址管理模块、N选1多路选择器、读请求输入端口相连，如果第二VC_i FIFO_TOP可以接收旁路数据，将数据输入端口的控制码直接旁路写入第二VC_i FIFO_TOP。从读请求输入端口接收到VC_i读请求输入，将数据从第二VC_i FIFO_TOP读出输出给N选1多路选择器，然后，向VC_i读写地址管理模块发出VC_i读请求。第二VC_i FIFO_TOP从第三数据缓冲区接收数据，缓存至第二VC_i FIFO_TOP。

N选1多路选择器与第二VC₀到VC_N-1顶部缓冲区以及外部DAMQ_DATA相连，从第二VC₀到VC_N-1顶部缓冲区相连接收VC₀到VC_N-1读出数据，即控制码，然后选择其中一个数据通过数据输出端口输出给DAMQ_DATA。

作为本发明技术方案的进一步改进，DAMQ_DATA包含第二数据缓冲区、第二空闲地址缓冲区和空闲地址管理器。第二数据缓冲区用于存储报文数据；第二数据缓冲区与空闲地址管理器、报文拆分逻辑、报文组合逻辑相连，第二数据缓冲区从报文拆分逻辑接收到报文数据，将第二空闲地址缓冲区的头指针Head转换成写缓冲地址wt_addr，作为报文数据在第二数据缓冲区中的存放地址，将报文数据缓存至第二数据缓冲区中wt_addr指向的地址，然后将wt_addr发送到报文组合逻辑，并将Head更新为报文数据指向的地址缓冲区保存的数据。空闲地址管理器与第二空闲地址缓冲区和第二数据缓冲区相连。空闲地址管理器通过头尾指针及第二空闲地址缓冲区把第二数据缓冲区中的空闲地址串成链表；当外部模块向第二数据缓冲区写数据时，空闲地址管理器将第二空闲地址缓冲区的头指针Head提供给第二数据缓冲区，作为第二数据缓冲区存储报文数据的地址；当从第二数据缓冲区读出一个数据时，该数据在第二数据缓冲区中的地址被返还空闲地址链。第二空闲地址缓冲区与空闲地址管理器相连；第二数据缓冲区的空闲地址通过地址链表构成虚拟队列，即为第二空闲地址缓冲区。

作为本发明技术方案的进一步改进，空闲地址管理器将读地址rd_addr返还给空闲地址链，返还方法如下：将第二数据缓冲区的读地址rd_addr转换成地址缓冲区地址addr_buf_addr，将addr_buf_addr写入空闲地址链尾指针Tail所指向的地址缓冲区位置，然后将Tail更新为addr_buf_addr。

作为本发明技术方案的进一步改进，第二VC₀到VC_N-1顶部缓冲区的深度根据共享缓冲区的读时序决定，第二VC₀到VC_N-1顶部缓冲区深度设为3，其中的存储单元分别标识为FIFO_TOP0，FIFO_TOP1，FIFO_TOP2。每个存储单元可能有三种状态：(1)2’b00:表明该存储单元中没有有效数据，而且没有预约第三数据缓冲区中的数据；(2)2’01:表明该存储单元中没有有效数据，但是已经预约了第三数据缓冲区中的数据；(3)2’b11：存储单元中有有效数据。

作为本发明技术方案的进一步改进，DAMQ_DATA中第二数据缓冲区和第二空闲地址缓冲区的存储单元宽度与报文切片的宽度相同，第二数据缓冲区的深度与第三数据缓冲区的深度相同，由上一级发送端与缓冲区之间的链路传输延迟和链路带宽共同决定。

作为本发明技术方案的进一步改进，第二空闲地址缓冲区采用寄存器阵列实现，其深度与第二数据缓冲区深度相同，宽度与第二数据缓冲区地址宽度相同，空闲地址通过地址链表构成虚拟队列。

本发明可以达到以下技术效果：

1.由于DAMQ_CTRL保证了整个DAMQ对于每个VC的数据都是先进先出，因此DAMQ_DATA仅需管理空闲地址，无需管理已经分配出去的存储空间，这相对于传统的DAMQ_NVC节省了N套队列管理逻辑；

2.DAMQ_CTRL中存储的是报文的控制信息以及报文数据存储在DAMQ_DATA中的地址，因此，DAMQ_CTRL中第一数据缓冲区的宽度由现有技术中的报文切片宽度减小为报文的控制信息以及报文数据存储在DAMQ_DATA中的地址位宽；(2)VC₀到VC_N-1顶部缓冲区的宽度与第一数据缓冲区相同，也由现有技术中的报文切片宽度减小为报文的控制信息以及报文数据存储在DAMQ_DATA中的地址位宽。举例来说，目前报文切片宽度高达600位，报文的控制信息一般为2位(即报文头/尾标志)，报文数据存储在DAMQ_DATA中的地址位宽一般为10位(即缓冲区的深度为1024)，因此，第一数据缓冲区和VC₀到VC_N-1顶部缓冲区的宽度由600降低至12。以每个交换芯片中包含300个DAMQ，报文切片的位宽为600位，VC数量为32，每个VC的顶部缓冲区深度为3为例，则背景技术中，一个交换芯片中顶部缓冲区使用的寄存器大小将为300*32*600*3＝17280000位，而采用本发明技术方案后，一个交换芯片中顶部缓冲区使用的寄存器大小缩减为300*32*12*3＝345600位，降低为原来的2％，大幅降低后端布局布线困难。

附图说明

图1是背景技术现有DAMQ结构图；

图2是本发明互连芯片动态共享缓冲装置总体结构图；

图3是本发明DAMQ中DAMQ_DATA结构图；

图4是本发明DAMQ中DAMQ_CTRL结构图。

具体实施方式

为了降低高数据位宽DAMQ在后端物理设计复杂性，本发明提供了一种互连芯片动态共享缓冲装置，通过将报文中的控制信息与数据分离，以降低后端布局布线困难，并降低物理设计成本。

如图2所示，本发明互连芯片动态共享缓冲装置包括：报文拆分逻辑、控制码组合逻辑、数据DAMQ和控制DAMQ；记控制DAMQ为DAMQ_CTRL，数据DAMQ为DAMQ_DATA，具有一个数据输入端口、一个读请求输入端口和一个数据输出端口。

DAMQ_DATA整体结构如图3所示，包含第二数据缓冲区、第二空闲地址缓冲区和空闲地址管理器。第二数据缓冲区和第二空闲地址缓冲区的存储单元宽度与报文切片的宽度相同，第二数据缓冲区的深度与第三数据缓冲区的深度相同，由上一级发送端与缓冲区之间的链路传输延迟和链路带宽共同决定。第二空闲地址缓冲区采用寄存器阵列RA实现，其深度与第二数据缓冲区深度相同，宽度与第二数据缓冲区地址宽度相同。空闲地址通过地址链表构成虚拟队列。第二数据缓冲区用于存储报文数据；第二数据缓冲区与空闲地址管理器、报文拆分逻辑、报文组合逻辑相连，第二数据缓冲区从报文拆分逻辑接收到报文数据，将第二空闲地址缓冲区的头指针Head转换成写缓冲地址wt_addr，作为报文数据在第二数据缓冲区中的存放地址，将报文数据缓存至第二数据缓冲区中wt_addr指向的地址，然后将wt_addr发送到报文组合逻辑，并将Head更新为报文数据指向的地址缓冲区保存的数据。空闲地址管理器与第二空闲地址缓冲区和第二数据缓冲区相连。空闲地址管理器通过头尾指针及第二空闲地址缓冲区把第二数据缓冲区中的空闲地址串成链表；当外部模块向第二数据缓冲区写数据时，空闲地址管理器将第二空闲地址缓冲区的头指针Head提供给第二数据缓冲区，作为第二数据缓冲区存储报文数据的地址；当从第二数据缓冲区读出一个数据时，该数据在第二数据缓冲区中的地址被返还空闲地址链，返还方法如下：将第二数据缓冲区的读地址rd_addr转换成地址缓冲区地址addr_buf_addr，将addr_buf_addr写入空闲地址链尾指针Tail所指向的地址缓冲区位置，然后将Tail更新为addr_buf_addr。第二空闲地址缓冲区第二数据缓冲区的空闲地址通过地址链表构成虚拟队列，即为第二空闲地址缓冲区。

DAMQ_CTRL的结构与背景中的DAMQ结构完全一致，不同之处在于：(1)DAMQ_CTRL中第一数据缓冲区存储的是报文的控制信息以及报文数据存储在DAMQ_DATA中的地址，因此，第一数据缓冲区的宽度由背景技术中的报文切片宽度减小为报文的控制信息以及报文数据存储在DAMQ_DATA中的地址位宽；(2)DAMQ_CTRL中VC₀到VC_N-1顶部缓冲区的宽度，也由背景技术中的报文切片宽度减小为报文的控制信息以及报文数据存储在DAMQ_DATA中的地址位宽；(3)DAMQ_CTRL中的数据即为控制码。为了与背景技术中的第一数据缓冲区以及VC₀到VC_N-1顶部缓冲区区分开来，记DAMQ_CTRL中与第一数据缓冲区对应的数据缓冲区记为第三数据缓冲区，DAMQ_CTRL中与VC₀到VC_N-1顶部缓冲区对应的顶部缓冲区记为第二VC₀到VC_N-1顶部缓冲区，即第二VC₀FIFO_TOP、……、VC_i FIFO_TOP、……VC_N-1FIFO_TOP。举例来说，目前报文切片宽度高达600位，报文的控制码为2位(即报文头/尾标志)，报文数据存储在DAMQ_DATA中的地址位宽一般为10位(即缓冲区的深度为1024)，因此，第一数据缓冲区和VC₀到VC_N-1顶部缓冲区的宽度由600降低至12。

如图4所示，DAMQ_CTRL由VC号识别模块、N个读写地址管理模块即VC₀到VC_N-1读写地址管理模块、第一写请求与写地址选择模块、第一读请求与读地址选择模块、第二写请求与写数据选择模块、第二读请求选择模块、第三数据缓冲区、地址缓冲区、空闲地址缓冲区、第二读写地址管理模块、N个第二VC顶部缓冲区即第二VC₀到VC_N-1FIFO_TOP、以及N选1多路选择器组成。DAMQ_CTRL包含有1个数据输入端口，一个读请求输入端口，和1个数据输出端口。

VC号识别模块与数据输入端口、VC₀到VC_N-1读写地址管理模块相连，从数据输入端口输入的控制码中提取该控制码的VC号i(0≤i≤N-1)，生成VC_i写请求，发送到VC_i读写地址管理模块。

第二VC_i FIFO_TOP由寄存器组组成。第二VC_i FIFO_TOP与数据输入端口、第三数据缓冲区、VC_i读写地址管理模块、N选1多路选择器、读请求输入端口相连，如果第二VC_i FIFO_TOP可以接收旁路数据，将数据输入端口的控制码直接旁路写入第二VC_i FIFO_TOP。从读请求输入端口接收到VC_i读请求输入，将数据从第二VC_i FIFO_TOP读出输出给N选1多路选择器，然后，向VC_i读写地址管理模块发出VC_i读请求。第二VC_i FIFO_TOP从第三数据缓冲区接收数据，缓存至第二VC_i FIFO_TOP。第二VC₀到VC_N-1顶部缓冲区的深度根据共享缓冲区的读时序决定，如果第一拍给出读地址，第三拍输出数据，第二VC₀到VC_N-1顶部缓冲区的深度设置为3。目前带寄存的存储器读时序普遍为第一拍给出读地址、第三拍输出数据，因此，第二VC₀到VC_N-1顶部缓冲区深度设为3，其中的存储单元分别标识为FIFO_TOP0，FIFO_TOP1，FIFO_TOP2。每个存储单元可能有三种状态：(1)2’b00:表明该存储单元中没有有效数据，而且没有预约第一数据缓冲区中的数据；(2)2’01:表明该存储单元中没有有效数据，但是已经预约了第一数据缓冲区中的数据；(3)2’b11：存储单元中有有效数据；另外，2’b10为不存在的状态。

最后所应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围。

Claims

1.一种互连芯片动态共享缓冲装置，其特征在于，包括：报文拆分逻辑、控制码组合逻辑、数据DAMQ和控制DAMQ，一个数据输入端口、一个读请求输入端口和一个数据输出端口；记控制DAMQ为DAMQ_CTRL，数据DAMQ为DAMQ_DATA；记互连芯片动态共享缓冲装置包含的虚信道VC数目为N，N为正整数；

报文拆分逻辑与数据输入端口、控制码组合逻辑、DAMQ_DATA相连；报文拆分逻辑从数据输入端口接收报文，将报文拆分成报文数据和报文控制信息，然后，将报文数据输出给DAMQ_DATA，将报文控制信息输出给控制码组合逻辑；

控制码组合逻辑与报文拆分逻辑、DAMQ_DATA、DAMQ_CTRL相连，从报文拆分逻辑接收报文控制信息即报文中的控制位，从DAMQ_DATA接收报文数据存储在DAMQ_DATA中的地址即写缓冲地址，将报文控制信息和写缓冲地址组合成控制码，并将控制码输出给DAMQ_CTRL；

DAMQ_DATA与报文拆分逻辑、报文组合逻辑、DAMQ_CTRL以及数据输出端相连；DAMA_DATA从报文拆分逻辑接收报文数据，将报文数据缓存至DAMQ_DATA，将报文数据在DAMQ_DATA中的存放地址记为写缓冲地址wt_addr，然后，将写缓冲地址wt_addr发送给控制码组合逻辑；DAMQ_DATA从DAMQ_CTRL接收控制码中的地址位即读缓冲地址，通过读缓冲地址从DAMQ_DATA读出报文数据，通过报文输出端口将报文数据输出；

DAMQ_CTRL与读请求输入端口、控制码组合逻辑、DAMQ_DATA相连，从控制码组合逻辑接收控制码，对N个VC的控制码动态共享存储，从读请求输入端口接收到读请求，根据控制码得到读缓冲地址，然后将读缓冲地址发送给DAMQ_DATA。

2.如权利要求1所述的互连芯片动态共享缓冲装置，其特征在于，DAMQ_CTRL由VC号识别模块、N个读写地址管理模块即VC₀到VC_N-1读写地址管理模块、第一写请求与写地址选择模块、第一读请求与读地址选择模块、第二写请求与写数据选择模块、第二读请求选择模块、第三数据缓冲区、地址缓冲区、空闲地址缓冲区、第二读写地址管理模块、N个第二VC顶部缓冲区即第二VC₀到VC_N-1 FIFO_TOP、以及N选1多路选择器组成；DAMQ_CTRL包含有1个数据输入端口，一个读请求输入端口，和1个数据输出端口；

数据输入端口与VC号识别模块、第三数据缓冲区、N个第二VC顶部缓冲区即第二VC₀到VC_N-1 FIFO-TOP相连，DAMQ_CTRL通过数据输入端口将从控制码组合逻辑接收的控制码输入到VC号识别模块，同时，如果第二VC₀到VC_N-1的顶部缓冲区可以接收旁路数据，将控制码直接旁路写入第二VC₀到VC_N-1的顶部缓冲区；否则，将控制码写入第三数据缓冲区；

VC号识别模块与数据输入端口、VC₀到VC_N-1读写地址管理模块相连，从数据输入端口输入的控制码中提取该控制码的VC号i，生成VC_i写请求，发送到VC_i读写地址管理模块，0≤i≤N-1，i为整数；

VC_i读写地址管理模块与VC号识别模块、VC_i顶部缓冲区即VC_iFIFO_TOP、第一写请求与写地址选择模块、第一读请求与读地址选择模块、第二写请求与写数据选择模块、第二读请求选择模块、地址缓冲区和空闲地址缓冲区相连，从VC号识别模块接收VC_i写请求，生成读空闲地址缓冲区的VC_i第二读请求，发送到第二读请求选择模块；VC_i读写地址管理模块接收从空闲地址缓冲区读出的空闲地址，将该地址保存为VC_i写地址，生成VC_i第一写请求，将VC_i第一写请求与写地址发送到第一写请求与写地址选择模块；VC_i读写地址管理模块从VC_iFIFO_TOP接收对VC_i的读请求，将VC_i的读请求和读地址作为VC_i第一读请求与读地址发送到第一读请求与读地址选择模块；生成VC_i第二写请求，将VC_i的读地址作为写数据，送给第二写请求与写数据选择模块；VC_i读写地址管理模块接收从地址缓冲区读出的地址，将VC_i的读地址更新为该地址；

第一写请求与写地址选择模块与VC₁到VC_N读写地址管理模块、数据缓冲区和地址缓冲区相连，串行接收VC_i读写地址管理模块发出的VC_i第一写请求与写地址，选择有效的写请求及其写地址分别生成第一写请求和第一写地址，发送给第三数据缓冲区和地址缓冲区；

第一读请求与读地址选择模块与VC₀到VC_N-1读写地址管理模块、第三数据缓冲区和地址缓冲区相连，串行接收VC_i读写地址管理模块发出的VC_i第一读请求与读地址，选择有效的读请求及其读地址分别生成第一读请求和第一读地址，发送给第三数据缓冲区和地址缓冲区；

第三数据缓冲区是具有独立的读写端口的双端口静态随机访问存储器SRAM，与数据输入端口、第一写请求与写地址选择模块、第一读请求与读地址选择模块、第二VC₀到VC_N-1顶部缓冲区相连，接收第一写请求与写地址选择模块发送的第一写请求和第一写地址，从数据输入端口接收控制码并将其写入到第一写地址指向的存储器空间；第三数据缓冲区接收第一读请求与读地址选择模块发送的第一读请求和第一读地址，从第一读地址指向的存储器空间输出数据到第二VC₀到VC_N-1顶部缓冲区；

地址缓冲区是具有独立的读写端口的双端口SRAM或者寄存器组，与第一写请求与写地址选择模块、第一读请求与读地址选择模块、VC₀到VC_N-1读写地址管理模块、空闲地址缓冲区相连，接收第一写请求与写地址选择模块发送的第一写请求和第一写地址，从空闲地址缓冲区接收空闲地址并将其写入到第一写地址指向的存储器空间；接收第一读请求与读地址选择模块发送的第一读请求和第一读地址，从第一读地址指向的存储器空间输出数据作为读出的地址，发送到VC₀到VC_N-1读写地址管理模块；

第二写请求与写数据选择模块与VC₀到VC_N-1读写地址管理模块、第二读写地址管理模块、空闲地址缓冲区相连，串行接收VC_i读写地址管理模块发送的第二写请求与写数据，选择有效的写请求，生成第二写请求，发送到第二读写地址管理模块和空闲地址缓冲区，选择有效的写数据作为写入的空闲地址写入到空闲地址缓冲区；

第二读请求选择模块与VC₀到VC_N-1读写地址管理模块、第二读写地址管理模块、空闲地址缓冲区相连，串行接收VC_i读写地址管理模块发送的第二读请求，选择有效的读请求作为第二读请求发送到第二读写地址管理模块和空闲地址缓冲区；

第二读写地址管理模块与第二写请求与写数据选择模块、第二读请求选择模块、空闲地址缓冲区相连，接收第二写请求与写数据选择模块发送的第二写请求，将第二写地址加一，发送到空闲地址缓冲区；第二读写地址管理模块接收第二读请求选择模块发送的第二读请求，将第二读地址加一，发送到空闲地址缓冲区；

空闲地址缓冲区是具有独立的读写端口的双端口SRAM或者寄存器组，与第二写请求与写数据选择模块、第二读请求选择模块、第二读写地址管理模块相连，接收第二写请求，将写入的空闲地址写到第二写地址指向的位置；空闲地址缓冲区接收第二读请求，从第二读地址指向的位置输出数据作为读出的空闲地址，发送到地址缓冲区和VC₀到VC_N-1读写地址管理模块；

第二VC_i FIFO_TOP由寄存器组组成；第二VC_i FIFO_TOP与数据输入端口、第三数据缓冲区、VC_i读写地址管理模块、N选1多路选择器、读请求输入端口相连，如果第二VC_i FIFO_TOP可以接收旁路数据，将数据输入端口的控制码直接旁路写入第二VC_iFIFO_TOP；从读请求输入端口接收到VC_i读请求输入，将数据从第二VC_iFIFO_TOP读出输出给N选1多路选择器，然后，向VC_i读写地址管理模块发出VC_i读请求；第二VC_iFIFO_TOP从第三数据缓冲区接收数据，缓存至第二VC_iFIFO_TOP；

N选1多路选择器与第二VC₀到VC_N-1顶部缓冲区以及外部DAMQ_DATA相连，从第二VC₀到VC_N-1顶部缓冲区相连接收VC₀到VC_N-1读出数据，然后选择其中一个数据通过数据输出端口输出给DAMQ_DATA。

3.如权利要求1所述的互连芯片动态共享缓冲装置，其特征在于，DAMQ_DATA包含第二数据缓冲区、第二空闲地址缓冲区和空闲地址管理器；

第二数据缓冲区用于存储报文数据；第二数据缓冲区与空闲地址管理器、报文拆分逻辑、报文组合逻辑相连，第二数据缓冲区从报文拆分逻辑接收到报文数据，将第二空闲地址缓冲区的头指针Head转换成写缓冲地址wt_addr，作为报文数据在第二数据缓冲区中的存放地址，将报文数据缓存至第二数据缓冲区中wt_addr指向的地址，然后将wt_addr发送到报文组合逻辑，并将Head更新为报文数据指向的地址缓冲区保存的数据；

空闲地址管理器与第二空闲地址缓冲区和第二数据缓冲区相连；空闲地址管理器通过头尾指针及第二空闲地址缓冲区把第二数据缓冲区中的空闲地址串成链表；当外部模块向第二数据缓冲区写数据时，空闲地址管理器将第二空闲地址缓冲区的头指针Head提供给第二数据缓冲区，作为第二数据缓冲区存储报文数据的地址；当从第二数据缓冲区读出一个数据时，该数据在第二数据缓冲区中的地址被返还空闲地址链；

第二空闲地址缓冲区与空闲地址管理器相连；第二空闲地址缓冲区将第二数据缓冲区的空闲地址通过地址链表构成虚拟队列。

4.如权利要求2所述的互连芯片动态共享缓冲装置，其特征在于，第二VC₀到VC_N-1顶部缓冲区的深度根据共享缓冲区的读时序决定，第二VC₀到VC_N-1顶部缓冲区深度设为3，其中的存储单元分别标识为FIFO_TOP0，FIFO_TOP1，FIFO_TOP2；每个存储单元可能有三种状态：(1)2’b00:表明该存储单元中没有有效数据，而且没有预约第三数据缓冲区中的数据；(2)2’01:表明该存储单元中没有有效数据，但是已经预约了第三数据缓冲区中的数据；(3)2’b11：存储单元中有有效数据。

5.如权利要求3所述的互连芯片动态共享缓冲装置，其特征在于，空闲地址管理器将读地址rd_addr返还给空闲地址链，返还方法如下：将第二数据缓冲区的读地址rd_addr转换成地址缓冲区地址addr_buf_addr，将addr_buf_addr写入空闲地址链尾指针Tail所指向的地址缓冲区位置，然后将Tail更新为addr_buf_addr。

6.如权利要求3所述的互连芯片动态共享缓冲装置，其特征在于，DAMQ_DATA中第二数据缓冲区的深度由上一级发送端与缓冲区之间的链路传输延迟和链路带宽共同决定。

7.如权利要求3所述的互连芯片动态共享缓冲装置，其特征在于，第二空闲地址缓冲区采用寄存器阵列实现，其深度与第二数据缓冲区深度相同，宽度与第二数据缓冲区地址宽度相同，空闲地址通过地址链表构成虚拟队列。

8.如权利要求1～7中任意一项所述的互连芯片动态共享缓冲装置，其特征在于，报文控制信息长度为两位，分别为报文的头/尾标志位。