WO2019228077A1

WO2019228077A1 - 实现数据传输的方法、装置、电子设备及计算机可读存储介质

Info

Publication number: WO2019228077A1
Application number: PCT/CN2019/082225
Authority: WO
Inventors: 李嘉昕
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2018-05-31
Filing date: 2019-04-11
Publication date: 2019-12-05
Also published as: CN110196824B; CN110196824A; US20200401542A1; US11481346B2

Abstract

一种实现数据传输的方法及装置、电子设备、计算机可读存储介质，该方法应用于计算服务所运行实例和外部设备所分别对应的不同类型总线之间传输的执行，包括：获取进行数据读写的访问指令，所述访问指令是所述实例与外部设备两端之间通过总线而向任意一端发起的（310）；将所述访问指令缓存至所述访问指令对应的指令存储区域（330）；根据所述访问指令指示的访问对象，将所述指令存储区域缓存的所述访问指令持续传输至所述访问对象，直至受到流控才停止所述访问指令的传输（350）。

Description

实现数据传输的方法、装置、电子设备及计算机可读存储介质

本申请要求于2018年5月31日提交中国专利局、申请号为201810551660.7、发明名称为“实现数据传输的方法及装置、电子设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及集成电路技术领域，特别涉及一种实现数据传输的方法、装置、电子设备及计算机可读存储介质。

发明背景

随着集成电路的深亚微米制造技术、设计技术的迅速发展,集成电路已进入片上系统时代。所谓片上系统，也就是系统级集成电路(SOC，System on chip)。与此同时，IC的设计方法也从基于时序驱动的方式，发展到了基于IP(Intellectual Property，知识产权核)资源复用的方式。

由于各家FPGA(现场可编程门阵列)芯片厂商定义了不同的内部总线互联标准，而不同类型总线的传输带宽不同，这样当将A芯片中基于第一总线的用户设计移植到基于第二总线的B芯片中时，由于第一总线和第二总线的传输带宽不同，通过第一总线和第二总线传输的数据只能按照带宽较小的总线标准进行传输，由此影响了数据传输效率，浪费了另一总线的传输带宽。如果根据第二总线的传输带宽，重新调整用户设计的系统结构去适配新的总线带宽，则需要花费大量时间和精力，开发成本较高。

综上，由于不同类型总线的传输带宽不同，在进行用户设计的跨芯片移植时，影响了数据传输效率，浪费了总线带宽。

发明内容

为了解决相关技术中存在的由于不同类型总线的传输带宽不同，在进行用户设计的跨芯片移植时，影响了数据传输效率，浪费了总线带宽的问题，本申请提供了一种实现数据传输的方法。

一方面，本申请还提供了一种实现数据传输的方法，由电子设备执行，所述方法应用于计算服务所运行实例和外部设备所分别对应的不同类型总线之间传输的执行，所述方法包括：

获取进行数据读写的访问指令，所述访问指令是所述实例与外部设备两端之间通过总线而向任意一端发起的；

将所述访问指令缓存至所述访问指令对应的指令存储区域；

根据所述访问指令指示的访问对象，将所述指令存储区域缓存的所述访问指令持续传输至所述访问对象，直至受到流控才停止所述访问指令的传输。

另一方面，本申请还提供了一种实现数据传输的装置，所述装置应用于计算服务所运行实例和外部设备所分别对应的不同类型总线之间传输的执行，所述装置包括：

指令获取模块，用于获取进行数据读写的访问指令，所述访问指令是所述实例与外部设备两端之间通过总线而向任意一端发起的；

指令缓存模块，用于将所述访问指令缓存至所述访问指令对应的指令存储区域；

指令传输模块，用于根据所述访问指令指示的访问对象，将所述指令存储区域缓存的所述访问指令持续传输至所述访问对象，直至受到流控才停止所述访问指令的传输。

进一步的，本申请还提供了一种电子设备，所述电子设备包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行上述实现数据传输的方法。

另外，本申请还提供了一种计算机可读存储介质，存有处理器可执行指令，所述指令由一个或一个以上处理器执行时，完成上述实现数据传输的方法。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本申请。

附图简要说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

图1为基于AXI总线的实例移植到基于CCI-P总线的FPGA芯片后的实施环境示意图；

图2为基于CCI-P总线的实例移植到基于AXI总线的FPGA芯片后的实施环境示意图；

图3是根据一示例性实施例示出的一种实现数据传输的方法的流程图；

图4是在图3对应实施例的基础上另一示例性实施例提供的实现数据传输的方法流程图；

图5是图3对应实施例中步骤310的细节流程图；

图6是图5对应实施例中步骤312的细节流程图；

图7为FPGA芯片中部署的AXI总线与CCI-P总线转换的总线转换装置系统框架图；

图8是图7所示总线转换装置的详细展开图。

图9是根据一示例性实施例示出的快速链路协议转换器中读链路流处理模块处理读请求的流程示意图；

图10是根据一示例性实施例示出的快速链路协议转换器中全链路流处理模块处理读请求的流程示意图；

图11是根据一示例性实施例示出的快速链路协议转换器中写链路流处理模块处理写请求的流程示意图；

图12是根据一示例性实施例示出的快速链路协议转换器中全链路流处理模块处理写请求的流程示意图；

图13是本申请示例性实施例提供的实现数据传输的方法的完整流程示意图；

图14是根据一示例性实施例示出的一种实现数据传输的装置的框图；

图15是在图14对应实施例的基础上另一示例性实施例示出的一种实现数据传输的装置的框图；

图16是图14对应实施例中指令获取模块的细节框图。

实施方式

这里将详细地对示例性实施例执行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

目前主流FPGA(现场可编程门阵列)芯片生产商有因特尔(Intel)和赛灵思(Xilinx)，由于赛灵思一般采用AXI总线进行芯片内部各功能模块互联，而因特尔则是采用CCI-P总线进行芯片内部各功能模块互联。由于不同厂商提供的FPGA芯片采用不同类型的总线互联，为了最大限度减少用户的二次开发，本申请在FPGA芯片内增加了一个快速链路协议转换器，可以实现CCI-P与AXI总线之间的转换，这样赛灵思提供的FPGA芯片中基于AXI总线的实例就可以方便的移植到因特尔提供的基于CCI-P总线的FPGA芯片中。

图1为基于AXI总线的实例移植到基于CCI-P总线的FPGA芯片后的实施环境示意图。如图1所示，该实施环境包括：FPGA芯片110和用于运行应用程序的外部设备120，外部设备120与FPGA芯片110之间通过PCIe总线互联。

实例111是从基于AXI总线115的芯片中移植过来的深度学习、图形图像压缩处理、基因组学等计算服务所运行的程序。如图1所示，可以在FPGA芯片110中部署本申请实现数据传输的快速链路协议转换器113，从而基于AXI总线115的实例111移植到基于CCI-P总线114的FPGA芯片110中时，可以与FPGA芯片110的CCI-P总线114的转接。

如图1所示，快速链路协议转换器113包括多个FIFO(先进先出的数据缓存器)，分别缓存外部设备120向实例111发送的数据，以及缓存实例111向外部设备120发送的数据。即使AXI总线115与CCI-P总线114传输数据的时钟周期不同，传输带宽不同，通过对AXI总线115与CCI-P总线114之间传输的数据进行缓存，当需要传输高速数据时，避免了传输带宽的浪费；并且在没有接收到流控信号时持续将缓存的数据传输至接收方，实现了数据的流模式传输，提高了数据传输效率，进一步的，可以使数据按照接收方的时钟周期输出，从而实现数据的异步传输。

如图1所示，上述快速链路协议转换器113可以包括读链路流处理模块101、写链路流处理模块102、全链路流处理模块103和协链路流处理模块104，每个模块均包含FIFO。

读链路流处理模块101可以接收实例111通过AXI总线115传输的读请求，并处理读请求得到读指令。将读指令缓存在读指令异步FIFO中，进而以流模式向CCI-P总线114异步传输读指令，获得外部设备120响应读指令返回的读数据。读链路流处理模块101将读数据缓存在读数据异步FIFO中，进而以流模式将读数据通过AXI总线115异步传输至计算服务所运行的实例111，从而实例111可以对接收的读数据进行数据分析处理。

写链路流处理模块102可以接收实例111通过AXI总线115传输的写请求，并处理写请求得到写指令。将写指令缓存在写指令异步FIFO中，进而以流模式向CCI-P总线114异步传输写指令，外部设备120将写指令所携带的写数据进行写入，并返回写响应。写链路流处理模块102将写响应缓存在写响应异步FIFO中，进而以流模式将写响应通过AXI总线115异步传输至计算服务所运行的实例111。其中，写数据可以是实例111对上述读数据进行数据分析处理获得的结果。

全链路流处理模块103具有并行读写功能，可以并行接收外部设备120通过CCI-P总线114传输的读写请求，并处理读写请求得到读写指令，将读指令缓存在读指令异步FIFO，将写指令缓存在写指令异步FIFO，进而以流模式向向AXI总线115异步传输读指令或写指令，获得实例111响应读指令返回的读数据或者响应写指令返回的写响应。全链路流处理模块103进一步可以对写响应或读数据进行缓存，并以流模式通过CCI-P总线114异步传输至外部设备120。

其中，协链路流处理模块104用于向AXI总线115传输低速的配置信息，例如可以辅助读链路流处理模块101和写链路流处理模块102，向AXI总线115返回读数据的包头信息和写响应的包头信息，以及传输校验码等。

现有技术为了将Xilinx芯片的用户设计(即实例111)移植到Intel的芯片，则需要重新设计接口以及调整用户设计的系统结构去适配Intel芯片的总线带宽和时序，需要花费较多设计成本。本申请提供的方法，实现了不同类型总线之间的数据传输，从而可以实现用户设计的跨芯片移植，节省了开发成本。

图2为基于CCI-P总线的实例移植到基于AXI总线的FPGA芯片后的实施环境示意图。该实施环境包括：FPGA芯片110和用于运行应用程序的外部设备120，外部设备120与FPGA芯片110之间通过PCIe总线互联。

实例111是从基于CCI-P总线114的芯片中移植过来的深度学习、图形图像压缩处理、基因组学等计算服务所运行的程序。如图2所示，可以在FPGA芯片110中部署本申请实现数据传输的快速链路协议转换器113，从而基于CCI-P总线114的实例111移植到基于AXI总线115的FPGA芯片110中时，可以与FPGA芯片110的AXI总线115对接。

与图1相同，快速链路协议转换器包括多个FIFO，分别缓存外部设备120向实例111发送的数据，以及缓存实例111向外部设备120发送的数据，从而实现AXI总线115和CCI-P总线114之间数据的异步传输以及流模式传输。

如图2所示，快速链路协议转换器113包括读链路流处理模块101、写链路流处理模块102、全链路流处理模块103和协链路流处理模块104，每个模板均包括FIFO。

读链路流处理模块101可以接收外部设备120通过AXI总线115传输的读请求，并处理读请求得到读指令。将读指令缓存在读指令异步FIFO中，进而以流模式向CCI-P总线114异步传输读指令，获得实例111响应读指令返回的读数据。读链路流处理模块101进一步在读数据异步FIFO中对读数据进行缓存，并以流模式通过AXI总线115将读数据异步传输至外部设备120，从而外部设备120可以对接收的读数据进行数据分析处理。

写链路流处理模块102可以接收外部设备120通过AXI总线115传输的写请求，并处理写请求得到写指令，将写指令缓存在写指令异步FIFO中，进而以流模式向CCI-P总线114异步传输写指令，获得实例111响应写指令返回的写响应，写链路流处理模块102进一步可以在写响应异步FIFO中对写响应进行缓存，并以流模式通过AXI总线115异步传输写响应至外部设备120。其中写数据可以是外部设备120对上述读数据进行数据分析处理获得的结果。

全链路流处理模块103具有并行读写功能，可以并行接收实例111通过CCI-P总线114传输的读写请求，并处理读写请求得到读写指令。在读指令异步缓存器中缓存读指令，在写指令异步缓存器中缓存写指令，并以流模式向AXI总线115异步传输读指令或写指令，进而获得外部设备120响应读指令返回的读数据。全链路流处理模块103进一步可以对读数据进行缓存，并以流模式通过CCI-P总线114异步传输至实例111。

图3是根据一示例性实施例示出的一种实现数据传输的方法流程图。该实现数据传输的方法的适用范围，例如可以用于图1所示实施环境的FPGA芯片110中，实现计算服务所运行实例和外部设备所分别对应的不同类型总线之间传输的执行，如图3所示，该方法由后文介绍的电子设备执行，具体可以包括以下步骤。

在步骤310中，获取进行数据读写的访问指令，访问指令是所述实例与外部设备两端之间通过总线而向任意一端发起的。

其中，计算服务是指FPGA芯片部署的某种数据处理功能，例如深度学习、图形图像压缩处理、基因组学等计算服务。实例是指完成上述计算服务的程序模块。外部设备是相对FPGA芯片而言，运行应用程序的终端设备，例如计算机的主机。FPGA芯片内部本身采用的总线，可能是AXI总线或CCI-P总线，实例可以是从其他设计中移植过来的，有可能采用不同类型的总线。例如，FPGA芯片采用AXI总线时，移植过来的实例可能采用CCI-P总线。FPGA芯片采用CCI-P总线时，移植过来的实例可能采用AXI总线。本申请提供的方法可以用于实现CCI-P总线和AXI总线之间传输的执行。

需要说明的是，访问指令可以是根据访问请求生成的，访问指令包括读指令和写指令。访问请求可以是实例发起的，通过AXI总线和CCI-P总线对外部设备进行数据读写的请求。访问请求也可以是外部设备发起的，通过AXI总线和CCI-P总线对实例进行数据读写的请求。由于AXI总线和CCI-P总线的时序和带宽不同，FPGA芯片通过快速链路协议转换器可以实现AXI总线和CCI-P总线之间的转换。快速链路协议转换器可以接收实例或外部设备发送的访问请求，并对读写请求进行处理获得访问指令。

在步骤330中，将访问指令缓存至访问指令对应的指令存储区域。

需要说明的是，将访问指令缓存至访问指令对应的指令存储区域是指将针对同一访问对象的访问指令存储在一起。指令存储区域可以是FPGA芯片中部署的异步FIFO，针对同一访问对象的写操作指令存储在写指令异步FIFO中，针对同一访问对象的读操作指令存储在读指令异步FIFO中。按照访问指令生成的先后顺序，按序在指令存储区域中进行访问指令的存储，并按照先进先出原则，在没有接收到反压信号时，按序读取访问指令进行输出。

具体的，FPGA芯片的快速链路协议转换器将处理访问请求获得的访问指令按序存储在对应的指令存储区域。FPGA芯片访问外部设备的读指令缓存在第一FIFO中，FPGA芯片访问外部设备的写指令缓存在第二FIFO中，而外部设备访问FPGA芯片中实例的读指令缓存在第三FIFO中，外部设备访问FPGA芯片中实例的写指令缓存在第四FIFO中。

在步骤350中，根据访问指令指示的访问对象，将指令存储区域缓存的访问指令持续传输至访问对象，直至受到流控才停止所述访问指令的传输。

需要说明的是，假设访问指令是根据实例发送的访问请求生成的，则访问对象是外部设备。假设访问指令是根据外部设备发送的访问请求生成的，则访问对象是FPGA芯片中的实例。对应于实例的总线可能是AXI总线，对应于外部设备的总线是CCI-P总线。或者，对应于实例的总线是CCI-P总线，对应于外部设备的总线是AXI总线。AXI总线是ARM公司提出的一种面向高性能、高带宽、低延迟的片内总线。CCI-P总线是Intel公司提出的一种面向片上高速缓存应用的总线。采用本申请提供的方法可以实现CCI-P总线和AXI总线之间的转换，这样就可以方便的将其他FPGA芯片的实例移植到该当前FPGA芯片110。

其中，受到流控是指因访问对象数据处理不过来需暂停访问指令的传输。在一种实施例中，如果接收到访问对象对访问指令返回的流控信号，可以认为访问指令的传输受到流控，则停止访问指令的传输。当访问对象没有多余处理能力处理访问指令时，则会向FPGA芯片发送流控信号。FPGA芯片的快速链路协议转换器在没有接收到访问对象对访问指令的流控信号时，会持续不断地将缓存的访问指令通过对应于访问对象的总线传输至访问对象，从而实现数据的流模式传输，提高传输效率。当接收到对访问指令的流控信号时，才停止向访问对象传输访问指令。

在一种实施例中，访问对象是外部设备，FPGA芯片的快速链路协议转换器持续不断将缓存的读指令传输至外部设备，直到接收到外部设备返回的对读指令的流控信号，则暂停读指令的传输。FPGA芯片的快速链路协议转换器持续不断将缓存的写指令传输至外部设备，直到接收到外部设备返回的对写指令的流控信号，则暂停写指令的传输。换句话说，读指令的传输和写指令的传输互不干扰，在接收到对读指令的流控信号时，暂停读指令的传输，但是如果没有接收到对写指令的流控信号，仍可继续进行写指令的传输。

需要强调的是，由于AXI总线和CCI-P总线属于不同类型的总线，当需要传输高速数据时，由于AXI总线与CCI-P总线的带宽不同，因此传输速率只能按照带宽小的总线进行传输，导致传输带宽的浪费。而本申请通过对访问指令进行缓存，在没有接收到访问对象返回的流控信号时，可以持续不断将缓存的访问指令传输至访问对象。举例来说，当AXI总线传输带宽较大时，CCI-P总线传输带宽较小时，可以对AXI总线传输的高速数据进行缓存，并在没有接收到流控信号时，将缓存的数据持续向CCI-P总线传输，从而最大限度提高了数据传输效率，提高了吞吐量。

本申请提供的技术方案，通过对实例与外部设备之间通过不同类型总线传输的访问指令进行缓存，并持续向访问指令的访问对象传输缓存的访问指令，直至受到流控才停止向访问对象传输访问指令，从而实现了访问指令的流模式传输，提高了数据传输效率，通过对访问指令进行缓存，克服了实例跨芯片移植时，因不同类型总线之间带宽不同导致的带宽浪费问题，进而无需调整实例，节省了开发成本。

在一种示例性实施例中，上述步骤350具体包括：

按照向所述访问对象传输所述访问指令的时钟周期，持续将所述指令存储区域缓存的访问指令传输至所述访问对象，直到接收到所述访问对象对所述访问指令返回的流控信号。

其中，时钟周期是指对应于访问对象的总线，向访问对象传输访问指令的时序。流控信号可以是反压信号，也可以是其他用于指示数据处理不过来需暂停数据传输的信号。FPGA芯片的快速链路协议转换器按照该时序，不断从指令存储区域读取访问指令并传输至访问对象，直到接收到该访问对象由于对访问指令处理不过来而发送的反压信号，则暂停向访问对象传输访问指令。当接收到撤销反压的信号时，则继续向访问对象传输访问指令。

假设对应于实例的总线是AXI总线，对应于外部设备的总线是CCI-P总线，不同类型总线的时钟周期不同。假设访问指令是实例发起的，用于对外部设备进行访问。本申请通过快速链路协议转换器对AXI总线和CCI-P总线之间传输的访问指令的进行缓存，从而快速链路协议转换器可以按照AXI总线的时钟周期接收传输的访问指令并进行缓存，之后可以按照CCI-P总线的时钟周期向外部设备传输缓存的访问指令，由此实现FPGA芯片内不同类型总线之间数据的异步传输。

在一种示例性实施例中，如图4所示，在上述步骤350之后，本申请提供的实现数据传输的方法还包括以下步骤：

在步骤401中，在所述访问指令对应的数据存储区域中，缓存所述访问对象根据所述访问指令返回的读写反馈数据；

其中，数据存储区域用于存储访问对象响应访问指令返回的读写反馈数据。读写反馈数据包括读数据和写响应。数据存储区域包括写响应异步FIFO、读数据异步FIFO。其中，写响应异步FIFO用于缓存访问对象根据写指令返回的写响应，而读数据异步FIFO用于缓存访问对象根据读指令返回的读数据。

具体的，FPGA芯片的快速链路协议转换器接收到访问对象响应访问指令返回的读写反馈数据后，在访问指令对应的数据存储区域缓存该读写反馈数据，例如在写响应异步FIFO中缓存访问对象响应写指令返回的写响应，在读数据异步FIFO中缓存访问对象响应读指令返回的读数据。

在步骤402中，根据所述访问指令的发起方，将所述数据存储区域缓存的所述读写反馈数据持续传输至所述发起方，直到接收到所述发起方对所述读写反馈数据返回的流控信号。

其中，访问指令的发起方可以是实例，也可以是外部设备。当发起方是实例时，访问对象是外部设备；相反的，当发起方是外部设备时，访问对象是实例。以发起方是实例，访问对象是外部设备的场景举例来说，FPGA芯片的快速链路协议转换器将缓存的访问指令(以读指令为例)发送至外部设备，接收外部设备根据读指令返回的读数据，然后将读数据缓存在读数据异步FIFO中。快速链路协议转换器按照先进先出原则持续将读数据异步FIFO中缓存的读数据传输至实例，直到接收到实例对读数据返回的流控信号，才暂停读数据的返回。

进一步的，上述步骤350具体包括：

在所述数据存储区域非满时，将所述访问指令持续传输至所述访问对象，直到接收到所述访问对象对所述访问指令的流控信号。

也就是说，FPGA芯片在将缓存的访问指令传输至访问对象之前，还需要判断数据存储区域是否非满。因数据存储区域用户缓存访问对象根据访问指令返回的读写反馈数据，如果该数据存储区域满了，则返回的读写反馈数据无法写入数据存储区域，还需另外进行寄存。由此，FPGA芯片在数据存储区域非满时，才不断向访问对象传输缓存的访问指令，直到接收到访问对象对访问指令返回的流控信号。

在一种示例性实施例中，如图5所示，上述步骤310具体包括：

在步骤311中，接收进行数据读写的访问请求，所述访问请求是所述实例与外部设备两端之间通过总线而向任意一端发起的；

其中，访问请求可以是实例或外部设备发起的。在一种实施例中，FPGA芯片的快速链路协议转换器通过对应于计算服务所运行实例的AXI总线或CCI-P总线，接收实例发起的用于对外部设备进行数据读写的访问请求。在一种实施例中，通过对应于外部设备的CCI-P总线或AXI总线，接收外部设备发起的用于对计算服务所运行实例进行数据读写的访问请求。

在步骤312中，根据不同类型总线之间的协议转换规则，处理所述访问请求获得相应访问指令。

需要说明的是，FPGA芯片110中可以预先存储不同总线之间的协议转换规则。根据AXI总线和CCI-P总线之间的协议转换规则，可以将实例通过AXI总线传输的访问请求，按照该协议转换规则映射得到对CCI-P总线进行访问的访问指令。在其他实施例中，可以将实例通过CCI-P总线传输的访问请求，按照该协议转换规则映射得到向AXI总线进行访问的访问指令。举例来说，按照协议转换规则，根据访问请求中所携带的AXI总线读地址与其他控制信息(如校验码等)计算出CCI-P总线读地址，获得包含该CCI-P总线读地址的访问指令，进而通过向外部设备传输该访问指令可以获得该读地址对应存储的数据。

进一步的，如图6所示，上述步骤312具体包括：

在步骤601中，根据所述访问请求所携带的标识信息，判断所述访问请求的有效性；

其中，标识信息用于指示访问请求的有效性。举例来说，访问请求中携带标识信息a，表示执行读操作。访问请求中携带标识信息b，表示执行写操作。当访问请求中没有携带上述标识信息时，表示该访问请求无效，由此根据访问请求所携带的标识信息，可以判断出访问请求是否有效，对于无效的访问请求可以不作处理。

在步骤602中，在所述访问请求有效时，根据不同类型总线之间的协议转换规则，将包含地址信号的访问请求映射得到包含读写地址的访问指令。

需要说明的是，通过AXI总线传输的访问请求，该访问请求是基于AXI总线协议，该访问请求中所携带的地址信号是基于AXI总线协议的访问地址。根据AXI总线和CCI-P总线之间的协议转换规则，可以将基于AXI总线的地址信号映射得到基于CCI-P总线的包含读写地址的访问指令。例如基于AXI总线协议的地址信号111111，映射得到的基于CCI-P总线协议的读写地址可能是111000。同样的，通过CCI-P总线传输的访问请求，也可以根据AXI总线和CCI-P总线之间的协议转换规则，将访问请求中所携带的基于CCI-P总线的地址信号映射得到基于AXI总线的包含读写地址的访问指令。

具体的，在判断出访问请求有效时，FPGA芯片的快速链路协议转换器可以根据AXI总线和CCI-P总线之间的协议转换规则，对于实例通过AXI总线传输的访问请求(包含读写地址)，将按照AXI总线传输的读写地址映射为通过CCI-P总线传输的读写地址，从而得到包含读写地址的访问指令。

在一种示例性实施例中，上述步骤330具体包括：

根据所述访问指令指示的访问对象及指令类型，持续将所述访问指令写入与所述访问对象及指令类型对应的指令存储区域，直到所述指令存储区域被写满。

其中，访问对象包括外部设备和实例，指令类型包括读指令和写指令。

当访问指令是访问外部设备的读指令时，该读指令存储在对应的第一读指令异步FIFO，在第一读指令异步FIFO非满时，按照读指令生成的先后顺序，将读指令按序缓存至第一读指令异步FIFO。由此在没有接收到外部设备对读指令的流控信号时，可以持续不断从第一读指令异步FIFO中读取读指令并传输至外部设备。

当访问指令是访问外部设备的写指令时，该写指令存储在对应的第一写指令异步FIFO，在第一写指令异步FIFO非满时，按照写指令生成的先后顺序，将写指令按序缓存至第一写指令异步FIFO。由此在没有接收到外部设备对写指令的流控信号时，可以持续不断从第一写指令异步FIFO中读取写指令并传输至外部设备。

当访问指令是访问实例的读指令时，该读指令存储在对应的第二读指令异步FIFO，在第二读指令异步FIFO非满时，按照读指令生成的先后顺序，将读指令按序缓存至第二读指令异步FIFO。由此在没有接收到实例对读指令的流控信号时，可以持续不断从第二读指令异步FIFO中获取读指令并传输至实例。

当访问指令是访问实例的写指令时，该写指令存储在对应的第二写指令异步FIFO，在第二写指令异步FIFO非满时，按照写指令生成的先后顺序，将写指令按序缓存至第二写指令异步FIFO。由此在没有接收到实例对写指令的流控信号时，可以持续不断从第二写指令异步FIFO中获取写指令并传输至实例。

图7为FPGA芯片中部署的AXI总线与CCI-P总线转换的总线转换装置系统框架图，如图7所示，该总线转换装置可以包括快速链路协议转换器113、AXI总线115的第一接口701、CCI-P总线114的第二接口702。快速链路协议转换器113对接AXI总线115的第一接口701以及CCI-P总线114的第二接口703，从而实现AXI总线115和CCI-P总线114之间的数据异步传输，以及数据的流模式传输。除非接收到流控信号，否则快速链路协议转换器113可以不间断向接口传输数据，最大限度提高数据传输效率，避免传输带宽的浪费。

其中，AXI总线115包含4条数据传输链路，CCI-P总线114包含三条数据传输链路，第一接口701由三条独立AXI总线和一条AXI-Lite总线组成，其中有两条独立AXI总线端口是主方(M:Master)，一条独立AXI总线端口是从方(S：Slave)。一条AXI-Lite总线端口是从方(S：Slave)。第二接口702由C0,C1,C2三条数据传输链路组成。

图8是图7所示总线转换装置的详细展开图。其中，快速链路协议转换器113包括AXI接口106、CCI-P接口105、读链路流处理模块101、写链路流处理模块102、全链路流处理模块103以及协链路流处理模块104。CCI-P接口105包括3个TX(发送端)和2个RX(接收端)。根据业务类型可以划分为7种业务，其对应关系如下表1所示。

表1：CCI-P接口业务类型列表

AXI接口106包括了3条AXI总线(AXI0、AXI1、AXI2)和1条AXI-Lite总线，其中3条AXI总线传输的是高速数据，AXI-Lite总线传输的是低速的配置数据，例如附加包头信息。AXI接口106与快速链路协议转换器113的互连关系如下表2所示。

表2：AXI总线互连关系

总线编号	主方	从方
AXI0	AXI接口	读链路流处理模块
AXI1	AXI接口	写链路流处理模块
AXI2	全链路流处理模块	AXI接口
AXI-Lite	协处理模块	AXI接口

具体的，读链路流处理模块101主要用于执行AXI总线115向CCI-P总线114的读操作，即接收来自AXI总线115的读请求，从CCI-P总线114读取数据并返回至AXI总线115(即MEM_RD和MEM_RD_RSP业务)。写链路流处理模块102主要用于执行AXI总线115向CCI-P总线114的写操作，即接收AXI总线115的写请求，将数据写入CCI-P总线114并接收返回的写响应(即MEM_WR和MEM_WR_RSP业务)。全链路流处理模块103主要用于执行CCI-P总线114向AXI总线115的读写操作，即将数据写入AXI总线115或从AXI总线115读取数据返回至CCI-P总线114(即MMIO_WR、MMIO_RD和MMIO_RD_RSP 业务)。协链路流处理模块104主要把C0.RX、C1.RX端口传输的写内存响应和读内存响应包含的附加包头信息通过AXI-Lite总线返回至AXI接口106。如下表3所示，为协链路流处理模块104的处理业务描述。

表3：协处理模块处理业务描述

业务类型	CCI-P硬件接口	返回具体信息
MEM_WR_RSP	C1.RX	写内存响应的附加包头信息
MEM_RD_RSP	C0.RX	读内存响应的附加包头信息

在一种示例性实施例中，当访问指令是访问外部设备120的读指令，对应于外部设备120的总线是CCI-P总线114时(参照图1所示实施环境)，FPGA芯片110中部署的读链路流处理模块101处理MEM_RD(读内存)和MEM_RD_RSP(读内存响应)业务，实现FPGA芯片110中不同类型总线之间的数据传输。读链路流处理模块101包含读指令异步FIFO以及读数据异步FIFO。如图9所示，读链路流处理模块101的具体工作流程包括以下步骤。

在步骤901，检测读请求。当读链路流处理模块处于空闲状态时，读链路流处理模块不断检测当前是否有读请求，并判断读请求是否有效，如果当前读请求有效，则进入计算读请求包头阶段。

在步骤902，计算读请求包头。根据读请求所携带的AXI总线读地址以及其他控制信息(如校验码)计算CCI-P总线读请求包头(即包含CCI-P总线读地址的读指令)。

在步骤903，写入读指令异步FIFO。在读指令异步FIFO非满时，把步骤702计算得到的读请求包头写入读指令异步FIFO。

在步骤904，发起CCI-P总线读操作(MEM_RD)。当CCI-P接口读反压无效而且读数据异步FIFO非满情况下,在CCI-P接口的CO.TX端口发起读操作。

在步骤905，接收CCI-P总线读数据返回。把CCI-P接口的C0.RX端口返回的读数据(MEM_RD_RSP)写入读数据异步FIFO。

在步骤906，当AXI接口读反压无效时，向AXI总线返回对应的读数据。

在另一示例性实施例中，当访问指令是访问实例111的读指令，对应于实例111的总线是AXI总线115时(参照图1所示实施环境)，FPGA芯片110中部署的全链路流处理模块103处理MMIO_RD_RSP(内存映射I/O读响应)和MMIO_RD(读内存映射I/O)业务。全链路流处理模块103包含读指令异步FIFO以及读数据异步FIFO。如图10所示，全链路流处理模块103处理MMIO_RD_RSP和MMIO_RD业务，完成读请求的具体工作流程包括以下步骤。

在步骤1001中，检测CCI-P C0.RX端口接收的读请求。当系统处于空闲状态时，链路不断检测当前是否有读请求，如果当前读请求有效，则进入步骤1002。

在步骤1002中，寄存CCI-P总线读地址，根据CCI-P读地址计算AXI总线读地址。

在步骤1003中，在读指令异步FIFO非满时，将AXI总线读地址写入读指令异步FIFO。

在步骤1004中，在读数据异步FIFO非满且AXI接口读反压无效时，向AXI总线发起读操作。

在步骤1005中，把AXI接口返回的读数据写入读数据异步FIFO。

在步骤1006中，当CCI-P C2.TX端口反压无效时，向CCI-P总线返回对应读数据。

需要说明的是，在处理读任务时，由于FPGA芯片110的读链路流处理模块101和全链路流处理模块103均包含读指令异步FIFO和读数据异步FIFO，因此在AXI总线115和CCI-P总线114之间支持异步时钟域之间数据和指令的传输；读链路流处理模块101和全链路流处理模块103支持流模式数据传输，当FIFO非满时允许以流方式不断写入指令或者数据，在无反压时不断输出指令或数据，最大限度提高访问效率，提高吞吐。

在一种示例性实施例中，当访问指令是访问外部设备120的写指令，对应于外部设备120的总线是CCI-P总线114时(参照图1所示实施环境)，FPGA芯片110中部署的写链路流处理模块102处理MEM_WR(写内存)和MEM_WR_RSP(写响应)业务。写链路流处理模块102包含写指令异步FIFO以及写响应异步FIFO。如图11所示，写链路流处理模块102的具体工作流程包括以下步骤。

在步骤1101中，检测写请求。当系统处于空闲状态时，写链路流处理模块不断检测当前是否有写请求，如果当前写请求有效，则同时进入MEM_WR和MEM_WR_RSP阶段。

对于MEM_WR阶段，当写请求有效后，进入步骤1102寄存AXI总线写地址和数据，当寄存完毕后，进入计算写请求包头。

在步骤1103中，计算写请求包头，根据当前AXI总线写地址以及其他控制信息计算CCI-P总线写请求包头(包括CCI-P总线写地址)。

在步骤1104中，在写指令异步FIFO非满时，将写地址和写数据(即写指令)写入写指令异步FIFO。

在步骤1105中，发起CCI-P总线写操作。当CCI-P总线写反压无效的情况下在CCI-P C1总线的TX端口发起MEM_WR操作。

对于MEM_WR_RSP阶段，当写请求有效后，进入步骤1106的等待写响应阶段。

在步骤1107中，接收CCI-P总线返回的写响应。

在步骤1108中，当写响应异步FIFO非满时，把CCI-P C1.RX返回的写响应(MEM_WR_RSP)写入写响应异步FIFO。

在步骤1109中，当AXI总线的写响应接口反压无效时，向AXI总线返回对应写响应。

在一种示例性实施例中，当访问指令是访问实例111的写指令，对应于实例111的总线是AXI总线115时(参照图1所示实施环境)，FPGA芯片110中部署的全链路流处理模块103处理MMIO_WR(写内存映射I/O))业务。其中，全链路流处理模块103支持读、写并行操作。全链路流处理模块103除了包含读指令异步FIFO以及读数据异步FIFO外，还包含写指令异步FIFO。如图11所示，全链路流处理模块103处理MMIO_WR业务的具体工作流程包括以下步骤。

在步骤1201中，检测CCI-P C0.RX写请求。当系统处于空闲状态时，链路不断检测当前是否有写请求，如果当前写请求有效，进入步骤1202。

在步骤1202中，寄存写请求所携带的CCI-P写地址和数据，当寄存完毕后，进入步骤1203。

在步骤1203中，根据寄存的CCI-P写请求包头，计算AXI写地址。

在步骤1204中，在写指令异步FIFO非满时，将写数据和AXI写地址(即写指令)写入写指令异步FIFO。

在步骤1205中，在AXI总线写端口反压无效时，对AXI总线执行写操作直到完毕。

需要说明的是，在处理写任务时，由于FPGA芯片110的写链路流处理模块102包含写指令异步FIFO和写响应异步FIFO，全链路流处理模块103包括写指令异步FIFO对写数据和写地址进行缓存，因此FPGA芯片110的AXI接口106和CCI-P接口105之间支持异步时钟域之间数据和指令的传输；写链路流处理模块102和全链路流处理模块103支持流模式数据传输，当FIFO非满时允许以流方式不断写入指令或者数据，在无反压时不断输出指令或数据，最大限度提高访问效率，提高吞吐，克服由于带宽不适配导致的带宽浪费问题。

图13是本申请示例性实施例提供的实现数据传输的方法的完整流程示意图。假设FPGA芯片本身采用的总线是CCI-P总线，从其他芯片移植过来的实例采用的总线是AXI总线，如图13所示，该实现数据传输的方法可以包括以下步骤。对于FPGA芯片采用AXI总线，实例采用CCI-P总线的情况，可以参照当前实施例执行。

在步骤1301中，FPGA芯片的快速链路协议转换器接收实例通过AXI总线(或者外部设备通过CCI-P总线)传输的读写请求；

在步骤1302中，根据访问请求携带的标识信息，判断读写请求是否有效，

在步骤1303中，在访问请求有效时，根据AXI总线和CCI-P总线之间的协议转换规则，将访问请求映射得到包含读写地址的读写指令；

在步骤1304中，在读指令异步FIFO非满时持续进行读指令的缓存，并在没有接收到外部设备通过CCI-P总线(或者实例通过AXI总线)返回对读指令的流控信号时，按照先进先出原则，持续将缓存的读指令通过CCI-P总线传输至外部设备(或者通过AXI总线传输至实例)。

在写指令异步FIFO非满时持续进行写指令的缓存，并在没有接收到外部设备通过CCI-P总线(或者实例通过AXI总线)返回对写指令的流控信号时，按照先进先出原则，持续将缓存的写指令通过CCI-P总线传输至外部设备(或者通过AXI总线传输至实例)。

下述为本申请装置实施例，可以用于执行本申请上述FPGA芯片中快速链路协议转换器执行的实现数据传输的方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请实现数据传输的方法实施例。

图14是根据一示例性实施例示出的一种实现数据传输的装置的框图，该实现数据传输的装置可以用于图1所示实施环境的FPGA芯片110中，执行图3-图6、图9-图13任一所示的实现数据传输的方法的全部或者部分步骤。如图14所示，该装置包括但不限于：指令获取模块1310、指令缓存模块1330以及指令传输模块1350。

指令获取模块1310，用于获取进行数据读写的访问指令，所述访问指令是所述实例与外部设备两端之间通过总线而向任意一端发起的；

指令缓存模块1330，用于将所述访问指令缓存至所述访问指令对应的指令存储区域；

指令传输模块1350，用于根据所述访问指令指示的访问对象，将所述指令存储区域缓存的所述访问指令持续传输至所述访问对象，直至受到流控才停止所述访问指令的传输。

上述装置中各个模块的功能和作用的实现过程具体详见上述实现数据传输的方法中对应步骤的实现过程，在此不再赘述。

指令获取模块1310、指令缓存模块1330、指令传输模块1350可以是功能模块，用于执行上述实现数据传输的方法中的对应步骤。可以理解，这些模块可以通过硬件、软件、或二者结合来实现。当以硬件方式实现时，这些模块可以实施为一个或多个硬件模块，例如一个或多个专用集成电路。当以软件方式实现时，这些模块可以实施为在一个或多个处理器上执行的一个或多个计算机程序。

在一种示例性实施例中，所述指令传输模块1350包括但不限于：

异步传输单元，用于按照向所述访问对象传输所述访问指令的时钟周期，持续将所述指令存储区域缓存的访问指令传输至所述访问对象，直到接收到所述访问对象对所述访问指令返回的流控信号。

在一种示例性实施例中，如图15所示，本申请提供的实现数据传输的装置还包括但不限于：

数据缓存模块1370，用于在所述访问指令对应的数据存储区域中，缓存所述访问对象根据所述访问指令返回的读写反馈数据；

数据传输模块1390，用于根据所述访问指令的发起方，将所述数据存储区域缓存的所述读写反馈数据持续传输至所述发起方，直到接收到所述发起方对所述读写反馈数据返回的流控信号。

持续传输单元，用于在所述数据存储区域非满时，将所述访问指令持续传输至所述访问对象，直到接收到所述访问对象对所述访问指令的流控信号。

在一种示例性实施例中，如图16所示，所述指令获取模块1310包括但不限于：

请求接收单元1311，用于接收进行数据读写的访问请求，所述访问请求是所述实例与外部设备两端之间通过总线而向任意一端发起的；

协议转换单元1312，用于根据不同类型总线之间的协议转换规则，处理所述访问请求获得相应访问指令。

其中，上述请求接收单元1311包括但不限于：

第一子单元，用于通过对应于计算服务所运行实例的AXI总线或CCI-P总线，接收所述实例发起的用于对外部设备进行数据读写的访问请求；

或者，

第二子单元，用于通过对应于所述外部设备的CCI-P总线或AXI总线，接收所述外部设备发起的用于对计算服务所运行实例进行数据读写的访问请求。

其中，上述协议转换单元1312包括但不限于：

判断子单元，用于根据所述访问请求所携带的标识信息，判断所述访问请求的有效性；

转换子单元，用于在所述访问请求有效时，根据不同类型总线之间的协议转换规则，将包含地址信号的访问请求映射得到包含读写地址的访问指令。

在一种示例性实施例中，上述指令缓存模块1330包括但不限于：

持续缓存单元，用于根据所述访问指令指示的访问对象及指令类型，持续将所述访问指令写入与所述访问对象及指令类型对应的指令存储区域，直到所述指令存储区域被写满。

本申请还提供一种电子设备，该电子设备可以用于图1所示实施环境的FPGA芯片110中，执行图3-图6、图9-图13任一所示的实现数据传输的方法的全部或者部分步骤。具体的，该电子设备可以包括：

处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为执行上述实施例所述的实现数据传输的方法。

该实施例中电子设备的处理器执行操作的具体方式已经在有关该实现数据传输的方法的实施例中执行了详细描述，此处将不做详细阐述说明。

在示例性实施例中，还提供了一种存储介质，该存储介质为计算机可读存储介质，例如可以为包括指令的临时性和非临时性计算机可读存储介质。该存储介质存储有计算机程序，该计算机程序可由图1所示实施环境中的FPGA芯片110执行以完成上述实现数据传输的方法。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围执行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims

一种实现数据传输的方法，由电子设备执行，所述方法应用于计算服务所运行实例和外部设备所分别对应的不同类型总线之间传输的执行，所述方法包括：

获取进行数据读写的访问指令，所述访问指令是所述实例与外部设备两端之间通过总线而向任意一端发起的；

将所述访问指令缓存至所述访问指令对应的指令存储区域；

根据所述访问指令指示的访问对象，将所述指令存储区域缓存的所述访问指令持续传输至所述访问对象，直至受到流控才停止所述访问指令的传输。
根据权利要求1所述的方法，其中，所述根据所述访问指令指示的访问对象，将所述指令存储区域缓存的所述访问指令持续传输至所述访问对象，直至受到流控才停止所述访问指令的传输，包括：

按照向所述访问对象传输所述访问指令的时钟周期，持续将所述指令存储区域缓存的访问指令传输至所述访问对象，直到接收到所述访问对象对所述访问指令返回的流控信号。
根据权利要求1所述的方法，其中，所述根据所述访问指令指示的访问对象，将所述指令存储区域缓存的所述访问指令持续传输至所述访问对象，直至受到流控才停止所述访问指令的传输之后，所述方法还包括：

在所述访问指令对应的数据存储区域中，缓存所述访问对象根据所述访问指令返回的读写反馈数据；

根据所述访问指令的发起方，将所述数据存储区域缓存的所述读写反馈数据持续传输至所述发起方，直到接收到所述发起方对所述读写反馈数据返回的流控信号。
根据权利要求3所述的方法，其中，所述根据所述访问指令指示的访问对象，将所述指令存储区域缓存的所述访问指令持续传输至所述访问对象，直至受到流控才停止所述访问指令的传输，包括：

在所述数据存储区域非满时，将所述访问指令持续传输至所述访问对象，直到接收到所述访问对象对所述访问指令的流控信号。
根据权利要求1所述的方法，其中，所述获取进行数据读写的访问指令，所述访问指令是所述实例与外部设备两端之间通过总线而向任意一端发起的，包括：

接收进行数据读写的访问请求，所述访问请求是所述实例与外部设备两端之间通过总线而向任意一端发起的；

根据不同类型总线之间的协议转换规则，处理所述访问请求获得相应访问指令。
根据权利要求5所述的方法，其中，所述接收进行数据读写的访问请求，包括：

通过对应于计算服务所运行实例的AXI总线或CCI-P总线，接收所述实例发起的用于对外部设备进行数据读写的访问请求。
根据权利要求5所述的方法，其中，所述接收进行数据读写的访问请求，包括：

通过对应于所述外部设备的CCI-P总线或AXI总线，接收所述外部设备发起的用于对计算服务所运行实例进行数据读写的访问请求。
根据权利要求5所述的方法，其中，所述根据不同类型总线之间的协议转换规则，处理所述访问请求获得相应访问指令，包括：

根据所述访问请求所携带的标识信息，判断所述访问请求的有效性；

在所述访问请求有效时，根据不同类型总线之间的协议转换规则，将包含地址信号的访问请求映射得到包含读写地址的访问指令。
根据权利要求1所述的方法，其中，所述将所述访问指令缓存至所述访问指令对应的指令存储区域，包括：

根据所述访问指令指示的访问对象及指令类型，持续将所述访问指令写入与所述访问对象及指令类型对应的指令存储区域，直到所述指令存储区域被写满。
一种实现数据传输的装置，所述装置应用于计算服务所运行实例和外部设备所分别对应的不同类型总线之间传输的执行，所述装置包括：

指令获取模块，用于获取进行数据读写的访问指令，所述访问指令是所述实例与外部设备两端之间通过总线而向任意一端发起的；

指令缓存模块，用于将所述访问指令缓存至所述访问指令对应的指令存储区域；

指令传输模块，用于根据所述访问指令指示的访问对象，将所述指令存储区域缓存的所述访问指令持续传输至所述访问对象，直至受到流控才停止所述访问指令的传输。
根据权利要求10所述的装置，其中，所述指令传输模块包括：

异步传输单元，用于按照向所述访问对象传输所述访问指令的时钟周期，持续将所述指令存储区域缓存的访问指令传输至所述访问对象，直到接收到所述访问对象对所述访问指令返回的流控信号。
根据权利要求10所述的装置，其中，所述装置还包括：

数据缓存模块，用于在所述访问指令对应的数据存储区域中，缓存所述访问对象根据所述访问指令返回的读写反馈数据；

数据传输模块，用于根据所述访问指令的发起方，将所述数据存储区域缓存的所述读写反馈数据持续传输至所述发起方，直到接收到所述发起方对所述读写反馈数据返回的流控信号。
根据权利要求12所述的装置，其中，所述指令传输模块包括：

持续传输单元，用于在所述数据存储区域非满时，将所述访问指令持续传输至所述访问对象，直到接收到所述访问对象对所述访问指令的流控信号。
根据权利要求10所述的装置，其中，所述指令获取模块包括：

请求接收单元，用于接收进行数据读写的访问请求，所述访问请求是所述实例与外部设备两端之间通过总线而向任意一端发起的；

协议转换单元，用于根据不同类型总线之间的协议转换规则，处理所述访问请求获得相应访问指令。
一种电子设备，所述电子设备包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行权利要求1-9任意一项所述的实现数据传输的方法。
一种计算机可读存储介质，存有处理器可执行指令，所述指令由一个或一个以上处理器执行时，完成如权利要求1-9中任一的实现数据传输的方法。