CN111831226A

CN111831226A - 一种自主输出nvme协议命令加速处理方法

Info

Publication number: CN111831226A
Application number: CN202010643442.3A
Authority: CN
Inventors: 孙中琳; 刘奇浩; 粟如发; 段好强
Original assignee: Shandong Sinochip Semiconductors Co Ltd
Current assignee: Shandong Sinochip Semiconductors Co Ltd
Priority date: 2020-07-07
Filing date: 2020-07-07
Publication date: 2020-10-27
Anticipated expiration: 2040-07-07
Also published as: CN111831226B

Abstract

本发明公开一种自主输出NVME协议命令加速处理方法，本方法在NVME子系统的CPU中集成一个或多个数据紧耦合内存单元DTCM，在NVME控制器增加一个AXI MASTER接口，所述AXI MASTER接口接入AXI总线，地址访问空间为CPU内部的DTCM地址；NVME控制器通过AXI MASTER接口将NVME命令写入DTCM，NVME子系统中的CPU内核直接访问DTCM；并且NVME子系统根据namespace ID，将namespace ID不同的所有命令写入相应的DTCM中。本发明减少了CPU读取操作次数，降低时延，提高性能。

Description

一种自主输出NVME协议命令加速处理方法

技术领域

本发明涉及NVME协议命令处理领域，具体地说，是一种自主输出NVME协议命令加速处理方法。

背景技术

NVM Express(NVME)：非易失性内存主机控制器接口规范主要面向PCIe SSD 开发的一套接口标准。NVME定义了系统接口、队列、寄存器和命令集，优势在于延迟更低，性能更好，功耗更低。

现有NVME命令的处理流程中，首先是主机阶段，主机向提交队列（SubmissionQueue，SQ）写入NVME命令，主机通过更新NVME子系统控制器中的寄存器SQ Tail Doorbell通知控制器提取NVME命令；第二阶段是NVME子系统控制器阶段，控制器从SQ提取NVME命令，执行该命令，执行命令结束后，将完成状态写入CQ，并且更新CQ Tail Pointer寄存器；第三阶段是主机阶段，主机检查CQ中的命令完成状态和完成信息，处理完成后更新控制器内部寄存器CQ Head Doorbell。从上述流程中，可以看出NVME协议详细的规定了HOST和控制器之间的处理操作，对于控制器得到NVME命令到执行该命令，却没有过多描述。现有的方案是控制器得到NVME命令，并将该命令写入控制器内部的寄存器，控制器内部CPU通过读取寄存器得到该命令，但一条NVME命令为64Byte，而单个寄存器数据量仅为4byte，因此CPU需要连续读取16次寄存器才能够得到一条NVME命令，该方案存在CPU操作频繁，长期占用CPU资源，时延消耗大等缺点。

另外，为了支持不同类型的应用层，NVME协议支持多namespace，一个空间可以对应若干个逻辑空间，每个namespace都有一个ID，HOST通过ID来区分不同的namespace，不同的namespace可以有不同的数据结构和相关设置，但支持多namespace的同时，会增加软件对不同namespace的处理开销和设计难度。

发明内容

本发明要解决的技术问题是提供一种自主输出NVME协议命令加速处理方法，减少了CPU读取操作次数，降低时延，提高性能。

为了解决所述技术问题，本发明采用的技术方案是：一种自主输出NVME协议命令加速处理方法，包括以下步骤：

S01）、在NVME子系统的CPU中集成一个或多个数据紧耦合内存单元DTCM，在NVME控制器增加一个AXI MASTER接口，所述AXI MASTER接口接入AXI总线，地址访问空间为CPU内部的DTCM地址；

S02）、NVME控制器通过AXI MASTER接口将NVME命令写入DTCM，NVME子系统中的CPU内核直接访问DTCM；

S03）、NVME子系统根据namespace ID，将namespace ID为i的所有命令通过AXI MASTER接口将NVME 命令写入DTCM_i中，i=1,2,…,n：

S04）每个DTCM都采用队列方式实现，由NVME控制器和NVME子系统中的CPU共同维护，NVME控制器作为本队列的生产者，通过PCIe接口获得主机命令，再将主机命令通过AXIMASTER接口写入DTCM中，CPU作为该队列的消费者，NVME子系统中的CPU直接读取DTCM，获得待执行的主机命令。

进一步的，NVME控制器使用Tail入口指针向DTCM队列提交主机命令，CPU使用Head入口指针从DTCM队列获得主机命令。

进一步的，Tail、Head是NVME控制器的内部寄存器，Tail寄存器为NVME控制器可写、CPU只读，Head寄存器为NVME控制器只读、CPU可写。

进一步的，NVME子系统中系统总线、NVME控制器、CPU与系统总线接口的数据宽度支持参数配置。

进一步的，DTCM大小为N*64Byte。

进一步的，NVME子系统的CPU为多核CPU，每个CPU内核均集成一个DTCM。

进一步的，每个DTCM与NVME控制器、CPU的通信并行进行。

进一步的，DTCM为空的条件是Head指针等于Tail指针，DTCM为满的条件是Head指针等于Tail指针加1，当Tail指针等于DTCM深度时，则自动回0.

进一步的，当DTCM不满时，NVME控制器接收的主机命令通过AXI MASTER接口向DTCM写入；当DTCM不空时，NVME子系统中的CPU从DTCM中读取主机命令。

本发明提供一种自主输出NVME协议命令加速处理方法，有以下有益效果：

1、NVME 控制器通过AXI MASTER接口将主机命令写入DTCM中，具有AXI总线高性能、高带宽、低延时等优势，提高系统总线的数据传输高效性；

2、NVME 控制器跟据namespace ID将每个namespace的命令写入不同的DTCM中，利用多核CPU，NVME子系统支持并行处理命令，提高系统的高效性；

3、NVME子系统中系统总线、NVME 控制器、CPU与总线接口的数据宽度可用参数配置，将数据宽度配置为N*64Byte，NVME 控制器可单次将N条主机命令写入CPU内部TCM中，单次写入数据量增加至N*64Byte，并且CPU单次大批量从DTCM中读取主机命令，减少了CPU操作次数，解决了之前CPU单次访问NVME 控制器寄存器只读取4Byte数据量的问题，提高了NVME子系统带宽和性能；

4、将主机命令存储在DTCM中，CPU内核可直接访问DTCM，访问速度极快，提高CPU访问效率，使整个NVME子系统具有高性能、高带宽、低延时的特性。

附图说明

图1为基于PCIe接口NVME控制器示意图；

图2为DTCM空状态示意图；

图3为DTCM满状态示意图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步的说明。

实施例1

本实施例公开一种自主输出NVME协议命令加速处理方法，包括以下步骤：

S01）、如图1所示，在NVME子系统的CPU中集成一个或多个数据紧耦合内存单元DTCM（Data Tightly Coupled Memory），在NVME控制器增加一个AXI MASTER接口，所述AXIMASTER接口接入AXI总线，地址访问空间为CPU内部的DTCM地址；

本实施例中，NVME控制器使用Tail入口指针向DTCM队列提交主机命令，CPU使用Head入口指针从DTCM队列获得主机命令。具体的，Tail、Head是NVME控制器的内部寄存器，Tail寄存器为NVME控制器可写、CPU只读，Head寄存器为NVME控制器只读、CPU可写。

本实施例中，NVME子系统中系统总线、NVME控制器、CPU与系统总线接口的数据宽度支持参数配置。DTCM可存储N条主机命令，由于一条主机命令为64Byte，因此DTCM大小为N*64Byte。将系统总线的数据宽度置为N*64Byte，NVME控制器可单次将N条NVME命令写入CPU内部DTCM中，单次写入数据量增加至N*64Byte，并且CPU单次大批量从DTCM中读取主机命令，减少了CPU操作次数，解决了之前CPU单次访问NVME控制器寄存器只读取4Byte数据量的问题，提高了NVME子系统带宽和性能。

本实施例中，DTCM数据位宽为16Byte，一条主机命令需要读取或者写入64Byte/16Byte次DTCM，DTCM深度为N*(64Byte/16Byte)。当NVME控制器写入I条主机命令时，Tail指针等于I*(64Byte/16Byte)，当CPU读取J条主机命令时，Head指针等于J*(64Byte/16Byte)。

本实施例中，NVME子系统的CPU为双核CPU，每个CPU内核均集成一个DTCM，如图1所示，CPU中集成了两个DTCM，分别为DTCM0和DTCM1。每个DTCM与NVME控制器、CPU的通信并行进行。

如图2所示，DTCM为空的条件是Head指针等于Tail指针，如图3所示，DTCM为满的条件是Head指针等于Tail指针加1，当Tail指针等于DTCM深度时，则自动回0。

当DTCM不满时，NVME控制器接收的主机命令通过AXI MASTER接口向DTCM写入；当DTCM不空时，NVME子系统中的CPU从DTCM中读取主机命令。

本发明提出一种自主输出NVME协议命令加速处理的方法，将NVME命令写入DTCM中，CPU需要读取NVME命令时直接访问DTCM，不用消耗时间访问外部的寄存器或者RAM。NVME命令处理模块接口配置为主机端接口，访问地址空间为NVME子系统中CPU内部的DTCM，NVME命令处理模块通过系统总线可直接将NVME命令写入到DTCM中，CPU读取DTCM获得NVME命令，由于DTCM被直接集成在CPU芯片中，缩短了CPU获得NVME命令的时间延时，另一方面，由于NVME命令处理模块一次性可将NVME命令大批量写入DTCM中，减少了CPU读取操作次数，提高NVME命令传输高效性。并且利用多核CPU芯片中，每个核都对应有一个DTCM，将不同namespace的NVME命令放在不同核的DTCM中，实现多核CPU对多namespace的NVME命令的执行，提高多namespace的读写性能。

以上描述的仅是本发明的基本原理和优选实施例，本领域技术人员根据本发明做出的改进和替换，属于本发明的保护范围。

Claims

1.一种自主输出NVME协议命令加速处理方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的自主输出NVME协议命令加速处理方法，其特征在于：NVME控制器使用Tail入口指针向DTCM队列提交主机命令，CPU使用Head入口指针从DTCM队列获得主机命令。

3.根据权利要求2所述的自主输出NVME协议命令加速处理方法，其特征在于：Tail、Head是NVME控制器的内部寄存器，Tail寄存器为NVME控制器可写、CPU只读，Head寄存器为NVME控制器只读、CPU可写。

4.根据权利要求1所述的自主输出NVME协议命令加速处理方法，其特征在于：NVME子系统中系统总线、NVME控制器、CPU与系统总线接口的数据宽度支持参数配置。

5.根据权利要求1所述的自主输出NVME协议命令加速处理方法，其特征在于：DTCM大小为N*64Byte。

6.根据权利要求1所述的自主输出NVME协议命令加速处理方法，其特征在于：NVME子系统的CPU为多核CPU，每个CPU内核均集成一个DTCM。

7.根据权利要求6所述的自主输出NVME协议命令加速处理方法，其特征在于：每个DTCM与NVME控制器、CPU的通信并行进行。

8.根据权利要求2所述的自主输出NVME协议命令加速处理方法，其特征在于：DTCM为空的条件是Head指针等于Tail指针，DTCM为满的条件是Head指针等于Tail指针加1，当Tail指针等于DTCM深度时，则自动回0。

9.根据权利要求1所述的自主输出NVME协议命令加速处理方法，其特征在于：当DTCM不满时，NVME控制器接收的主机命令通过AXI MASTER接口向DTCM写入；当DTCM不空时，NVME子系统中的CPU从DTCM中读取主机命令。