CN105426120A - 一种基于nvme的混合加速系统 - Google Patents

一种基于nvme的混合加速系统 Download PDF

Info

Publication number
CN105426120A
CN105426120A CN201510726309.3A CN201510726309A CN105426120A CN 105426120 A CN105426120 A CN 105426120A CN 201510726309 A CN201510726309 A CN 201510726309A CN 105426120 A CN105426120 A CN 105426120A
Authority
CN
China
Prior art keywords
pcie
module
pond
nvme
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510726309.3A
Other languages
English (en)
Other versions
CN105426120B (zh
Inventor
王磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201510726309.3A priority Critical patent/CN105426120B/zh
Publication of CN105426120A publication Critical patent/CN105426120A/zh
Application granted granted Critical
Publication of CN105426120B publication Critical patent/CN105426120B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于NVME的混合加速系统,包括业务应用池、PCIe交换池、网络通讯池以及至少两个管理模块,所述业务应用模块、所述PCIe交换模块与所述数据通讯模块同时通过I2C总线以及以太网与所述管理模块相连接,所述I2C总线用于获取各模块的底层核心器件信息,业务应用模块包括多个NVME磁盘阵列和PCIe交换单元,PCIe交换池与所述业务应用池相连接,用于使PCIe数据在所述业务应用模块间传输,设计至少两个管理模块对各模块进行管理,且同时采用I2C和以太网的双管理链路设计,冗余设计防止单个管理模块或链路出现故障,整个架构用PCIe传输技术作为核心的数据传输网络,实现针对NVME磁盘阵列的物理底层资源的池化和其他模块的池化,便于集中的部署及管理。

Description

一种基于NVME的混合加速系统
技术领域
本发明涉及计算机领域,特别是涉及一种基于NVME的混合加速系统。
背景技术
NVMe是一个由10个公司发起的,目前已有80多个业内知名公司加入的行业协会,其成员包括EMC、戴尔、英特尔、甲骨文以及NetApp等公司,NVMe是专为企业级和客户端系统设计的采用PCIe固态硬盘的可扩展的主机控制器接口,其中包括优化的寄存器接口和命令集。
NVME是基于PCIe信号传输,比传统基于SAS或SATA传输的磁盘相比,不仅在传输带宽上有明显的提高,而且PCIe信号可以直接与处理器进行通信,数据通讯的延时更低。但是目前还没有基于大规模NVMe阵列的集运算、网络及管理为一体的系统出现。
发明内容
有鉴于此,本发明的主要目的在于提供一种基于NVME的混合加速系统,可以基于大规模NVMe阵列集运算、网络及管理为一体。
为实现上述目的,本发明提供了一种基于NVME的混合加速系统,包括业务应用池、PCIe交换池、网络通讯池以及至少两个管理模块;
所述业务应用池包括多个业务应用模块,所述PCIe交换池包括多个PCIe交换模块,所述网络通讯池包括多个数据通讯模块;
所述业务应用模块、所述PCIe交换模块与所述数据通讯模块同时通过I2C总线以及以太网与所述管理模块相连接;
所述I2C总线用于获取各模块的底层核心器件信息;
所述以太网用于获取各模块的日志;
所述管理模块用于获取所述业务应用模块、所述PCIe交换模块与所述数据通讯模块的运行状态并对各模块进行管理;
所述业务应用模块包括多个NVME磁盘阵列和PCIe交换单元;
所述PCIe交换池与所述业务应用池相连接,用于使PCIe数据在所述业务应用模块间传输;
所述网络通讯池与所述PCIe交换池相连接,用于进行数据传输。
优选地,所述业务应用模块还包括:
处理单元,与所述NVME磁盘阵列与PCIe交换单元均相连接,用于控制所述NVME磁盘阵列;
网络单元,与所述处理单元通过PCIe信号进行连接,用于将PCIe信号转换为目标网络信号,进行信息的交换和网络信息的接收。
优选地,所述PCIe交换模块包括PCIe交换单元;
所述PCIe交换单元包括处理器、32个数据端口和3个PLX交换芯片;
所述处理器同时通过I2C总线、JTAG总线和PCIe总线与3个所述PLX交换芯片均相连接。
优选地,所述基于NVME的混合加速系统还包括:
与所述PCIe交换池和所述网络通讯池均相连接的I/O扩展池,用于将业务应用池中处理的数据和运算结果传送至网络通讯池;
所述I/O扩展池包括多个I/O子模块。
优选地,所述基于NVME的混合加速系统还包括:
与所述网络通讯池相连接的数据存储池,用于接收所述网络通讯池传递的数据进行存储。
应用本发明提供的一种基于NVME的混合加速系统,包括业务应用池、PCIe交换池、网络通讯池以及至少两个管理模块,所述业务应用模块、所述PCIe交换模块与所述数据通讯模块同时通过I2C总线以及以太网与所述管理模块相连接,所述I2C总线用于获取各模块的底层核心器件信息,业务应用模块包括多个NVME磁盘阵列和PCIe交换单元,PCIe交换池与所述业务应用池相连接,用于使PCIe数据在所述业务应用模块间传输,设计至少两个管理模块对各模块进行管理,且同时采用I2C和以太网的双管理链路设计,冗余设计防止单个管理模块或链路出现故障,整个架构用PCIe传输技术作为核心的数据传输网络,实现针对NVME磁盘阵列的物理底层资源的池化和其他模块的池化,便于集中的部署及管理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明一种基于NVME的混合加速系统实施例的结构示意图;
图2为本发明一种基于NVME的混合加速系统实施例的详细拓扑图;
图3为本发明一种基于NVME的混合加速系统实施例的又一结构示意图;
图4为本发明一种基于NVME的混合加速系统实施例的详细结构示意图;
图5为本发明一种基于NVME的混合加速系统实施例的又一详细结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种基于NVME的混合加速系统,包括业务应用池、PCIe交换池、网络通讯池以及至少两个管理模块;
图1示出了本发明基于NVME的混合加速系统实施例的结构示意图,以两个管理模块为例,图中系统包括:业务应用池101、PCIe交换池102、网络通讯池103以及至少两个管理模块104;
所述业务应用池101包括多个业务应用模块,所述PCIe交换池102包括多个PCIe交换模块,所述网络通讯池103包括多个数据通讯模块;
图2示出了本实施例详细拓扑图,整个管理架构基于全冗余的架构,首先设置2个管理模块对系统中的所有模块进行管理,管理模块用于获取业务应用模块、PCIe交换模块与数据通讯模块的运行状态并对各模块进行管理,2个管理模块用户可以在同一时间一同使用,由于管理模块是作为系统中的管理核心,一旦单个管理模块出现故障,用户将无法得知系统中设备的运行状态等管理信息,因此冗余的设计将完全解决此风险;其次采用I2C总线和以太网的双管理链路设计,I2C总线主要用来获取各模块的底层核心器件的信息,比如模块时时运行的温度、核心器件的电流/电压情况。以太网主要用来实现基于IPMI的管理,获取各模块的了Log日志基于当出现故障时通过SNMP发送预警。同时I2C和以太网双管理链路的设计,也可避免当单管理链路失效后管理模块失去对子模块管理信息的获取,I2C总线可使用星型总线代替。
系统中除业务应用池、PCIe交换池、网络通讯池之外,如图3所示,还包括:
与所述PCIe交换池和所述网络通讯池均相连接的I/O扩展池,以及与所述网络通讯池相连接的数据存储池,所述I/O扩展池包括多个I/O子模块。
全新的架构由业务应用池、PCIe交换池、I/O扩展池、网络通讯池和数据存储池五部分组成,其中业务应用池由多个含有NVME阵列的模块组成,每个模块中主要由处理单元、PCIe交换单元和NVME磁盘阵列组成,所有的NVME磁盘阵列都是由处理单元进行直接的控制,由于处理单元物理支持的PCIe通道数量有限,为了进一步能扩展支持NVME磁盘的数量,引入PCIe交换单元作为PCIe信号的扩展,整个业务应用池实现基于NVME磁盘的数据加速,来提升整个架构的应用数据处理速度;
PCIe交换池作为多个NVME阵列模块间数据的交换中枢,整个PCIe交换池基于PCIe信号传输,实现PCIe数据在NVME池中所有模块间的传输,同时提供冗余模式的传输通路架构,进一步保证核心数据交换的可靠性;
I/O扩展池一方面提升NVME阵列模块的扩展性能,可以搭配传统的FPGA或GPU等协处理单元来进一步加强子模块的浮点及多线程计算处理能力,另一方面实现与网络通讯模块间的数据通信,可以将业务应用池中处理的数据及运算的结果通过I/O扩展池传送给网络通讯池,再由网络通讯池将数据传递给数据存储池进行存储,同时也可直接从数据存储池中读取数据进行运算;
网络通讯池可采用FC协议进行数据传输的协议,FC协议较传统的以太网不但采用私有的基于链路质量的协议进行数据传输,数据的安全性和完整性更好,而且采用光纤的物理传输通路,传输距离更远、传输带宽更高;
具体地,图4示出了业务应用池中单个业务应用模块的结构示意图,每个模块中主要由处理单元、PCIe交换单元和NVME磁盘阵列组成,所有的NVME磁盘阵列都是由处理单元进行直接的控制,由于处理单元物理支持的PCIe通道数量有限,为了进一步能扩展支持NVME磁盘的数量,引入PCIe交换单元作为PCIe信号的扩展,整个业务应用池实现基于NVME磁盘的数据加速。网络单元与处理单元通过PCIe信号进行连接,网络单元实现将PCIe信号转换为不同网络的信号进行信息的对外交换及网络信息的接收。
图5为业务应用模块中以及PCIe交换池中的PCIe交换单元的结构示意图,PCIe交换单元设备负责整个系统中PCIe数据的接收、交换与转发。整个交换单元对外有32个数据端口,每个端口的数据带宽可以达到32Gb/s,外部交换带宽可达1024Gb/s。交换单元设计中主要由处理器、PLX交换芯片组成,由于考虑到数据传输的带宽和数据通道的数量,数据交换核心采用通过3个PLX交换芯片联合来组成,内部交换带宽可以达到128Gb/s。处理器采用市场上主流的ARM芯片,处理器与3个PLX芯片间分别通过I2C、JTAG和PCIe三条总线连接,其中I2C总线用于接收PLX芯片的状态信息及传送管理信息;JTAG总线用于与PLX芯片间的调试;从处理器出来的1组PCIe总线通过PEX8606转成3组PCIe信号后分别连接3颗PLX芯片,用来实现业务数据的传输。
应用本实施例提供的一种基于NVME的混合加速系统,主要包括业务应用池、PCIe交换池、网络通讯池以及至少两个管理模块,所述业务应用模块、所述PCIe交换模块与所述数据通讯模块同时通过I2C总线以及以太网与所述管理模块相连接,所述I2C总线用于获取各模块的底层核心器件信息,业务应用模块包括多个NVME磁盘阵列和PCIe交换单元,PCIe交换池与所述业务应用池相连接,用于使PCIe数据在所述业务应用模块间传输,设计至少两个管理模块对各模块进行管理,且同时采用I2C和以太网的双管理链路设计,冗余设计防止单个管理模块或链路出现故障,整个架构用PCIe传输技术作为核心的数据传输网络,实现针对NVME磁盘阵列的物理底层资源的池化和其他模块的池化,便于集中的部署及管理。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (5)

1.一种基于NVME的混合加速系统,其特征在于,包括业务应用池、PCIe交换池、网络通讯池以及至少两个管理模块;
所述业务应用池包括多个业务应用模块,所述PCIe交换池包括多个PCIe交换模块,所述网络通讯池包括多个数据通讯模块;
所述业务应用模块、所述PCIe交换模块与所述数据通讯模块同时通过I2C总线以及以太网与所述管理模块相连接;
所述I2C总线用于获取各模块的底层核心器件信息;
所述以太网用于获取各模块的日志;
所述管理模块用于获取所述业务应用模块、所述PCIe交换模块与所述数据通讯模块的运行状态并对各模块进行管理;
所述业务应用模块包括多个NVME磁盘阵列和PCIe交换单元;
所述PCIe交换池与所述业务应用池相连接,用于使PCIe数据在所述业务应用模块间传输;
所述网络通讯池与所述PCIe交换池相连接,用于进行数据传输。
2.根据权利要求1所述的基于NVME的混合加速系统,其特征在于,所述业务应用模块还包括:
处理单元,与所述NVME磁盘阵列与PCIe交换单元均相连接,用于控制所述NVME磁盘阵列;
网络单元,与所述处理单元通过PCIe信号进行连接,用于将PCIe信号转换为目标网络信号,进行信息的交换和网络信息的接收。
3.根据权利要求2所述的基于NVME的混合加速系统,其特征在于,所述PCIe交换模块包括PCIe交换单元;
所述PCIe交换单元包括处理器、32个数据端口和3个PLX交换芯片;
所述处理器同时通过I2C总线、JTAG总线和PCIe总线与3个所述PLX交换芯片均相连接。
4.根据权利要求1所述的基于NVME的混合加速系统,其特征在于,还包括:
与所述PCIe交换池和所述网络通讯池均相连接的I/O扩展池,用于将业务应用池中处理的数据和运算结果传送至网络通讯池;
所述I/O扩展池包括多个I/O子模块。
5.根据权利要求4所述的基于NVME的混合加速系统,其特征在于,还包括:
与所述网络通讯池相连接的数据存储池,用于接收所述网络通讯池传递的数据进行存储。
CN201510726309.3A 2015-10-30 2015-10-30 一种基于nvme的混合加速系统 Active CN105426120B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510726309.3A CN105426120B (zh) 2015-10-30 2015-10-30 一种基于nvme的混合加速系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510726309.3A CN105426120B (zh) 2015-10-30 2015-10-30 一种基于nvme的混合加速系统

Publications (2)

Publication Number Publication Date
CN105426120A true CN105426120A (zh) 2016-03-23
CN105426120B CN105426120B (zh) 2018-07-06

Family

ID=55504353

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510726309.3A Active CN105426120B (zh) 2015-10-30 2015-10-30 一种基于nvme的混合加速系统

Country Status (1)

Country Link
CN (1) CN105426120B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021525A (zh) * 2016-10-28 2018-05-11 北京计算机技术及应用研究所 一种基于pcie总线多主互连的冗余交换系统
CN109933554A (zh) * 2019-03-20 2019-06-25 浪潮商用机器有限公司 一种基于GPU服务器的NVMe硬盘扩展装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1591354A (zh) * 2003-08-25 2005-03-09 英业达股份有限公司 计算机机箱管理系统
US20120096211A1 (en) * 2009-10-30 2012-04-19 Calxeda, Inc. Performance and power optimized computer system architectures and methods leveraging power optimized tree fabric interconnect
CN104025063A (zh) * 2012-08-24 2014-09-03 英特尔公司 用于共享网络接口控制器的方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1591354A (zh) * 2003-08-25 2005-03-09 英业达股份有限公司 计算机机箱管理系统
US20120096211A1 (en) * 2009-10-30 2012-04-19 Calxeda, Inc. Performance and power optimized computer system architectures and methods leveraging power optimized tree fabric interconnect
CN104025063A (zh) * 2012-08-24 2014-09-03 英特尔公司 用于共享网络接口控制器的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HUANGHUI: "NVMe推动PCIe与闪存紧密结合", 《HTTP://STORAGE.CHINABYTE.COM/200/13002200.SHTML》 *
PMC公司: "NVME and PCIE SSDs NVME Management Interface", 《HTTPS://WENKU.BAIDU.COM/VIEW/2B4C9B05312B3169A451A4F0.HTML》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021525A (zh) * 2016-10-28 2018-05-11 北京计算机技术及应用研究所 一种基于pcie总线多主互连的冗余交换系统
CN108021525B (zh) * 2016-10-28 2019-11-15 北京计算机技术及应用研究所 一种基于pcie总线多主互连的冗余交换系统
CN109933554A (zh) * 2019-03-20 2019-06-25 浪潮商用机器有限公司 一种基于GPU服务器的NVMe硬盘扩展装置
CN109933554B (zh) * 2019-03-20 2021-02-09 浪潮商用机器有限公司 一种基于GPU服务器的NVMe硬盘扩展装置

Also Published As

Publication number Publication date
CN105426120B (zh) 2018-07-06

Similar Documents

Publication Publication Date Title
US9043526B2 (en) Versatile lane configuration using a PCIe PIe-8 interface
CN106462498B (zh) 用于数据存储系统的模块化交换架构
TWI538450B (zh) 利用串行器/解串器通道來實現50Gb/s乙太網的裝置
US10802887B2 (en) Compute nodes within reconfigurable computing clusters
Schares et al. Optics in future data center networks
JP2021185497A (ja) 再構成可能なサーバー及びそれを有するサーバーラック
Storage Technology Brief
CN105099776A (zh) 云服务器的管理系统
CN104135514A (zh) 融合式虚拟化存储系统
CN104639469A (zh) 一种基于pcie互连的计算和存储集群系统
CN105138494A (zh) 一种多路计算机系统
CN107220195A (zh) 一种支持高密度NVMe存储的多路计算机系统架构
CN105763488B (zh) 数据中心汇聚核心交换机及其背板
CN105426120A (zh) 一种基于nvme的混合加速系统
US20190065272A1 (en) Connecting accelerator resources using a switch
CN105224496A (zh) 一种动态可重构系统
CN104486256B (zh) 面向融合架构服务器的多平面交换网络设备
CN107181702B (zh) 一种实现RapidIO和以太网融合交换的装置
Saljoghei et al. dreddbox: Demonstrating disaggregated memory in an optical data centre
CN104898775A (zh) 计算装置、存储装置、网络交换设备及计算机体系架构
CN105511990B (zh) 基于融合架构双冗余度存储控制节点架构的装置
CN104598403A (zh) 一种基于pcie交换器的集群存储系统
CN104579786B (zh) 一种基于2D Torus网络拓扑架构的服务器设计方法
CN204463103U (zh) 一种数据传输系统及数据处理设备
US20200235815A1 (en) Methods and sysems for reconfigurable network topologies

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant