CN118689287B - 刀片服务器系统、服务器以及cxl内存配置方法 - Google Patents

刀片服务器系统、服务器以及cxl内存配置方法 Download PDF

Info

Publication number
CN118689287B
CN118689287B CN202411184200.7A CN202411184200A CN118689287B CN 118689287 B CN118689287 B CN 118689287B CN 202411184200 A CN202411184200 A CN 202411184200A CN 118689287 B CN118689287 B CN 118689287B
Authority
CN
China
Prior art keywords
blade
cxl
nodes
node
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202411184200.7A
Other languages
English (en)
Other versions
CN118689287A (zh
Inventor
丁超
邵家麒
于云杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Metabrain Intelligent Technology Co Ltd
Original Assignee
Suzhou Metabrain Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Metabrain Intelligent Technology Co Ltd filed Critical Suzhou Metabrain Intelligent Technology Co Ltd
Priority to CN202411184200.7A priority Critical patent/CN118689287B/zh
Publication of CN118689287A publication Critical patent/CN118689287A/zh
Application granted granted Critical
Publication of CN118689287B publication Critical patent/CN118689287B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/18Packaging or power distribution
    • G06F1/183Internal mounting support structures, e.g. for supporting printed circuit boards
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/161Computing infrastructure, e.g. computer clusters, blade chassis or hardware partitioning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/173Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
    • G06F15/17337Direct connection machines, e.g. completely connected computers, point to point communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Power Engineering (AREA)
  • Human Computer Interaction (AREA)
  • Multi Processors (AREA)

Abstract

本申请实施例提供了一种刀片服务器系统、服务器、CXL内存配置方法、存储介质、电子设备以及计算机程序产品,其中,该刀片服务器系统包括:机箱壳体,多个刀片节点以及计算快速链路交换CXL Switch板,多个所述刀片节点以及所述CXL Switch板内置于所述机箱壳体中;每个所述刀片节点均通过正交高密连接器与所述CXL Switch板直连;其中,在多个所述刀片节点中包括满足目标条件的目标刀片节点的情况下,所述目标刀片节点还通过高密线缆连接器与所述CXL Switch板连接;多个所述刀片节点均为中央处理单元CPU计算节点;或者,多个所述刀片节点中的部分刀片节点为中央处理单元CPU计算节点,部分刀片节点为计算快速链路CXL内存扩展节点。

Description

刀片服务器系统、服务器以及CXL内存配置方法
技术领域
本申请实施例涉及计算机领域,具体而言,涉及一种刀片服务器系统、服务器、CXL内存配置方法、存储介质、电子设备以及计算机程序产品。
背景技术
CXL(Compute Express Link)技术由于可以提供较高的数据吞吐量、具备较低的延迟,因此可以满足现代计算、存储系统的需求,相关技术中,由于分别单独设置服务器机箱、CXL扩展BOX以及CXL Switch机架式BOX,因此,服务器机箱、CXL扩展BOX以及CXL Switch机架式BOX之间需要采用大量线缆进行连接,花费成本较高,同时设备组装维护的可靠性不足。
发明内容
本申请实施例提供了一种刀片服务器系统、服务器、CXL内存配置方法、存储介质、电子设备以及计算机程序产品,以至少解决相关技术中由于分别单独设置服务器机箱、CXL扩展BOX以及CXL Switch机架式BOX,因此,服务器机箱、CXL扩展BOX以及CXL Switch机架式BOX之间需要采用大量线缆进行连接,所造成的花费成本较高、设备组装维护的可靠性不足的问题。
根据本申请的一个实施例,提供了一种刀片服务器系统,包括:机箱壳体,多个刀片节点以及计算快速链路交换CXL Switch板,多个所述刀片节点以及所述CXL Switch板内置于所述机箱壳体中;每个所述刀片节点均通过正交高密连接器与所述CXL Switch板直连;其中,在多个所述刀片节点中包括满足目标条件的目标刀片节点的情况下,所述目标刀片节点还通过高密线缆连接器与所述CXL Switch板连接;多个所述刀片节点均为中央处理单元CPU计算节点;或者,多个所述刀片节点中的部分刀片节点为中央处理单元CPU计算节点,部分刀片节点为计算快速链路CXL内存扩展节点。
在一个示例性实施例中,在多个所述刀片节点均为所述CPU计算节点的情况下,所述刀片服务器系统还包括:内存模组,其中,所述内存模组设置于所述机箱壳体中,所述内存模组通过高密线缆连接器与所述CXL Switch板上设置的线缆插座线缆连接,所述内存模组的存储方式包括以下至少之一:E3.S内存扩展模组、PCIE外设组件互连快速通道内存扩展卡、内存扩展单板。
在一个示例性实施例中,在多个所述刀片节点中包括满足目标条件的目标刀片节点的情况下,所述目标刀片节点还通过高密线缆连接器与所述CXL Switch板连接包括:在多个所述刀片节点中的部分刀片节点为所述CPU计算节点,部分刀片节点为所述CXL内存扩展节点,并且待存储到所述CXL内存扩展节点中的第一目标数据达到第一阈值的情况下,所述CXL内存扩展节点还通过高密线缆连接器与所述CXL Switch板连接,其中,所述目标数据为所述CPU计算节点产生的待存储到所述CXL内存扩展节点中的数据。
在一个示例性实施例中,在多个所述刀片节点中包括满足目标条件的目标刀片节点的情况下,所述目标刀片节点还通过高密线缆连接器与所述CXL Switch板连接包括:在多个所述刀片节点中的部分刀片节点为所述CPU计算节点,部分刀片节点为所述CXL内存扩展节点,并且待存储到所述CXL内存扩展节点中的第二目标数据达到第二阈值、所述CPU计算节点的计算能力达到第三阈值的情况下,所述CPU计算节点以及所述CXL内存扩展节点均还通过高密线缆连接器与所述CXL Switch板连接,所述第二目标数据为所述CPU计算节点产生的待存储到所述CXL内存扩展节点中的数据。
在一个示例性实施例中,在多个所述刀片节点中包括满足目标条件的目标刀片节点的情况下,所述目标刀片节点还通过高密线缆连接器与所述CXL Switch板连接包括:在多个所述刀片节点中均为所述CPU计算节点,并且所述CPU计算节点的计算能力达到第四阈值的情况下,所述CPU计算节点还通过高密线缆连接器与所述CXL Switch板连接。
在一个示例性实施例中,每个所述刀片节点均通过正交高密连接器与所述CXLSwitch板直连包括:每个所述刀片节点上设置有所述正交高密连接器的母头,所述CXLSwitch板上设置有与每个所述刀片节点对应的所述正交高密连接器的公头,每个所述刀片节点以及所述CXL Switch板通过插接属于同一个正交高密连接器的母头与公头的方式直接连接。
在一个示例性实施例中,所述CXL Switch板上还设置有:CXL Switch芯片以及线缆插座;所述目标刀片节点还通过高密线缆连接器与所述CXL Switch板连接包括:所述目标刀片节点通过高密线缆连接器与所述CXL Switch板上设置的线缆插座线缆连接。
在一个示例性实施例中,在多个所述刀片节点中的部分刀片节点为所述CXL内存扩展节点的情况下,所述CXL内存扩展节点的内存扩展方式包括以下至少之一:E3.S内存扩展模组、PCIE外设组件互连快速通道内存扩展卡、内存扩展单板。
根据本申请的一个实施例,还提供了一种刀片服务器,运行上述刀片服务器系统,所述刀片服务器包括:电源模块、风扇模块、集中管理板;其中,所述集中管理板用于与每个所述刀片节点的管理芯片交互通信,所述集中管理板对外引出集中管理接口,所述电源模块上对外引出电源输入接口,每个所述刀片节点上均设有第一热插拔把手,每个所述电源模块上均设有第二热插拔把手,多个所述刀片节点并排设置在所述机箱壳体的前侧,多个所述电源模块并排设置在多个所述刀片节点的下方,多个所述风扇模块、所述电源输入接口、所述集中管理接口设置在所述机箱壳体的后侧。
根据本申请的一个实施例,还提供了一种CXL内存配置方法,应用于前述的刀片服务器系统中,包括:在多个所述刀片节点中的部分刀片节点为所述CPU计算节点,部分刀片节点为所述CXL内存扩展节点,所述CXL Switch板在接收到所述CPU计算节点通过CXL协议发送的待存储数据的情况下,按照发送待存储数据的每个所述CPU计算节点的优先级,依次将所述待存储数据路由到所述CXL内存扩展节点中进行存储。
在一个示例性实施例中,所述方法还包括:在所述CPU计算节点产生的待存储到所述CXL内存扩展节点中的数据中包括多种类型数据的情况下,按照如下顺序,依次进行存储:操作系统数据、预定应用程序数据、安全数据、系统性能监控数据、用户数据应用程序日志、备份数据、测试和开发数据。
在一个示例性实施例中,在按照发送待存储数据的每个所述CPU计算节点的优先级,依次将所述待存储数据路由到所述CXL内存扩展节点之前,所述方法还包括:根据目标CPU计算节点在预定时段内产生的待存储数据,确定所述目标CPU计算节点的目标内存需求,其中,所述目标CPU计算节点为产生待存储数据的多个所述CPU计算节点中的任一CPU计算节点;获取并分析所述CXL内存扩展节点中包括的多个内存中每一内存的目标剩余存储空间;根据所述目标内存需求以及所述目标剩余存储空间,确定用于存储所述目标CPU计算节点产生的待存储数据的目标内存。
根据本申请的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本申请的又一个实施例,还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
根据本申请的又一个实施例,还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任一项方法实施例中的步骤。
通过本申请,由于将CXL Switch板以及刀片节点置于服务器机箱壳体内,并将多个所述刀片节点均通过正交高密连接器与所述CXL Switch板直连,因此,可以解决相关技术中由于分别单独设置服务器机箱、CXL扩展BOX以及CXL Switch机架式BOX,因此,服务器机箱、CXL扩展BOX以及CXL Switch机架式BOX之间需要采用大量线缆进行连接,所导致的花费成本较高,设备组装维护的可靠性不足的问题,达到降低成本、提高设备组装维护的可靠性的效果。
附图说明
图1是根据本申请实施例的刀片服务器系统的结构图一;
图2是根据本申请实施例的刀片服务器系统的示意图一;
图3是根据本申请实施例的刀片服务器系统的结构图二;
图4是根据本申请实施例的刀片服务器系统的存储方式的示意图一;
图5是根据本申请实施例的刀片服务器系统的结构图三;
图6是根据本申请实施例的刀片服务器系统的存储方式的示意图二;
图7是根据本申请实施例的刀片服务器系统的存储方式的示意图三;
图8是根据本申请实施例的刀片服务器系统的存储方式的示意图四;
图9是根据本申请实施例的刀片服务器系统的存储方式的示意图五;
图10是根据本申请实施例的刀片服务器系统的存储方式的示意图六;
图11是根据本申请实施例的刀片服务器系统的存储方式的示意图七;
图12是根据本申请实施例的刀片服务器系统的存储方式的示意图八;
图13是根据本申请实施例的刀片服务器系统的存储方式的示意图九;
图14是根据本申请实施例的刀片服务器系统的存储方式的示意图十;
图15是根据本申请实施例的刀片服务器系统的存储方式的示意图十一;
图16是根据本申请实施例的刀片服务器系统的存储方式的示意图十二;
图17是根据本申请实施例的刀片服务器的结构图一;
图18是根据本申请实施例的刀片服务器的结构图二;
图19是根据本申请实施例的CXL内存配置方法的服务器设备的硬件结构框图;
图20是根据本申请实施例的CXL内存配置方法的流程图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请的实施例。
图1是根据本申请实施例的刀片服务器系统的结构图一,图2是根据本申请实施例的刀片服务器系统的示意图一,如图1所示,包括:机箱壳体,多个刀片节点以及计算快速链路交换CXL Switch板,多个所述刀片节点以及所述CXL Switch板内置于所述机箱壳体中;每个所述刀片节点均通过正交高密连接器与所述CXL Switch板直连;其中,在多个所述刀片节点中包括满足目标条件的目标刀片节点的情况下,所述目标刀片节点还通过高密线缆连接器与所述CXL Switch板连接;多个所述刀片节点均为中央处理单元CPU计算节点;或者,多个所述刀片节点中的部分刀片节点为中央处理单元CPU计算节点,部分刀片节点为计算快速链路CXL内存扩展节点。
在上述实施例中,示例性的,所述刀片节点包括但不限于为支持以插装形式插入刀片服务器的卡式服务器节点,示例性的,所述CXL Switch板上有CXL Switch芯片,所述CXL Switch芯片支持256个CXL/PCIE(Peripheral Component Interconnect Express,外设组件互连高速)物理通道,其中128个CXL/PCIE物理通道通过Switch板上的8个所述正交高密连接器与8个所述刀片节点直接相连,所述CXL Switch板上的另外128个CXL/PCIE物理通道与所述CXL Switch板上的16个×8线缆插座相连接,所述CXL Switch板可以基于所述线缆插座通过线缆连接至所述刀片节点或者其他部件上,每个所述刀片节点上有1至2颗CPU,在所述刀片节点的后部支持1个×16 CXL/PCIE带宽的正交高密连接器与所述CXLSwitch板对插相连,其中,每个刀片节点包括但不限于设置有0-112路径数的不等数量带宽的高密线缆连接器,通过上述结构,由于不同的线缆组合构成不同的拓扑,从而可以满足不同客户的CXL内存池化要求,同时线缆和CXL Switch板固定在机箱内部,不影响节点的插拔。
在本申请的上述实施例中,由于将CXL Switch板以及刀片节点置于服务器机箱壳体内,并将多个所述刀片节点均通过正交高密连接器与所述CXL Switch板直连,因此,可以解决相关技术中由于分别单独设置服务器机箱、CXL扩展BOX以及CXL Switch机架式BOX,因此,服务器机箱、CXL扩展BOX以及CXL Switch机架式BOX之间需要采用大量线缆进行连接,所导致的花费成本较高,设备组装维护的可靠性不足的问题,达到降低成本、提高设备组装维护的可靠性的效果。
在一个可选的实施例中,在多个所述刀片节点均为所述CPU计算节点的情况下,所述刀片服务器系统还包括:内存模组,其中,所述内存模组设置于所述机箱壳体中,所述内存模组通过高密线缆连接器与所述CXL Switch板上设置的线缆插座线缆连接,所述内存模组的存储方式包括以下至少之一:E3.S内存扩展模组、PCIE外设组件互连快速通道内存扩展卡、内存扩展单板。
在上述实施例中,示例性的,图3是根据本申请实施例的刀片服务器系统的结构图二,图4是根据本申请实施例的刀片服务器系统的存储方式的示意图一,如图3所示,8个所述刀片节点全部为所述CPU计算节点,每个所述CPU计算节点与所述CXL Switch板采用1组正交高密连接器相连,传输×16 CXL/PCIE信号,在刀片服务器机箱后窗支持最大16张E3.SCXL内存扩展模块,每个E3.S模块通过线缆与CXL Switch板上的一组×8高速线缆插座相连。所述内存模组并排设置在所述机箱壳体的后侧,多个所述风扇模块分别并排设置在所述内存模组的上方以及下方。
在一个可选的实施例中,在多个所述刀片节点中包括满足目标条件的目标刀片节点的情况下,所述目标刀片节点还通过高密线缆连接器与所述CXL Switch板连接包括:在多个所述刀片节点中的部分刀片节点为所述CPU计算节点,部分刀片节点为所述CXL内存扩展节点,并且待存储到所述CXL内存扩展节点中的第一目标数据达到第一阈值的情况下,所述CXL内存扩展节点还通过高密线缆连接器与所述CXL Switch板连接,其中,所述目标数据为所述CPU计算节点产生的待存储到所述CXL内存扩展节点中的数据。
在上述实施例中,示例性的,图5是根据本申请实施例的刀片服务器系统的结构图三,如图5所示,示例性的,在8个所述刀片节点中,7个所述刀片节点为所述CPU计算节点,1个所述刀片节点为所述CXL内存扩展节点,所述CXL内存扩展节点与所述CXL Switch板连接8个×16 CXL/PCIE信号,其中1组×16信号采用所述正交高密连接器相连,另外7组×16信号采用高密连接器与内置的7组所述高密线缆连接器相连,所述高密线缆连接器在机箱内部通过线缆与所述CXL Switch板上的14个×8线缆插座相连。
在本申请的上述实施例中,由于内置的高密线缆连接器固定在机箱内部,不随刀片节点拔出而拔出,从而避免了对刀片节点的插拔维护造成影响。
图6是根据本申请实施例的刀片服务器系统的存储方式的示意图二,如图6所示,所述CXL内存扩展节点的内存扩展方式包括:所述E3.S内存扩展模组、所述PCIE内存扩展卡、所述内存扩展单板。图7是根据本申请实施例的刀片服务器系统的存储方式的示意图三,如图7所示,在所述CXL内存扩展节点的内存扩展方式为所述内存扩展单板时,示例性的,支持16个CXL Memory控制器以及32颗内存条。图8是根据本申请实施例的刀片服务器系统的存储方式的示意图四,如图8所示,在所述CXL内存扩展节点的内存扩展方式为E3.S内存扩展模组时,示例性的,支持16张E3.S内存扩展模组,图9是根据本申请实施例的刀片服务器系统的存储方式的示意图五,如图9所示,在所述CXL内存扩展节点的内存扩展方式为所述PCIE内存扩展卡时,示例性的,支持8张4DIMM(Dual In-line Memory Module,双列直插式内存模块)的PCIE内存扩展卡、4张8DIMM的PCIE内存扩展卡。
在一个可选的实施例中,在多个所述刀片节点中包括满足目标条件的目标刀片节点的情况下,所述目标刀片节点还通过高密线缆连接器与所述CXL Switch板连接包括:在多个所述刀片节点中的部分刀片节点为所述CPU计算节点,部分刀片节点为所述CXL内存扩展节点,并且待存储到所述CXL内存扩展节点中的第二目标数据达到第二阈值、所述CPU计算节点的计算能力达到第三阈值的情况下,所述CPU计算节点以及所述CXL内存扩展节点均还通过高密线缆连接器与所述CXL Switch板连接,所述第二目标数据为所述CPU计算节点产生的待存储到所述CXL内存扩展节点中的数据。
在上述实施例中,示例性的,在8个所述刀片节点中,所述刀片节点与所述CXLSwitch板连接相同数量的PCIE通道,支持任意数量的所述CPU计算节点以及所述CXL内存扩展节点,每个所述刀片节点与所述CXL Switch板连接2个×16 CXL/PCIE信号,其中1组×16信号采用所述正交高密连接器相连,另外1组×16信号,在所述刀片节点上通过内置的1组高密线缆连接器相连,高密线缆连接器在机箱内部通过线缆与所述CXL Switch板上的2个×8线缆插座相连。
在本申请的上述实施例中,由于内置的高密线缆连接器固定在机箱内部,不随刀片节点拔出而拔出,从而避免了对刀片节点的插拔维护造成影响。
图10是根据本申请实施例的刀片服务器系统的存储方式的示意图六,如图10所示,所述CXL内存扩展节点的内存扩展方式包括:所述E3.S内存扩展模组、所述PCIE内存扩展卡、所述内存扩展单板。图11是根据本申请实施例的刀片服务器系统的存储方式的示意图七,如图11所示,在所述CXL内存扩展节点的内存扩展方式为所述内存扩展单板时,示例性的,支持4个CXL Memory控制器以及8颗内存条。图12是根据本申请实施例的刀片服务器系统的存储方式的示意图八,如图12所示,在所述CXL内存扩展节点的内存扩展方式为E3.S内存扩展模组时,示例性的,支持4张E3.S内存扩展模组,图13是根据本申请实施例的刀片服务器系统的存储方式的示意图九,如图13所示,在所述CXL内存扩展节点的内存扩展方式为所述PCIE内存扩展卡时,示例性的,支持2张4DIMM的PCIE内存扩展卡、1张8DIMM的PCIE内存扩展卡。
在上述实施例中,通过采用均衡的连接方式,用户可任意变更计算节点的数量和CXL内存扩展节点的数量,并支持更大容量的CXL内存,同时CXL内存扩展节点支持使用二级switch扩展更多的内存容量,实现了在提高了内存设置的灵活度的同时提高内存容量。
在一个可选的实施例中,图14是根据本申请实施例的刀片服务器系统的存储方式的示意图十,图15是根据本申请实施例的刀片服务器系统的存储方式的示意图十一,图16是根据本申请实施例的刀片服务器系统的存储方式的示意图十二,在所述CXL内存扩展节点中增加一级CXL Switch芯片,从而扩展出如图14所示的16个CXL Memory控制器和32颗内存条,如图15所示的16张E3.S内存扩展模组、如图16所示的8张4DIMM的PCIE AIC内存扩展卡,或者4张8DIMM的PCIE AIC内存扩展卡。
在一个可选的实施例中,在多个所述刀片节点中包括满足目标条件的目标刀片节点的情况下,所述目标刀片节点还通过高密线缆连接器与所述CXL Switch板连接包括:在多个所述刀片节点中均为所述CPU计算节点,并且所述CPU计算节点的计算能力达到第四阈值的情况下,所述CPU计算节点还通过高密线缆连接器与所述CXL Switch板连接。
在一个可选的实施例中,每个所述刀片节点均通过正交高密连接器与所述CXLSwitch板直连包括:每个所述刀片节点上设置有所述正交高密连接器的母头,所述CXLSwitch板上设置有与每个所述刀片节点对应的所述正交高密连接器的公头,每个所述刀片节点以及所述CXL Switch板通过插接属于同一个正交高密连接器的母头与公头的方式直接连接。
在一个可选的实施例中,所述CXL Switch板上还设置有:CXL Switch芯片以及线缆插座;所述目标刀片节点还通过高密线缆连接器与所述CXL Switch板连接包括:所述目标刀片节点通过高密线缆连接器与所述CXL Switch板上设置的线缆插座线缆连接。
在一个可选的实施例中,在多个所述刀片节点中的部分刀片节点为所述CXL内存扩展节点的情况下,所述CXL内存扩展节点的内存扩展方式包括以下至少之一:E3.S内存扩展模组、PCIE外设组件互连快速通道内存扩展卡、内存扩展单板。
通过上述实施例中,由于在刀片服务器中设计内置CXL Switch交换板,支持CXL共享内存刀片节点,实现了刀片服务器中多个计算节点之间共享池化内存的目的,使得多主机之间的内存池化方案可以在刀片服务器内部完成,避免产生外部线缆,相对于相关技术中机柜级内存池化方案,降低了外部线缆以及PCIE接口卡的成本,避免了外部线缆的运维问题和可靠性问题,并且通过内置高密连接器和线缆连接的不同连接组合,可以灵活支持多种内置CXL内存池化拓扑,灵活适配不同的CXL内存池化需求。
图17是根据本申请实施例的刀片服务器的结构图一,图18是根据本申请实施例的刀片服务器的结构图二,如图17、图18所示,所述刀片服务器包括:电源模块、风扇模块、集中管理板;其中,所述集中管理板用于与每个所述刀片节点的管理芯片交互通信,所述集中管理板对外引出集中管理接口,所述电源模块上对外引出电源输入接口,每个所述刀片节点上均设有第一热插拔把手,每个所述电源模块上均设有第二热插拔把手,多个所述刀片节点并排设置在所述机箱壳体的前侧,多个所述电源模块并排设置在多个所述刀片节点的下方,多个所述风扇模块、所述电源输入接口、所述集中管理接口设置在所述机箱壳体的后侧。
在上述实施例中,示例性的,所述刀片服务器包括但不限于:高度为7U,上方6U竖置并排设置有8个刀片节点,下方1U并排设置有6个电源模块,其中,每个所述刀片节点的高度为6U,宽度包括但不限于1.25U,每个所述刀片节点支持快速热插拔功能,每个所述电源模块支持快速热插拔功能,所述电源模块在所述刀片服务器的机箱内部包括但不限于通过电源板、busbar、电源线等方式为所述刀片节点以及所述刀片服务器中的其它部件供电,所述风扇模块用于对所述刀片服务器进行散热,所述CXL Switch板设置在所述刀片服务器的内部的所述刀片节点的后侧,设计有CXL Switch板,所述CXL Switch板与所述刀片节点通过所述正交高密连接器直接连接。
在上述实施例中,所述集中管理板用于执行以下操作:添加或删除节点、更新节点配置并监视节点健康状况;提供安全维护功能,例如,访问控制、加密和监控系统日志从而检测潜在的恶意活动;监视系统性能,例如,网络流量、CPU和内存使用情况,同时识别可能影响系统性能的瓶颈。
本申请实施例中所提供的方法实施例可以在服务器设备或者类似的运算装置中执行。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
以运行在服务器设备上为例,图19是根据本申请实施例的CXL内存配置方法的服务器设备的硬件结构框图。如图19所示,服务器设备可以包括一个或多个(图19中仅示出一个)处理器1902(处理器1902可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器1904,其中,上述服务器设备还可以包括用于通信功能的传输设备1906以及输入输出设备1908。本领域普通技术人员可以理解,图19所示的结构仅为示意,其并不对上述服务器设备的结构造成限定。例如,服务器设备还可包括比图19中所示更多或者更少的组件,或者具有与图19所示不同的配置。
存储器1904可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本申请实施例中的CXL内存配置方法对应的计算机程序,处理器1902通过运行存储在存储器1904内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器1904可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1904可进一步包括相对于处理器1902远程设置的存储器,这些远程存储器可以通过网络连接至服务器设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备1906用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器设备的通信供应方提供的无线网络。在一个实例中,传输设备1906包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备1906可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种CXL内存配置方法,该方法可以应用于上述任一项实施例中所述的刀片服务器系统中,图20是根据本申请实施例的CXL内存配置方法的流程图,如图20所示,该流程包括如下步骤:
步骤S2002,在多个所述刀片节点中的部分刀片节点为所述CPU计算节点,部分刀片节点为所述CXL内存扩展节点,所述CXL Switch板在接收到所述CPU计算节点通过CXL协议发送的待存储数据的情况下,按照发送待存储数据的每个所述CPU计算节点的优先级,依次将所述待存储数据路由到所述CXL内存扩展节点中进行存储。
在上述实施例中,所述CPU计算节点的优先级的确定方法包括但不限于: 性能指标:根据所述CPU计算节点的性能指标(例如,核心数、时钟频率、缓存大小等等)来确定优先级,性能较高的CPU节点优先级较高。负载均衡:根据所述CPU计算节点的当前负载情况来动态调整优先级,负载较低的节点的优先级较高。资源分配:根据所述CPU计算节点的对应的可用资源(例如,内存、磁盘空间等等)确定优先级,资源充足的节点的优先级较高。故障容忍性:根据所述CPU计算节点的故障容忍能力确定优先级。数据访问频率:根据所述CPU计算节点产生的数据被访问的频率确定优先级,高频访问的数据应该具有更高的优先级,以便于可以更快地从存储系统中被检索。数据重要性:根据所述CPU计算节点产生的数据的重要程度确定优先级,对于关键业务数据,设置更高的存储优先级,以确保数据的快速访问和高可用性。服务质量(QoS)需求:根据所述CPU计算节点的应用程序或服务的服务质量要求来分配存储优先级,例如,对于需要低延迟和高吞吐量的服务,分配更高的优先级。数据大小:根据所述CPU计算节点产生的数据量的大小,确定优先级,例如,所述CPU计算节点产生的数据量越大,所述CPU计算节点的优先级越高。数据类型:根据所述CPU计算节点产生的数据量种类,确定所述CPU计算节点的优先级,例如,对于事务性数据可能需要比非事务性数据更高的优先级。
其中,上述步骤的执行主体可以为服务器、终端等,但不限于此。
在一个可选的实施例中,所述方法还包括:在所述CPU计算节点产生的待存储到所述CXL内存扩展节点中的数据中包括多种类型数据的情况下,按照如下顺序,依次进行存储:操作系统数据、预定应用程序数据、安全数据、系统性能监控数据、用户数据应用程序日志、备份数据、测试和开发数据。
在上述实施例中,所述操作系统数据,包括但不限于:操作系统日志、系统配置、驱动程序信息等等。 所述预定应用程序数据,包括但不限于:应用程序的配置文件、应用程序日志、应用程序产生的数据等等。所述安全数据,包括但不限于:安全事件日志、安全策略、用户访问权限等等。所述系统性能监控数据,包括但不限于:CPU使用率、内存使用情况、磁盘空间使用情况、网络流量等等。所述用户数据应用程序日志,包括但不限于:用户操作日志、应用程序运行日志等等。所述备份数据,包括但不限于:定期备份的系统文件、应用程序文件、数据库等等。所述测试和开发数据,包括但不限于:测试用例、开发过程中产生的代码、开发过程中的日志等等。
在一个可选的实施例中,在按照发送待存储数据的每个所述CPU计算节点的优先级,依次将所述待存储数据路由到所述CXL内存扩展节点之前,所述方法还包括:根据目标CPU计算节点在预定时段内产生的待存储数据,确定所述目标CPU计算节点的目标内存需求,其中,所述目标CPU计算节点为产生待存储数据的多个所述CPU计算节点中的任一CPU计算节点;获取并分析所述CXL内存扩展节点中包括的多个内存中每一内存的目标剩余存储空间;根据所述目标内存需求以及所述目标剩余存储空间,确定用于存储所述目标CPU计算节点产生的待存储数据的目标内存。
在上述实施例中,根据目标CPU计算节点在预定时段内产生的待存储数据,确定所述目标CPU计算节点的目标内存需求,包括但不限于:进行数据采集:收集目标CPU计算节点在预定时段内产生的所有待存储数据,包括输入数据、中间结果、输出数据等等;进行数据分类:将收集到的数据按照类型、大小、重要性等进行分类;进行数据量估算:对每个类别的数据进行量级的估算;考虑冗余和备份因素:在确定内存需求时,考虑数据的冗余和备份需求,例如,在数据需要进行多份备份的情况下,增加相应的内存需求;进行数据增长预测:考虑数据随时间的变化趋势,统计目标CPU计算节点在预定时段内产生的待存储数据,由此对未来时段的数据变化情况进行预测,从而对内存需求进行调整;考虑安全裕度:为了应对意外情况,在计算出的内存需求基础上增加一定比例的安全裕度,以确保系统的稳定运行。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
在本实施例中还提供了一种刀片服务器系统,该系统用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“单元”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的单元较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本申请实施例中刀片服务器系统包括:路由单元,用于在多个所述刀片节点中的部分刀片节点为所述CPU计算节点,部分刀片节点为所述CXL内存扩展节点,所述CXLSwitch板在接收到所述CPU计算节点通过CXL协议发送的待存储数据的情况下,按照发送待存储数据的每个所述CPU计算节点的优先级,依次将所述待存储数据路由到所述CXL内存扩展节点中进行存储。
在一个可选的实施例中,所述刀片服务器系统还包括:存储单元,用于在所述CPU计算节点产生的待存储到所述CXL内存扩展节点中的数据中包括多种类型数据的情况下,按照如下顺序,依次进行存储:操作系统数据、预定应用程序数据、安全数据、系统性能监控数据、用户数据应用程序日志、备份数据、测试和开发数据。
在一个可选的实施例中,所述刀片服务器系统还包括:第一确定单元,用于在按照发送待存储数据的每个所述CPU计算节点的优先级,依次将所述待存储数据路由到所述CXL内存扩展节点之前,根据目标CPU计算节点在预定时段内产生的待存储数据,确定所述目标CPU计算节点的目标内存需求,其中,所述目标CPU计算节点为产生待存储数据的多个所述CPU计算节点中的任一CPU计算节点;获取单元,用于获取并分析所述CXL内存扩展节点中包括的多个内存中每一内存的目标剩余存储空间;第一确定单元,用于根据所述目标内存需求以及所述目标剩余存储空间,确定用于存储所述目标CPU计算节点产生的待存储数据的目标内存。
需要说明的是,上述各个单元是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述单元均位于同一处理器中;或者,上述各个单元以任意组合的形式分别位于不同的处理器中。
本申请的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本申请的实施例还提供了一种电子设备,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本申请的实施例还提供了一种计算机程序产品,上述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述任一项方法实施例中的步骤。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (14)

1.一种刀片服务器系统,其特征在于,
包括:
机箱壳体,多个刀片节点以及计算快速链路交换CXL Switch板,多个所述刀片节点以及所述CXL Switch板内置于所述机箱壳体中;
每个所述刀片节点均通过正交高密连接器与所述CXL Switch板直连;
其中,在多个所述刀片节点中包括满足目标条件的目标刀片节点的情况下,所述目标刀片节点还通过高密线缆连接器与所述CXL Switch板连接;
多个所述刀片节点均为中央处理单元CPU计算节点;或者,多个所述刀片节点中的部分刀片节点为中央处理单元CPU计算节点,部分刀片节点为计算快速链路CXL内存扩展节点;
其中,在多个所述刀片节点中包括满足目标条件的目标刀片节点的情况下,所述目标刀片节点还通过高密线缆连接器与所述CXL Switch板连接包括:
在多个所述刀片节点中的部分刀片节点为所述CPU计算节点,部分刀片节点为所述CXL内存扩展节点,并且待存储到所述CXL内存扩展节点中的第二目标数据达到第二阈值、所述CPU计算节点的计算能力达到第三阈值的情况下,所述CPU计算节点以及所述CXL内存扩展节点均还通过高密线缆连接器与所述CXL Switch板连接,所述第二目标数据为所述CPU计算节点产生的待存储到所述CXL内存扩展节点中的数据。
2.根据权利要求1所述的刀片服务器系统,其特征在于,
在多个所述刀片节点均为所述CPU计算节点的情况下,所述刀片服务器系统还包括:内存模组,其中,所述内存模组设置于所述机箱壳体中,所述内存模组通过高密线缆连接器与所述CXL Switch板上设置的线缆插座线缆连接,所述内存模组的存储方式包括以下至少之一:E3.S内存扩展模组、PCIE外设组件互连快速通道内存扩展卡、内存扩展单板。
3.根据权利要求1所述的刀片服务器系统,其特征在于,
在多个所述刀片节点中包括满足目标条件的目标刀片节点的情况下,所述目标刀片节点还通过高密线缆连接器与所述CXL Switch板连接包括:
在多个所述刀片节点中的部分刀片节点为所述CPU计算节点,部分刀片节点为所述CXL内存扩展节点,并且待存储到所述CXL内存扩展节点中的第一目标数据达到第一阈值的情况下,所述CXL内存扩展节点还通过高密线缆连接器与所述CXL Switch板连接,其中,所述目标数据为所述CPU计算节点产生的待存储到所述CXL内存扩展节点中的数据。
4.根据权利要求1所述的刀片服务器系统,其特征在于,
在多个所述刀片节点中包括满足目标条件的目标刀片节点的情况下,所述目标刀片节点还通过高密线缆连接器与所述CXL Switch板连接包括:
在多个所述刀片节点中均为所述CPU计算节点,并且所述CPU计算节点的计算能力达到第四阈值的情况下,所述CPU计算节点还通过高密线缆连接器与所述CXL Switch板连接。
5.根据权利要求1所述的刀片服务器系统,其特征在于,
每个所述刀片节点均通过正交高密连接器与所述CXL Switch板直连包括:
每个所述刀片节点上设置有所述正交高密连接器的母头,所述CXL Switch板上设置有与每个所述刀片节点对应的所述正交高密连接器的公头,每个所述刀片节点以及所述CXLSwitch板通过插接属于同一个正交高密连接器的母头与公头的方式直接连接。
6.根据权利要求5所述的刀片服务器系统,其特征在于,
所述CXL Switch板上还设置有:
CXL Switch芯片以及线缆插座;
所述目标刀片节点还通过高密线缆连接器与所述CXL Switch板连接包括:
所述目标刀片节点通过高密线缆连接器与所述CXL Switch板上设置的线缆插座线缆连接。
7.根据权利要求1所述的刀片服务器系统,其特征在于,
在多个所述刀片节点中的部分刀片节点为所述CXL内存扩展节点的情况下,所述CXL内存扩展节点的内存扩展方式包括以下至少之一:E3.S内存扩展模组、PCIE外设组件互连快速通道内存扩展卡、内存扩展单板。
8.一种刀片服务器,其特征在于,运行有权利要求1-7中任一项所述的刀片服务器系统,所述刀片服务器包括:
电源模块、风扇模块、集中管理板;
其中,所述集中管理板用于与每个所述刀片节点的管理芯片交互通信,所述集中管理板对外引出集中管理接口,所述电源模块上对外引出电源输入接口,每个所述刀片节点上均设有第一热插拔把手,每个所述电源模块上均设有第二热插拔把手,多个所述刀片节点并排设置在所述机箱壳体的前侧,多个所述电源模块并排设置在多个所述刀片节点的下方,多个所述风扇模块、所述电源输入接口、所述集中管理接口设置在所述机箱壳体的后侧。
9.一种CXL内存配置方法,其特征在于,应用于权利要求1至7中任一项所述的刀片服务器系统中,包括:
在多个所述刀片节点中的部分刀片节点为所述CPU计算节点,部分刀片节点为所述CXL内存扩展节点,所述CXL Switch板在接收到所述CPU计算节点通过CXL协议发送的待存储数据的情况下,按照发送待存储数据的每个所述CPU计算节点的优先级,依次将所述待存储数据路由到所述CXL内存扩展节点中进行存储。
10.根据权利要求9所述的CXL内存配置方法,其特征在于,
所述方法还包括:
在所述CPU计算节点产生的待存储到所述CXL内存扩展节点中的数据中包括多种类型数据的情况下,按照如下顺序,依次进行存储:操作系统数据、预定应用程序数据、安全数据、系统性能监控数据、用户数据应用程序日志、备份数据、测试和开发数据。
11.根据权利要求9所述的CXL内存配置方法,其特征在于,
在按照发送待存储数据的每个所述CPU计算节点的优先级,依次将所述待存储数据路由到所述CXL内存扩展节点之前,所述方法还包括:
根据目标CPU计算节点在预定时段内产生的待存储数据,确定所述目标CPU计算节点的目标内存需求,其中,所述目标CPU计算节点为产生待存储数据的多个所述CPU计算节点中的任一CPU计算节点;
获取并分析所述CXL内存扩展节点中包括的多个内存中每一内存的目标剩余存储空间;
根据所述目标内存需求以及所述目标剩余存储空间,确定用于存储所述目标CPU计算节点产生的待存储数据的目标内存。
12.一种计算机可读存储介质,其特征在于,
所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求9至11任一项中所述的CXL内存配置方法的步骤。
13.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,
所述处理器执行所述计算机程序时实现所述权利要求9至11任一项中所述的CXL内存配置方法的步骤。
14.一种计算机程序产品,包括计算机程序,其特征在于,
所述计算机程序被处理器执行时实现权利要求9至11任一项中所述的CXL内存配置方法的步骤。
CN202411184200.7A 2024-08-27 2024-08-27 刀片服务器系统、服务器以及cxl内存配置方法 Active CN118689287B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202411184200.7A CN118689287B (zh) 2024-08-27 2024-08-27 刀片服务器系统、服务器以及cxl内存配置方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202411184200.7A CN118689287B (zh) 2024-08-27 2024-08-27 刀片服务器系统、服务器以及cxl内存配置方法

Publications (2)

Publication Number Publication Date
CN118689287A CN118689287A (zh) 2024-09-24
CN118689287B true CN118689287B (zh) 2024-11-15

Family

ID=92764800

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202411184200.7A Active CN118689287B (zh) 2024-08-27 2024-08-27 刀片服务器系统、服务器以及cxl内存配置方法

Country Status (1)

Country Link
CN (1) CN118689287B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115551272A (zh) * 2022-09-29 2022-12-30 苏州浪潮智能科技有限公司 服务器管理方法、装置及机柜
CN117033001A (zh) * 2023-10-09 2023-11-10 苏州元脑智能科技有限公司 服务器系统、配置方法、cpu、控制模组与存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115551272A (zh) * 2022-09-29 2022-12-30 苏州浪潮智能科技有限公司 服务器管理方法、装置及机柜
CN117033001A (zh) * 2023-10-09 2023-11-10 苏州元脑智能科技有限公司 服务器系统、配置方法、cpu、控制模组与存储介质

Also Published As

Publication number Publication date
CN118689287A (zh) 2024-09-24

Similar Documents

Publication Publication Date Title
US11689436B2 (en) Techniques to configure physical compute resources for workloads via circuit switching
KR102801566B1 (ko) 커넥터를 통해 장치에 전력을 공급하기 위한 시스템, 방법 및 장치
CN109428770B (zh) 用于管理网络统计计数器的方法及装置
CN114040467B (zh) 一种传输路径的确定方法、装置、服务器及存储介质
US12041124B2 (en) Methods and apparatus for peer-to-peer data channels for storage devices
TW201640360A (zh) 資料傳輸方法及資料傳輸系統
CN118568032A (zh) 信息发送方法及装置、存储介质及电子设备
US11044210B2 (en) Technologies for performing switch-based collective operations in distributed architectures
CN112261132B (zh) 数据中心机群中的处理分配
CN118193408A (zh) 内存资源的访问系统和方法、存储介质及电子设备
CN118689287B (zh) 刀片服务器系统、服务器以及cxl内存配置方法
CN117041184A (zh) IO拓展架构、IO交换机及PCIe设备
CN120196513B (zh) 服务器的管理方法、计算机程序产品和服务器机柜
JP6256167B2 (ja) データセンターネットワークにおけるリスク軽減
CN105607872A (zh) 一种存储装置
CN107896196B (zh) 一种分配报文的方法和装置
CN105763366A (zh) 一种基于聚合链路实现的数据通信方法及装置
CN119211325B (zh) 一种服务器中网卡的处理方法、装置、设备及介质
CN113568847A (zh) 一种网卡与处理器的互联装置及服务器
EP3353667B1 (en) Modular backplane
CN117076356A (zh) 指令发送方法及装置、基板管理控制器、存储介质
US10038767B2 (en) Technologies for fabric supported sequencers in distributed architectures
US20060143357A1 (en) Multiple cell computer systems and methods
CN103677152A (zh) 存储服务器及其机架系统
CN118337733B (zh) 一种带宽补偿方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant