CN111736984B - 一种感知pcie设备numa分布平衡的方法、系统 - Google Patents

一种感知pcie设备numa分布平衡的方法、系统 Download PDF

Info

Publication number
CN111736984B
CN111736984B CN202010468725.9A CN202010468725A CN111736984B CN 111736984 B CN111736984 B CN 111736984B CN 202010468725 A CN202010468725 A CN 202010468725A CN 111736984 B CN111736984 B CN 111736984B
Authority
CN
China
Prior art keywords
pcie
information
numa
equipment
pcie equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010468725.9A
Other languages
English (en)
Other versions
CN111736984A (zh
Inventor
王月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010468725.9A priority Critical patent/CN111736984B/zh
Publication of CN111736984A publication Critical patent/CN111736984A/zh
Application granted granted Critical
Publication of CN111736984B publication Critical patent/CN111736984B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明提供一种感知PCIE设备NUMA分布平衡的方法、系统,所述方法包括如下步骤:获取服务器中NUMA节点数量信息、PCIE设备信息;判断获取的PCI槽位信息是否包含处理器槽位信息,若是,获取PCIE设备对应的NUMA节点归属信息,若否,根据获取的地址信息进行数据库匹配查询,获取PCIE设备对应的NUMA节点归属信息;根据获取的PCIE设备类型信息判断PCIE设备类型并获取相应PCIE设备类型数量;根据NUMA节点数量信息、PCIE设备类型数量及PCIE设备对应的NUMA节点归属信息,判断PCIE设备NUMA分布是否平衡,若NUMA分布不平衡,则输出提示信息,否则,不输出提示信息。

Description

一种感知PCIE设备NUMA分布平衡的方法、系统
技术领域
本发明涉及NUMA节点分布技术领域,具体涉及一种感知PCIE设备NUMA分布平衡的方法、系统。
背景技术
由于虚拟化技术的快速发展,商业和消费者开始要求多核CPU带来性能改进,这个重要创新就开始了;因为多核CPU比单核CPU具有性能和效率优势,多核处理器将会成为被广泛采用的计算模型。
在驱动pc安全性和虚拟化技术的重大进程过程中,多核CPU扮演着中心作用,这些安全性和虚拟化技术的开发用于为商业计算市场提供更大的安全性、更好的资源利用率、创造更大价值。普通消费者用户也期望得到前所未有的性能,这将极大地扩展、数字媒体计算系统的使用。与此同时,多核CPU在服务器中的应用中,既满足了大数据量的快速吞吐、超强的稳定性的要求,也对服务器长时间保持高效率运行的性能基础提供了保证。可以确切的说,多核CPU的配置与稳定性决定了服务器使用的质量。
现有的主流的通用服务器的多核处理器采用的架构是非一致性内存访问 (Non-Uniform Memory Access,简称NUMA)架构。NUMA架构的特点是系统的相关硬件资源 (如内存、CPU)被划分为多个节点。在NUMA架构里,处理器访问本地节点的内存的速度要比访问远程节点的内存的速度要快。自从Sandy Bridge体系结构(2009)起,英特尔重新组织了对内核至关重要的功能,并将它们归为Uncore,这是一个“构造”,也已集成到处理器中。 Uncore具有处理PCIE总线的功能。本质上,PCIE设备被硬连线到处理器上的特定端口。这意味着我们可以将另一个概念引入NUMA局部性,即PCIE本地性。在调度低延迟或GPU计算工作负载时考虑PCIE本地性不仅有益于应用程序本身的性能,而且还有益于系统上活动的其他工作负载。例如,机器学习涉及处理大量数据,这些数据在系统内从CPU和内存子系统流向要处理的GPU。一旦将数据集加载到GPU上,正确编写的机器学习应用程序例程就可以最大程度地减少GPU与CPU之间的通信,但是将数据传输到GPU上通常会使应用程序成为系统其余部分的嘈杂邻居。想象一下,如果GPU卡已连接到NUMA节点0,并且应用程序正在NUMA节点1中的内核上运行,那么所有数据都必须通过与GPU卡的互连。将应用程序进程和数据处理软件组件保持在同一NUMA节点上,可以防止工作负载多走“互联”。如果服务器上的PCIE设备较多,那么PCIE设备的NUMA节点分布平衡是降低系统延迟的关键。
发明内容
针对将应用程序进程和数据处理软件组件保持在同一NUMA节点上,可以防止工作负载多走“互联”。如果服务器上的PCIE设备较多,那么PCIE设备的NUMA节点分布平衡是降低系统延迟的关键的问题,本发明提供一种感知PCIE设备NUMA分布平衡的方法、系统。
本发明的技术方案是:
一方面,本发明技术方案提供一种感知PCIE设备NUMA分布平衡的方法,应用于具有PCIE设备的服务器,PCIE设备与服务器通过PCIE协议进行通信,该方法包括:
获取服务器中NUMA节点数量信息、PCIE设备信息;所述的PCIE设备信息包括PCIE设备的地址信息、PCIE设备类型信息、PCI槽位信息;
判断获取的PCI槽位信息是否包含处理器槽位信息,若是,获取PCIE设备对应的NUMA节点归属信息,若否,根据获取的地址信息进行数据库匹配查询,获取PCIE设备对应的NUMA节点归属信息;
根据获取的PCIE设备类型信息判断PCIE设备类型并获取相应PCIE设备类型数量;
根据NUMA节点数量信息、PCIE设备类型数量及PCIE设备对应的NUMA节点归属信息,判断PCIE设备NUMA分布是否平衡,若NUMA分布不平衡,则输出提示信息,否则,不输出提示信息。
进一步的,该方法还包括:
为了方便用户进行查看,将获取PCIE设备对应的NUMA节点归属信息、PCIE设备类型数量、PCIE设备NUMA分布是否平衡及输出的提示信息进行输出显示。
进一步的,所述的根据获取的地址信息进行数据库匹配查询,获取PCIE设备对应的NUMA节点归属信息的步骤之前,还包括:
根据获取的NUMA节点数量信息调用相应映射数据库用于进行匹配查询。根据NUMA节点数量调用存储该NUMA节点数量的映射关系数据库进行匹配查询。
进一步的,判断获取的PCI槽位信息是否包含处理器槽位信息,若是,获取PCIE设备对应的NUMA节点归属信息,若否,根据获取的地址信息进行数据库匹配查询,获取PCIE设备对应的NUMA节点归属信息的步骤包括:
判断获取的PCIE设备信息是否存在PCI槽位信息,若是,判断PCI槽位信息中是否包含处理器槽位信息,若包含处理器槽位信息,获取该PCIE设备对应的NUMA节点归属信息,无需进行数据库匹配;若不包含处理器槽位信息,根据获取的地址信息进行数据库匹配查询,获取PCIE设备对应的NUMA节点归属信息。
进一步的,若不包含处理器槽位信息,根据获取的地址信息进行数据库匹配查询,获取PCIE设备对应的NUMA节点归属信息中,所述的地址信息包括PCI根地址、PCI地址;该步骤包括:
若不包含处理器槽位信息,但包含PCI根地址、PCI地址,首先根据PCI根地址进行数据库匹配查询,获取该PCIE设备对应的NUMA节点归属信息。
进一步的,若既不包括处理器槽位信息也不包括PCI根地址,则根据PCI地址进行数据库匹配查询,获取该PCIE设备对应的NUMA节点归属信息。上述几步是按照PCI槽位信息、PCI根地址、PCI地址优先级由高到低进行数据库匹配查询。
进一步的,根据NUMA节点数量信息、PCIE设备类型数量及PCIE设备对应的NUMA节 点归属信息,判断PCIE设备NUMA分布是否平衡的步骤中,判断规则如下:服务器NUMA节点数 量为
Figure 775743DEST_PATH_IMAGE001
,其中,
Figure 579751DEST_PATH_IMAGE002
为小于或等于2的自然数;
(1)
Figure 574251DEST_PATH_IMAGE002
=1,所述服务器NUMA节点数量为2个,分别为NUMA 节点0和NUMA 节点1;PCIE 设备类型一致;
若PCIE设备数量2N个,其中N个PCIE设备属于NUMA 节点0,另外N个PCIE设备属于NUMA节点1,则PCIE设备NUMA分布平衡,若2N均属于NUMA 节点0或均属于NUMA节点1,则PCIE设备NUMA分布不平衡;
若PCIE设备数量2N+1个,其中N+1个PCIE设备属于NUMA节点0,另外N个PCIE设备属于NUMA节点1,或 N个PCIE设备属于NUMA节点0,另外N+1个PCIE设备属于NUMA节点1,则PCIE设备NUMA分布平衡,反之,则PCIE设备NUMA分布不平衡,N为自然数;
(2)
Figure 980962DEST_PATH_IMAGE002
=2,所述服务器NUMA节点数量为4个,PCIE设备类型一致;
若PCIE设备数量N个,其中N为大于1小于4的自然数,其中N个PCIE设备属于不同NUMA节点,则PCIE设备NUMA分布平衡,反之则PCIE设备NUMA分布不平衡;
若PCIE设备数量 N个,其中N为大于或等于4的自然数,采取计算公式为N/4,其中商为M,每M个PCIE设备均属于不同NUMA节点,余数为K, K个PCIE设备均属于不同NUMA节点,则PCIE设备NUMA分布平衡,反之则PCIE设备NUMA分布不平衡。
另一方面,本发明技术方案提供一种感知PCIE设备NUMA分布平衡的系统,包括远程控制单元和具有PCIE设备的服务器,PCIE设备与服务器通过PCIE协议进行通信;远程控制单元与所述服务器进行通信连接;所述的远程控制单元包括获取模块、处理模块和数据库模块;
获取模块,用于获取服务器中NUMA节点数量信息、PCIE设备信息;所述的PCIE设备信息包括PCIE设备的地址信息、PCIE设备类型信息、PCI槽位信息;
处理模块,用于判断获取的PCIE设备信息是否存在PCI槽位信息,进一步判断获取的PCI槽位信息是否包含处理器槽位信息;若是,获取PCIE设备对应的NUMA节点归属信息,若否,根据获取的地址信息在数据库模块进行匹配查询,获取PCIE设备对应的NUMA节点归属信息;
处理模块,还用于根据获取的PCIE设备类型信息判断PCIE设备类型并获取相应PCIE设备类型数量;
处理模块,根据NUMA节点数量信息、PCIE设备类型数量及PCIE设备对应的NUMA节点归属信息,判断PCIE设备NUMA分布是否平衡,若NUMA分布不平衡,则输出提示信息,否则,不输出提示信息;
数据库模块,用于预存储PCIE设备信息与NUMA归属地映射关系。
进一步的,所述的远程控制单元还包括显示模块,所述显示模块,用于显示处理模块发布的信息,处理模块发布的信息包括PCIE设备类型数量、PCIE设备对应的NUMA节点归属信息及PCIE设备NUMA分布是否平衡,并显示提示用户提示信息。
进一步的,远程控制单元与所述服务器通过TCP/IP协议进行通信;
服务器还包括基板管理控制器,所述的基板管理控制器,用于获取PCIE设备的PCI槽位信息、PCI地址及PCI根地址并将获取PCIE设备的PCI槽位信息、PCI地址及PCI根地址与NUMA节点归属的映射关系存入数据库模块。
从以上技术方案可以看出,本发明具有以下优点:能够快速地判断当前服务器PCIE设备NUMA分布是否均衡,若当前NUMA分布不平衡,输出提示信息提示用户目前NUMA分布不平衡,方便用户进行后续操作设置,这有助于降低延迟,提升业务相应能力,尤其对虚拟化场景、高频低延迟场景有益。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著地进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的示意性流程图。
图2是本发明一个实施例的系统的示意性框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本发明技术方案提供一种感知PCIE设备NUMA分布平衡的方法,应用于具有PCIE设备的服务器,PCIE设备与服务器通过PCIE协议进行通信,具体的,在本申请实施例提供的感知PCIE设备NUMA分布平衡的方法中包括:获取服务器中NUMA节点数量信息、PCIE设备信息;所述的PCIE设备信息包括PCIE设备的地址信息、PCIE设备类型信息、PCI槽位信息;判断获取的PCI槽位信息是否包含处理器槽位信息,若是,获取PCIE设备对应的NUMA节点归属信息,若否,根据获取的地址信息进行数据库匹配查询,获取PCIE设备对应的NUMA节点归属信息;根据获取的PCIE设备类型信息判断PCIE设备类型并获取相应PCIE设备类型数量;根据NUMA节点数量信息、PCIE设备类型数量及PCIE设备对应的NUMA节点归属信息,判断PCIE设备NUMA分布是否平衡,若NUMA分布不平衡,则输出提示信息,否则,不输出提示信息。
如此,能够快速地判断当前服务器PCIE设备NUMA分布是否均衡,若当前NUMA分布不平衡,输出提示信息提示用户目前NUMA分布不平衡,方便用户进行后续操作设置,这有助于降低延迟,提升业务相应能力,尤其对虚拟化场景、高频低延迟场景有益。
下面通过实施例对本申请提供的感知PCIE设备NUMA分布平衡的方法进行介绍。
如图1所示,该感知PCIE设备NUMA分布平衡的方法包括以下步骤:
S1:获取服务器中NUMA节点数量信息、PCIE设备信息;所述的PCIE设备信息包括PCIE设备的地址信息、PCIE设备类型信息、PCI槽位信息;
通过IPMI协议或redfish协议获取所述服务器中NUMA节点数量信息、PCIE设备信息,其中地址信息包含PCI根地址、PCIE地址;
S2:根据获取的NUMA节点数量信息调用相应映射数据库用于进行匹配查询;调用相应映射数据库进行NUMA归属查询,根据步骤S1中获取的NUMA节点数量信息判断调用映射数据库,如NUMA节点数量为2,就调用存储NUMA节点数量为2的映射关系数据库进行匹配;
S3:判断获取的PCI槽位信息是否包含处理器槽位信息,若是,获取PCIE设备对应的NUMA节点归属信息,若否,根据获取的地址信息进行数据库匹配查询,获取PCIE设备对应的NUMA节点归属信息;
需要说明的是,本步骤中,首先要判断获取的PCIE设备信息是否存在PCI槽位信息,若是,判断PCI槽位信息中是否包含处理器槽位信息,若包含处理器槽位信息,获取该PCIE设备对应的NUMA节点归属信息,无需进行数据库匹配;如PCI槽位信息显示该PCI设备位于处理器0所属的PCI插槽上,这表示该PCI设备隶属于NUMA节点0上;
若不包含处理器槽位信息,但包含PCI根地址、PCI地址,首先根据PCI根地址进行数据库匹配查询,获取该PCIE设备对应的NUMA节点归属信息。
若既不包括处理器槽位信息也不包括PCI根地址,则根据PCI地址进行数据库匹配查询,获取该PCIE设备对应的NUMA节点归属信息。
S4:根据获取的PCIE设备类型信息判断PCIE设备类型并获取相应PCIE设备类型数量;根据上述获取信息中PCIE类型信息,判断PCIE设备类型并获取相应设备数量,如网络设备、存储设备、GPU设备,通过提取PCIE设备类型信息的关键字段判断PCIE设备类型。
S5:根据NUMA节点数量信息、PCIE设备类型数量及PCIE设备对应的NUMA节点归属 信息,判断PCIE设备NUMA分布是否平衡,若NUMA分布不平衡,则输出提示信息,否则,不输出 提示信息。获取的PCIE设备类型、PCIE设备数量进行统计,判断当前同类型PCIE设备隶属 NUMA节点是否平衡;进一步地,优选同类型PCIE设备进行判断,如网卡设备、GPU设备、NVME 存储设备,进一步地,判断NUMA节点平衡的规则如下:服务器NUMA节点数量为
Figure 744519DEST_PATH_IMAGE001
,其中,
Figure 985007DEST_PATH_IMAGE002
为 小于或等于2的自然数;
(1)
Figure 512809DEST_PATH_IMAGE002
=1,所述服务器NUMA节点数量为2个,分别为NUMA 节点0和NUMA 节点1;PCIE 设备类型一致;
若PCIE设备数量2N个,其中N个PCIE设备属于NUMA 节点0,另外N个PCIE设备属于NUMA节点1,则PCIE设备NUMA分布平衡,若2N均属于NUMA 节点0或均属于NUMA节点1,则PCIE设备NUMA分布不平衡;
若PCIE设备数量2N+1个,其中N+1个PCIE设备属于NUMA节点0,另外N个PCIE设备属于NUMA节点1,或 N个PCIE设备属于NUMA节点0,另外N+1个PCIE设备属于NUMA节点1,则PCIE设备NUMA分布平衡,反之,则PCIE设备NUMA分布不平衡,N为自然数;如PCIE设备为5,2个属于 NUMA 节点0,另外3个属于NUMA节点1,或3个属于 NUMA 节点0,另外2个属于NUMA节点1,则为平衡;若4个属于NUMA节点0,另外1个NUMA节点1,或5个均属于NUMA节点0或NUMA节点1,则为不平衡;
(2)
Figure 660894DEST_PATH_IMAGE002
=2,所述服务器NUMA节点数量为4个,PCIE设备类型一致;
若PCIE设备数量N个,其中N为大于1小于4的自然数,其中N个PCIE设备属于不同NUMA节点,则PCIE设备NUMA分布平衡,反之则PCIE设备NUMA分布不平衡;
若PCIE设备数量 N个,其中N为大于或等于4的自然数,采取计算公式为N/4,其中商为M,每M个PCIE设备均属于不同NUMA节点,余数为K, K个PCIE设备均属于不同NUMA节点,则PCIE设备NUMA分布平衡,反之则PCIE设备NUMA分布不平衡。
该方法还包括:将PCIE设备类型数量、PCIE设备对应的NUMA节点归属信息、PCIE设备NUMA分布是否平衡以及用户提示信息进行输出显示。
如图2所示,本申请实施例还提供了一种感知PCIE设备NUMA分布平衡的系统,包括远程控制单元和具有PCIE设备的服务器,PCIE设备与服务器通过PCIE协议进行通信;远程控制单元与所述服务器进行通信连接;所述的远程控制单元包括获取模块、处理模块和数据库模块;
获取模块,用于获取服务器中NUMA节点数量信息、PCIE设备信息;所述的PCIE设备信息包括PCIE设备的地址信息、PCIE设备类型信息、PCI槽位信息;
处理模块,用于判断获取的PCIE设备信息是否存在PCI槽位信息,进一步判断获取的PCI槽位信息是否包含处理器槽位信息;若是,获取PCIE设备对应的NUMA节点归属信息,若否,根据获取的地址信息在数据库模块进行匹配查询,获取PCIE设备对应的NUMA节点归属信息;
处理模块,还用于根据获取的PCIE设备类型信息判断PCIE设备类型并获取相应PCIE设备类型数量;
处理模块,根据NUMA节点数量信息、PCIE设备类型数量及PCIE设备对应的NUMA节点归属信息,判断PCIE设备NUMA分布是否平衡,若NUMA分布不平衡,则输出提示信息,否则,不输出提示信息;
数据库模块,用于预存储PCIE设备信息与NUMA归属地映射关系。
需要说明的是,所述的远程控制单元还包括显示模块,所述显示模块,用于显示处理模块发布的信息,处理模块发布的信息包括PCIE设备类型数量、PCIE设备对应的NUMA节点归属信息及PCIE设备NUMA分布是否平衡,并显示提示用户提示信息。
需要说明的是,远程控制单元与所述服务器通过TCP/IP协议进行通信;
服务器还包括基板管理控制器,所述的基板管理控制器,用于获取PCIE设备的PCI槽位信息、PCI地址及PCI根地址并将获取PCIE设备的PCI槽位信息、PCI地址及PCI根地址与NUMA节点归属的映射关系存入数据库模块。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种感知PCIE设备NUMA分布平衡的方法,其特征在于,应用于具有PCIE设备的服务器,PCIE设备与服务器通过PCIE协议进行通信,该方法包括:
获取服务器中NUMA节点数量信息、PCIE设备信息;所述的PCIE设备信息包括PCIE设备的地址信息、PCIE设备类型信息、PCI槽位信息;
判断获取的PCI槽位信息是否包含处理器槽位信息,若是,获取PCIE设备对应的NUMA节点归属信息,若否,根据获取的地址信息进行数据库匹配查询,获取PCIE设备对应的NUMA节点归属信息;
根据获取的PCIE设备类型信息判断PCIE设备类型并获取相应PCIE设备类型数量;
根据NUMA节点数量信息、PCIE设备类型数量及PCIE设备对应的NUMA节点归属信息,判断PCIE设备NUMA分布是否平衡,若NUMA分布不平衡,则输出提示信息,否则,不输出提示信息。
2.根据权利要求1所述的一种感知PCIE设备NUMA分布平衡的方法,其特征在于,该方法还包括:
将获取PCIE设备对应的NUMA节点归属信息、PCIE设备类型数量、PCIE设备NUMA分布是否平衡及输出的提示信息进行输出显示。
3.根据权利要求1所述的一种感知PCIE设备NUMA分布平衡的方法,其特征在于,所述的根据获取的地址信息进行数据库匹配查询,获取PCIE设备对应的NUMA节点归属信息的步骤之前,还包括:
根据获取的NUMA节点数量信息调用相应映射数据库用于进行匹配查询。
4.根据权利要求1所述的一种感知PCIE设备NUMA分布平衡的方法,其特征在于,判断获取的PCI槽位信息是否包含处理器槽位信息,若是,获取PCIE设备对应的NUMA节点归属信息,若否,根据获取的地址信息进行数据库匹配查询,获取PCIE设备对应的NUMA节点归属信息的步骤包括:
判断获取的PCIE设备信息是否存在PCI槽位信息,若是,判断PCI槽位信息中是否包含处理器槽位信息,若包含处理器槽位信息,获取该PCIE设备对应的NUMA节点归属信息,无需进行数据库匹配;若不包含处理器槽位信息,根据获取的地址信息进行数据库匹配查询,获取PCIE设备对应的NUMA节点归属信息。
5.根据权利要求4所述的一种感知PCIE设备NUMA分布平衡的方法,其特征在于,若不包含处理器槽位信息,根据获取的地址信息进行数据库匹配查询,获取PCIE设备对应的NUMA节点归属信息中,所述的地址信息包括PCI根地址、PCI地址;该步骤包括:
若不包含处理器槽位信息,但包含PCI根地址、PCI地址,首先根据PCI根地址进行数据库匹配查询,获取该PCIE设备对应的NUMA节点归属信息。
6.根据权利要求5所述的一种感知PCIE设备NUMA分布平衡的方法,其特征在于,若既不包括处理器槽位信息也不包括PCI根地址,则根据PCI地址进行数据库匹配查询,获取该PCIE设备对应的NUMA节点归属信息。
7.根据权利要求5所述的一种感知PCIE设备NUMA分布平衡的方法,其特征在于,根据 NUMA节点数量信息、PCIE设备类型数量及PCIE设备对应的NUMA节点归属信息,判断PCIE设 备NUMA分布是否平衡的步骤中,判断规则如下:服务器NUMA节点数量为
Figure 148935DEST_PATH_IMAGE001
,其中,
Figure 844359DEST_PATH_IMAGE002
为小于 或等于2的自然数;
(1)
Figure 554826DEST_PATH_IMAGE002
=1,所述服务器NUMA节点数量为2个,分别为NUMA 节点0和NUMA 节点1;PCIE设备 类型一致;
若PCIE设备数量2N个,其中N个PCIE设备属于NUMA 节点0,另外N个PCIE设备属于NUMA节点1,则PCIE设备NUMA分布平衡,若2N均属于NUMA 节点0或均属于NUMA节点1,则PCIE设备NUMA分布不平衡;
若PCIE设备数量2N+1个,其中N+1个PCIE设备属于NUMA节点0,另外N个PCIE设备属于NUMA节点1,或 N个PCIE设备属于NUMA节点0,另外N+1个PCIE设备属于NUMA节点1,则PCIE设备NUMA分布平衡,反之,则PCIE设备NUMA分布不平衡,N为自然数;
(2)
Figure 157845DEST_PATH_IMAGE002
=2,所述服务器NUMA节点数量为4个,PCIE设备类型一致;
若PCIE设备数量N个,其中N为大于1小于4的自然数,其中N个PCIE设备属于不同NUMA节点,则PCIE设备NUMA分布平衡,反之则PCIE设备NUMA分布不平衡;
若PCIE设备数量 N个,其中N为大于或等于4的自然数,采取计算公式为N/4,其中商为M,每M个PCIE设备均属于不同NUMA节点,余数为K, K个PCIE设备均属于不同NUMA节点,则PCIE设备NUMA分布平衡,反之则PCIE设备NUMA分布不平衡。
8.一种感知PCIE设备NUMA分布平衡的系统,其特征在于,包括远程控制单元和具有PCIE设备的服务器,PCIE设备与服务器通过PCIE协议进行通信;远程控制单元与所述服务器进行通信连接;所述的远程控制单元包括获取模块、处理模块和数据库模块;
获取模块,用于获取服务器中NUMA节点数量信息、PCIE设备信息;所述的PCIE设备信息包括PCIE设备的地址信息、PCIE设备类型信息、PCI槽位信息;
处理模块,用于判断获取的PCIE设备信息是否存在PCI槽位信息,进一步判断获取的PCI槽位信息是否包含处理器槽位信息;若是,获取PCIE设备对应的NUMA节点归属信息,若否,根据获取的地址信息在数据库模块进行匹配查询,获取PCIE设备对应的NUMA节点归属信息;
处理模块,还用于根据获取的PCIE设备类型信息判断PCIE设备类型并获取相应PCIE设备类型数量;
处理模块,根据NUMA节点数量信息、PCIE设备类型数量及PCIE设备对应的NUMA节点归属信息,判断PCIE设备NUMA分布是否平衡,若NUMA分布不平衡,则输出提示信息,否则,不输出提示信息;
数据库模块,用于预存储PCIE设备信息与NUMA归属地映射关系。
9.根据权利要求8所述的一种感知PCIE设备NUMA分布平衡的系统,其特征在于,所述的远程控制单元还包括显示模块,所述显示模块,用于显示处理模块发布的信息,处理模块发布的信息包括PCIE设备类型数量、PCIE设备对应的NUMA节点归属信息及PCIE设备NUMA分布是否平衡,并显示提示用户提示信息。
10.根据权利要求8所述的一种感知PCIE设备NUMA分布平衡的系统,其特征在于,远程控制单元与所述服务器通过TCP/IP协议进行通信;
服务器还包括基板管理控制器,所述的基板管理控制器,用于获取PCIE设备的PCI槽位信息、PCI地址及PCI根地址并将获取PCIE设备的PCI槽位信息、PCI地址及PCI根地址与NUMA节点归属的映射关系存入数据库模块。
CN202010468725.9A 2020-05-28 2020-05-28 一种感知pcie设备numa分布平衡的方法、系统 Active CN111736984B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010468725.9A CN111736984B (zh) 2020-05-28 2020-05-28 一种感知pcie设备numa分布平衡的方法、系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010468725.9A CN111736984B (zh) 2020-05-28 2020-05-28 一种感知pcie设备numa分布平衡的方法、系统

Publications (2)

Publication Number Publication Date
CN111736984A CN111736984A (zh) 2020-10-02
CN111736984B true CN111736984B (zh) 2023-01-10

Family

ID=72647916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010468725.9A Active CN111736984B (zh) 2020-05-28 2020-05-28 一种感知pcie设备numa分布平衡的方法、系统

Country Status (1)

Country Link
CN (1) CN111736984B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112256618B (zh) * 2020-10-23 2022-10-21 新华三信息安全技术有限公司 一种映射关系确定方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199718A (zh) * 2014-08-22 2014-12-10 上海交通大学 一种基于numa高性能网络缓存资源亲和度的虚拟处理器的调度方法
CN105353981A (zh) * 2015-10-27 2016-02-24 浪潮电子信息产业股份有限公司 一种pcie ssd优化的方法
CN110515723A (zh) * 2019-08-09 2019-11-29 苏州浪潮智能科技有限公司 一种双路服务器及其cpu负载均衡系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199718A (zh) * 2014-08-22 2014-12-10 上海交通大学 一种基于numa高性能网络缓存资源亲和度的虚拟处理器的调度方法
CN105353981A (zh) * 2015-10-27 2016-02-24 浪潮电子信息产业股份有限公司 一种pcie ssd优化的方法
CN110515723A (zh) * 2019-08-09 2019-11-29 苏州浪潮智能科技有限公司 一种双路服务器及其cpu负载均衡系统

Also Published As

Publication number Publication date
CN111736984A (zh) 2020-10-02

Similar Documents

Publication Publication Date Title
US7444459B2 (en) Methods and systems for load balancing of virtual machines in clustered processors using storage related load information
US9250969B2 (en) Tagging a copy of memory of a virtual machine with information for fetching of relevant portions of the memory
US7793297B2 (en) Intelligent resource provisioning based on on-demand weight calculation
US20170279703A1 (en) Managing variations among nodes in parallel system frameworks
CN108196935B (zh) 一种面向云计算的虚拟机节能迁移方法
US7536461B2 (en) Server resource allocation based on averaged server utilization and server power management
US9612641B2 (en) Adjusting the connection idle timeout in connection pools
Agrawal et al. Rhythm: Harnessing data parallel hardware for server workloads
CN104102543A (zh) 一种云计算环境中负载调整的方法和装置
TWI624757B (zh) 資料處理方法、資料處理系統與電腦程式產品
US9417902B1 (en) Managing resource bursting
JP7200078B2 (ja) I/oステアリングエンジンを備えるシステムオンチップ
US20150304409A1 (en) Determining at least one cost factor associated with using the cloud to provide an application component
WO2018086467A1 (zh) 一种云环境下应用集群资源分配的方法、装置和系统
CN107251002B (zh) 多模式片上系统
WO2015032201A1 (zh) 虚拟机放置方法和装置
US11321077B1 (en) Live updating of firmware behavior
CN111736984B (zh) 一种感知pcie设备numa分布平衡的方法、系统
CN114124968B (zh) 基于行情数据的负载均衡方法、装置、设备及介质
WO2009070912A1 (en) Modifying system routing information in link based systems
CN108289086B (zh) 请求处理方法及装置、服务器
CN111597041B (zh) 一种分布式系统的调用方法、装置、终端设备及服务器
Ji et al. An online virtual machine placement algorithm in an over-committed cloud
CN115421922A (zh) 一种分布式系统的限流方法、装置、设备、介质及产品
US20150248303A1 (en) Paravirtualized migration counter

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant