CN114116378B - 获取PCIe设备温度的方法、系统、终端及存储介质 - Google Patents

获取PCIe设备温度的方法、系统、终端及存储介质 Download PDF

Info

Publication number
CN114116378B
CN114116378B CN202111335530.8A CN202111335530A CN114116378B CN 114116378 B CN114116378 B CN 114116378B CN 202111335530 A CN202111335530 A CN 202111335530A CN 114116378 B CN114116378 B CN 114116378B
Authority
CN
China
Prior art keywords
temperature
pcie
file
bmc
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111335530.8A
Other languages
English (en)
Other versions
CN114116378A (zh
Inventor
朱全娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202111335530.8A priority Critical patent/CN114116378B/zh
Publication of CN114116378A publication Critical patent/CN114116378A/zh
Application granted granted Critical
Publication of CN114116378B publication Critical patent/CN114116378B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/20Handling requests for interconnection or transfer for access to input/output bus
    • G06F13/22Handling requests for interconnection or transfer for access to input/output bus using successive scanning, e.g. polling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0026PCI express
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)
  • Stored Programmes (AREA)

Abstract

本发明提供一种获取PCIe设备温度的方法、系统、终端及存储介质,包括:通过PCIe总线轮询PCIe设备,采集PCIe设备的温度数据;将所述温度数据通过智能平台管理接口命令发送至基板管理控制器。本发明可以在BMC无法直接读取PCIe设备的温度时,通过系统获取到再传递给BMC,从而进行散热调控,保障服务器的散热;通过本发明能同时获取不同PCIe卡的温度,配置变化时不需要频繁更换固件版本,使服务器固件版本稳定,为服务器的后续运维工作提供了便利。

Description

获取PCIe设备温度的方法、系统、终端及存储介质
技术领域
本发明涉及服务器技术领域,具体涉及一种获取PCIe设备温度的方法、系统、终端及存储介质。
背景技术
BMC(Baseboard Management Controller,基板管理控制器)是服务器特有的管理控制器,BMC可以自动监控服务器运行状态,并及时根据当前状态进行调控。BMC是一个完整的嵌入式Linux系统,有自己的芯片,内存,网络及存储空间,用户可以通过网络带外访问BMC,也可以在服务器系统下访问BMC。服务器正常运行时,由于环境温度的升高,或者硬盘、处理器等部件由于负载压力产生升温,需要增加风扇转速对其进行散热调控,以维持服务器正常工作,这个散热调控的工作是由BMC完成的。一方面,BMC可以及时获取当前服务器各个部件的实时温度,另一方面,BMC可以直接对风扇进行操作,控制风扇的转速和模式。而各个温度在到达何阈值时开始调控,调控时风扇转速如何增加,都是散热调控策略的内容。一些PCIe卡设备,如GPU、APU、网卡、FPGA卡等由于工作时芯片发热量较大,一般本身不支持主动散热或者主动散热性能较差,需要依赖于服务器的散热功能,因此服务器BMC需要获取PCIe卡设备的温度进行风扇调控。
当前服务器BMC获取PCIe卡温度的方案,例如,PCIe卡是通过PCIe卡槽接至服务器主板上的,PCIe接口有预留I2C总线接口,另一端接至BMC处。BMC通过I2C访问至PCIe卡中的寄存器,读取当前PCIe卡核心的温度。BMC根据当前读取到的温度进行散热调控。
现有技术存在以下缺陷:BMC通过I2C读取PCIe卡寄存器的温度值,但不同厂商固件对温度寄存器的处理逻辑不同,以GPU来说,一般都是由不同的OEM厂商进行生产制造,即使核心是相同的,固件也不同,因此BMC读取温度的寄存器地址,数据类型,计算方法等都有所差异。这就需要服务器BMC端进行适配,服务器每更新一款PCIe卡,都需要重新发布BMC去适配。
发明内容
针对现有技术的上述不足,本发明提供一种获取PCIe设备温度的方法、系统、终端及存储介质,以解决上述技术问题。
第一方面,本发明提供一种获取PCIe设备温度的方法,包括:
通过PCIe总线轮询PCIe设备,采集PCIe设备的温度数据;
将所述温度数据通过智能平台管理接口命令发送至基板管理控制器。
进一步的,通过PCIe总线轮询PCIe设备,采集PCIe设备的温度数据,包括:
校验与PCIe设备的PCIe总线的通信状态;
通过第一脚本轮询向PCIe设备发送读取温度数据的请求;
将PCIe设备返回的温度数据保存至第一文件。
进一步的,将所述温度数据通过智能平台管理接口命令发送至基板管理控制器,包括:
读取第一文件中的温度数据,并将所述温度数据转换为16进制;
将16进制的温度数据通过智能平台管理接口命令发送至基板管理控制器;
接收基板管理控制器返回的数据接收回执,根据所述数据接收回执将已发送的温度数据从所述第一文件清除。
进一步的,将所述温度数据通过智能平台管理接口命令发送至基板管理控制器之后,所述方法还包括:
基板管理控制器将接收到16进制的温度数据写入第二文件;
循环以初始化文件格式从第二文件读取温度数据,并基于温度调控策略生成与所述温度数据的风扇调控信号;
将所述风扇调控信号发送至与所述温度数据所属PCIe设备对应的风扇。
第二方面,本发明提供一种获取PCIe设备温度的系统,包括:
温度采集单元,用于通过PCIe总线轮询PCIe设备,采集PCIe设备的温度数据;
温度转发单元,用于将所述温度数据通过智能平台管理接口命令发送至基板管理控制器。
进一步的,所述温度采集单元用于:
校验与PCIe设备的PCIe总线的通信状态;
通过第一脚本轮询向PCIe设备发送读取温度数据的请求;
将PCIe设备返回的温度数据保存至第一文件。
进一步的,所述温度转发单元用于:
读取第一文件中的温度数据,并将所述温度数据转换为16进制;
将16进制的温度数据通过智能平台管理接口命令发送至基板管理控制器;
接收基板管理控制器返回的数据接收回执,根据所述数据接收回执将已发送的温度数据从所述第一文件清除。
进一步的,所述系统还包括:
数据保存单元,用于基板管理控制器将接收到16进制的温度数据写入第二文件;
数据读取单元,用于循环以初始化文件格式从第二文件读取温度数据,并基于温度调控策略生成与所述温度数据的风扇调控信号;
温度调控单元,用于将所述风扇调控信号发送至与所述温度数据所属PCIe设备对应的风扇。
第三方面,提供一种终端,包括:
处理器、存储器,其中,
该存储器用于存储计算机程序,
该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。
第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
本发明的有益效果在于,
本发明提供的获取PCIe设备温度的方法、系统、终端及存储介质,为了保证通用性及可扩展性,不限制传递内容,提出了通过IPMI命令来发送此温度文件的方式进行温度传递。通过文件进行传递,可以不限制传递的温度配置个数,也可以将其他散热调控参数在文件中传递,能够提高效率,同时后期PCIe卡设备增加时,不需要改动BMC固件版本。本发明可以在BMC无法直接读取PCIe设备的温度时,通过系统获取到再传递给BMC,从而进行散热调控,保障服务器的散热;通过本发明能同时获取不同PCIe卡的温度,配置变化时不需要频繁更换固件版本,使服务器固件版本稳定,为服务器的后续运维工作提供了便利。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的示意性流程图。
图2是本发明一个实施例的方法的示意性原理图。
图3是本发明一个实施例的系统的示意性框图。
图4为本发明实施例提供的一种终端的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
下面对本发明中出现的关键术语进行解释。
BMC,执行伺服器远端管理控制器,英文全称为Baseboard ManagementController.为基板管理控制器。它可以在机器未开机的状态下,对机器进行固件升级、查看机器设备、等一些操作。在BMC中完全实现IPMI功能需要一个功能强大的16位元或32位元微控制器以及用于数据储存的RAM、用于非挥发性数据储存的快闪记忆体和韧体,在安全远程重启、安全重新上电、LAN警告和系统健康监视方面能提供基本的远程可管理性。除了基本的IPMI功能和系统工作监视功能外,通过利用2个快闪记忆体之一储存以前的BIOS,mBMC还能实现BIOS快速元件的选择和保护。例如,在远程BIOS升级後系统不能启动时,远程管理人员可以切换回以前工作的BIOS映像来启动系统。一旦BIOS升级後,BIOS映像还能被锁住,可有效防止病毒对它的侵害。
.ini文件是Initialization File的缩写,即初始化文件,是windows的系统配置文件所采用的存储格式,统管windows的各项配置,一般用户就用windows提供的各项图形化管理界面就可实现相同的配置了。但在某些情况,还是要直接编辑ini才方便,一般只有很熟悉windows才能去直接编辑。
智能平台管理接口(Intelligent Platform Management Interface)原本是一种Intel架构的企业系统的周边设备所采用的一种工业标准。IPMI亦是一个开放的免费标准,用户无需支付额外的费用即可使用此标准。IPMI能够横跨不同的操作系统、固件和硬件平台,可以智能的监视、控制和自动回报大量服务器的运作状况,以降低服务器系统成本。
PCI-Express(peripheral component interconnect express)是一种高速串行计算机扩展总线标准,它原来的名称为“3GIO”,是由英特尔在2001年提出的,旨在替代旧的PCI,PCI-X和AGP总线标准。PCIe属于高速串行点对点双通道高带宽传输,所连接的设备分配独享通道带宽,不共享总线带宽,主要支持主动电源管理,错误报告,端对端的可靠性传输,热插拔以及服务质量(QOS)等功能。PCIe交由PCI-SIG(PCI特殊兴趣组织)认证发布后才改名为“PCI-Express”,简称“PCI-e”。它的主要优势就是数据传输速率高,而且还有相当大的发展潜力。PCIExpress也有多种规格,从PCIExpressx1到PCI Expressx32,能满足将来一定时间内出现的低速设备和高速设备的需求。PCI-Express的接口是PCIe 3.0接口,其比特率为8Gbps,约为上一代产品带宽的两倍,并且包含发射器和接收器均衡、PLL改善以及时钟数据恢复等一系列重要的新功能,用以改善数据传输和数据保护性能。
CPU中央处理器(central processing unit,简称CPU)作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元。
图1是本发明一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种获取PCIe设备温度的系统。
如图1所示,该方法包括:
步骤110,通过PCIe总线轮询PCIe设备,采集PCIe设备的温度数据;
步骤120,将所述温度数据通过智能平台管理接口命令发送至基板管理控制器。
为了便于对本发明的理解,下面以本发明获取PCIe设备温度的方法的原理,结合实施例中对PCIe设备温度进行获取的过程,对本发明提供的获取PCIe设备温度的方法做进一步的描述。
本发明在PCIe卡没有独立固件进行温度管理、BMC无法通过I2C读取PCIe卡的寄存器来获取温度时,提出了一种新的获取温度的方式。在操作系统下将PCIe设备的核心温度通过IPMI协议传递至服务器BMC内,建立一套温度传递的通信解析机制,使BMC能够获取到PCIe设备温度进行散热调控。本发明的关键在于通过服务器系统来进行温度数据转发。操作系统可以通过驱动获取到PCIe设备的核心温度,在操作系统下运行脚本不断获取温度并发通过IPMI命令转发至BMC,通过IPMI协议与BMC进行信息交互。
具体的,请参考图2,获取PCIe设备温度的方法包括:
S1、通过PCIe总线轮询PCIe设备,采集PCIe设备的温度数据。
校验与PCIe设备的PCIe总线的通信状态;通过第一脚本轮询向PCIe设备发送读取温度数据的请求;将PCIe设备返回的温度数据保存至第一文件。
在OS下运行的脚本1,循环通过驱动获取PCIE设备的温度,并将温度存至温度第一文件中。其中脚本1中写有目标PCIe设备的温度数据存储地址。
S2、将温度数据通过智能平台管理接口命令发送至基板管理控制器。
读取第一文件中的温度数据,并将温度数据转换为16进制;将16进制的温度数据通过智能平台管理接口命令发送至基板管理控制器;接收基板管理控制器返回的数据接收回执,根据数据接收回执将已发送的温度数据从第一文件清除。
在OS下运行的脚本2,循环打开系统的下的第一文件,进行16进制读取,然后将16进制数据通过IPMI命令发送给BMC。
S3、基板管理控制器将接收到16进制的温度数据写入第二文件;循环以初始化文件格式从第二文件读取温度数据,并基于温度调控策略生成与温度数据的风扇调控信号;将风扇调控信号发送至与温度数据所属PCIe设备对应的风扇。
BMC收到发过来的IPMI命令将命令数据16进制写入至第二文件中;BMC内的文件解析程序,循环以ini格式读取第二文件,并将第二文件中的温度赋值给到的传感器中。BMC中的散热程序根据传感器中的温度进行散热调控。
ini文件格式示例如下,可以一次传递多个温度及散热参数,提高传递效率。
[Thermal/T4_PCIE1]
CurrentTemp=69
TargetTemp=70
Kp=3
Ki=0.4
Kd=0.3
Timeout=65
Hysteresis=2
Inlet_temp_line=20,40|21,42|22,44|23,46|24,48|25,50|26,52|27,54|28,56|30,60|31,62|32,64|33,66|34,68|35,70|36,72|37,74|38,76|39,78|40,80|
[Thermal/G1_PCIE2]
CurrentTemp=30
TargetTemp=60
Kp=3
Ki=0.4
Kd=0.3
Timeout=65
Hysteresis=2
Inlet_temp_line=20,40|21,42|22,44|23,46|24,48|25,50|26,52|27,54|28,56|30,60|31,62|32,64|33,66|34,68|35,70|36,72|37,74|38,76|39,78|40,80|
本发明为了保证通用性及可扩展性,不限制传递内容,提出了通过IPMI命令来发送此温度文件的方式进行温度传递。通过文件进行传递,可以不限制传递的温度配置个数,也可以将其他散热调控参数在文件中传递,能够提高效率,同时后期PCIE卡设备增加时,只需要调整脚本,不需要改动BMC固件版本。
如图3所示,该系统300包括:
温度采集单元310,用于通过PCIe总线轮询PCIe设备,采集PCIe设备的温度数据;
温度转发单元320,用于将所述温度数据通过智能平台管理接口命令发送至基板管理控制器。
可选地,作为本发明一个实施例,所述温度采集单元用于:
校验与PCIe设备的PCIe总线的通信状态;
通过第一脚本轮询向PCIe设备发送读取温度数据的请求;
将PCIe设备返回的温度数据保存至第一文件。
可选地,作为本发明一个实施例,所述温度转发单元用于:
读取第一文件中的温度数据,并将所述温度数据转换为16进制;
将16进制的温度数据通过智能平台管理接口命令发送至基板管理控制器;
接收基板管理控制器返回的数据接收回执,根据所述数据接收回执将已发送的温度数据从所述第一文件清除。
可选地,作为本发明一个实施例,所述系统还包括:
数据保存单元,用于基板管理控制器将接收到16进制的温度数据写入第二文件;
数据读取单元,用于循环以初始化文件格式从第二文件读取温度数据,并基于温度调控策略生成与所述温度数据的风扇调控信号;
温度调控单元,用于将所述风扇调控信号发送至与所述温度数据所属PCIe设备对应的风扇。
图4为本发明实施例提供的一种终端400的结构示意图,该终端400可以用于执行本发明实施例提供的获取PCIe设备温度的方法。
其中,该终端400可以包括:处理器410、存储器420及通信单元430。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本发明的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,该存储器420可以用于存储处理器410的执行指令,存储器420可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。当存储器420中的执行指令由处理器410执行时,使得终端400能够执行以下上述方法实施例中的部分或全部步骤。
处理器410为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器420内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(Integrated Circuit,简称IC)组成,例如可以由单颗封装的IC所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器410可以仅包括中央处理器(Central Processing Unit,简称CPU)。在本发明实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
通信单元430,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
因此,本发明为了保证通用性及可扩展性,不限制传递内容,提出了通过IPMI命令来发送此温度文件的方式进行温度传递。通过文件进行传递,可以不限制传递的温度配置个数,也可以将其他散热调控参数在文件中传递,能够提高效率,同时后期PCIe卡设备增加时,不需要改动BMC固件版本。本发明可以在BMC无法直接读取PCIe设备的温度时,通过系统获取到再传递给BMC,从而进行散热调控,保障服务器的散热;通过本发明能同时获取不同PCIe卡的温度,配置变化时不需要频繁更换固件版本,使服务器固件版本稳定,为服务器的后续运维工作提供了便利,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (4)

1.一种获取PCIe设备温度的方法,其特征在于,包括:
确认PCIe卡没有独立固件进行温度管理、BMC无法通过I2C读取PCIe卡的寄存器来获取温度;
通过PCIe总线轮询PCIe设备,采集PCIe设备的温度数据;
将所述温度数据通过智能平台管理接口命令发送至基板管理控制器;
通过PCIe总线轮询PCIe设备,采集PCIe设备的温度数据,包括:
在OS下运行的第一脚本,循环通过驱动获取PCIe设备的温度,并将温度存至温度第一文件中,其中第一脚本中写有目标PCIe设备的温度数据的存储地址;
将所述温度数据通过智能平台管理接口命令发送至基板管理控制器,包括:
在OS下运行的第二脚本,循环打开系统的下的第一文件,进行16进制读取,然后将16进制数据通过IPMI命令发送给BMC;
方法还包括:
BMC收到发过来的IPMI命令,将命令数据16进制写入至第二文件中;BMC内的文件解析程序,循环以ini格式读取第二文件,并将第二文件中的温度赋值给到传感器中;BMC中的散热程序根据传感器中的温度进行散热调控。
2.一种获取PCIe设备温度的系统,其特征在于,包括:
确认PCIe卡没有独立固件进行温度管理、BMC无法通过I2C读取PCIe卡的寄存器来获取温度;
温度采集单元,用于通过PCIe总线轮询PCIe设备,采集PCIe设备的温度数据;
温度转发单元,用于将所述温度数据通过智能平台管理接口命令发送至基板管理控制器;
通过PCIe总线轮询PCIe设备,采集PCIe设备的温度数据,包括:
在OS下运行的第一脚本,循环通过驱动获取PCIe设备的温度,并将温度存至温度第一文件中,其中第一脚本中写有目标PCIe设备的温度数据的存储地址;
将所述温度数据通过智能平台管理接口命令发送至基板管理控制器,包括:
在OS下运行的第二脚本,循环打开系统的下的第一文件,进行16进制读取,然后将16进制数据通过IPMI命令发送给BMC;
系统还包括:
BMC收到发过来的IPMI命令,将命令数据16进制写入至第二文件中;BMC内的文件解析程序,循环以ini格式读取第二文件,并将第二文件中的温度赋值给到传感器中;BMC中的散热程序根据传感器中的温度进行散热调控。
3.一种终端,其特征在于,包括:
处理器;
用于存储处理器的执行指令的存储器;
其中,所述处理器被配置为执行权利要求1所述的方法。
4.一种存储有计算机程序的计算机可读存储介质,其特征在于,该程序被处理器执行时实现如权利要求1所述的方法。
CN202111335530.8A 2021-11-11 2021-11-11 获取PCIe设备温度的方法、系统、终端及存储介质 Active CN114116378B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111335530.8A CN114116378B (zh) 2021-11-11 2021-11-11 获取PCIe设备温度的方法、系统、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111335530.8A CN114116378B (zh) 2021-11-11 2021-11-11 获取PCIe设备温度的方法、系统、终端及存储介质

Publications (2)

Publication Number Publication Date
CN114116378A CN114116378A (zh) 2022-03-01
CN114116378B true CN114116378B (zh) 2023-12-22

Family

ID=80378644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111335530.8A Active CN114116378B (zh) 2021-11-11 2021-11-11 获取PCIe设备温度的方法、系统、终端及存储介质

Country Status (1)

Country Link
CN (1) CN114116378B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114968862B (zh) * 2022-08-01 2022-11-11 摩尔线程智能科技(北京)有限责任公司 图形处理器管理方法、装置和存储介质
CN117807003A (zh) * 2022-09-26 2024-04-02 华为技术有限公司 一种电子设备、处理器、数据传输方法及装置
CN115543881B (zh) * 2022-11-29 2023-05-02 苏州浪潮智能科技有限公司 Pcie设备适配方法、系统、计算机设备和存储介质
CN117591378B (zh) * 2024-01-17 2024-04-05 苏州元脑智能科技有限公司 一种服务器的温度控制方法、系统、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109947221A (zh) * 2019-02-28 2019-06-28 苏州浪潮智能科技有限公司 一种服务器散热调控的方法
CN110096366A (zh) * 2019-05-10 2019-08-06 苏州浪潮智能科技有限公司 一种异构内存系统的配置方法、装置及服务器
CN112732035A (zh) * 2021-01-08 2021-04-30 苏州浪潮智能科技有限公司 一种温度实时监控和风扇管理装置和服务器
CN113360344A (zh) * 2021-06-18 2021-09-07 山东云海国创云计算装备产业创新中心有限公司 一种服务器监控方法、装置、设备及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI447670B (zh) * 2011-07-11 2014-08-01 Aspeed Technology Inc 具有高速傳輸功能之基板管理控制器及其傳輸方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109947221A (zh) * 2019-02-28 2019-06-28 苏州浪潮智能科技有限公司 一种服务器散热调控的方法
CN110096366A (zh) * 2019-05-10 2019-08-06 苏州浪潮智能科技有限公司 一种异构内存系统的配置方法、装置及服务器
CN112732035A (zh) * 2021-01-08 2021-04-30 苏州浪潮智能科技有限公司 一种温度实时监控和风扇管理装置和服务器
CN113360344A (zh) * 2021-06-18 2021-09-07 山东云海国创云计算装备产业创新中心有限公司 一种服务器监控方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN114116378A (zh) 2022-03-01

Similar Documents

Publication Publication Date Title
CN114116378B (zh) 获取PCIe设备温度的方法、系统、终端及存储介质
US9954727B2 (en) Automatic debug information collection
US10127170B2 (en) High density serial over LAN management system
US10402207B2 (en) Virtual chassis management controller
EP3035187B1 (en) Hard disk and management method
US9804980B2 (en) System management through direct communication between system management controllers
CN113645047B (zh) 一种基于智能网卡的带外管理系统和服务器
EP3429128B1 (en) Hard drive operation method and hard drive manager
CN114003445B (zh) Bmc的i2c监控功能测试方法、系统、终端及存储介质
CN110825547B (zh) 一种基于smbus的pcie卡异常恢复装置及方法
CN107908418B (zh) 光纤通道节点卡的逻辑程序升级方法及光纤通道总线设备
CN114691223B (zh) 一种通过网络传输bios日志的方法及装置
CN114253573A (zh) PCIe设备固件批量升级方法、系统、终端及存储介质
CN115766682A (zh) 一种数据传输方法及其装置
CN115098342A (zh) 系统日志收集方法、系统、终端及存储介质
CN114201439A (zh) 服务器信号识别优化方法、系统及存储介质
CN112579507A (zh) 宿主机与bmc通信的方法、bios、操作系统、bmc和服务器
US20060165075A1 (en) Out-of-band state machine
CN220085381U (zh) 一种远程读写串口设备的装置
CN114201323A (zh) Bmc记录系统异常信息的方法、系统、终端及存储介质
CN113836068B (zh) PCIe显卡的控制方法、装置、服务器及电子设备
CN114115955B (zh) 服务器资源盒子fpga固件升级方法、系统、终端及存储介质
US20240012770A1 (en) Interface device having plurality of ports and method of operating the same
KR20080010791A (ko) 웹 기반 모니터링 모듈, 이를 포함하는 하드웨어 시스템,그리고 웹 기반 모니터링 모듈의 모니터링 방법
CN116204383A (zh) 基于bmc的串口信息监控方法、系统、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant