CN116719689A - 芯片内核温度监控方法、系统、终端及存储介质 - Google Patents
芯片内核温度监控方法、系统、终端及存储介质 Download PDFInfo
- Publication number
- CN116719689A CN116719689A CN202310574000.1A CN202310574000A CN116719689A CN 116719689 A CN116719689 A CN 116719689A CN 202310574000 A CN202310574000 A CN 202310574000A CN 116719689 A CN116719689 A CN 116719689A
- Authority
- CN
- China
- Prior art keywords
- chip
- temperature
- power consumption
- core
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000012544 monitoring process Methods 0.000 title claims abstract description 44
- 230000015654 memory Effects 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 6
- 230000017525 heat dissipation Effects 0.000 abstract description 10
- 238000004364 calculation method Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 238000004806 packaging method and process Methods 0.000 description 5
- 238000011897 real-time detection Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 108010028984 3-isopropylmalate dehydratase Proteins 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000011217 control strategy Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 241001290266 Sciaenops ocellatus Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3058—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/20—Cooling means
- G06F1/206—Cooling means comprising thermal management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明涉及服务器技术领域,具体提供一种芯片内核温度监控方法、系统、终端及存储介质,包括:采集芯片所在的电路板的温度值;基于芯片型号信息获取相应的温度影响参数;获取当前风扇转速,基于当前风扇转速和温度影响参数计算权重因子;获取芯片的实际功耗值;将所述功耗值乘以权重因子后与温度值的和,输出为芯片内核温度。本发明在芯片内核的温度传感器故障后仍然能够实现对芯片内核温度的监控,增加了芯片内核温度的监控途径,从而保证了服务器散热策略的正常运作,提升了服务器的散热性能。
Description
技术领域
本发明属于服务器技术领域,具体涉及一种芯片内核温度监控方法、系统、终端及存储介质。
背景技术
为保证设备的高温运行可靠性,目前I T设备都有完善的系统温控策略,温控策略的执行严重依赖于关键芯片的结温获取,比如常说的CPU温度,内存温度等等。这些芯片都有内置温度传感器,可以准确即时的反应芯片工作的温度状态,然后用来做系统风扇,或者水冷泵的调速依据。
但是在一些特殊情况下,比如芯片内置温度传感器故障,或者获取芯片内部温度的通信链路故障,会导致系统无法感知芯片的T j,此时的处理策略一般是将系统风扇调到最大转速,保证在温度未知状态下器件工作的可靠。这样会导致系统能耗,和噪声大幅增加。
发明内容
针对现有技术的芯片内核温度监控途径单一,在内核温度传感器故障后无法获取芯片内核温度的问题,本发明提供一种芯片内核温度监控方法、系统、终端及存储介质,以解决上述技术问题。
第一方面,本发明提供一种芯片内核温度监控方法,包括:
采集芯片所在的电路板的温度值;
基于芯片型号信息获取相应的温度影响参数;
获取当前风扇转速,基于当前风扇转速和温度影响参数计算权重因子;
获取芯片的实际功耗值;
将所述功耗值乘以权重因子后与温度值的和,输出为芯片内核温度。
在一个可选的实施方式中,在采集芯片所在的电路板的温度值之前,所述方法还包括:
监控设置于芯片内核的固有温度传感器是否在位:
若是,则从所述固有温度传感器采集芯片内核温度。
在一个可选的实施方式中,基于芯片型号信息获取相应的温度影响参数,包括:
预先将多种型号芯片的第一影响参数和第二影响参数保存至数据库;
基于芯片型号信息从数据库调取相应的第一影响参数和第二影响参数。
在一个可选的实施方式中,预先将多种型号芯片的第一影响参数和第二影响参数保存至数据库,包括:
从芯片手册获取第一影响参数,并将第一影响参数和所属的芯片型号保存至数据库;
收集芯片运行数据,所述运行数据包括功耗值、内核温度、风扇转速和芯片所属的电路板的温度;
通过基于运行数据生成风扇转速与热阻的拟合曲线,得到芯片的第二影响参数;
将第二影响参数和所属的芯片型号保存至数据库。
在一个可选的实施方式中,通过基于运行数据生成风扇转速与热阻的拟合曲线,得到芯片的第二影响参数,包括:
根据芯片运行数据计算热阻Rca:
其中,T j为芯片内核温度,Ta为芯片所属的电路板的温度,P为芯片功耗,Rj c为芯片的第一影响参数;
对芯片的热阻和对应时间节点的风扇转速进行拟合,得到芯片的第二影响参数。
在一个可选的实施方式中,获取当前风扇转速,基于当前风扇转速和温度影响参数计算权重因子,包括:
基于当前风扇转速和第二影响参数计算热阻;
将热阻与第一影响参数的和输出为权重因子。
在一个可选的实施方式中,获取芯片的实际功耗值,包括:
从电流检测电路采集芯片的电流值;
将所述电流值与固定供电电压的乘积输出为实际功耗值。
第二方面,本发明提供一种芯片内核温度监控系统,包括:
温度采集模块,用于采集芯片所在的电路板的温度值;
参数获取模块,用于基于芯片型号信息获取相应的温度影响参数;
权重获取模块,用于获取当前风扇转速,基于当前风扇转速和温度影响参数计算权重因子;
功耗获取模块,用于获取芯片的实际功耗值;
温度输出模块,用于将所述功耗值乘以权重因子后与温度值的和,输出为芯片内核温度。
在一个可选的实施方式中,所述系统还包括:
在位监控模块,用于监控设置于芯片内核的固有温度传感器是否在位;
直接获取模块,用于若设置于芯片内核的固有温度传感器在位,则从所述固有温度传感器采集芯片内核温度。
在一个可选的实施方式中,参数获取模块包括:
参数保存单元,用于预先将多种型号芯片的第一影响参数和第二影响参数保存至数据库;
参数调取单元,用于基于芯片型号信息从数据库调取相应的第一影响参数和第二影响参数。
在一个可选的实施方式中,预先将多种型号芯片的第一影响参数和第二影响参数保存至数据库,包括:
从芯片手册获取第一影响参数,并将第一影响参数和所属的芯片型号保存至数据库;
收集芯片运行数据,所述运行数据包括功耗值、内核温度、风扇转速和芯片所属的电路板的温度;
通过基于运行数据生成风扇转速与热阻的拟合曲线,得到芯片的第二影响参数;
将第二影响参数和所属的芯片型号保存至数据库。
在一个可选的实施方式中,通过基于运行数据生成风扇转速与热阻的拟合曲线,得到芯片的第二影响参数,包括:
根据芯片运行数据计算热阻Rca:
其中,T j为芯片内核温度,Ta为芯片所属的电路板的温度,P为芯片功耗,Rj c为芯片的第一影响参数;
对芯片的热阻和对应时间节点的风扇转速进行拟合,得到芯片的第二影响参数。
在一个可选的实施方式中,权重获取模块包括:
第一计算单元,用于基于当前风扇转速和第二影响参数计算热阻;
第二计算单元,用于将热阻与第一影响参数的和输出为权重因子。
在一个可选的实施方式中,功耗获取模块包括:
电流获取单元,用于从电流检测电路采集芯片的电流值;
功耗计算单元,用于将所述电流值与固定供电电压的乘积输出为实际功耗值。
第三方面,提供一种终端,包括:
处理器、存储器,其中,
该存储器用于存储计算机程序,
该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。
第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
本发明的有益效果在于,本发明提供的芯片内核温度监控方法、系统、终端及存储介质,在芯片内核的温度传感器故障后仍然能够实现对芯片内核温度的监控,增加了芯片内核温度的监控途径,从而保证了服务器散热策略的正常运作,提升了服务器的散热性能。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的示意性流程图。
图2是本发明一个实施例的方法的另一示意性流程图。
图3是本发明一个实施例的系统的示意性框图。
图4为本发明实施例提供的一种终端的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
下面对本发明中出现的关键术语进行解释。
BMC,执行伺服器远端管理控制器,英文全称为Baseboard ManagementController.为基板管理控制器。它可以在机器未开机的状态下,对机器进行固件升级、查看机器设备、等一些操作。在BMC中完全实现IPMI功能需要一个功能强大的16位元或32位元微控制器以及用于数据储存的RAM、用于非挥发性数据储存的快闪记忆体和韧体,在安全远程重启、安全重新上电、LAN警告和系统健康监视方面能提供基本的远程可管理性。除了基本的IPMI功能和系统工作监视功能外,通过利用2个快闪记忆体之一储存以前的BIOS,mBMC还能实现BIOS快速元件的选择和保护。例如,在远程BIOS升级後系统不能启动时,远程管理人员可以切换回以前工作的BIOS映像来启动系统。一旦BIOS升级後,BIOS映像还能被锁住,可有效防止病毒对它的侵害。BMC还对服务器状态进行监控管理:对服务器各个部件(CPU、内存、硬盘、风扇、机框等)的温度、电压等健康状态进行检测,同时根据各个温度采集点情况实时调整风扇转速保证服务器不产生过温、而且控制总体功耗又不能过高;如果单板部件出现任何异常则通过SNMP协议、SMTP协议、Redfish协议等多种业界通用规范将信息及时上报给上层网管。
本发明实施例提供的芯片内核温度监控方法由计算机设备执行,相应地,芯片内核温度监控系统运行于计算机设备中。
图1是本发明一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种芯片内核温度监控系统。根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
如图1所示,该方法包括:
步骤110,采集芯片所在的电路板的温度值;
步骤120,基于芯片型号信息获取相应的温度影响参数;
步骤130,获取当前风扇转速,基于当前风扇转速和温度影响参数计算权重因子;
步骤140,获取芯片的实际功耗值;
步骤150,将所述功耗值乘以权重因子后与温度值的和,输出为芯片内核温度。
正常情况下,通过芯片内置温度传感器直接获取Tj进行调速。
当出现故障Tj无法获取时,根据设定的计算规则进行内核温度评估,具体规则为:
Tj=Ta+P*Rj a=Ta+P*(Rj c+Rca),其中Ta通过在PCB上布置温度传感器实时获取,这个值会根据整个设备工作的环境温度变化;芯片供电电压是固定的,因此芯片功耗P可以通过在PCB上设置芯片电流实时检测电路获取;Rj c是芯片封装特性,固定参数,直接在芯片手册上获取;Rca跟芯片携带的散热器设计和吹过散热器的风速有关,这个参数需要根据风扇转速进行计算。
为了便于对本发明的理解,下面以本发明芯片内核温度监控方法的原理,结合实施例中对芯片内核温度进行监控的过程,对本发明提供的芯片内核温度监控方法做进一步的描述。
具体的,请参考图2,所述芯片内核温度监控方法包括:
S 1、确认芯片内核的固有温度传感器故障。
监控设置于芯片内核的固有温度传感器是否在位:若是,则从所述固有温度传感器采集芯片内核温度。若否,则继续执行S2。
具体的,监控芯片固有温度传感器是否在位的方法是,判断是否识别到固有温度传感器的设备信息。
S 2、获取计算芯片内核温度所需的数据。
数据包括芯片所在的电路板的温度值、风扇转速和芯片的实际功耗值,以及芯片的温度影响参数。
S 201采集芯片所在的电路板的温度值。
根据预先存储的设备列表,查询芯片对应的电路板温度传感器信息。进而从相应温度传感器采集相应的电路板温度值。
S 202基于芯片型号信息获取相应的温度影响参数;获取当前风扇转速,基于当前风扇转速和温度影响参数计算权重因子。
温度影响参数包括第一影响参数和第二影响参数。第一影响参数由芯片的封装特性决定,是固定参数,直接在芯片手册上获取即可。第二影响参数跟芯片携带的散热器设计有关。
第二影响参数的获取方法包括:
对芯片进行大量模拟试验,收集芯片运行数据,所述运行数据包括功耗值、内核温度、风扇转速和芯片所属的电路板的温度,如表1所示。
表1芯片运行数据
根据芯片运行数据计算热阻Rca:
其中,T j为芯片内核温度,Ta为芯片所属的电路板的温度,P为芯片功耗,Rj c为芯片的第一影响参数。
根据测试数据制订曲线,因为Rca跟风速的平方成关系,因此根据曲线拟合2次计算式,Y=5E-05X2-0.0231X+3.3512,计算式里Y就是Rca,X为PWM值。
可见第二影响参数是基于风扇转速计算热阻的一个关系式。
预先将多种型号芯片的第一影响参数和第二影响参数保存至数据库;基于目标芯片的型号信息从数据库调取相应的第一影响参数和第二影响参数。
从BMC芯片获取风扇转速,将风扇转速代入第二影响参数,得到热阻值。
权重因子为Rj c+5E-05X2-0.0231X+3.3512。X为风扇转速PWM值。
S 203获取芯片的实际功耗值。
芯片供电电压是固定的,因此芯片功耗P可以通过在PCB上设置芯片电流实时检测电路获取。
具体的,从电流检测电路采集芯片的电流值;将电流值与固定供电电压的乘积输出为实际功耗值。
S 3、将所述功耗值乘以权重因子后与温度值的和,输出为芯片内核温度。
具体的内核温度计算公式为:Tj=Ta+P*Rja=Ta+P*(Rjc+Rca)
Ta为电路板温度,这个值会根据整个设备工作的环境温度变化;功耗P可以通过在PCB上设置芯片电流实时检测电路获取;Rj c由芯片封装特性决定的第一影响参数;Rca是热阻值。
在另一种实施方式中,基于热阻计算方法,对上述计算公式进行改进,得到最终的内核温度Tj计算公式:
Tj=Ta+P*(Rjc+5E-05X2-0.0231X+3.3512)
即使芯片功耗变化,风扇转速变化,芯片来流温度变化,计算式里P和X(PWM)两个值都可以实时获取,因此可以获得准确的动态值T j来进行系统温度调控。
该方法在芯片内核的温度传感器故障后仍然能够实现对芯片内核温度的监控,增加了芯片内核温度的监控途径,从而保证了服务器散热策略的正常运作,提升了服务器的散热性能。
在一些实施例中,所述芯片内核温度监控系统300可以包括多个由计算机程序段所组成的功能模块。所述芯片内核温度监控系统300中的各个程序段的计算机程序可以存储于计算机设备的存储器中,并由至少一个处理器所执行,以执行(详见图1描述)芯片内核温度监控的功能。
本实施例中,所述芯片内核温度监控系统300根据其所执行的功能,可以被划分为多个功能模块,如图3所示。所述功能模块可以包括:温度采集模块310、参数获取模块320、权重获取模块330、功耗获取模块340和温度输出模块350。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
温度采集模块310,用于采集芯片所在的电路板的温度值;
参数获取模块320,用于基于芯片型号信息获取相应的温度影响参数;
权重获取模块330,用于获取当前风扇转速,基于当前风扇转速和温度影响参数计算权重因子;
功耗获取模块340,用于获取芯片的实际功耗值;
温度输出模块350,用于将所述功耗值乘以权重因子后与温度值的和,输出为芯片内核温度。
可选地,作为本发明一个实施例,所述系统还包括:
在位监控模块,用于监控设置于芯片内核的固有温度传感器是否在位;
直接获取模块,用于若设置于芯片内核的固有温度传感器在位,则从所述固有温度传感器采集芯片内核温度。
监控设置于芯片内核的固有温度传感器是否在位:若是,则从所述固有温度传感器采集芯片内核温度。若否,则触发执行本发明提供的监控方法。
具体的,监控芯片固有温度传感器是否在位的方法是,判断是否识别到固有温度传感器的设备信息。
可选地,作为本发明一个实施例,参数获取模块包括:
参数保存单元,用于预先将多种型号芯片的第一影响参数和第二影响参数保存至数据库;
参数调取单元,用于基于芯片型号信息从数据库调取相应的第一影响参数和第二影响参数。
可选地,作为本发明一个实施例,预先将多种型号芯片的第一影响参数和第二影响参数保存至数据库,包括:
从芯片手册获取第一影响参数,并将第一影响参数和所属的芯片型号保存至数据库;
收集芯片运行数据,所述运行数据包括功耗值、内核温度、风扇转速和芯片所属的电路板的温度;
通过基于运行数据生成风扇转速与热阻的拟合曲线,得到芯片的第二影响参数;
将第二影响参数和所属的芯片型号保存至数据库。
温度影响参数包括第一影响参数和第二影响参数。第一影响参数由芯片的封装特性决定,是固定参数,直接在芯片手册上获取即可。第二影响参数跟芯片携带的散热器设计有关。
可选地,作为本发明一个实施例,通过基于运行数据生成风扇转速与热阻的拟合曲线,得到芯片的第二影响参数,包括:
根据芯片运行数据计算热阻Rca:
其中,T j为芯片内核温度,Ta为芯片所属的电路板的温度,P为芯片功耗,Rj c为芯片的第一影响参数;
对芯片的热阻和对应时间节点的风扇转速进行拟合,得到芯片的第二影响参数。
例如,对芯片进行大量模拟试验,收集芯片运行数据,所述运行数据包括功耗值、内核温度、风扇转速和芯片所属的电路板的温度。
其中,T j为芯片内核温度,Ta为芯片所属的电路板的温度,P为芯片功耗,Rj c为芯片的第一影响参数。
根据测试数据制订曲线,因为Rca跟风速的平方成关系,因此根据曲线拟合2次计算式,Y=5E-05X2-0.0231X+3.3512,计算式里Y就是Rca,X为PWM值。
可见第二影响参数是基于风扇转速计算热阻的一个关系式。
预先将多种型号芯片的第一影响参数和第二影响参数保存至数据库;基于目标芯片的型号信息从数据库调取相应的第一影响参数和第二影响参数。
可选地,作为本发明一个实施例,权重获取模块包括:
第一计算单元,用于基于当前风扇转速和第二影响参数计算热阻;
第二计算单元,用于将热阻与第一影响参数的和输出为权重因子。
从BMC芯片获取风扇转速,将风扇转速代入第二影响参数,得到热阻值。权重因子为Rj c+5E-05X2-0.0231X+3.3512。X为风扇转速PWM值。
可选地,作为本发明一个实施例,功耗获取模块包括:
电流获取单元,用于从电流检测电路采集芯片的电流值;
功耗计算单元,用于将所述电流值与固定供电电压的乘积输出为实际功耗值。
芯片供电电压是固定的,因此芯片功耗P可以通过在PCB上设置芯片电流实时检测电路获取。
具体的,从电流检测电路采集芯片的电流值;将电流值与固定供电电压的乘积输出为实际功耗值。
温度输出模块将所述功耗值乘以权重因子后与温度值的和,输出为芯片内核温度。
温度输出模块的内核温度计算规则为:Tj=Ta+P*Rja=Ta+P*(Rjc+Rca)
Ta为电路板温度,这个值会根据整个设备工作的环境温度变化;功耗P可以通过在PCB上设置芯片电流实时检测电路获取;Rj c由芯片封装特性决定的第一影响参数;Rca是热阻值。
在另一种实施方式中,温度输出模块的计算规则选用改进的计算规则,得到最终的内核温度Tj计算公式:
Tj=Ta+P*(Rjc+5E-05X2-0.0231X+3.3512)
即使芯片功耗变化,风扇转速变化,芯片来流温度变化,计算式里P和X(PWM)两个值都可以实时获取,因此可以获得准确的动态值T j来进行系统温度调控。
该系统在芯片内核的温度传感器故障后仍然能够实现对芯片内核温度的监控,增加了芯片内核温度的监控途径,从而保证了服务器散热策略的正常运作,提升了服务器的散热性能。
图4为本发明实施例提供的一种终端400的结构示意图,该终端400可以用于执行本发明实施例提供的芯片内核温度监控方法。
其中,该终端400可以包括:处理器410、存储器420及通信模块430。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本发明的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,该存储器420可以用于存储处理器410的执行指令,存储器420可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。当存储器420中的执行指令由处理器410执行时,使得终端400能够执行以下上述方法实施例中的部分或全部步骤。
处理器410为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器420内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(Integrated Circuit,简称IC)组成,例如可以由单颗封装的IC所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器410可以仅包括中央处理器(Central Processing Unit,简称CPU)。在本发明实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
通信模块430,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
因此,本发明在芯片内核的温度传感器故障后仍然能够实现对芯片内核温度的监控,增加了芯片内核温度的监控途径,从而保证了服务器散热策略的正常运作,提升了服务器的散热性能。,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种芯片内核温度监控方法,其特征在于,包括:
采集芯片所在的电路板的温度值;
基于芯片型号信息获取相应的温度影响参数;
获取当前风扇转速,基于当前风扇转速和温度影响参数计算权重因子;
获取芯片的实际功耗值;
将所述功耗值乘以权重因子后与温度值的和,输出为芯片内核温度。
2.根据权利要求1所述的方法,其特征在于,在采集芯片所在的电路板的温度值之前,所述方法还包括:
监控设置于芯片内核的固有温度传感器是否在位:
若是,则从所述固有温度传感器采集芯片内核温度。
3.根据权利要求1所述的方法,其特征在于,基于芯片型号信息获取相应的温度影响参数,包括:
预先将多种型号芯片的第一影响参数和第二影响参数保存至数据库;
基于芯片型号信息从数据库调取相应的第一影响参数和第二影响参数。
4.根据权利要求3所述的方法,其特征在于,预先将多种型号芯片的第一影响参数和第二影响参数保存至数据库,包括:
从芯片手册获取第一影响参数,并将第一影响参数和所属的芯片型号保存至数据库;
收集芯片运行数据,所述运行数据包括功耗值、内核温度、风扇转速和芯片所属的电路板的温度;
通过基于运行数据生成风扇转速与热阻的拟合曲线,得到芯片的第二影响参数;
将第二影响参数和所属的芯片型号保存至数据库。
5.根据权利要求4所述的方法,其特征在于,通过基于运行数据生成风扇转速与热阻的拟合曲线,得到芯片的第二影响参数,包括:
根据芯片运行数据计算热阻Rca:
其中,Tj为芯片内核温度,Ta为芯片所属的电路板的温度,P为芯片功耗,Rjc为芯片的第一影响参数;
对芯片的热阻和对应时间节点的风扇转速进行拟合,得到芯片的第二影响参数。
6.根据权利要求3或5所述的方法,其特征在于,获取当前风扇转速,基于当前风扇转速和温度影响参数计算权重因子,包括:
基于当前风扇转速和第二影响参数计算热阻;
将热阻与第一影响参数的和输出为权重因子。
7.根据权利要求1所述的方法,其特征在于,获取芯片的实际功耗值,包括:
从电流检测电路采集芯片的电流值;
将所述电流值与固定供电电压的乘积输出为实际功耗值。
8.一种芯片内核温度监控系统,其特征在于,包括:
温度采集模块,用于采集芯片所在的电路板的温度值;
参数获取模块,用于基于芯片型号信息获取相应的温度影响参数;
权重获取模块,用于获取当前风扇转速,基于当前风扇转速和温度影响参数计算权重因子;
功耗获取模块,用于获取芯片的实际功耗值;
温度输出模块,用于将所述功耗值乘以权重因子后与温度值的和,输出为芯片内核温度。
9.一种终端,其特征在于,包括:
存储器,用于存储芯片内核温度监控程序;
处理器,用于执行所述芯片内核温度监控程序时实现如权利要求1-7任一项所述芯片内核温度监控方法的步骤。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,所述可读存储介质上存储有芯片内核温度监控程序,所述芯片内核温度监控程序被处理器执行时实现如权利要求1-7任一项所述芯片内核温度监控方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310574000.1A CN116719689A (zh) | 2023-05-19 | 2023-05-19 | 芯片内核温度监控方法、系统、终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310574000.1A CN116719689A (zh) | 2023-05-19 | 2023-05-19 | 芯片内核温度监控方法、系统、终端及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116719689A true CN116719689A (zh) | 2023-09-08 |
Family
ID=87865092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310574000.1A Pending CN116719689A (zh) | 2023-05-19 | 2023-05-19 | 芯片内核温度监控方法、系统、终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116719689A (zh) |
-
2023
- 2023-05-19 CN CN202310574000.1A patent/CN116719689A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110799757A (zh) | 风扇的控制方法、风扇控制装置及电子设备 | |
CN115459204B (zh) | 一种并联hsc芯片故障处理装置、方法、设备及介质 | |
CN114151373B (zh) | 服务器风扇转速调控方法、系统、终端及存储介质 | |
CN106814826A (zh) | 控制服务器机柜中气流的系统及方法 | |
CN116301251A (zh) | 散热策略调整方法、装置、设备及存储介质 | |
CN114166266B (zh) | 一种检测cpu散热器螺丝是否漏拧的方法和装置 | |
CN108051234B (zh) | 风扇故障检测方法、装置、变流器及计算机可读存储介质 | |
CN116465515B (zh) | 芯片核心温度估计方法、装置、电子设备、计算机及介质 | |
CN113675824A (zh) | 电机的过载保护方法和装置、存储介质及电子装置 | |
CN111062503B (zh) | 一种电网监控告警处理方法、系统、终端及存储介质 | |
CN116719689A (zh) | 芯片内核温度监控方法、系统、终端及存储介质 | |
CN116498592A (zh) | 风扇转速平稳调控方法、系统、终端及存储介质 | |
CN115808640B (zh) | 电源故障检测电路、方法、系统、电子设备及存储介质 | |
CN102541705B (zh) | 计算机的测试方法和工装板 | |
CN102480396A (zh) | 一种服务器系统及其连接方法 | |
CN112328033A (zh) | 一种bmc中的风扇自动控制方法及相关设备 | |
CN104714866A (zh) | 风扇测试系统及方法 | |
CN113238778B (zh) | 一种升级bios固件的方法、系统、设备及介质 | |
CN111022365B (zh) | 应对风扇转子故障的调速方法、系统、终端及存储介质 | |
CN108880916B (zh) | 一种基于iic总线的故障定位方法及系统 | |
US20210208646A1 (en) | Temperature controlling method for server, baseboard management controller, and server temperature controlling system | |
CN109656777B (zh) | 一种风扇降噪调控方法、装置、终端及存储介质 | |
CN115097919B (zh) | 基于bmc的散热补偿方法、系统、终端及存储介质 | |
CN114253375B (zh) | 服务器散热模式控制方法、系统、终端及存储介质 | |
CN103838224A (zh) | 风扇控制板的测试系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |