CN114003464B - 根据温度变化的参数自适应方法、服务器、设备和介质 - Google Patents

根据温度变化的参数自适应方法、服务器、设备和介质 Download PDF

Info

Publication number
CN114003464B
CN114003464B CN202111261186.2A CN202111261186A CN114003464B CN 114003464 B CN114003464 B CN 114003464B CN 202111261186 A CN202111261186 A CN 202111261186A CN 114003464 B CN114003464 B CN 114003464B
Authority
CN
China
Prior art keywords
temperature
sub
server
parameter
calculation result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111261186.2A
Other languages
English (en)
Other versions
CN114003464A (zh
Inventor
魏冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202111261186.2A priority Critical patent/CN114003464B/zh
Publication of CN114003464A publication Critical patent/CN114003464A/zh
Application granted granted Critical
Publication of CN114003464B publication Critical patent/CN114003464B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/24Resetting means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Power Sources (AREA)

Abstract

本申请公开了一种根据温度变化的参数自适应方法、服务器、设备和介质,涉及服务器监控技术领域。根据温度变化的参数自适应方法,应用于服务器,方法包括:响应于所述服务器上电,获取当前所述服务器运行的第一温度;获取所述服务器运行过程中的第二温度;根据所述第一温度与所述第二温度进行计算,得到第一计算结果;根据所述第一计算结果,判断是否执行参数自适应指令。本申请能够通过监控服务器的温度变化,使PCIE设备在温度变化较大时再次进行初始化,且不影响其他PCIE设备,以保证链路信号质量,避免服务器报错,设备降速甚至丢失等问题的出现。

Description

根据温度变化的参数自适应方法、服务器、设备和介质
技术领域
本申请涉及服务器监控技术领域,具体涉及一种根据温度变化的参数自适应方法、服务器、设备和介质。
背景技术
在服务器中,服务器的温度会随着环境的变化而变化,例如,服务器在刚开机或重启时,服务器的各个负载模块还没有工作,功率较小,温度也较低;而当服务器开始工作时,各个负载模块满负荷运行,功率较大,温度也会随之升高。当服务器开机时,各种高速链路,如PCIE(peripheral component interconnect express)、SAS(Serial Attached SCSI)等,开始初始化,其中包含TXEQ(Transmitter Equalization,发送端均衡器)和CTLE(Continuous Time Linear Equalizer,连续时间线性均衡器)参数协商。这时协商的参数是在温度较低的环境下完成的。而由于PCB受温度影响较大,当服务器温度升高时,PCB的损耗会比低温时增加10%~15%,这时在低温环境下协商完成的TXEQ及CTLE有可能不再适用于高温环境,此时会存在服务器报错,设备降速甚至丢失等问题。
申请内容
为了解决上述背景技术中提到的至少一个问题,本申请提供了一种根据温度变化的参数自适应方法、服务器、设备和介质,能够通过监控服务器的温度变化,使PCIE设备在温度变化较大时再次进行初始化,且不影响其他PCIE设备,以保证链路信号质量,避免服务器报错,设备降速甚至丢失等问题的出现。
本申请实施例提供的具体技术方案如下:
第一方面,提供一种根据温度变化的参数自适应方法,应用于服务器,所述方法包括:
响应于所述服务器上电,获取当前所述服务器运行的第一温度;
获取所述服务器运行过程中的第二温度;
根据所述第一温度与所述第二温度进行计算,得到第一计算结果;
根据所述第一计算结果,判断是否执行参数自适应指令。
进一步的,所述获取所述服务器运行过程中的第二温度,还包括:
获取预先设定的检测周期,所述检测周期为获取所述服务器中温度传感器显示数值的时间间隔;
根据所述检测周期,重复获取所述服务器运行过程中的本次第二温度,将获取的所述本次第二温度与上一次获取的第二温度进行比较,获得比较结果;
根据所述比较结果,判断是否更新所述第二温度。
进一步的,所述比较结果包括所述本次第二温度与上一次获取的第二温度相同、所述本次第二温度与上一次获取的第二温度不同,
若所述比较结果为所述本次第二温度与上一次获取的第二温度不同,所述根据所述比较结果,判断是否更新所述第二温度,还包括:
将上一次获取的所述第二温度替换为所述本次第二温度,得到更新后的第二温度。
进一步的,所述服务器包括一个或多个PCIE设备,所述第一温度包括一个或多个第一子温度;
每个所述PCIE设备对应一个所述第一子温度;
所述第二温度包括一个或多个第二子温度;
每个所述PCIE设备对应一个所述第二子温度。
进一步的,所述根据所述第一温度与所述第二温度进行计算,得到第一计算结果,具体包括:
判断任一所述PCIE设备对应的所述第一子温度与所述第二子温度之间的差值是否大于预设温度阈值,得到第一计算结果;
所述预设温度阈值为预先设定的会影响到链路信号质量的温度差值的临界值;
所述第一计算结果包括所述第一子温度与所述第二子温度之间的差值大于所述预设温度阈值、所述第一子温度与所述第二子温度之间的差值不大于所述预设温度阈值。
进一步的,若所述第一计算结果为所述第一子温度与所述第二子温度之间的差值大于所述预设温度阈值,所述根据所述第一计算结果,判断是否执行参数自适应指令,包括:
获取并执行参数自适应指令;
所述参数自适应指令包括:在所述第一子温度与所述第二子温度对应的PCIE设备的链路上进行热复位,以使所述PCIE设备获取并更新链路信号质量参数值。
进一步的,所述链路信号质量参数值包括以下至少一种:
TXEQ参数值以及CTLE参数值。
第二方面,提供一种服务器,包括BMC、CPLD、CPU、一个或多个PCIE设备和一个或多个温度传感器,所述服务器还包括:
检测模块,用于响应于所述服务器上电,获取当前所述服务器运行的第一温度;
获取模块,用于获取所述服务器运行过程中的第二温度;
管理模块,用于根据所述第一温度与所述第二温度进行计算,得到第一计算结果;
控制模块,用于根据所述第一计算结果,判断是否执行参数自适应指令。
第三方面,提供一种根据温度变化的参数自适应设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述根据温度变化的参数自适应方法。
第四方面,提供一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行所述根据温度变化的参数自适应方法。
本申请实施例具有如下有益效果:
本申请实施例提供的一种根据温度变化的参数自适应方法、服务器、设备和介质,能够实时监控服务器中各个PCIE设备的温度,并设定策略,能够自定义监测周期以及温度阈值,灵活性好,用户的体验感好;能够识别PCIE设备的温度变化达到温度阈值,并使对应的PCIE设备进行初始化,使其协商出新的链路信号质量参数值,且不会影响到其他的PCIE设备,以保证链路信号质量,更加适应当前环境,从而避免服务器报错,设备降速甚至丢失等问题的出现。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本申请实施例提供的根据温度变化的参数自适应方法的流程图;
图2示出本申请实施例提供的服务器的结构示意图;
图3示出根据本申请一个实施例的链路结构示意图;
图4示出可被用于实施本申请中所述的各个实施例的示例性系统。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,在本申请的描述中,除非上下文明确要求,否则整个说明书和权利要求书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
还应当理解,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。
需要注意的是,术语“S1”、“S2”等仅用于步骤的描述目的,并非特别指称次序或顺位的意思,亦非用以限定本申请,其仅仅是为了方便描述本申请的方法,而不能理解为指示步骤的先后顺序。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。
实施例一
本申请提供了一种根据温度变化的参数自适应方法,应用于服务器,参照图1,方法包括:
S1、响应于服务器上电,获取当前服务器运行的第一温度。
具体的,在服务器工作的不同时段,服务器的温度是有波动的。在服务器刚开机时,即服务器上电时,各模块都在做初始化动作,没有大量的负载,服务器的温度较低。由于服务器的温度是随着不同的业务类型,不同的负载而变化,温度变化没有规律,且高速链路的TXEQ(Transmitter Equalization,发送端均衡器)、CTLE(Continuous Time LinearEqualizer,连续时间线性均衡器)等参数在服务器上电初始化过程中已经确定,而服务器的工作一般是以年为单位不间断的运行。这就意味着在运行过程中服务器只能使用开机初始化时的参数,而这些参数要在各种环境下保持高速链路的稳定,例如高负载高温环境,低负载低温环境等,这对于某些高速链路来说,一个参数或一组参数无法适应不同的环境。尤其是现在高速链路的速率越来越快,PCIE从2.5Gbps到8Gbps、16Gbps,如今的PCIE5.0速率达到了32Gbps,它对于温度的变化更加敏感。就需要在服务器上电时,先获取当前服务器运行的第一温度,即初始温度;并且获取服务器的第一链路信号质量参数值,即初始参数值,以便于监控服务器及其子设备的温度的变化,以及设定、执行策略,以使链路协商出新的参数组合,从而适应变化后的环境。
具体的,链路信号质量参数值可以包括上述的TXEQ参数值以及CTLE参数值中的至少一种。根据PCIE协议规范,接收端采用figure of merit作为判断链路信号质量的依据,figure of merit即经过TXEQ和CTLE处理后形成的最终眼图的面积。
S2、获取服务器运行过程中的第二温度。
具体的,在服务器运行过程中,各个负载模块满负荷运行,服务器温度较高。需要注意的是,在服务器运行过程中,服务器中的某些模块在空闲时会自动进入省电模式,降低功耗,达到节能效果,这时服务器的温度也会降低。因此,需要实时地对服务器运行过程中的设备温度进行监测,需要实时监控服务器及其设备的温度变化。
在一些实施例中,S2还包括:
S21、获取预先设定的检测周期,其中,检测周期为获取服务器中温度传感器显示数值的时间间隔。
S22、根据检测周期,重复获取服务器运行过程中的本次第二温度,将获取的本次第二温度与上一次获取的第二温度进行比较,获得比较结果。
S23、根据比较结果,判断是否更新第二温度。
具体的,执行上述步骤的目的即实时监控服务器及其设备的温度变化,其中,比较结果可以包括本次第二温度与上一次获取的第二温度相同以及本次第二温度与上一次获取的第二温度不同。
若比较结果为本次第二温度与上一次获取的第二温度不同,上述S23还可以包括:
将上一次获取的第二温度替换为本次第二温度,得到更新后的第二温度。
具体的,通过执行上述步骤,仅需要实时响应检测到的温度变化,若实时检测到的温度发生变化,可以及时替换更新第二温度,得到更新后的第二温度,以保证该第二温度实时有效。另外,检测周期为获取服务器中温度传感器显示数值的时间间隔,可以根据经验预设标准值也可以根据用户的实际需求变更该时间间隔,以满足用户不同场景不同作业情况的各种需求。
在一些实施例中,服务器可以包括一个或多个PCIE设备,第一温度可以包括一个或多个第一子温度,每个PCIE设备对应一个第一子温度。第二温度包括一个或多个第二子温度,每个PCIE设备对应一个第二子温度。另外,上述第一链路信号质量参数值包括一个或多个第一子链路信号质量参数值,每个PCIE设备对应一个第一子链路信号质量参数值。
S3、根据第一温度与第二温度进行计算,得到第一计算结果。
S4、根据第一计算结果,判断是否执行参数自适应指令。
具体的,第一温度与第二温度之间进行计算,主要是计算第一温度与第二温度之间的差值,用以判断当前环境温度变化的幅度。并以此为依据,若幅度过大,则需要下达指令,使得温度变化幅度过大对应的设备进行初始化,重新获得适配的链路信号质量参数值,以保证链路信号质量;若温度变化幅度不大,则可以不执行动作。
下面以服务器包括多个PCIE设备为例进行说明:
在一些实施例中,S3还包括:
S31、判断任一PCIE设备对应的第一子温度与第二子温度之间的差值是否大于预设温度阈值,得到第一计算结果。
其中,预设温度阈值为预先设定的会影响到链路信号质量的温度差值的临界值。第一计算结果包括第一子温度与第二子温度之间的差值大于预设温度阈值以及第一子温度与第二子温度之间的差值不大于预设温度阈值。同样的,预设温度阈值作为预先设定值,可以预先给定一个经验标准值,也可以根据用户的需求、PCIE设备温度敏感度、不同的作业环境等来设定温度阈值。可以是5摄氏度、10摄氏度等等,具体按照实际适用场景设定。
在一些实施例中,若第一计算结果为第一子温度与第二子温度之间的差值大于预设温度阈值,则S4还包括:
S41、获取并执行参数自适应指令。
其中,参数自适应指令可以包括:在第一子温度与第二子温度对应的PCIE设备的链路上进行热复位,以使PCIE设备获取并更新链路信号质量参数值。
具体的,服务器包括多个PCIE设备,通过监控服务器中各个PCIE设备的温度,当任一PCIE设备温差超过预设温度阈值时,可以向CPU或者该PCIE设备发送指令,令其进行热复位,相当于对该PCIE设备进行初始化。在这个过程中,PCIE设备会重新进行链路的TXEQ及CTLE参数协商,协商出的新的参数组合,即第二链路信号质量参数值。用第二链路信号质量参数值替换第一子链路信号质量参数值,以使得新的参数组合更加适应当前环境,保证链路信号质量。需要注意的是,在这个过程中,只有满足温差超过预设温度阈值条件的PCIE设备会进行初始化,而不会影响到其他的PCIE设备,能够实现单个或多个PCIE设备根据温度变化调整TXEQ和CTLE参数。
在本实施例中,能够实时监控服务器中各个PCIE设备的温度,并设定策略,能够自定义监测周期以及温度阈值,灵活性好,用户的体验感好;能够识别PCIE设备的温度变化达到温度阈值,并使对应的PCIE设备进行初始化,使其协商出新的链路信号质量参数值,且不会影响到其他的PCIE设备,以保证链路信号质量,更加适应当前环境,从而避免服务器报错,设备降速甚至丢失等问题的出现。
实施例二
对应上述实施例,本申请还提供了一种服务器,包括BMC、CPLD、CPU、一个或多个PCIE设备和一个或多个温度传感器。参照图2,服务器可以包括:检测模块、获取模块、管理模块以及控制模块。
其中,检测模块用于响应于服务器上电,获取当前服务器运行的第一温度;获取模块用于获取服务器运行过程中的第二温度;管理模块用于根据第一温度与第二温度进行计算,得到第一计算结果;控制模块用于根据第一计算结果,判断是否执行参数自适应指令。
进一步的,获取模块还用于获取预先设定的检测周期,其中,所述检测周期为获取所述服务器中温度传感器显示数值的时间间隔;获取模块还用于根据所述检测周期,重复获取所述服务器运行过程中的本次第二温度,将获取的所述本次第二温度与上一次获取的第二温度进行比较,获得比较结果;获取模块还用于根据所述比较结果,判断是否更新所述第二温度。
进一步的,若所述比较结果为所述本次第二温度与上一次获取的第二温度不同,获取模块还用于将上一次获取的所述第二温度替换为所述本次第二温度,得到更新后的第二温度。
进一步的,管理模块还用于判断任一所述PCIE设备对应的所述第一子温度与所述第二子温度之间的差值是否大于预设温度阈值,得到第一计算结果。其中,关于第一子温度、第二子温度、PCIE设备以及第一子链路信号质量参数值的对应关系在方法实施例中已有详细说明,故此处不作过多赘述。另外,预设温度阈值与第一计算结果也有详细说明,此处不作赘述。
进一步的,若所述第一计算结果为所述第一子温度与所述第二子温度之间的差值大于所述预设温度阈值,控制模块还用于获取并执行参数自适应指令。其中,所述参数自适应指令包括:在所述第一子温度与所述第二子温度对应的PCIE设备的链路上进行热复位,以使PCIE设备获取并更新链路信号质量参数值。
具体的,参照图3,在服务器中,BMC作为master的I2C链路分别接到CPU和多个PCIE设备及各个设备的温度传感器上。BMC首先记录各个PCIE设备在开机时温度传感器的显示数值,以及各个PCIE设备的链路信号质量参数值,并将显示数值作为第一温度/第一子温度,链路信号质量参数值记为第一链路信号质量参数值/第一子链路信号质量参数值;然后每隔检测周期重复获取各个温度传感器的数值,与第一子温度对比。若比较结果为差值不超过预设温度阈值(例如10摄氏度),则不做任何动作;若比较结果为差值超过预设温度阈值(例如10摄氏度),则向CPU发送指令,使其在对应的PCIE设备的链路上进行热复位hotreset(初始化),并获取PCIE设备的第二链路信号质量参数值,更新替换第一子链路信号质量参数值。这样就可以做到在不影响其他设备的情况下,单独对某个设备进行初始化,更新链路信号质量参数值,以保证链路信号质量。
实施例三
对应上述实施例,本申请还提供了一种根据温度变化的参数自适应设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时可以实现上述根据温度变化的参数自适应方法。
如图4所示,在一些实施例中,系统能够作为各所述实施例中的任意一个用于根据温度变化的参数自适应方法的上述根据温度变化的参数自适应设备。在一些实施例中,系统可包括具有指令的一个或多个计算机可读介质(例如,系统存储器或NVM/存储设备)以及与该一个或多个计算机可读介质耦合并被配置为执行指令以实现模块从而执行本申请中所述的动作的一个或多个处理器(例如,(一个或多个)处理器)。
对于一个实施例,系统控制模块可包括任意适当的接口控制器,以向(一个或多个)处理器中的至少一个和/或与系统控制模块通信的任意适当的设备或组件提供任意适当的接口。
系统控制模块可包括存储器控制器模块,以向系统存储器提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。
系统存储器可被用于例如为系统加载和存储数据和/或指令。对于一个实施例,系统存储器可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,系统存储器可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。
对于一个实施例,系统控制模块可包括一个或多个输入/输出(I/O)控制器,以向NVM/存储设备及(一个或多个)通信接口提供接口。
例如,NVM/存储设备可被用于存储数据和/或指令。NVM/存储设备可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。
NVM/存储设备可包括在物理上作为系统被安装在其上的设备的一部分的存储资源,或者其可被该设备访问而不必作为该设备的一部分。例如,NVM/存储设备可通过网络经由(一个或多个)通信接口进行访问。
(一个或多个)通信接口可为系统提供接口以通过一个或多个网络和/或与任意其他适当的设备通信。系统可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信。
对于一个实施例,(一个或多个)处理器中的至少一个可与系统控制模块的一个或多个控制器(例如,存储器控制器模块)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器中的至少一个可与系统控制模块的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP)。对于一个实施例,(一个或多个)处理器中的至少一个可与系统控制模块的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器中的至少一个可与系统控制模块的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。
在各个实施例中,系统可以但不限于是:服务器、工作站、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)。在各个实施例中,系统可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,系统包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。
需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。本领域技术人员应能理解,计算机程序指令在计算机可读介质中的存在形式包括但不限于源文件、可执行文件、安装包文件等,相应地,计算机程序指令被计算机执行的方式包括但不限于:该计算机直接执行该指令,或者该计算机编译该指令后再执行对应的编译后程序,或者该计算机读取并执行该指令,或者该计算机读取并安装该指令后再执行对应的安装后程序。在此,计算机可读介质可以是可供计算机访问的任意可用的计算机可读存储介质或通信介质。
通信介质包括藉此包含例如计算机可读指令、数据结构、程序模块或其他数据的通信信号被从一个系统传送到另一系统的介质。通信介质可包括有导的传输介质(诸如电缆和线(例如,光纤、同轴等))和能传播能量波的无线(未有导的传输)介质,诸如声音、电磁、RF、微波和红外。计算机可读指令、数据结构、程序模块或其他数据可被体现为例如无线介质(诸如载波或诸如被体现为扩展频谱技术的一部分的类似机制)中的已调制数据信号。术语“已调制数据信号”指的是其一个或多个特征以在信号中编码信息的方式被更改或设定的信号。调制可以是模拟的、数字的或混合调制技术。
在此,根据本申请的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。
实施例四
对应上述实施例,本申请还提供了一种计算机可读存储介质,存储有计算机可执行指令,计算机可执行指令用于执行根据温度变化的参数自适应方法。
在本实施例中,计算机可读存储介质可包括以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据的信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动的介质。例如,计算机可读存储介质包括,但不限于,易失性存储器,诸如随机存储器(RAM,DRAM,SRAM);以及非易失性存储器,诸如闪存、各种只读存储器(ROM,PROM,EPROM,EEPROM)、磁性和铁磁/铁电存储器(MRAM,FeRAM);以及磁性和光学存储设备(硬盘、磁带、CD、DVD);或其它现在已知的介质或今后开发的能够存储供计算机系统使用的计算机可读信息/数据。
尽管已描述了本申请实施例中的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例中范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (7)

1.一种根据温度变化的参数自适应方法,应用于服务器,其特征在于,所述方法包括:
响应于所述服务器上电,获取当前所述服务器运行的第一温度;
获取所述服务器运行过程中的第二温度,所述服务器包括一个或多个PCIE设备,所述第一温度包括一个或多个第一子温度;每个所述PCIE设备对应一个所述第一子温度;所述第二温度包括一个或多个第二子温度;每个所述PCIE设备对应一个所述第二子温度;
根据所述第一温度与所述第二温度进行计算,得到第一计算结果,包括:
判断任一所述PCIE设备对应的所述第一子温度与所述第二子温度之间的差值是否大于预设温度阈值,得到第一计算结果;
所述预设温度阈值为预先设定的会影响到链路信号质量的温度差值的临界值;
所述第一计算结果包括所述第一子温度与所述第二子温度之间的差值大于所述预设温度阈值、所述第一子温度与所述第二子温度之间的差值不大于所述预设温度阈值;
所述方法还包括:
根据所述第一计算结果,判断是否执行参数自适应指令;
若所述第一计算结果为所述第一子温度与所述第二子温度之间的差值大于所述预设温度阈值,所述根据所述第一计算结果,判断是否执行参数自适应指令,包括:获取并执行参数自适应指令;
所述参数自适应指令包括:在所述第一子温度与所述第二子温度对应的PCIE设备的链路上进行热复位,以使所述PCIE设备获取并更新链路信号质量参数值。
2.根据权利要求1所述的根据温度变化的参数自适应方法,其特征在于,所述获取所述服务器运行过程中的第二温度,还包括:
获取预先设定的检测周期,所述检测周期为获取所述服务器中温度传感器显示数值的时间间隔;
根据所述检测周期,重复获取所述服务器运行过程中的本次第二温度,将获取的所述本次第二温度与上一次获取的第二温度进行比较,获得比较结果;
根据所述比较结果,判断是否更新所述第二温度。
3.根据权利要求2所述的根据温度变化的参数自适应方法,其特征在于,所述比较结果包括所述本次第二温度与上一次获取的第二温度相同、所述本次第二温度与上一次获取的第二温度不同,
若所述比较结果为所述本次第二温度与上一次获取的第二温度不同,所述根据所述比较结果,判断是否更新所述第二温度,还包括:
将上一次获取的所述第二温度替换为所述本次第二温度,得到更新后的第二温度。
4.根据权利要求1所述的根据温度变化的参数自适应方法,其特征在于,所述链路信号质量参数值包括以下至少一种:
TXEQ参数值以及CTLE参数值。
5.一种服务器,包括BMC、CPLD、CPU、一个或多个PCIE设备和一个或多个温度传感器,其特征在于,所述服务器还包括:
检测模块,用于响应于所述服务器上电,获取当前所述服务器运行的第一温度;
获取模块,用于获取所述服务器运行过程中的第二温度,所述服务器包括一个或多个PCIE设备,所述第一温度包括一个或多个第一子温度;每个所述PCIE设备对应一个所述第一子温度;所述第二温度包括一个或多个第二子温度;每个所述PCIE设备对应一个所述第二子温度;
管理模块,用于根据所述第一温度与所述第二温度进行计算,得到第一计算结果;
所述管理模块还用于判断任一所述PCIE设备对应的所述第一子温度与所述第二子温度之间的差值是否大于预设温度阈值,得到第一计算结果;以及用于所述预设温度阈值为预先设定的会影响到链路信号质量的温度差值的临界值;还用于所述第一计算结果包括所述第一子温度与所述第二子温度之间的差值大于所述预设温度阈值、所述第一子温度与所述第二子温度之间的差值不大于所述预设温度阈值;
控制模块,用于根据所述第一计算结果,判断是否执行参数自适应指令;
若所述第一计算结果为所述第一子温度与所述第二子温度之间的差值大于所述预设温度阈值,控制模块还用于获取并执行参数自适应指令;所述参数自适应指令包括:在所述第一子温度与所述第二子温度对应的PCIE设备的链路上进行热复位,以使所述PCIE设备获取并更新链路信号质量参数值。
6.一种根据温度变化的参数自适应设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~4中任意一项所述根据温度变化的参数自适应方法。
7.一种计算机可读存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令用于执行权利要求1~4中任意一项所述根据温度变化的参数自适应方法。
CN202111261186.2A 2021-10-28 2021-10-28 根据温度变化的参数自适应方法、服务器、设备和介质 Active CN114003464B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111261186.2A CN114003464B (zh) 2021-10-28 2021-10-28 根据温度变化的参数自适应方法、服务器、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111261186.2A CN114003464B (zh) 2021-10-28 2021-10-28 根据温度变化的参数自适应方法、服务器、设备和介质

Publications (2)

Publication Number Publication Date
CN114003464A CN114003464A (zh) 2022-02-01
CN114003464B true CN114003464B (zh) 2024-01-12

Family

ID=79924511

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111261186.2A Active CN114003464B (zh) 2021-10-28 2021-10-28 根据温度变化的参数自适应方法、服务器、设备和介质

Country Status (1)

Country Link
CN (1) CN114003464B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115080281A (zh) * 2022-05-30 2022-09-20 苏州浪潮智能科技有限公司 基于arm服务器的加速卡适配方法、装置、设备和介质
CN118075065A (zh) * 2022-11-23 2024-05-24 华为技术有限公司 通信装置和参数调节方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102750189A (zh) * 2012-05-30 2012-10-24 曙光信息产业(北京)有限公司 一种pcie板卡的过热保护及恢复电路
CN102999140A (zh) * 2012-05-30 2013-03-27 国家计算机网络与信息安全管理中心 一种pcie板卡的上电时序控制系统和方法
CN108845651A (zh) * 2018-06-27 2018-11-20 郑州云海信息技术有限公司 一种无系统的服务器自主降温方法及系统
CN110647224A (zh) * 2019-09-04 2020-01-03 浪潮电子信息产业股份有限公司 一种运行状态的控制方法及装置
CN112486763A (zh) * 2020-11-23 2021-03-12 苏州浪潮智能科技有限公司 一种服务器cpu结温调控方法及装置
CN113342148A (zh) * 2021-06-30 2021-09-03 深圳市信锐网科技术有限公司 一种板卡过热保护方法、系统、业务卡、主控卡及介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103558878B (zh) * 2013-11-07 2016-08-24 曙光信息产业(北京)有限公司 服务器的温度调节方法和装置
JP6191718B1 (ja) * 2016-03-23 2017-09-06 日本電気株式会社 サーバ装置、サーバ制御方法、プログラム
CN109933109A (zh) * 2019-03-19 2019-06-25 浪潮商用机器有限公司 一种pcie卡的温度控制方法、系统及相关设备
CN112987891A (zh) * 2021-03-26 2021-06-18 杭州迪普科技股份有限公司 专用网卡过热保护的方法、电子设备及机器可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102750189A (zh) * 2012-05-30 2012-10-24 曙光信息产业(北京)有限公司 一种pcie板卡的过热保护及恢复电路
CN102999140A (zh) * 2012-05-30 2013-03-27 国家计算机网络与信息安全管理中心 一种pcie板卡的上电时序控制系统和方法
CN108845651A (zh) * 2018-06-27 2018-11-20 郑州云海信息技术有限公司 一种无系统的服务器自主降温方法及系统
CN110647224A (zh) * 2019-09-04 2020-01-03 浪潮电子信息产业股份有限公司 一种运行状态的控制方法及装置
CN112486763A (zh) * 2020-11-23 2021-03-12 苏州浪潮智能科技有限公司 一种服务器cpu结温调控方法及装置
CN113342148A (zh) * 2021-06-30 2021-09-03 深圳市信锐网科技术有限公司 一种板卡过热保护方法、系统、业务卡、主控卡及介质

Also Published As

Publication number Publication date
CN114003464A (zh) 2022-02-01

Similar Documents

Publication Publication Date Title
CN114003464B (zh) 根据温度变化的参数自适应方法、服务器、设备和介质
US20190220340A1 (en) System and method for remote system recovery
RU2624563C2 (ru) Оперативное регулирование производительности твердотельных запоминающих устройств
US9563254B2 (en) System, method and apparatus for energy efficiency and energy conservation by configuring power management parameters during run time
CN107357405A (zh) 功耗控制方法及相关设备
CN103516557A (zh) 测试方法及系统
CN105739668A (zh) 一种笔记本电脑的电源管理方法及电源管理系统
CN111120383A (zh) 一种设备风扇的控制方法、控制装置、交换机及存储介质
WO2022166875A1 (zh) 一种日志保存方法、通信装置、芯片及模组设备
WO2017202315A1 (zh) 一种电源适配器的控制方法及控制装置
CN112445739A (zh) 一种支持bios无感升级的电路及方法
CN111211937A (zh) 服务器链路信号稳定性的测试方法、测试装置及测试系统
CN109324676A (zh) 一种供电电路控制的方法及供电控制设备
CN106557362B (zh) 应用于智能机器人的任务迁移方法及系统
CN108351680A (zh) 用于使用带内信令提供功率状态信息的方法和装置
CN113868051A (zh) 一种PCIe故障检测装置、方法、设备和存储介质
US20220360514A1 (en) Network-based control method for power consumption of applications, terminal and storage medium
CN110532150B (zh) 一种机箱管理方法、装置、存储介质及处理器
CN108196999A (zh) 服务器bmc获取gpu温度的方法及装置
CN115826716B (zh) 制冷方法、虚装置和系统
CN105094295B (zh) 一种信息处理方法及电子设备
CN116089124A (zh) 一种仿真系统通信方法、装置、介质
US10324777B2 (en) Register-based communications interface
CN115729607A (zh) 一种设置界面命令格式同步方法、装置、设备和介质
TWI760951B (zh) 運算資源配置和管理方法及代理伺服器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant