CN115766623A - 交换机功耗调整方法、系统、计算机设备和存储介质 - Google Patents

交换机功耗调整方法、系统、计算机设备和存储介质 Download PDF

Info

Publication number
CN115766623A
CN115766623A CN202211196226.4A CN202211196226A CN115766623A CN 115766623 A CN115766623 A CN 115766623A CN 202211196226 A CN202211196226 A CN 202211196226A CN 115766623 A CN115766623 A CN 115766623A
Authority
CN
China
Prior art keywords
value
adjusting
exchange chip
chip
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211196226.4A
Other languages
English (en)
Inventor
武明珠
郭月俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202211196226.4A priority Critical patent/CN115766623A/zh
Publication of CN115766623A publication Critical patent/CN115766623A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Power Sources (AREA)

Abstract

本申请涉及一种交换机功耗调整方法、系统、计算机设备和存储介质,方法包括:通过基板管理控制器实时监测交换机上交换芯片的温度状态,当所述交换芯片的温度状态处于异常状态时,获取所述交换芯片的第一温度值;根据所述交换芯片的第一温度值确定对应的第一策略调整表,根据所述第一策略调整表确定对应的频率调整值,并根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值;根据所述频率调整值调整所述交换芯片的主频,同时根据所述电压调整值调整所述交换芯片的供电电压,以调整所述交换机的功耗,从而牺牲部分交换机性能而防止交换芯片的温度过高引起的宕机现象的发生。

Description

交换机功耗调整方法、系统、计算机设备和存储介质
技术领域
本申请涉及交换机领域,特别是涉及一种交换机功耗调整方法、系统、计算机设备和存储介质。
背景技术
随着大数据、云计算的发展,数据中心的业务呈指数增长,客户希望所有的交换机能够以最大的容量和性能持续工作,能够满足数据量的需求。交换机产品中主要芯片的性能变得越来越强,芯片的功耗也越来越大,功耗和性能之间的平衡至关重要,同时功耗的提升给系统的散热带来极大的挑战。数据中心的交换机通常能够维持在25℃的室温,因此产品的设计主要基于室温,以及产品风扇正常的情况下设计,这样能够大幅降低产品的成本。
现有的交换机通常采用固定主频率,为了满足交换芯片的性能最佳,VR电源按照交换芯片最大功耗设计,同时为了满足散热需求,通常需要设计n+1的风扇冗余,因此电源设计和散热设计都需要按照冗余设计,极大地浪费空间和成本。当数据中心机房的散热出现故障,导致环境温度上升时,需要剩余风扇增大更大的转速来实现交换芯片的散热;当环境温度更高,或者风扇故障数量增多时,交换机的现有散热策略无法满足时,交换芯片的温度会持续上升,最终造成机器超温,直到宕机,影响客户的整体业务。
发明内容
基于此,本申请提供一种交换机功耗调整方法、系统、计算机设备和存储介质,以防止交换芯片的温度过高引起的宕机现象的发生。
一方面,提供一种交换机功耗调整方法,所述方法包括:
通过基板管理控制器实时监测交换机上交换芯片的温度状态,当所述交换芯片的温度状态处于异常状态时,获取所述交换芯片的第一温度值;
根据所述交换芯片的第一温度值确定对应的第一策略调整表,根据所述第一策略调整表确定对应的频率调整值,并根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值;
根据所述频率调整值调整所述交换芯片的主频,同时根据所述电压调整值调整所述交换芯片的供电电压,以调整所述交换机的功耗。
在其中一个实施例中,所述通过基板管理控制器实时监测交换机上交换芯片的温度状态,包括:
所述基板管理控制器控制所述交换芯片内置的温度监测模块监测所述交换芯片的温度状态;和/或,
所述基板管理控制器控制外置的温度监测模块监测所述交换芯片的环境温度,并通过所述交换芯片的环境温度反映所述交换芯片的温度状态。
在其中一个实施例中,根据所述交换芯片的第一温度值确定对应的第一策略调整表,根据所述第一策略调整表确定对应的频率调整值,包括:
所述基板管理控制器根据所述交换芯片的第一温度值确定对应的第一策略调整表;
所述基板管理控制器根据所述第一策略调整表确定对应的频率调整值;
所述基板管理控制器通过低引脚数总线将所述频率调整值发送至复杂可编程逻辑芯片。
在其中一个实施例中,所述根据所述频率调整值调整所述交换芯片的主频,包括:
所述复杂可编程逻辑芯片将所述频率调整值发送至所述交换芯片的采样管脚;
所述交换芯片从所述采样管脚接收所述频率调整值,并按照所述频率调整值配置所述交换芯片的主频。
在其中一个实施例中,所述根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值,包括:
所述基板管理控制器根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值;
所述基板管理控制器通过电源管理总线将所述电压调整值发送至电压调整器芯片;
所述根据所述电压调整值调整所述交换芯片的供电电压,包括:
所述电压调整器芯片接收所述电压调整值,并按照所述电压调整值配置所述交换芯片的供电电压。
在其中一个实施例中,当所述交换芯片的温度状态处于异常状态时,所述方法还包括:
将所述温度状态处于异常状态的消息进行上报告警,并发送至运维人员。
在其中一个实施例中,当运维人员对所述交换机进行维护,使得所述交换芯片的温度状态从异常状态恢复到正常状态时,所述方法还包括:
获取所述交换芯片的第二温度值;
根据所述交换芯片的第二温度值获取对应的第二策略调整表,根据所述第二策略调整表确定对应的频率调整值,并根据所述频率调整值从第二策略调整表中获取与所述频率调整值相对应的电压调整值;
根据所述频率调整值调整所述交换芯片的主频,同时根据所述电压调整值调整所述交换芯片的供电电压,以调整所述交换机的功耗。
另一方面,提供了一种交换机功耗调整系统,所述系统包括:
温度检测模块,用于通过基板管理控制器实时监测交换机上交换芯片的温度状态,当所述交换芯片的温度状态处于异常状态时,获取所述交换芯片的第一温度值;
数据获取模块,用于根据所述交换芯片的第一温度值从第一策略调整表中获取与所述实时温度值相对应的频率调整值,并根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值;
参数调整模块,用于根据所述频率调整值调整所述交换芯片的主频,同时根据所述电压调整值调整所述交换芯片的供电电压,以调整所述交换机的功耗。
再一方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
通过基板管理控制器实时监测交换机上交换芯片的温度状态,当所述交换芯片的温度状态处于异常状态时,获取所述交换芯片的第一温度值;
根据所述交换芯片的第一温度值确定对应的第一策略调整表,根据所述第一策略调整表确定对应的频率调整值,并根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值;
根据所述频率调整值调整所述交换芯片的主频,同时根据所述电压调整值调整所述交换芯片的供电电压,以调整所述交换机的功耗。
又一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有程序,当所述程序被处理器执行时,使得所述处理器执行以下步骤:
通过基板管理控制器实时监测交换机上交换芯片的温度状态,当所述交换芯片的温度状态处于异常状态时,获取所述交换芯片的第一温度值;
根据所述交换芯片的第一温度值确定对应的第一策略调整表,根据所述第一策略调整表确定对应的频率调整值,并根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值;
根据所述频率调整值调整所述交换芯片的主频,同时根据所述电压调整值调整所述交换芯片的供电电压,以调整所述交换机的功耗。
本申请的上述技术方案相比现有技术具有以下优点:
上述交换机功耗调整方法、系统、计算机设备和存储介质,当交换芯片的温度状态处于异常状态时,本申请的交换机功耗调整方法能够根据实际的温度值来自适应调整交换芯片的工作主频和供电电压,以降低交换机的功耗,牺牲部分交换机性能而防止交换芯片的温度过高引起的宕机现象的发生。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本申请实施例提供的交换机功耗调整方法的第一方法流程图;
图2是本申请实施例提供的交换机功耗调整方法的第二方法流程图;
图3是本申请实施例提供的交换机功耗调整方法的拓扑结构图;
图4是本申请实施例提供的交换机功耗调整系统的系统结构图;
图5是本申请实施例提供的计算机设备的设备结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
实施例一:
参照图1所示,图1为本申请实施例提供的交换机功耗调整方法的第一方法流程图。
方法包括以下步骤:
S101,通过基板管理控制器实时监测交换机上交换芯片的温度状态,当所述交换芯片的温度状态处于异常状态时,获取所述交换芯片的第一温度值;
具体地,现有技术的交换机通常采用固定主频率的设计方式,当交换机的环境温度上升导致交换机芯片的温度上升,或者交换机的散热系统故障导致交换机芯片的温度上升时,将会使得现有的散热策略无法满足交换机的散热需求,严重则会导致交换机的交换芯片温度超过规格,出现宕机的现象,影响客户的整体业务,因此本申请提出一种交换机功耗调整方法,以根据交换芯片的温度自适应调整交换机的交换芯片的功耗,在散热策略无法满足当前的散热需求时,降低交换芯片的功耗,避免宕机现象的发生。要想实现交换机功耗的自适应调整,首先要通过基板管理控制器(BMC,Baseboard Management Controller)实时监测交换机上交换芯片的温度状态,以根据温度状态判断交换芯片的工作状态。交换芯片的温度状态包括两种,一种是温度正常状态,表示当前的散热策略能够满足交换芯片的散热需求;另一种是温度异常状态,表示当前的散热策略不能满足交换芯片的散热需求,也就是表示交换芯片的环境温度升高导致交换芯片的温度升高,或者是当前的散热系统故障导致交换芯片的温度升高。当交换芯片的温度状态处于异常状态时,表示交换芯片的工作状态异常,可能会导致宕机现象的发生,因此要获取交换芯片的第一温度值,以便于根据第一温度值对交换机进行功耗调整,其中,第一温度值是指交换芯片的温度状态处于异常状态时所采集到的反映交换芯片温度的温度值。
S102,根据所述交换芯片的第一温度值获取对应的第一策略调整表,根据所述第一策略调整表确定对应的频率调整值,并根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值;
具体地,当交换芯片的温度状态处于异常状态时,获取交换芯片的第一温度值;获取到交换芯片的第一温度值后,根据交换芯片的第一温度值匹配相应的频率调整值;然后根据频率调整值匹配相应的电压调整值。进一步地,频率调整值与电压调整值之间的对应关系存储在第一策略调整表中,当交换芯片的温度状态处于异常状态时,获取交换芯片的第一温度值,根据交换芯片的第一温度值获取对应的第一策略调整表,其次根据第一策略调整表确定对应的频率调整值;然后根据频率调整值从第一策略调整表中获取与频率调整值相对应的电压调整值。交换芯片工作在不同的频率(主频)下,需要对应设置不同的供电电压,以实现资源的合理利用。其中,第一策略调整表中可以保存具体的频率值,以及与频率值对应的电压值,按照第一策略调整表中的频率值调整交换芯片的主频,按照第一策略调整表中的电压值调整交换芯片的供电电压;或者是保存频率步进值,以及与频率步进值对应的电压步进值;最终要实现按照第一策略调整表中的参数对交换芯片的主频和电压逐渐调整到目标值。
S103,根据所述频率调整值调整所述交换芯片的主频,同时根据所述电压调整值调整所述交换芯片的供电电压,以调整所述交换机的功耗。
具体地,根据交换芯片的第一温度值获取对应的第一策略调整表,并根据第一策略调整表确定对应的频率调整值后,根据频率调整值调整交换芯片的主频,同时根据电压调整值调整交换芯片的供电电压,以实现交换机功耗的自适应调整。
交换芯片不同的温度值对应不同的第一策略调整表,如果交换芯片的温度太高,则交换芯片的主频降低值会大一些,如果交换芯片的温度较高,则交换芯片的主频降低值会小一些。当温度值偏高时,需要降低交换芯片的频率值(主频),以降低交换芯片的功耗,牺牲交换芯片的部分性能来防止交换芯片因功耗过大导致温度偏高而进一步导致宕机现象的发生;第一策略调整表中存储了频率调整值与电压调整值之间的对应关系,不同频率工况下的交换芯片需配置不同的供电电压,因此需要对交换芯片配置与频率调整值相对应的电压调整值,以实现资源的合理利用。因此,当交换芯片的温度状态处于异常状态时,本申请的交换机功耗调整方法能够根据实际的温度值来自适应调整交换芯片的工作主频和供电电压,以降低交换机的功耗,牺牲部分交换机性能而防止交换芯片的温度过高引起的宕机现象的发生。
在其中一个实施方式中,所述通过基板管理控制器实时监测交换机上交换芯片的温度状态,包括:
所述基板管理控制器控制所述交换芯片内部的温度监测模块监测所述交换芯片的温度状态;和/或,
所述基板管理控制器控制外置的温度监测模块监测所述交换芯片的环境温度,并通过所述交换芯片的环境温度反映所述交换芯片的温度状态。
具体地,基板管理控制器负责监测交换机上交换芯片的温度状态。其中,要想获取交换芯片的实际工作温度,采用三种方式,第一种是通过基板管理控制器控制交换芯片内部的温度监测模块监测交换芯片的温度值,通过对温度值的监测来确定交换机芯片的温度状态,此种方式能够准确的反映交换机因功耗过大引起的温度异常;第二种是通过基板管理控制器控制外置的温度监测模块监测交换芯片的环境温度,并通过交换芯片的环境温度反映交换芯片的温度值,也就是通过交换芯片的环境温度值来确定交换机芯片的温度状态,此种方式能够准确的反映交换机因环境温度导致的温度异常;第三种方式是前两种方式的结合,通过内置和外置的温度监测模块共同监测交换芯片的温度值,能够准确的将功耗过大和环境温度两种状况有效地结合在一起,更为准确的反映交换芯片的温度状态。进一步地,基板管理控制器通过系统管理总线(SMBus,System Management Bus)与内置的温度监测模块通信连接,以及通过系统管理总线与外置的温度监测模块通信连接。
在其中一个实施方式中,所述根据所述交换芯片的第一温度值获取对应的第一策略调整表,根据所述第一策略调整表确定对应的频率调整值,包括:
所述基板管理控制器根据所述交换芯片的第一温度值确定对应的第一策略调整表;
具体地,交换芯片不同的温度值对应不同的第一策略调整表,如果交换芯片的温度太高,则交换芯片的主频降低值会大一些,如果交换芯片的温度较高,则交换芯片的主频降低值会小一些。因此获取到交换芯片的第一温度值后,根据交换芯片的第一温度值获取对应的第一策略调整表,以根据第一温度值的大小来适配对应的第一策略调整表。
所述基板管理控制器根据所述第一策略调整表确定对应的频率调整值;
具体地,基板管理控制器根据交换芯片的第一温度值确定对应的第一策略调整表后,第一策略调整表中存储了降序排序的频率调整值,通过第一策略调整表可以确定频率调整值,便于按照第一策略调整表中频率调整值的排序对交换芯片的频率进行调整。当交换芯片的温度状态处于异常状态时,表示交换芯片的温度过高,需要降低交换芯片的主频,因此,按照第一策略调整表中降序排序的频率调整值对交换芯片的频率进行调整,逐渐降低到目标值。
所述基板管理控制器通过低引脚数总线将所述频率调整值发送至复杂可编程逻辑芯片;
具体地,当交换芯片的温度状态处于异常状态时,基板管理控制器根据第一策略调整表确定对应的频率调整值后,基板管理控制器通过低引脚数总线(LPC,Low pin countBus)将频率调整值发送至复杂可编程逻辑芯片(CPLD,Complex Programmable LogicDevice),以便于通过复杂可编程逻辑芯片调整交换芯片的频率。
在其中一个实施方式中,所述根据所述频率调整值调整所述交换芯片的主频,包括:
所述复杂可编程逻辑芯片将所述频率调整值发送至所述交换芯片的采样管脚;
具体地,复杂可编程逻辑芯片从第一策略调整表中获取与实时温度值相对应的频率调整值后,复杂可编程逻辑芯片将频率调整值发送至交换芯片的采样管脚(StrapPin),以便于交换芯片通过采样管脚接收频率调整值,并按照频率调整值配置交换芯片的主频。
所述交换芯片从所述采样管脚接收所述频率调整值,并按照所述频率调整值配置所述交换芯片的主频。
具体地,复杂可编程逻辑芯片将频率调整值发送至交换芯片的采样管脚后,交换芯片从采样管脚接收复杂可编程逻辑芯片发送的频率调整值,然后按照频率调整值配置交换芯片的主频,实现根据交换芯片的实时温度值自适应调整交换芯片的频率。
在其中一个实施方式中,所述根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值,包括:
所述基板管理控制器根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值;
具体地,第一策略调整表中存储了频率调整值与电压调整值之间的对应关系,因此,基板管理控制器可以根据频率调整值从第一策略调整表中获取与频率调整值相对应的电压调整值,以便于对交换芯片的供电电压进行调整。其中,频率调整值与电压调整值是一一对应的关系,一个频率调整值对应一个电压调整值。
所述基板管理控制器通过电源管理总线将所述电压调整值发送至电压调整器芯片;
具体地,基板管理控制器根据频率调整值从第一策略调整表中获取与频率调整值相对应的电压调整值后,基板管理控制器通过电源管理总线(PMBus,Power ManagementBus)将电压调整值发送至电压调整器(VR,Voltage Regulation)芯片,以便于通过电压调整器芯片调整交换芯片的供电电压。
所述根据所述电压调整值调整所述交换芯片的供电电压,包括:
所述电压调整器芯片接收所述电压调整值,并按照所述电压调整值配置所述交换芯片的供电电压。
具体地,基板管理控制器通过电源管理总线将电压调整值发送至电压调整器芯片后,电压调整器芯片接收基板管理控制器通过电源管理总线发送的电压调整值,并按照电压调整值配置交换芯片的供电电压,使得交换芯片的供电电压匹配交换芯片调整后的频率,从而达到降低交换芯片功耗的目的。
在其中一个实施方式中,当所述交换芯片的温度状态处于异常状态时,所述方法还包括:
将所述温度状态处于异常状态的消息进行上报告警,并发送至运维人员。
具体地,当交换芯片的温度状态处于异常状态时,说明交换芯片的环境温度异常导致交换芯片的温度上升,或者是交换机的风扇散热系统故障导致交换机芯片的温度上升,使得交换芯片工作超过额定工作温度的工况,需要运维人员去排查交换芯片工作温度上升的原因,进一步地,需要去排查交换芯片环境温度上升的原因,或者是交换机的风扇散热系统的故障原因,以便于恢复交换机的正常工作工况。
在其中一个实施方式中,当运维人员对所述交换机进行维护,使得所述交换芯片的温度状态从异常状态恢复到正常状态时,所述方法还包括:
获取所述交换芯片的第二温度值;
具体地,运维人员对交换芯片工作温度上升的原因进行排查后,使得交换芯片的温度状态从异常状态恢复到正常状态,此时需要将交换芯片的工作频率和工作电压恢复到原来的正常状态,因此需要获取交换芯片的第二温度值。其中,第二温度值是指交换芯片的温度状态处于正常状态时所采集到的反映交换芯片温度的温度值。
根据所述交换芯片的第二温度值获取对应的第二策略调整表,根据所述第二策略调整表确定对应的频率调整值,并根据所述频率调整值从第二策略调整表中获取与所述频率调整值相对应的电压调整值;
具体地,交换芯片的温度状态从异常状态恢复到正常状态后,此时交换芯片的实时温度值降低,恢复到正常状态,需要将频率值和电压值调高,因此获取到交换芯片的第二温度值后,根据交换芯片的第二温度值获取对应的第二策略调整表,根据第二策略调整表确定对应的频率调整值,并根据频率调整值从第二策略调整表中获取与频率调整值相对应的电压调整值。由于交换芯片的温度状态从正常状态进入异常状态后,需要逐渐调高交换芯片的主频和供电电压,交换芯片的温度状态从异常状态进入正常状态后,需要逐渐调低交换芯片的主频和供电电压,因此,第二策略调整表与第一策略调整表中的频率调整值的排序相反,或者采用同一个策略调整表,当交换芯片的温度状态从正常状态进入异常状态后,正向遍历策略调整表中的频率调整值和电压调整值,逐渐调高交换芯片的主频和供电电压;当交换芯片的温度状态从异常状态进入正常状态后,反向遍历策略调整表中的频率调整值和电压调整值,逐渐调低交换芯片的主频和供电电压。调低交换芯片的主频和供电电压的步骤与调高交换芯片的主频和供电电压的步骤一致,只是策略调整表中保存的频率调整值和电压调整值的顺序不一致,两个步骤的频率调整值和电压调整值调整顺序相反。或者是根据具体的应用场景配置不同的策略调整表的参数,需要降低交换芯片的主频值和电压值时,按照第一策略调整表执行;需要提高交换芯片的主频值和电压值时,按照第二策略调整表执行。
根据所述频率调整值调整所述交换芯片的主频,同时根据所述电压调整值调整所述交换芯片的供电电压,以调整所述交换机的功耗。
具体地,根据交换芯片的第二温度值获取对应的第二策略调整表,并根据第二策略调整表确定对应的频率调整值后,根据频率调整值调整交换芯片的主频,同时根据电压调整值调整交换芯片的供电电压,以实现交换机功耗的自适应调整。
实施例二:
参照图2所示,图2为本申请实施例提供的交换机功耗调整方法的第二方法流程图。其中,图2所示方法中,与图1所示方法中相同或相似的内容,可以参考图1方法中的描述,此处不做赘述。
S201,通过基板管理控制器实时监测交换机上交换芯片的温度状态,当所述交换芯片的温度状态处于异常状态时,获取所述交换芯片的第一温度值;
要想实现交换机功耗的自适应调整,首先要通过基板管理控制器实时监测交换机上交换芯片的温度状态,当交换芯片的温度状态处于异常状态时,获取交换芯片的第一温度值,以便于根据第一温度值对交换机进行功耗调整。
S202,所述基板管理控制器根据所述交换芯片的第一温度值确定对应的第一策略调整表;
交换芯片不同的温度值对应不同的第一策略调整表,如果交换芯片的温度太高,则交换芯片的主频降低值会大一些,如果交换芯片的温度较高,则交换芯片的主频降低值会小一些。因此获取到交换芯片的第一温度值后,根据交换芯片的第一温度值获取对应的第一策略调整表,以根据第一温度值的大小来适配对应的第一策略调整表。
S203,所述基板管理控制器根据所述第一策略调整表确定对应的频率调整值;
基板管理控制器根据交换芯片的第一温度值确定对应的第一策略调整表后,第一策略调整表中存储了降序排序的频率调整值,通过第一策略调整表可以确定频率调整值,便于按照第一策略调整表中频率调整值的排序对交换芯片的频率进行调整。
S204,所述基板管理控制器通过低引脚数总线将所述频率调整值发送至复杂可编程逻辑芯片;
当交换芯片的温度状态处于异常状态时,基板管理控制器根据第一策略调整表确定对应的频率调整值后,基板管理控制器通过低引脚数总线将频率调整值发送至复杂可编程逻辑芯片,以便于通过复杂可编程逻辑芯片调整交换芯片的频率。
S205,所述复杂可编程逻辑芯片将所述频率调整值发送至所述交换芯片的采样管脚;
复杂可编程逻辑芯片从第一策略调整表中获取与实时温度值相对应的频率调整值后,复杂可编程逻辑芯片将频率调整值发送至交换芯片的采样管脚,以便于交换芯片通过采样管脚接收频率调整值,并按照频率调整值配置交换芯片的主频。
S206,所述基板管理控制器根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值;
第一策略调整表中存储了频率调整值与电压调整值之间的对应关系,因此,基板管理控制器可以根据频率调整值从第一策略调整表中获取与频率调整值相对应的电压调整值,以便于对交换芯片的供电电压进行调整。
S207,所述基板管理控制器通过电源管理总线将所述电压调整值发送至电压调整器芯片;
基板管理控制器根据频率调整值从第一策略调整表中获取与频率调整值相对应的电压调整值后,基板管理控制器通过电源管理总线将电压调整值发送至电压调整器芯片,以便于通过电压调整器芯片调整交换芯片的供电电压。
S208,所述交换芯片从所述采样管脚接收所述频率调整值,并按照所述频率调整值配置所述交换芯片的主频;
复杂可编程逻辑芯片将频率调整值发送至交换芯片的采样管脚后,交换芯片从采样管脚接收复杂可编程逻辑芯片发送的频率调整值,然后按照频率调整值配置交换芯片的主频,实现根据交换芯片的实时温度值自适应调整交换芯片的频率。
S209,同时所述电压调整器芯片接收所述电压调整值,并按照所述电压调整值配置所述交换芯片的供电电压;
基板管理控制器通过电源管理总线将电压调整值发送至电压调整器芯片后,电压调整器芯片接收基板管理控制器通过电源管理总线发送的电压调整值,并按照电压调整值配置交换芯片的供电电压,使得交换芯片的供电电压匹配交换芯片调整后的频率,从而达到降低交换芯片功耗的目的。
S210,将所述温度状态处于异常状态的消息进行上报告警,并发送至运维人员;
当交换芯片的温度状态处于异常状态时,说明交换芯片的环境温度异常导致交换机芯片的温度上升,或者是交换机的风扇散热系统故障导致交换机芯片的温度上升,使得交换芯片工作超过额定工作温度的工况,需要运维人员去排查交换芯片工作温度上升的原因,进一步地,需要去排查交换芯片环境温度上升的原因,或者是交换机的风扇散热系统的故障原因,以便于恢复交换机的正常工作工况。
S211,当运维人员对所述交换机进行维护,使得所述交换芯片的温度状态从异常状态恢复到正常状态时,获取所述交换芯片的第二温度值;
运维人员对交换芯片工作温度上升的原因进行排查后,使得交换芯片的温度状态从异常状态恢复到正常状态,此时需要将交换芯片的工作频率和工作电压恢复到原来的正常状态,因此需要获取交换芯片的第二温度值。
S212,根据所述交换芯片的第二温度值获取对应的第二策略调整表,根据所述第二策略调整表确定对应的频率调整值,并根据所述频率调整值从第二策略调整表中获取与所述频率调整值相对应的电压调整值;
交换芯片的温度状态从异常状态恢复到正常状态后,此时交换芯片的实时温度值降低,恢复到正常状态,需要将频率值和电压值调高,因此获取到交换芯片的第二温度值后,根据交换芯片的第二温度值获取对应的第二策略调整表,根据第二策略调整表确定对应的频率调整值,并根据频率调整值从第二策略调整表中获取与频率调整值相对应的电压调整值。由于交换芯片的温度状态从正常状态进入异常状态后,需要逐渐调高交换芯片的主频和供电电压,交换芯片的温度状态从异常状态进入正常状态后,需要逐渐调低交换芯片的主频和供电电压,因此,第二策略调整表与第一策略调整表中的频率调整值的排序相反,或者采用同一个策略调整表,当交换芯片的温度状态从正常状态进入异常状态后,正向遍历策略调整表中的频率调整值和电压调整值,逐渐调高交换芯片的主频和供电电压;当交换芯片的温度状态从异常状态进入正常状态后,反向遍历策略调整表中的频率调整值和电压调整值,逐渐调低交换芯片的主频和供电电压。调低交换芯片的主频和供电电压的步骤与调高交换芯片的主频和供电电压的步骤一致,只是策略调整表中保存的频率调整值和电压调整值不一致,两个步骤的频率调整值和电压调整值调整顺序不一致。
S213,根据所述频率调整值调整所述交换芯片的主频,同时根据所述电压调整值调整所述交换芯片的供电电压,以调整所述交换机的功耗。
根据交换芯片的第二温度值获取对应的第二策略调整表,并根据第二策略调整表确定对应的频率调整值后,根据频率调整值调整交换芯片的主频,同时根据电压调整值调整交换芯片的供电电压,以实现交换机功耗的自适应调整。
应该理解的是,虽然图1~2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1~2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
实施例三:
参照图4所示,图4为本申请实施例提供的交换机功耗调整系统的系统结构图。
本实施例的交换机功耗调整系统,包括:
温度检测模块,用于通过基板管理控制器实时监测交换机上交换芯片的温度状态,当所述交换芯片的温度状态处于异常状态时,获取所述交换芯片的第一温度值;
要想实现交换机功耗的自适应调整,首先要通过温度监测模块实时监测交换机上交换芯片的温度状态,当交换芯片的温度状态处于异常状态时,获取交换芯片的第一温度值,以便于根据第一温度值进行交换机的功耗调整策略。
数据获取模块,用于根据所述交换芯片的第一温度值从第一策略调整表中获取与所述实时温度值相对应的频率调整值,并根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值;
当交换芯片的温度状态处于异常状态时,通过数据获取模块获取交换芯片的第一温度值;获取到交换芯片的第一温度值后,根据交换芯片的第一温度值匹配相应的频率调整值;然后根据频率调整值匹配相应的电压调整值。
参数调整模块,用于根据所述频率调整值调整所述交换芯片的主频,同时根据所述电压调整值调整所述交换芯片的供电电压,以调整所述交换机的功耗。
根据交换芯片的第一温度值获取对应的第一策略调整表,并根据第一策略调整表确定对应的频率调整值后,根据频率调整值通过参数调整模块调整交换芯片的主频,同时根据电压调整值通过参数调整模块调整交换芯片的供电电压,以实现交换机功耗的自适应调整。
此外,本实施例的交换机功耗调整方法的拓扑结构图如图3所示,交换芯片的供电电源为VR芯片,VR芯片通过PMBus与BMC相连;外部温度监测模块以及交换芯片内置的温度监测模块,通过SMBus与BMC相连;BMC与CPLD通过LPC总线进行通讯;CPLD与交换芯片的StrapPin相连。
关于交换机功耗调整系统的具体限定可以参见上文中对于方法的限定,在此不再赘述。上述交换机功耗调整系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
实施例四:
本实施例提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现交换机功耗调整方法的步骤。
该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现交换机功耗调整方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域内的技术人员应明白,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在其中一个实施方式中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
通过基板管理控制器实时监测交换机上交换芯片的温度状态,当所述交换芯片的温度状态处于异常状态时,获取所述交换芯片的第一温度值;
根据所述交换芯片的第一温度值确定对应的第一策略调整表,根据所述第一策略调整表确定对应的频率调整值,并根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值;
根据所述频率调整值调整所述交换芯片的主频,同时根据所述电压调整值调整所述交换芯片的供电电压,以调整所述交换机的功耗。
实施例五:
本实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
通过基板管理控制器实时监测交换机上交换芯片的温度状态,当所述交换芯片的温度状态处于异常状态时,获取所述交换芯片的第一温度值;
根据所述交换芯片的第一温度值确定对应的第一策略调整表,根据所述第一策略调整表确定对应的频率调整值,并根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值;
根据所述频率调整值调整所述交换芯片的主频,同时根据所述电压调整值调整所述交换芯片的供电电压,以调整所述交换机的功耗。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种交换机功耗调整方法,其特征在于,所述方法包括:
通过基板管理控制器实时监测交换机上交换芯片的温度状态,当所述交换芯片的温度状态处于异常状态时,获取所述交换芯片的第一温度值;
根据所述交换芯片的第一温度值确定对应的第一策略调整表,根据所述第一策略调整表确定对应的频率调整值,并根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值;
根据所述频率调整值调整所述交换芯片的主频,同时根据所述电压调整值调整所述交换芯片的供电电压,以调整所述交换机的功耗。
2.根据权利要求1所述的交换机功耗调整方法,其特征在于,所述通过基板管理控制器实时监测交换机上交换芯片的温度状态,包括:
所述基板管理控制器控制所述交换芯片内置的温度监测模块监测所述交换芯片的温度状态;和/或,
所述基板管理控制器控制外置的温度监测模块监测所述交换芯片的环境温度,并通过所述交换芯片的环境温度反映所述交换芯片的温度状态。
3.根据权利要求1所述的交换机功耗调整方法,其特征在于,根据所述交换芯片的第一温度值确定对应的第一策略调整表,根据所述第一策略调整表确定对应的频率调整值,包括:
所述基板管理控制器根据所述交换芯片的第一温度值确定对应的第一策略调整表;
所述基板管理控制器根据所述第一策略调整表确定对应的频率调整值;
所述基板管理控制器通过低引脚数总线将所述频率调整值发送至复杂可编程逻辑芯片。
4.根据权利要求3所述的交换机功耗调整方法,其特征在于,所述根据所述频率调整值调整所述交换芯片的主频,包括:
所述复杂可编程逻辑芯片将所述频率调整值发送至所述交换芯片的采样管脚;
所述交换芯片从所述采样管脚接收所述频率调整值,并按照所述频率调整值配置所述交换芯片的主频。
5.根据权利要求1所述的交换机功耗调整方法,其特征在于,所述根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值,包括:
所述基板管理控制器根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值;
所述基板管理控制器通过电源管理总线将所述电压调整值发送至电压调整器芯片;
所述根据所述电压调整值调整所述交换芯片的供电电压,包括:
所述电压调整器芯片接收所述电压调整值,并按照所述电压调整值配置所述交换芯片的供电电压。
6.根据权利要求1所述的交换机功耗调整方法,其特征在于,当所述交换芯片的温度状态处于异常状态时,所述方法还包括:
将所述温度状态处于异常状态的消息进行上报告警,并发送至运维人员。
7.根据权利要求6所述的交换机功耗调整方法,其特征在于,当运维人员对所述交换机进行维护,使得所述交换芯片的温度状态从异常状态恢复到正常状态时,所述方法还包括:
获取所述交换芯片的第二温度值;
根据所述交换芯片的第二温度值获取对应的第二策略调整表,根据所述第二策略调整表确定对应的频率调整值,并根据所述频率调整值从第二策略调整表中获取与所述频率调整值相对应的电压调整值;
根据所述频率调整值调整所述交换芯片的主频,同时根据所述电压调整值调整所述交换芯片的供电电压,以调整所述交换机的功耗。
8.一种交换机功耗调整系统,其特征在于,所述交换机功耗调整系统包括:
温度检测模块,用于通过基板管理控制器实时监测交换机上交换芯片的温度状态,当所述交换芯片的温度状态处于异常状态时,获取所述交换芯片的第一温度值;
数据获取模块,用于根据所述交换芯片的第一温度值从第一策略调整表中获取与所述实时温度值相对应的频率调整值,并根据所述频率调整值从第一策略调整表中获取与所述频率调整值相对应的电压调整值;
参数调整模块,用于根据所述频率调整值调整所述交换芯片的主频,同时根据所述电压调整值调整所述交换芯片的供电电压,以调整所述交换机的功耗。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1~7中任意一项所述方法的步骤。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有程序,当所述程序被处理器执行时,使得所述处理器执行如权利要求1~7中任意一项所述的方法的步骤。
CN202211196226.4A 2022-09-29 2022-09-29 交换机功耗调整方法、系统、计算机设备和存储介质 Pending CN115766623A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211196226.4A CN115766623A (zh) 2022-09-29 2022-09-29 交换机功耗调整方法、系统、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211196226.4A CN115766623A (zh) 2022-09-29 2022-09-29 交换机功耗调整方法、系统、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN115766623A true CN115766623A (zh) 2023-03-07

Family

ID=85350563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211196226.4A Pending CN115766623A (zh) 2022-09-29 2022-09-29 交换机功耗调整方法、系统、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN115766623A (zh)

Similar Documents

Publication Publication Date Title
CN105546757B (zh) 一种冷水机组的群控方法及系统
US9513690B2 (en) Apparatus and method for adjusting operating frequencies of processors based on result of comparison of power level with a first threshold and a second threshold
CN102916835A (zh) 一种调整设备功耗的方法及装置
CN108170507B (zh) 虚拟应用管理方法/系统、计算机可读存储介质及服务端
CN117331863B (zh) 电源信息的通信方法、系统、电子设备及存储介质
CN112181124A (zh) 功耗管理的方法和相关设备
EP2245518A1 (en) Changing power states of data handling devices to meet redundancy criterion
CN111045844A (zh) 一种故障降级方法与装置
CN111309132B (zh) 一种服务器多档位电源冗余的方法
CN115766623A (zh) 交换机功耗调整方法、系统、计算机设备和存储介质
CN108924772B (zh) 短信发送方法、装置、计算机设备和存储介质
CN106534262B (zh) 一种网络信息系统故障的切换方法
CN116071049B (zh) 储能设备故障排除方法、装置、计算机设备和存储介质
CN111880945B (zh) 共享设备信息处理方法、系统、装置、计算机和存储介质
CN108184323B (zh) 整机柜服务器的散热调控方法、装置、设备及存储介质
CN115000540A (zh) 电动汽车热管理系统故障处理方法、装置、介质以及设备
CN115020829A (zh) 车辆热管理系统的热控制方法、装置、设备和存储介质
CN110633176A (zh) 工作系统切换方法、立方星和切换装置
CN112503722A (zh) 设备的联动控制方法、系统、计算机设备和存储介质
CN114721852B (zh) 电源管理系统及管理方法
CN114301058B (zh) 功率智能分配方法、系统和计算机设备
CN117404775B (zh) 空调机房切机方法、装置、计算机设备和存储介质
CN115333044B (zh) 基于智能变电站芯片化保护装置的即时备用方法和系统
CN114610242B (zh) 一种提高系统可用性的方法、系统和装置
US20240079871A1 (en) Power management device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination