CN110794949A - 一种基于部件温度自动分配计算资源的降功耗方法和系统 - Google Patents

一种基于部件温度自动分配计算资源的降功耗方法和系统 Download PDF

Info

Publication number
CN110794949A
CN110794949A CN201910921890.2A CN201910921890A CN110794949A CN 110794949 A CN110794949 A CN 110794949A CN 201910921890 A CN201910921890 A CN 201910921890A CN 110794949 A CN110794949 A CN 110794949A
Authority
CN
China
Prior art keywords
temperature
component
low
computing resources
equal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910921890.2A
Other languages
English (en)
Inventor
宗斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wave Intelligent Technology Co Ltd
Original Assignee
Suzhou Wave Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wave Intelligent Technology Co Ltd filed Critical Suzhou Wave Intelligent Technology Co Ltd
Priority to CN201910921890.2A priority Critical patent/CN110794949A/zh
Publication of CN110794949A publication Critical patent/CN110794949A/zh
Priority to PCT/CN2020/087163 priority patent/WO2021057023A1/zh
Priority to US17/764,422 priority patent/US20220357786A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D27/00Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids
    • F04D27/004Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids by varying driving speed
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D29/00Details, component parts, or accessories
    • F04D29/66Combating cavitation, whirls, noise, vibration or the like; Balancing
    • F04D29/661Combating cavitation, whirls, noise, vibration or the like; Balancing especially adapted for elastic fluid pumps
    • F04D29/663Sound attenuation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3215Monitoring of peripheral devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/329Power saving characterised by the action undertaken by task scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Mechanical Engineering (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Power Sources (AREA)
  • Control Of Temperature (AREA)

Abstract

本发明实施例公开了一种基于部件温度自动分配计算资源的降功耗方法和系统,具体包括:获取N个同类部件在当前采样时刻的温度值;计算当前采样时刻同类部件的平均温度值T,确定温度上限阈值Tmax和温度下限阈值Tmin;判断高温部件Ai、低温部件Bj和正常温度部件Ck;将高温部件Ai的10%计算资源分配给低温部件Bj,分配后各部件持续运行一个周期;一个周期结束后重复以上步骤。本发明实施例所述方法和系统解决了同类部件均衡加压的系统架构中,处于边界条件下的部件出现温度特别高,而导致的控制风扇转速升高、拉升整机功耗和系统PUE值的问题。

Description

一种基于部件温度自动分配计算资源的降功耗方法和系统
技术领域
本发明涉及服务器风扇调控技术领域,具体涉及一种基于部件温度自动分配计算资源的降功耗方法和系统。
背景技术
随着云计算、大数据等新型技术的发展,对数据存储的带宽和容量要求越来越高,处理器的运算速度与运算量也越来越大,导致内存、硬盘等各个部件的温度也不断飙升,电子部件的散热成为目前一个相当灼手的问题,而且现在社会对功耗的要求也越来越低,节能是目前的一个主流趋势。如何能有效的降低各个电子部件的温度过高而且降低风扇墙的功耗,而且满足整机的功耗最优已是一个急需解决的技术问题。
现有技术中,同类部件采用均衡分配计算资源的方法,BMC收到计算指令后,将计算指令均衡的下发给同类型的各个部件,各个部件统一加压完成相同的计算任务,也就是处在不同环境条件下的部件要完成相同的任务。
现有技术中同类部件均衡分配计算资源的方法,对来流温度较高,风速较低的边界条件下对应的部件不利,身处恶劣条件下的部件会要求更多的资源,及要求更多的风流量,该要求的风流量是在整体的风流量提升的基础上分到受限的一部分风流,风扇墙整体转速会提升,拉升整机功耗和系统的PUE值,提高运营成本。
发明内容
本发明实施例中提供了一种基于部件温度自动分配计算资源的降功耗方法和系统,根据部件温度来自动分配计算资源,使处于不同边界条件下的器件分配到匹配的计算量,基本实现同类器件的控制温度值基本一致。本发明实施例所述方法和系统解决了同类部件均衡加压的系统架构中,处于边界条件下的部件出现温度特别高,而导致的控制风扇转速升高、拉升整机功耗和系统PUE值的问题。
本发明实施例公开了如下技术方案:
本发明第一方面提供了一种基于部件温度自动分配计算资源的降功耗方法,包括:
S1,获取N个同类部件在当前采样时刻的温度值;
S2,计算当前采样时刻同类部件的平均温度值T,确定温度上限阈值Tmax和温度下限阈值Tmin,所述温度上限阈值Tmax=T+3℃,所述温度下限阈值Tmin=T-3℃;
S3,判断高温部件Ai、低温部件Bj和正常温度部件Ck,设定i为高温部件的序号,共I个高温部件,j为低温部件的序号,共J个高温部件,k为正常温度部件的序号,共K个高温部件,0≤i≤I,0≤j≤J,0≤k≤K,I+J+K=N;
S4,将高温部件Ai的10%计算资源分配给低温部件Bj,分配后各部件持续运行一个周期;
S5,重复步骤S1~S4。
进一步地,所述步骤S3中判断高温部件Ai、低温部件Bj和正常温度部件Ck的方法为:
S31,判断单个部件的温度值>Tmax,如果是,则将单个部件作为高温部件Ai;
S32,判断单个部件的温度值<Tmin,如果是,则将单个部件作为低温部件Bj;
S33,判断Tmin≤单个部件的温度值≤Tmax,则将单个部件作为正常温度部件。
进一步地,所述步骤S4中将高温部件Ai的10%计算资源分配给低温部件Bj的方法为:
S41,将I个高温部件的温度从高到低排序为A1,A2,A3,…,Ai,…,AI;
S42,将J个低温部件的温度从低到高排序为B1,B2,B3,…,Bj,…,BJ;
S43,如果I>J,则高温部件取A1,A2,A3,…,Aj,…,AJ,低温部件取B1,B2,B3,…,Bj,…,BJ,按照步骤S45将高温部件的10%计算资源分配给低温部件;
S44,如果I<J,则高温部件取A1,A2,A3,…,Ai,…,AI,低温部件取B1,B2,B3,…,Bi,…,BI,按照步骤S45将高温部件的10%计算资源分配给低温部件;
S45,如果I=J,则将
高温部件A1的10%计算资源分配给低温部件B1,
高温部件A2的10%计算资源分配给低温部件B2,
高温部件A3的10%计算资源分配给低温部件B3,
…,
高温部件Ai的10%计算资源分配给低温部件Bj;
…,
高温部件AI的10%计算资源分配给低温部件BJ。
进一步地,所述方法中同类部件为CPU、GPU或PCIE,N≥2。
进一步地,所述方法的周期为1min。
本发明第二方面提供了一种基于部件温度自动分配计算资源的降功耗系统,包括:
数据采集单元,用于获取N个同类部件在当前采样时刻的温度值;
数据计算单元,用于计算当前采样时刻同类部件的平均温度值T,确定温度上限阈值Tmax和温度下限阈值Tmin,所述温度上限阈值Tmax=T+3℃,所述温度下限阈值Tmin=T-3℃;
数据判断单元,用于判断高温部件Ai、低温部件Bj和正常温度部件Ck,设定i为高温部件的序号,共I个高温部件,j为低温部件的序号,共J个高温部件,k为正常温度部件的序号,共K个高温部件,0≤i≤I,0≤j≤J,0≤k≤K,I+J+K=N;
数据分配单元,用于将高温部件Ai的10%计算资源分配给低温部件Bj,分配后各部件持续运行一个周期;
数据循环单元,用于数据分配单元执行完任务后跳转至数据采集单元。
进一步地,所述数据判断单元包括:
高温部件判断模块,用于判断单个部件的温度值是否>Tmax,如果是,则将单个部件作为高温部件Ai;
低温部件判断模块,用于单个部件的温度值≤Tmax时,判断单个部件的温度值是否<Tmin,如果是,则将单个部件作为低温部件Bj;
正常温度部件判断模块,用于判断是否是Tmin≤单个部件的温度值≤Tmax,如果是,则将单个部件作为正常温度部件。
进一步地,所述数据分配单元包括:
第一排序模块,用于将I个高温部件的温度从高到低排序为A1,A2,A3,…,Ai,…,AI;
第二排序模块,用于将J个低温部件的温度从低到高排序为B1,B2,B3,…,Bj,…,BJ;
高低温部件比对模块,用于比对高温部件的数量I和低温部件的数量J,
如果I>J,则高温部件取A1,A2,A3,…,Aj,…,AJ,低温部件取B1,B2,B3,…,Bj,…,BJ,按照数据分配模块执行计算资源分配任务,
如果I<J,则高温部件取A1,A2,A3,…,Ai,…,AI,低温部件取B1,B2,B3,…,Bi,…,BI,按照数据分配模块执行计算资源分配任务;
数据分配模块,用于当I=J时,将
高温部件A1的10%计算资源分配给低温部件B1,
高温部件A2的10%计算资源分配给低温部件B2,
高温部件A3的10%计算资源分配给低温部件B3,
…,
高温部件Ai的10%计算资源分配给低温部件Bj;
…,
高温部件AI的10%计算资源分配给低温部件BJ。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
本发明实施例提供的一种基于部件温度自动分配计算资源的降功耗方法和系统,在一个周期内,获取同类部件在当前采样时刻的温度值,将大于温度上限阈值的部件计算资源的10%分配给低于温度下限阈值的部件,通过降低高温部件的计算资源负载,降低高温部件的温度。各部件不但能保证足够的计算量,而且能保证处于不同边界条件下的部件分配到匹配的计算量,基本实现同类部件的控制温度值基本一致。本发明实施例所述方法和系统解决了同类部件均衡加压的系统架构中,处于边界条件下的部件出现温度特别高,而导致的控制风扇转速升高、拉升整机功耗和系统PUE值的问题。
本发明实施例所述方法和系统应用于存在CPU、GPU、PCIE或其他高功耗芯片控制器部件的服务器通用机型中,在同类部件有多个的情况下,通过本发明所述算法,能保证在不同工作条件下,保证足够的计算资源,有效降低风扇转速,将各个部件温度控制在要求的阀值之内,从而降低了整机功耗、减小了噪音,满足最优化的设计,使用范围广泛。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所述方法的流程图;
图2为本发明所述步骤S4中将高温部件Ai的10%计算资源分配给低温部件Bj的流程图;
图3为本发明所述系统的结构框图。
具体实施方式
为了能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
如图1所示,为本发明提供的基于部件温度自动分配计算资源的降功耗方法的流程图,方法包括:
S1,获取N个同类部件在当前采样时刻的温度值;
S2,计算当前采样时刻同类部件的平均温度值T,确定温度上限阈值Tmax和温度下限阈值Tmin,温度上限阈值Tmax=T+3℃,温度下限阈值Tmin=T-3℃;
S3,判断高温部件Ai、低温部件Bj和正常温度部件Ck,其中i代表高温部件的序号,共I个高温部件,j代表低温部件的序号,共J个高温部件,k代表正常温度部件的序号,共K个高温部件,0≤i≤I,0≤j≤J,0≤k≤K,I+J+K=N;
S4,将高温部件Ai的10%计算资源分配给低温部件Bj,分配后各部件持续运行一个周期;
S5,重复步骤S1~S4。
步骤S3中判断高温部件Ai、低温部件Bj和正常温度部件Ck的方法为:
S31,判断单个部件的温度值>Tmax,如果是,则将单个部件作为高温部件Ai;
S32,判断单个部件的温度值<Tmin,如果是,则将单个部件作为低温部件Bj;
S33,判断Tmin≤单个部件的温度值≤Tmax,则将单个部件作为正常温度部件。
如图2所示,为步骤S4中将高温部件Ai的10%计算资源分配给低温部件Bj的流程图,具体方法为:
S41,将I个高温部件的温度从高到低排序为A1,A2,A3,…,Ai,…,AI;
S42,将J个低温部件的温度从低到高排序为B1,B2,B3,…,Bj,…,BJ;
S43,如果I>J,则高温部件取A1,A2,A3,…,Aj,…,AJ,低温部件取B1,B2,B3,…,Bj,…,BJ,按照步骤S45将高温部件的10%计算资源分配给低温部件;
S44,如果I<J,则高温部件取A1,A2,A3,…,Ai,…,AI,低温部件取B1,B2,B3,…,Bi,…,BI,按照步骤S45将高温部件的10%计算资源分配给低温部件;
S45,如果I=J,则将高温部件A1的10%计算资源分配给低温部件B1,高温部件A2的10%计算资源分配给低温部件B2,高温部件A3的10%计算资源分配给低温部件B3,…,高温部件Ai的10%计算资源分配给低温部件Bj;…,高温部件AI的10%计算资源分配给低温部件BJ。
以服务器中CPU为例说明,例如服务器中共有8个CPU,即N=8,CPU当前采样时刻的温度如下表所示:
实现步骤如下:
1)获取CPU在当前时刻的温度值,见上表;
2)计算CPU的平均温度T=75℃,
确定温度上限阈值Tmax=78℃,
确定温度下限阈值Tmin=72℃;
3)根据步骤2),判断高温部件为大于78℃的CPU,即CPU4(82℃)、CPU5(83℃)、CPU6(81℃),共三个高温部件,判断低温部件为小于72℃的CPU,即CPU3(70.5℃)、CPU7(67℃)、CPU8(69.5℃),共三个低温部件,其余2个CPU为正常温度部件。
4)分配计算资源
4.1)将三个高温CPU按照从高到低排序,A1为CPU5(83℃),A2为CPU4(82℃),A3为CPU6(81℃),
4.2)将3个低温CPU的温度从低到高排序为,B1为CPU7(67℃),B2为CPU8(69.5℃),B3为CPU3(70.5℃),
4.3)高温CPU的数量和低温CPU的数量相等,则将
A1高温CPU5(83℃)的10%计算资源分配给B1低温CPU7(67℃),
A2高温CPU4(82℃)的10%计算资源分配给B2低温CPU8(69.5℃),
A3高温CPU6(81℃)的10%计算资源分配给B3低温CPU3(70.5℃)。
5)重复步骤1)~4)。
通过采用本发明所述基于部件温度自动分配计算资源的降功耗的方法,可以将处于不同边界条件下的CPU分配到匹配的计算量,基本实现各CPU的控制温度值基本一致,同时实现对CPU合理分配计算资源。
本发明实施例所述方法中,同类部件为CPU、GPU或PCIE,N≥2,周期为1min,其他符合实际运行的时间也可以作为本发明中的周期。
如图3所示,为本发明提供的基于部件温度自动分配计算资源的降功耗系统的结构框图,系统包括:
数据采集单元,用于获取N个同类部件在当前采样时刻的温度值;
数据计算单元,用于计算当前采样时刻同类部件的平均温度值T,确定温度上限阈值Tmax和温度下限阈值Tmin,温度上限阈值Tmax=T+3℃,温度下限阈值Tmin=T-3℃;
数据判断单元,用于判断高温部件Ai、低温部件Bj和正常温度部件Ck,其中i代表高温部件的序号,共I个高温部件,j代表低温部件的序号,共J个高温部件,k代表正常温度部件的序号,共K个高温部件,0≤i≤I,0≤j≤J,0≤k≤K,I+J+K=N;
数据分配单元,用于将高温部件Ai的10%计算资源分配给低温部件Bj,分配后各部件持续运行一个周期;
数据循环单元,用于数据分配单元执行完任务后跳转至数据采集单元。
数据判断单元包括:
高温部件判断模块,用于判断单个部件的温度值是否>Tmax,如果是,则将单个部件作为高温部件Ai;
低温部件判断模块,用于单个部件的温度值≤Tmax时,判断单个部件的温度值是否<Tmin,如果是,则将单个部件作为低温部件Bj;
正常温度部件判断模块,用于判断是否是Tmin≤单个部件的温度值≤Tmax,如果是,则将单个部件作为正常温度部件。
数据分配单元包括:
第一排序模块,用于将I个高温部件的温度从高到低排序为A1,A2,A3,…,Ai,…,AI;
第二排序模块,用于将J个低温部件的温度从低到高排序为B1,B2,B3,…,Bj,…,BJ;
高低温部件比对模块,用于比对高温部件的数量I和低温部件的数量J,如果I>J,则高温部件取A1,A2,A3,…,Aj,…,AJ,低温部件取B1,B2,B3,…,Bj,…,BJ,按照数据分配模块执行计算资源分配任务,如果I<J,则高温部件取A1,A2,A3,…,Ai,…,AI,低温部件取B1,B2,B3,…,Bi,…,BI,按照数据分配模块执行计算资源分配任务;
数据分配模块,用于当I=J时,将高温部件A1的10%计算资源分配给低温部件B1,高温部件A2的10%计算资源分配给低温部件B2,高温部件A3的10%计算资源分配给低温部件B3,…,高温部件Ai的10%计算资源分配给低温部件Bj;…,高温部件AI的10%计算资源分配给低温部件BJ。
通过采用本发明所述基于部件温度自动分配计算资源的降功耗方法和系统,可避免实际运行中各个器件统一加压,在不同的环境条件、同样的计算量资源分配下,出现受到来流温度较高,风速较低的边界条件对应位置的器件出现局部温度过高,而导致的风扇转速快速升高的问题。
本发明不但能有效的合理分配计算资源,保证足够的计算量,而且能有效降低整机系统功耗,针对不同的操作环境,实现机器自身调节负载资源,这种设置更加合理和智能化。
以上所述只是本发明的优选实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也被视为本发明的保护范围。

Claims (8)

1.一种基于部件温度自动分配计算资源的降功耗方法,其特征在于,所述方法包括:
S1,获取N个同类部件在当前采样时刻的温度值;
S2,计算当前采样时刻同类部件的平均温度值T,确定温度上限阈值Tmax和温度下限阈值Tmin,所述温度上限阈值Tmax=T+3℃,所述温度下限阈值Tmin=T-3℃;
S3,判断高温部件Ai、低温部件Bj和正常温度部件Ck,设定i为高温部件的序号,共I个高温部件,j为低温部件的序号,共J个高温部件,k为正常温度部件的序号,共K个高温部件,0≤i≤I,0≤j≤J,0≤k≤K,I+J+K=N;
S4,将高温部件Ai的10%计算资源分配给低温部件Bj,分配后各部件持续运行一个周期;
S5,重复步骤S1~S4。
2.根据权利要求1所述的一种基于部件温度自动分配计算资源的降功耗方法,其特征在于,所述步骤S3中判断高温部件Ai、低温部件Bj和正常温度部件Ck的方法为:
S31,判断单个部件的温度值>Tmax,如果是,则将单个部件作为高温部件Ai;
S32,判断单个部件的温度值<Tmin,如果是,则将单个部件作为低温部件Bj;
S33,判断Tmin≤单个部件的温度值≤Tmax,则将单个部件作为正常温度部件。
3.根据权利要求1所述的一种基于部件温度自动分配计算资源的降功耗方法,其特征在于,所述步骤S4中将高温部件Ai的10%计算资源分配给低温部件Bj的方法为:
S41,将I个高温部件的温度从高到低排序为A1,A2,A3,…,Ai,…,AI;
S42,将J个低温部件的温度从低到高排序为B1,B2,B3,…,Bj,…,BJ;
S43,如果I>J,则高温部件取A1,A2,A3,…,Aj,…,AJ,低温部件取B1,B2,B3,…,Bj,…,BJ,按照步骤S45将高温部件的10%计算资源分配给低温部件;
S44,如果I<J,则高温部件取A1,A2,A3,…,Ai,…,AI,低温部件取B1,B2,B3,…,Bi,…,BI,按照步骤S45将高温部件的10%计算资源分配给低温部件;
S45,如果I=J,则将
高温部件A1的10%计算资源分配给低温部件B1,
高温部件A2的10%计算资源分配给低温部件B2,
高温部件A3的10%计算资源分配给低温部件B3,
…,
高温部件Ai的10%计算资源分配给低温部件Bj;
…,
高温部件AI的10%计算资源分配给低温部件BJ。
4.根据权利要求1所述的一种基于部件温度自动分配计算资源的降功耗方法,其特征在于,所述方法中同类部件为CPU、GPU或PCIE,N≥2。
5.根据权利要求1所述的一种基于部件温度自动分配计算资源的降功耗方法,其特征在于,所述方法的周期为1min。
6.一种基于部件温度自动分配计算资源的降功耗系统,其特征在于,所述系统包括:
数据采集单元,用于获取N个同类部件在当前采样时刻的温度值;
数据计算单元,用于计算当前采样时刻同类部件的平均温度值T,确定温度上限阈值Tmax和温度下限阈值Tmin,所述温度上限阈值Tmax=T+3℃,所述温度下限阈值Tmin=T-3℃;
数据判断单元,用于判断高温部件Ai、低温部件Bj和正常温度部件Ck,设定i为高温部件的序号,共I个高温部件,j为低温部件的序号,共J个高温部件,k为正常温度部件的序号,共K个高温部件,0≤i≤I,0≤j≤J,0≤k≤K,I+J+K=N;
数据分配单元,用于将高温部件Ai的10%计算资源分配给低温部件Bj,分配后各部件持续运行一个周期;
数据循环单元,用于数据分配单元执行完任务后跳转至数据采集单元。
7.根据权利要求6所述的一种基于部件温度自动分配计算资源的降功耗系统,其特征在于,所述数据判断单元包括:
高温部件判断模块,用于判断单个部件的温度值是否>Tmax,如果是,则将单个部件作为高温部件Ai;
低温部件判断模块,用于单个部件的温度值≤Tmax时,判断单个部件的温度值是否<Tmin,如果是,则将单个部件作为低温部件Bj;
正常温度部件判断模块,用于判断是否是Tmin≤单个部件的温度值≤Tmax,如果是,则将单个部件作为正常温度部件。
8.根据权利要求6所述的一种基于部件温度自动分配计算资源的降功耗系统,其特征在于,所述数据分配单元包括:
第一排序模块,用于将I个高温部件的温度从高到低排序为A1,A2,A3,…,Ai,…,AI;
第二排序模块,用于将J个低温部件的温度从低到高排序为B1,B2,B3,…,Bj,…,BJ;
高低温部件比对模块,用于比对高温部件的数量I和低温部件的数量J,
如果I>J,则高温部件取A1,A2,A3,…,Aj,…,AJ,低温部件取B1,B2,B3,…,Bj,…,BJ,按照数据分配模块执行计算资源分配任务,
如果I<J,则高温部件取A1,A2,A3,…,Ai,…,AI,低温部件取B1,B2,B3,…,Bi,…,BI,按照数据分配模块执行计算资源分配任务;
数据分配模块,用于当I=J时,将
高温部件A1的10%计算资源分配给低温部件B1,
高温部件A2的10%计算资源分配给低温部件B2,
高温部件A3的10%计算资源分配给低温部件B3,
…,
高温部件Ai的10%计算资源分配给低温部件Bj;
…,
高温部件AI的10%计算资源分配给低温部件BJ。
CN201910921890.2A 2019-09-27 2019-09-27 一种基于部件温度自动分配计算资源的降功耗方法和系统 Pending CN110794949A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201910921890.2A CN110794949A (zh) 2019-09-27 2019-09-27 一种基于部件温度自动分配计算资源的降功耗方法和系统
PCT/CN2020/087163 WO2021057023A1 (zh) 2019-09-27 2020-04-27 一种基于部件温度自动分配计算资源的降功耗方法和系统
US17/764,422 US20220357786A1 (en) 2019-09-27 2020-04-27 Method and system for reducing power consumption by automatically allocating computing resources on the basis of component temperature

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910921890.2A CN110794949A (zh) 2019-09-27 2019-09-27 一种基于部件温度自动分配计算资源的降功耗方法和系统

Publications (1)

Publication Number Publication Date
CN110794949A true CN110794949A (zh) 2020-02-14

Family

ID=69439883

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910921890.2A Pending CN110794949A (zh) 2019-09-27 2019-09-27 一种基于部件温度自动分配计算资源的降功耗方法和系统

Country Status (3)

Country Link
US (1) US20220357786A1 (zh)
CN (1) CN110794949A (zh)
WO (1) WO2021057023A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021057023A1 (zh) * 2019-09-27 2021-04-01 苏州浪潮智能科技有限公司 一种基于部件温度自动分配计算资源的降功耗方法和系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11874754B1 (en) * 2023-06-01 2024-01-16 International Business Machines Corporation Mitigating temperature induced performance variation

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120271481A1 (en) * 2011-04-22 2012-10-25 Jon James Anderson Method and system for thermal load management in a portable computing device
CN106293914A (zh) * 2016-08-01 2017-01-04 深圳市金立通信设备有限公司 一种任务调度的方法及终端
CN107111518A (zh) * 2014-10-30 2017-08-29 高通股份有限公司 多核处理器的热缓解
CN109918195A (zh) * 2019-01-18 2019-06-21 华南理工大学 基于热感知动态任务迁移的众核系统处理器资源调度方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080005591A1 (en) * 2006-06-28 2008-01-03 Trautman Mark A Method, system, and apparatus for dynamic thermal management
JP2014044527A (ja) * 2012-08-24 2014-03-13 Canon Inc 情報処理装置及びその制御方法、並びに、そのプログラムと記憶媒体
CN103105923B (zh) * 2013-03-07 2015-05-27 鄂尔多斯市云泰互联科技有限公司 云计算中心的it业务节能调度方法及其系统
US20140344827A1 (en) * 2013-05-16 2014-11-20 Nvidia Corporation System, method, and computer program product for scheduling a task to be performed by at least one processor core
CN103486070B (zh) * 2013-09-24 2016-01-13 浪潮电子信息产业股份有限公司 一种优化功耗的风扇调控测试方法
JP2016071679A (ja) * 2014-09-30 2016-05-09 日本電信電話株式会社 サーバ稼動決定方法およびサーバ稼動決定システム
US20180253288A1 (en) * 2017-03-03 2018-09-06 Intel IP Corporation Dynamically predict and enhance energy efficiency
KR102603299B1 (ko) * 2017-12-08 2023-11-17 한국전자통신연구원 그래픽 처리 장치 및 이의 동작 방법
CN109324679A (zh) * 2018-09-21 2019-02-12 郑州云海信息技术有限公司 一种服务器能耗控制方法及装置
JP7146622B2 (ja) * 2018-12-26 2022-10-04 ルネサスエレクトロニクス株式会社 半導体装置、温度制御装置、及び方法
CN110794949A (zh) * 2019-09-27 2020-02-14 苏州浪潮智能科技有限公司 一种基于部件温度自动分配计算资源的降功耗方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120271481A1 (en) * 2011-04-22 2012-10-25 Jon James Anderson Method and system for thermal load management in a portable computing device
CN107111518A (zh) * 2014-10-30 2017-08-29 高通股份有限公司 多核处理器的热缓解
CN106293914A (zh) * 2016-08-01 2017-01-04 深圳市金立通信设备有限公司 一种任务调度的方法及终端
CN109918195A (zh) * 2019-01-18 2019-06-21 华南理工大学 基于热感知动态任务迁移的众核系统处理器资源调度方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021057023A1 (zh) * 2019-09-27 2021-04-01 苏州浪潮智能科技有限公司 一种基于部件温度自动分配计算资源的降功耗方法和系统

Also Published As

Publication number Publication date
US20220357786A1 (en) 2022-11-10
WO2021057023A1 (zh) 2021-04-01

Similar Documents

Publication Publication Date Title
US8219839B2 (en) Power distribution system and method thereof in which redundant power is collected only when power pool is below or equal to pool threshold
CN110196767B (zh) 服务资源控制方法、装置、设备和存储介质
US20160378570A1 (en) Techniques for Offloading Computational Tasks between Nodes
KR20120046232A (ko) 성능 민감도에 따른 연산 유닛들의 차별적 성능 변경
CN105528330A (zh) 负载均衡的方法、装置、丛集和众核处理器
CN105808328A (zh) 任务调度的方法、装置和系统
US11163352B2 (en) Multicore processor and method for dynamically adjusting a supply voltage and a clock speed
CN104503932A (zh) 多主板服务器主基板管理控制器仲裁方法及系统
CN107111349B (zh) 用于片上多核系统的驱动基于访问的资源的低功耗控制和管理
CN110794949A (zh) 一种基于部件温度自动分配计算资源的降功耗方法和系统
US20130080809A1 (en) Server system and power managing method thereof
CN112596892B (zh) 多节点边缘计算设备的数据交互方法和系统
CN111190739A (zh) 一种资源分配方法、装置、电子设备及存储介质
US10942850B2 (en) Performance telemetry aided processing scheme
CN107132903B (zh) 一种节能管理实现方法、装置及网络设备
US20180048559A1 (en) Apparatus assigning controller and apparatus assigning method
CN113961353A (zh) 一种ai任务的任务处理方法和分布式系统
WO2022052479A1 (zh) 一种功耗调控方法、装置、设备及可读存储介质
CN110825212B (zh) 节能调度方法及装置、计算机可存储介质
CN110008515B (zh) 一种可再生能源数据中心管理方法及装置
US11853111B2 (en) System and method for controlling electrical current supply in a multi-processor core system via instruction per cycle reduction
CN109144693B (zh) 一种功率自适应任务调度方法及系统
CN107341060B (zh) 一种虚拟机内存分配方法和装置
CN110806918A (zh) 基于深度学习神经网络的虚拟机运行方法和装置
CN112394803B (zh) 一种国产服务器功耗实时动态调节方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200214

RJ01 Rejection of invention patent application after publication