CN110362448A - 一种gpu管控方法及相关装置 - Google Patents

一种gpu管控方法及相关装置 Download PDF

Info

Publication number
CN110362448A
CN110362448A CN201910577579.0A CN201910577579A CN110362448A CN 110362448 A CN110362448 A CN 110362448A CN 201910577579 A CN201910577579 A CN 201910577579A CN 110362448 A CN110362448 A CN 110362448A
Authority
CN
China
Prior art keywords
gpu
running temperature
running
temperature
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910577579.0A
Other languages
English (en)
Inventor
韩增福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wave Intelligent Technology Co Ltd
Original Assignee
Suzhou Wave Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wave Intelligent Technology Co Ltd filed Critical Suzhou Wave Intelligent Technology Co Ltd
Priority to CN201910577579.0A priority Critical patent/CN110362448A/zh
Publication of CN110362448A publication Critical patent/CN110362448A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Power Sources (AREA)

Abstract

本申请公开了一种GPU管控方法,包括获取GPU的运行温度;将所述运行温度与预设温度阈值进行比较,判断所述运行温度是否超出所述预设温度阈值;若所述运行温度超出所述预设温度阈值,则向所述GPU发送控制指令以降低所述GPU的所述运行温度。该GPU管控方法与原有GPU内部保护机制共同作用,可为GPU提供双重保护,尤其在GPU内部保护机制不透明的情况下,该GPU管控方法能够有效实现对GPU的保护,保持GPU的运行稳定性以及延长GPU的使用寿命。本申请还公开了一种GPU管控装置、基板管理控制器以及计算机可读存储介质,均具有上述技术效果。

Description

一种GPU管控方法及相关装置
技术领域
本申请涉及计算机技术领域,特别涉及一种GPU管控方法;还涉及一种GPU管控装置、基板管理控制器以及计算机可读存储介质。
背景技术
GPU即图形处理单元,又名显示核心或显示芯片或视觉处理器,是一种用于图像运算的微处理器。目前,随着智能技术的发展,GPU被越来越多的应用于AI服务器。而作为AI服务器中的重要硬件,GPU的稳定运行及其使用寿命成为影响AI服务器性能的关键,由此,对GPU实施保护日益成为研究重点。
因此,如何提供一种GPU管控方法,实现对GPU的有效保护,保持GPU的运行稳定性以及延长GPU的使用寿命是本领域技术人员亟待解决的技术问题。
发明内容
本申请的目的是提供一种GPU管控方法,能够实现对GPU的有效保护,保持GPU的运行稳定性以及延长GPU的使用寿命;本申请的另一目的是提供一种GPU管控装置、基板管理控制器以及计算机可读存储介质,均具有上述技术效果。
为解决上述技术问题,本申请提供了一种GPU管控方法,包括:
获取GPU的运行温度;
将所述运行温度与预设温度阈值进行比较,判断所述运行温度是否超出所述预设温度阈值;
若所述运行温度超出所述预设温度阈值,则向所述GPU发送控制指令以降低所述GPU的所述运行温度。
可选的,所述获取GPU的运行温度,包括:
依据预设周期向所述GPU发送温度获取指令并接收所述GPU响应所述温度获取指令发送的所述运行温度。
可选的,所述向所述GPU发送控制指令以降低所述GPU的所述运行温度,包括:
向所述GPU发送掉电指令以触发所述GPU掉电。
可选的,所述向所述GPU发送控制指令以降低所述GPU的所述运行温度,包括:
向所述GPU发送降频指令以降低所述GPU的运行频率。
可选的,还包括:
降低所述GPU的运行频率和/或触发所述GPU掉电后记录相应的日志。
为解决上述技术问题,本申请还提供了一种GPU管控装置,包括:
运行温度获取模块,用于获取GPU的运行温度;
判断模块,用于将所述运行温度与预设温度阈值进行比较,判断所述运行温度是否超出所述预设温度阈值;
指令发送模块,若所述运行温度超出所述预设温度阈值,则向所述GPU发送控制指令以降低所述GPU的所述运行温度。
可选的,所述指令发送模块具体用于向所述GPU发送掉电指令以触发所述GPU掉电。
可选的,所述指令发送模块具体用于向所述GPU发送降频指令以降低所述GPU的运行频率。
为解决上述技术问题,本申请还提供了一种基板管理控制器,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述任一项所述的GPU管控方法的步骤。
为解决上述技术问题,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的GPU管控方法的步骤。
本申请所提供的GPU管控方法,包括获取GPU的运行温度;将所述运行温度与预设温度阈值进行比较,判断所述运行温度是否超出所述预设温度阈值;若所述运行温度超出所述预设温度阈值,则向所述GPU发送控制指令以降低所述GPU的所述运行温度。
可见,在GPU内部采取保护机制的基础上,本申请所提供的GPU管控方法,在GPU外部对GPU实施保护,即通过获取GPU的运行温度,并将GPU的运行温度与预设温度阈值进行比较,进而当GPU的运行温度超出预设温度阈值时向GPU发送控制指令以降低GPU的运行温度。该GPU管控方法与原有GPU内部保护机制共同作用,可为GPU提供双重保护,尤其在GPU内部保护机制不透明的情况下,本申请所提供的GPU管控方法能够有效实现对GPU的保护,保持GPU的运行稳定性以及延长GPU的使用寿命。
本申请所提供的GPU管控装置、基板管理控制器以及计算机可读存储介质,均具有上述技术效果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例所提供的一种GPU管控方法的流程示意图;
图2为本申请实施例所提供的另一种GPU管控方法的流程示意图;
图3为本申请实施例所提供的又一种GPU管控方法的流程示意图;
图4为本申请实施例所提供的再一种GPU管控方法的流程示意图;
图5为本申请实施例所提供的一种GPU管控装置的示意图。
具体实施方式
本申请的核心是提供一种GPU管控方法,能够实现对GPU的有效保护,保持GPU的运行稳定性以及延长GPU的使用寿命;本申请的另一核心是提供一种GPU管控装置、基板管理控制器以及计算机可读存储介质,均具有上述技术效果。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参考图1,图1为本申请实施例所提供的一种GPU管控方法的流程示意图;参考图1所示,该GPU管控方法包括:
S101:获取GPU的运行温度;
具体的,本申请采取外部管控GPU的方式对GPU实施保护,具体将BMC即基板管理控制器通过I2C总线与GPU互联,从而在GPU运行的过程中,BMC通过I2C总线获取GPU的运行温度,进而以此运行温度作为触发GPU掉电的判别依据。其中,对于BMC获取GPU的运行温度的具体方式,本申请不做唯一限定,可以根据实际应用需要进行差异性设置,例如,可以采取BMC主动获取GPU的运行温度的方式,或者还可以采取BMC被动接收GPU上报的运行温度的方式。
在一种具体的实施方式中,上述获取GPU的运行温度包括依据预设周期向GPU发送温度获取指令,并接收GPU响应温度获取指令发送的运行温度。
具体的,本实施例具体采用BMC主动获取GPU的运行温度的方式,即在GPU运行的过程中,BMC依据预设周期通过I2C总线主动向GPU发送温度获取指令,进而GPU接收该温度获取指令后,响应该温度获取指令并将当前的运行温度发送至BMC,使BMC完成该时刻运行温度的获取。同样,对于上述预设周期的具体数值,本申请不做唯一限定,结合实际需要进行相适应的设置即可,例如,可以设置为2秒,即BMC每间隔2秒便向GPU发送一次温度获取指令,完成一次运行温度的获取。
S102:将运行温度与预设温度阈值进行比较,判断运行温度是否超出所述预设温度阈值;
S103:若所述运行温度超出预设温度阈值,则向GPU发送控制指令以降低GPU的运行温度。
具体的,在获取GPU的运行温度的基础上,本步骤旨在进行温度对比,以确认是否对GPU进行降温操作,以对GPU实施保护。具体而言,BMC获取到GPU当前的运行温度后,进一步将此运行温度与预设温度阈值进行比较,通常该预设温度阈值可设置为GPU标准中指定的最高温度值,或者也可以将该预设温度阈值设置为低于GPU标准中指定的最高温度值的某个温度值,以避免GPU的运行温度达到其最高温度值,减少高温对GPU的损害。若GPU当前的运行温度超出预设温度阈值,则BMC可通过I2C总线向GPU发送控制指令,从而降低GPU的运行温度。
综上所述,在GPU内部采取保护机制的基础上,本申请所提供的GPU管控方法,在GPU外部对GPU实施保护,即通过获取GPU的运行温度,并将GPU的运行温度与预设温度阈值进行比较,进而当GPU的运行温度超出预设温度阈值时向GPU发送控制指令以降低GPU的运行温度。该GPU管控方法与原有GPU内部保护机制共同作用,可为GPU提供双重保护,尤其在GPU内部保护机制不透明的情况下,本申请所提供的GPU管控方法能够有效实现对GPU的保护,保持GPU的运行稳定性以及延长GPU的使用寿命。
请参考图2,图2为本申请实施例所提供的另一种GPU管控方法的流程示意图;结合图2,该GPU管控方法包括:
S201:获取GPU的运行温度;
S202:将运行温度与预设温度阈值进行比较,判断运行温度是否超出预设温度阈值;
S203:若运行温度超出预设温度阈值,则向GPU发送掉电指令以降低GPU的运行温度。
具体的,对于步骤S201与S202的具体阐述本申请在此不再赘述,参见上述实施例的相应描述即可,以下对步骤S203做具体展开:本实施例中,BMC向GPU发送控制指令以降低GPU的运行温度的方式为向GPU发送掉电指令,以触发GPU掉电,从而实现降低GPU的运行温度的目的。具体而言,当BMC比较GPU当前的运行温度与预设温度阈值得知GPU当前的运行温度超出预设温度阈值时,BMC可立即通过I2C总线向GPU发送掉电指令,如主动拉低BMC与GPU连接的PWR Brake引脚的电平,从而触发GPU掉电,以降低GPU的运行温度。
进一步,GPU掉电后的一段时间后,BMC还可再次向GPU发送上电指令,如拉高BMC与GPU连接的PWR Brake引脚的电平,以使GPU恢复运行。
本实施例所提供的GPU管控方法,通过获取GPU的运行温度,并将GPU的运行温度与预设温度阈值进行比较,进而当GPU的运行温度超出预设温度阈值时通过外部触发GPU掉电的方式对GPU实施保护,从而有效保持GPU的运行稳定性以及延长GPU的使用寿命。
请参考图3,图3为本申请实施例所提供的另一种GPU管控方法的流程示意图;参考图3所示,该GPU管控方法包括:
S301:获取GPU的运行温度;
S302:将运行温度与预设温度阈值进行比较,判断运行温度是否超出预设温度阈值;
S303:若运行温度超出预设温度阈值,则向GPU发送降频指令以降低GPU的运行频率。
具体的,对于步骤S301与S202的具体内容本申请同样在此不再赘述,参见上述实施例的相应描述即可,以下对步骤S303做具体阐述:本实施例中,BMC向GPU发送控制指令以降低GPU的运行温度的方式为向GPU发送降频指令,实现降低GPU的运行温度的目的。具体而言,当BMC比较GPU当前的运行温度与预设温度阈值得知GPU当前的运行温度超出预设温度阈值时,BMC可通过I2C总线向GPU发送降频指令,以使GPU接收此降频指令后进行降频操作,降低GPU的输出功率,达到降低运行温度的目的。
针对上述降低GPU的运行频率以降低GPU的运行温度的实施方式,进一步,还可设置多个温度基准值,即可以设置多个不同数值的上述预设温度阈值,且各预设温度阈值对应于不同的降频幅度。BMC在获取GPU的运行温度的基础上,可将获取的GPU当前的运行温度与各预设温度阈值进行比较,当GPU的运行温度达到其中某个预设温度阈值时,发送与此预设温度阈值对应的降频指令,以使GPU进行与此预设温度阈值相对应的幅度的降频操作。
进一步,在GPU降频并实现降低运行温度的目的的情况下,BMC还可在GPU的运行温度降至某一温度值时,向GPU发送升频指令,以恢复GPU的运行频率,保障GPU的运行效率。
本实施例所提供的GPU管控方法,通过获取GPU的运行温度,并将GPU的运行温度与预设温度阈值进行比较,进而当GPU的运行温度超出预设温度阈值时通过外部触发GPU降频的方式对GPU实施保护,从而有效保持GPU的运行稳定性以及延长GPU的使用寿命。
请参考图4,图4为本申请实施例所提供的另一种GPU管控方法的流程示意图,参考图4所示,该GPU管控方法包括:
S401:获取GPU的运行温度;
S402:将运行温度与预设温度阈值进行比较,判断运行温度是否超出预设温度阈值;
S403:若运行温度超出预设温度阈值,则向GPU发送降频指令以降低GPU的运行频率;
S404:GPU降低运行频率后判断GPU降低运行频率后运行温度是否超出预设温度阈值;
S405:若运行温度超出预设温度阈值,则向GPU发送掉电指令以触发GPU掉电。
具体的,对于步骤S401与S402参考上述实施例的相关描述即可,以下对步骤S403至S405进行具体的阐述:在获取GPU的运行温度,将运行温度与预设温度阈值进行比较,并判断GPU的运行温度超出预设温度阈值的情况下,本实施例首先采用外部管控GPU的方式,降低GPU的运行频率,从而减少GPU的输出功率,以达到降低GPU的运行温度的目的,并判断GPU降频后的运行温度是否依旧超出预设温度阈值,若运行温度超出预设温度阈值,则再对GPU进行掉电控制。具体而言,当判断GPU的运行温度超出预设温度阈值时,BMC可首先通过I2C总线向GPU发送降频指令,以使GPU接收并响应该降频指令,降低其运行频率。在GPU降低运行频率后,BMC可判断GPU降频运行后的一个或多个预设周期内的运行温度是否依然超出预设温度阈值。若GPU的运行温度仍然超出预设温度阈值,则进一步向GPU发送掉电指令,以触发GPU掉电。
其中,为进一步保障GPU的保护效果,可设置两个不同的预设温度阈值,其中一个的数值可设置为低于GPU的最高温度值,并以此作为是否进行降频操作的判别依据;另一个可设置为GPU的最高温度值,并以此作为是否进行掉电处理的判别依据。当GPU的运行温度达到前者温度时,首先进行降频处理。若GPU降频后,其温度任然进一步升高且达到后者温度,则此时进行掉电处理。
本实施例所提供的GPU管控方法,采用降频与掉电的双重控制方式,通过获取GPU的运行温度,并将GPU的运行温度与预设温度阈值进行比较,进而当GPU的运行温度超出预设温度阈值时首先通过外部触发GPU降频的方式对GPU实施保护,并在GPU降频后其运行温度依旧超出预设温度阈值的情况下,通过外部触发GPU掉电的方式对GPU实施保护,从而有效保持GPU的运行稳定性以及延长GPU的使用寿命。
进一步,在上述各实施例的基础上,该GPU管控方法还可以包括降低GPU的运行频率和/或触发GPU掉电后记录相应的日志。
具体的,本实施例中,BMC向GPU发送控制指令以降低GPU的运行频率和/或触发GPU掉电后,还可进行相应的日志记录,从而便于后续查看了解GPU的运行情况。
本申请还提供了一种GPU管控装置,下文描述的该装置可以与上文描述的方法相互对应参照。请参考图5,图5为本申请实施例所提供的一种控制装置的示意图;结合图5,该GPU管控装置包括:
运行温度获取模块10,用于获取GPU的运行温度;
判断模块20,用于将运行温度与预设温度阈值进行比较,判断运行温度是否超出预设温度阈值;
指令发送模块30,若运行温度超出预设温度阈值,则向GPU发送控制指令以降低GPU的运行温度。
在上述实施例的基础上,可选的,运行温度获取模块10包括:
发送单元,用于依据预设周期向GPU发送温度获取指令;
接收单元,用于接收GPU响应温度获取指令发送的运行温度。
在上述实施例的基础上,可选的,指令发送模块30具体用于向GPU发送掉电指令以触发GPU掉电。
在上述实施例的基础上,可选的,指令发送模块30具体用于向GPU发送降频指令以降低GPU的运行频率。
在上述实施例的基础上,可选的,还包括:
记录模块,用于降低GPU的运行频率和/或触发GPU掉电后记录相应的日志。
本申请还提供了一种基板管理控制器,该基板管理控制器包括:存储器与处理器;其中,存储器用于存储计算机程序;处理器用于执行该计算机程序时实现如下的步骤:
获取GPU的运行温度;将运行温度与预设温度阈值进行比较,判断运行温度是否超出预设温度阈值;若运行温度超出预设温度阈值,则向GPU发送控制指令以降低GPU的运行温度。
对于本申请所提供的文件系统的介绍请参照上述方法的实施例,本申请在此不做赘述。
本申请还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现如下的步骤:
获取GPU的运行温度;将运行温度与预设温度阈值进行比较,判断运行温度是否超出预设温度阈值;若运行温度超出预设温度阈值,则向GPU发送控制指令以降低GPU的运行温度。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
对于本发明所提供的计算机可读存储介质的介绍请参照上述方法实施例,本发明在此不做赘述。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、设备以及计算机可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦写可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的GPU管控方法、装置、基板管理控制器以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围。

Claims (10)

1.一种GPU管控方法,其特征在于,包括:
获取GPU的运行温度;
将所述运行温度与预设温度阈值进行比较,判断所述运行温度是否超出所述预设温度阈值;
若所述运行温度超出所述预设温度阈值,则向所述GPU发送控制指令以降低所述GPU的所述运行温度。
2.根据权利要求1所述的GPU管控方法,其特征在于,所述获取GPU的运行温度,包括:
依据预设周期向所述GPU发送温度获取指令并接收所述GPU响应所述温度获取指令发送的所述运行温度。
3.根据权利要求2所述的GPU管控方法,其特征在于,所述向所述GPU发送控制指令以降低所述GPU的所述运行温度,包括:
向所述GPU发送掉电指令以触发所述GPU掉电。
4.根据权利要求2所述的GPU管控方法,其特征在于,所述向所述GPU发送控制指令以降低所述GPU的所述运行温度,包括:
向所述GPU发送降频指令以降低所述GPU的运行频率。
5.根据权利要求4所述的GPU管控方法,其特征在于,还包括:
降低所述GPU的运行频率和/或触发所述GPU掉电后记录相应的日志。
6.一种GPU管控装置,其特征在于,包括:
运行温度获取模块,用于获取GPU的运行温度;
判断模块,用于将所述运行温度与预设温度阈值进行比较,判断所述运行温度是否超出所述预设温度阈值;
指令发送模块,若所述运行温度超出所述预设温度阈值,则向所述GPU发送控制指令以降低所述GPU的所述运行温度。
7.根据权利要求6所述的GPU管控装置,其特征在于,所述指令发送模块具体用于向所述GPU发送掉电指令以触发所述GPU掉电。
8.根据权利要求6所述的GPU管控装置,其特征在于,所述指令发送模块具体用于向所述GPU发送降频指令以降低所述GPU的运行频率。
9.一种基板管理控制器,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述的GPU管控方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的GPU管控方法的步骤。
CN201910577579.0A 2019-06-28 2019-06-28 一种gpu管控方法及相关装置 Withdrawn CN110362448A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910577579.0A CN110362448A (zh) 2019-06-28 2019-06-28 一种gpu管控方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910577579.0A CN110362448A (zh) 2019-06-28 2019-06-28 一种gpu管控方法及相关装置

Publications (1)

Publication Number Publication Date
CN110362448A true CN110362448A (zh) 2019-10-22

Family

ID=68217351

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910577579.0A Withdrawn CN110362448A (zh) 2019-06-28 2019-06-28 一种gpu管控方法及相关装置

Country Status (1)

Country Link
CN (1) CN110362448A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111968684A (zh) * 2020-09-01 2020-11-20 深圳大普微电子科技有限公司 一种存储器的温控方法、装置、设备及存储介质
CN115981448A (zh) * 2022-12-23 2023-04-18 摩尔线程智能科技(北京)有限责任公司 Gpu的功耗控制方法、装置、设备、介质和程序产品

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111968684A (zh) * 2020-09-01 2020-11-20 深圳大普微电子科技有限公司 一种存储器的温控方法、装置、设备及存储介质
CN115981448A (zh) * 2022-12-23 2023-04-18 摩尔线程智能科技(北京)有限责任公司 Gpu的功耗控制方法、装置、设备、介质和程序产品

Similar Documents

Publication Publication Date Title
US11301029B2 (en) Method, apparatus, and system for allocating power to graphics processing unit
CN106502814B (zh) 一种记录pcie设备错误信息的方法及装置
CN106371807B (zh) 一种扩展处理器指令集的方法及装置
CN108563493A (zh) 一种事件驱动方法、装置、设备及可读存储介质
CN108304295A (zh) 一种控制gpu降频的方法、装置和计算机可读存储介质
US10890960B2 (en) Method and apparatus for limiting rack power consumption
CN110941325B (zh) 处理器的调频方法及装置、计算设备
CN103902399B (zh) 软件系统修复处理方法及装置
US20170269984A1 (en) Systems and methods for improved detection of processor hang and improved recovery from processor hang in a computing device
CN110362448A (zh) 一种gpu管控方法及相关装置
CN107967195A (zh) 一种基于双控存储的故障修复方法及系统
CN109766248A (zh) 系统故障信号获取方法、装置、服务器及可读存储介质
CN113660173B (zh) 一种流量控制方法、装置、计算机设备及存储介质
CN104462940A (zh) 计算机usb接口的监控方法和装置
CN105739668A (zh) 一种笔记本电脑的电源管理方法及电源管理系统
CN104991822A (zh) 一种管理内存的方法和装置
CN114253683B (zh) 任务处理方法、装置、电子设备及存储介质
CN113360344B (zh) 一种服务器监控方法、装置、设备及计算机可读存储介质
CN118244989A (zh) 一种日志处理方法、装置、设备及可读存储介质
CN110147254A (zh) 一种数据缓存处理方法、装置、设备及可读存储介质
CN109901664A (zh) 提供时钟信号的方法、装置、系统、设备及可读存储介质
CN107590100B (zh) 一种多核处理器的核间数据交互方法
CN112987891A (zh) 专用网卡过热保护的方法、电子设备及机器可读存储介质
US11269521B2 (en) Method, device and computer program product for processing disk unavailability states
CN103294169B (zh) 一种功耗优化的众核系统的冗余保护系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20191022

WW01 Invention patent application withdrawn after publication