CN108052436A - 对fpga板卡进行管控的方法、装置、设备及存储介质 - Google Patents

对fpga板卡进行管控的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN108052436A
CN108052436A CN201711460518.3A CN201711460518A CN108052436A CN 108052436 A CN108052436 A CN 108052436A CN 201711460518 A CN201711460518 A CN 201711460518A CN 108052436 A CN108052436 A CN 108052436A
Authority
CN
China
Prior art keywords
given threshold
fpga boards
control
operation data
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711460518.3A
Other languages
English (en)
Inventor
刘伟
张德闪
阚宏伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201711460518.3A priority Critical patent/CN108052436A/zh
Publication of CN108052436A publication Critical patent/CN108052436A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3031Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a motherboard or an expansion card
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/325Display of status information by lamps or LED's
    • G06F11/326Display of status information by lamps or LED's for error or online/offline status
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种对FPGA板卡进行管控的方法,包括获取FPGA板卡的运行数据;判断运行数据是否大于第一设定阈值;如果是,则判断大于第一设定阈值的异常运行数据的变化率是否大于第二设定阈值;如果是,则控制电源断电,并报警提示。该方法,可以在FPGA板卡运行的过程中获取FPGA板卡的相关运行数据,当判断出获取的运行数据大于第一设定阈值,且大于第一设定阈值的异常运行数据的变化率大于第二设定阈值时,就及时控制电源断电并报警提示有关工作人员解决了传统的FPGA板卡报废率高的问题,能够降低FPGA板卡报废率。另外,本发明还公开了一种对FPGA板卡进行管控的装置、设备及存储介质,效果如上。

Description

对FPGA板卡进行管控的方法、装置、设备及存储介质
技术领域
本发明涉及计算机应用领域,特别涉及一种对FPGA板卡进行管控的方法、装置、设备及存储介质。
背景技术
当今社会,在信息呈现出爆炸式增长的同时,云计算随之兴起、大数据时代随之到来,海量数据的传输和存储是目前急需关注的问题,海量数据在传输过程中需要占用超大的带宽,严重影响了云计算数据中心中网络传输的性能。近期有企业相继发布了FPGA云服务器,通过FPGA云服务器可以对FPGA板卡进行硬件编程,可将网络传输的性能提升至通用CPU服务器的30倍以上,而只需支付相当于通用CPU约40%的费用。在图片检测中,通过FPGA板卡对深度学习模型的CNN算法进行加速后,FPGA板卡处理性能是通用CPU的4倍,单位成本是通用CPU的1/3。
但是目前并没有对FPGA板卡的运行状态进行管控,当FPGA板卡发生异常时,因无法及时对FPGA板卡进行相应的异常处理,进而导致FPGA板卡报废率高。
由此可见,如何克服当FPGA板卡发生异常时,因没有相应的管控系统,无法及时对FPGA板卡进行异常处理,进而导致的FPGA板卡报废率高的问题是本领域技术人员亟待解决的问题。
发明内容
本申请实施例提供了对FPGA板卡进行管控的方法、装置、设备及存储介质,以解决现有技术中当FPGA板卡发生异常时,因没有相应的管控系统,无法及时对FPGA板卡进行异常处理,进而导致的FPGA板卡报废率高的问题。
为解决上述技术问题,本发明提供了一种对FPGA板卡进行管控的方法,包括:
获取FPGA板卡的运行数据;
判断所述运行数据是否大于第一设定阈值;
如果是,则判断大于所述第一设定阈值的异常运行数据的变化率是否大于第二设定阈值;
如果是,则控制电源断电,并报警提示。
优选地,所述获取FPGA板卡的运行数据具体包括:
接收主机周期性发送的获取指令;
依据所述获取指令获取所述运行数据;
则对应的,当所述运行数据小于所述第一设定阈值时,将所述运行数据存储至指定寄存器。
优选地,所述获取FPGA板卡的运行数据具体包括:
预先设定访问逻辑;
依据所述访问逻辑实时获取所述运行数据;
则对应的,当所述运行数据小于所述第一设定阈值时,则继续依据所述访问逻辑实时获取所述运行数据。
优选地,所述运行数据具体包括所述FPGA板卡运行时的温度和/或功率。
优选地,当所述运行数据为所述温度时,所述判断所述运行数据是否大于第一设定阈值具体包括:
判断所述温度是否大于第一设定阈值;
如果是,则判断大于所述第一设定阈值的温度的变化率是否大于所述第二设定阈值;
如果是,则进入所述控制电源断电,并报警提示的步骤,如果否,则降低所述FPGA板卡的运行频率和/或控制风扇转动。
优选地,当所述运行数据为所述功率时,所述判断所述运行数据是否大于第一设定阈值具体包括:
判断所述功率是否大于第一设定阈值;
如果是,则判断大于所述第一设定阈值的功率的变化率是否大于所述第二设定阈值;
如果是,则进入所述控制电源断电,并报警提示的步骤,如果否,则降低所述FPGA板卡的运行频率,并点亮目标指示灯。
优选地,在所述控制电源断电,并报警提示之后,还包括:
记录所述异常运行数据。
为解决上述技术问题,本发明还提供了一种与对FPGA板卡进行管控的方法对应的装置,包括:
获取单元,用于获取FPGA板卡的运行数据;
第一判断单元,用于判断所述运行数据是否大于第一设定阈值,如果是,则触发第二判断单元;
所述第二判断单元,用于判断大于所述第一设定阈值的异常运行数据的变化率是否大于第二设定阈值,如果是,则触发控制单元;
所述控制单元,用于控制电源断电,并报警提示。
为解决上述技术问题,本发明还提供了一种与对FPGA板卡进行管控的方法对应的设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现上述任意一种所述对FPGA板卡进行管控的方法的步骤。
为解决上述技术问题,本发明还提供了一种与对FPGA板卡进行管控的方法对应的一种计算机可读存储介质。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行以实现上述任意一种所述对FPGA板卡进行管控的方法的步骤。
相比于现有技术,本发明所提供的一种对FPGA板卡进行管控的方法,包括获取FPGA板卡的运行数据;判断运行数据是否大于第一设定阈值;如果是,则判断大于第一设定阈值的异常运行数据的变化率是否大于第二设定阈值;如果是,则控制电源断电,并报警提示。由此可见,该方法,可以在FPGA板卡运行的过程中获取FPGA板卡的相关运行数据,当判断出获取的运行数据大于第一设定阈值,且大于第一设定阈值的异常运行数据的变化率大于第二设定阈值时,就及时控制电源断电并报警提示有关工作人员,解决了现有技术中因无法及时对FPGA板卡进行相应的异常处理,导致的FPGA板卡报废率高的问题,能够降低FPGA板卡报废率。另外,本发明还提供了一种对FPGA板卡进行管控的装置、设备及存储介质,效果如上。
附图说明
图1为本发明实施例所提供的一种对FPGA板卡进行管控的方法流程图;
图2为本发明实施例所提供的一种对FPGA板卡进行管控的装置组成示意图;
图3为本发明实施例所提供的一种对FPGA板卡进行管控的设备组成示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明的核心是提供一种对FPGA板卡进行管控的方法、装置、设备及存储介质,可以解决现有技术中当FPGA板卡发生异常时,因没有相应的管控系统,无法及时对FPGA板卡进行异常处理,进而导致的FPGA板卡报废率高的问题。
为了使本技术领域的人员更好地理解本发明的方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
图1为本发明实施例所提供的一种对FPGA板卡进行管控的方法流程图,如图1所示,该管控方法包括:
S101:获取FPGA板卡的运行数据。
获取FPGA板卡运行时的运行数据,在实际操作时,首先加载与FPGA板卡连接的板卡单片机,并对该板卡单片机进行初始化,然后通过I2C总线接口获取FPGA板卡运行时的运行数据。优选地,运行数据具体包括FPGA板卡运行时的温度和/或功率。
S102:判断运行数据是否大于第一设定阈值,如果是,则进入步骤S103。
当单片机获取到有关运行数据时,首先判断该运行数据是否大于第一设定阈值,如果获取的运行数据大于第一设定阈值,说明当前获取的运行数据是发生异常的异常运行数据,这时就需要执行步骤S103。
S103:判断大于第一设定阈值的异常运行数据的变化率是否大于第二设定阈值,如果是,则进入步骤S104。
当获取到的运行数据为大于第一设定阈值的异常运行数据时,接着判断该异常运行数据的变化率是否大于第二设定阈值,如果该异常运行数据的变化率大于第二设定阈值,则执行步骤S104。
S104:控制电源断电,并报警提示。
只要确定出获取到的运行数据是异常运行数据并且该异常运行数据的变化率大于第二设定阈值,就说明如果FPGA板卡继续工作,则很可能损坏FPGA板卡,所以此时需要及时控制电源断电并报警提示有关工作人员,以防损坏FPGA板卡。
需要说明的是,判断运行数据是否大于第一设定阈值以及判断异常运行数据的变化率是否大于第二设定阈值,其实就是判断获取的运行数据的有关数据值是否异常;其次,当有关数据值异常时确定该运行数据的异常程度,第一设定阈值和第二设定阈值的命名是根据习惯和喜好命名的,并没有其它特殊含义,第一设定阈值和第二设定阈值具体设定为多少合适,可根据实际情况和经验确定,本发明并不做限定,第一设定阈值和第二设定阈值的命名方式以及大小并不影响本申请实施例的实现。
本发明所提供的一种对FPGA板卡进行管控的方法,包括获取FPGA板卡的运行数据;判断运行数据是否大于第一设定阈值;如果是,则判断大于第一设定阈值的异常运行数据的变化率是否大于第二设定阈值;如果是,则控制电源断电,并报警提示。由此可见,该方法,可以在FPGA板卡运行的过程中获取FPGA板卡的相关运行数据,当判断出获取的运行数据大于第一设定阈值,且大于第一设定阈值的异常运行数据的变化率大于第二设定阈值时,就及时控制电源断电并报警提示有关工作人员,解决了现有技术中因无法及时对FPGA板卡进行相应的异常处理,导致的FPGA板卡报废率高的问题,能够降低FPGA板卡报废率。
在上述实施例的基础上,作为优选地实施方式,获取FPGA板卡的运行数据具体包括:
接收主机周期性发送的获取指令;
依据获取指令获取运行数据;
则对应的,当运行数据小于第一设定阈值时,将运行数据存储至指定寄存器。
在上述实施例的基础上,作为优选地实施方式,
获取FPGA板卡的运行数据具体包括:
预先设定访问逻辑;
依据访问逻辑实时获取运行数据;
则对应的,当运行数据小于第一设定阈值时,则继续依据访问逻辑实时获取运行数据。
获取FPGA板卡的运行数据,即可以通过主机发送相关指令获取,也可以通过与FPGA板卡连接的板卡单片机直接获取。
通过主机获取的具体过程为:首先主机周期性通过SMBUS接口发送获取指令至板卡单片机,当板卡单片机接收到相关获取指令之后,会解析该指令,并按该指令设定寄存器地址,同时读取相应寄存器中存储的FPGA板卡运行时产生的运行数据,当读取的运行数据大于第一设定阈值时,执行步骤S103,而当读取到的运行数据小于或等于第一设定阈值时,板卡单片机会将获取到的相关运行数据存储至设定的寄存器地址,最后由主机取回。通过主机获取运行数据其实就是通过主机主板BMC—SMBUS总线—FPGA板卡—板卡单片机,该过程以板卡单片机为核心处理芯片,实现对FPGA板卡加速平台的远程管理监控。
通过FPGA板卡连接的板卡单片机直接获取的具体过程为:板卡单片机按照预先设定的访问逻辑实时获取FPGA板卡的运行数据,当判断出获取到的运行数据大于第一设定阈值时,则执行步骤S103,而当获取的运行数据小于或等于第一设定阈值时,则重复执行依据访问逻辑实时获取运行数据的步骤,直到FPGA板卡停止运行。
优选地,通过主机获取FPGA板卡的运行数据和通过板卡单片机获取FPGA板卡的运行数据,这两个过程可以并行执行,并且。需要说明的是,获取FPGA板卡的运行数据的具体方式并不影响本申请实施例的实现。
在上述实施例的基础上,作为优选地实施方式,当运行数据为温度时,判断运行数据是否大于第一设定阈值具体包括:
判断温度是否大于第一设定阈值;
如果是,则判断大于第一设定阈值的温度的变化率是否大于第二设定阈值;
如果是,则进入控制电源断电,并报警提示的步骤,如果否,则降低FPGA板卡的运行频率和/或控制风扇转动。
当运行数据为温度时,FPGA板卡自带温度芯片,获取FPGA板卡运行时的温度,首先判断获取的温度是否大于第一设定阈值,如果大于第一设定阈值,则判断异常温度的变化率是否大于第二设定阈值,如果异常温度的变化率大于第二设定阈值,则立即控制电源断电,并报警提示,如果异常温度的变化率小于或等于第二设定阈值,则降低FPGA板卡的运行频率和/或控制风扇转动。需要说明的是,如果FPGA板卡的温度是由主机获取的,则当获取到的温度大于第一设定阈值且该温度的变化率大于第二设定阈值时,需要将异常情况上报至主机,主机接收到相关异常情况后,通过SMBUS接口发送“控制电源断电,并报警”的指令由板卡单片机执行。
例如,第一设定阈值为50℃,第二设定阈值为40℃/S,假如某一时刻获取到的温度为51℃,说明此时的温度是异常温度,需要继续判断该异常温度的变化率是否大于40℃/S,如果该异常温度的变化率为39℃/S,则说明异常温度的变化率在正常范围内,此时只需降低FPGA板卡的运行频率和/或控制风扇转动以达到降温目的即可,如果该异常温度的变化率为41℃/S,则说明异常温度的变化率超出正常范围,需要立即控制电源断电,并报警提示有关工作人员。
在上述实施例的基础上,作为优选地实施方式,当运行数据为功率时,判断运行数据是否大于第一设定阈值具体包括:
判断功率是否大于第一设定阈值;
如果是,则判断大于第一设定阈值的功率的变化率是否大于第二设定阈值;
如果是,则进入控制电源断电,并报警提示的步骤,如果否,则降低FPGA板卡的运行频率,并点亮目标指示灯。
当运行数据为功率时,FPGA板卡自带功率芯片,获取FPGA板卡运行时的功率,首先判断获取的功率是否大于第一设定阈值,如果大于第一设定阈值,则判断异常功率的变化率是否大于第二设定阈值,如果异常功率的变化率大于第二设定阈值,则立即控制电源断电,并报警提示,如果异常功率的变化率小于第二设定阈值,则降低FPGA板卡的运行频率并点亮与异常功率对应的指示灯。在实际操作时,可以通过获取FPGA板卡的电压和电流值间接获取FPGA板卡的功率。
为了方便后期有关工作人员对FPGA板卡运行时的异常运行数据进行处理分析,在上述实施例的基础上,作为优选地实施方式,在控制电源断电,并报警提示之后,还包括:记录异常运行数据。
上文中对于一种对FPGA板卡进行管控的方法的实施例进行了详细描述,基于上述实施例描述的对FPGA板卡进行管控的方法,本发明实施例还提供了一种与该方法对应的对FPGA板卡进行管控的装置。由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参照方法部分的实施例描述,这里不再详细赘述。
图2为本发明实施例所提供的一种对FPGA板卡进行管控的装置组成示意图,如图2所示,该装置包括:获取单元201,第一判断单元202,第二判断单元203,控制单元204。
获取单元201,用于获取FPGA板卡的运行数据;
第一判断单元202,用于判断运行数据是否大于第一设定阈值,如果是,则触发第二判断单元;
第二判断单元203,用于判断大于第一设定阈值的异常运行数据的变化率是否大于第二设定阈值,如果是,则触发控制单元;
控制单元204,用于控制电源断电,并报警提示。
本发明所提供的一种对FPGA板卡进行管控的装置,首先获取FPGA板卡的运行数据;然后判断运行数据是否大于第一设定阈值;如果是,则判断大于第一设定阈值的异常运行数据的变化率是否大于第二设定阈值;如果是,则控制电源断电,并报警提示。由此可见,该装置,可以在FPGA板卡运行的过程中获取FPGA板卡的相关运行数据,当判断出获取的运行数据大于第一设定阈值,且大于第一设定阈值的异常运行数据的变化率大于第二设定阈值时,就及时控制电源断电并报警提示有关工作人员,解决了现有技术中因无法及时对FPGA板卡进行相应的异常处理,导致的FPGA板卡报废率高的问题,能够降低FPGA板卡报废率。
上文中对于一种对FPGA板卡进行管控的方法的实施例进行了详细描述,基于上述实施例描述的对FPGA板卡进行管控的方法,本发明实施例还提供了一种与该方法对应的对FPGA板卡进行管控的设备。由于设备部分的实施例与方法部分的实施例相互对应,因此设备部分的实施例请参照方法部分的实施例描述,这里不再详细赘述。
图3为本发明实施例所提供的一种对FPGA板卡进行管控的设备组成示意图,如图3所示,该设备包括:存储器301,处理器302。
存储器301,用于存储计算机程序;
处理器302,用于执行计算机程序以实现上述任一实施例所提供的对FPGA板卡进行管控的方法的步骤。
本发明所提供的一种对FPGA板卡进行管控的设备,可以在FPGA板卡运行的过程中获取FPGA板卡的相关运行数据,当判断出获取的运行数据大于第一设定阈值,且大于第一设定阈值的异常运行数据的变化率大于第二设定阈值时,就及时控制电源断电并报警提示有关工作人员,解决了现有技术中因无法及时对FPGA板卡进行相应的异常处理,导致的FPGA板卡报废率高的问题,能够降低FPGA板卡报废率。
上文中对于一种对FPGA板卡进行管控的方法的实施例进行了详细描述,基于上述实施例描述的对FPGA板卡进行管控的方法,本发明实施例还提供了一种与该方法对应的一种计算机可读存储介质。由于一种计算机可读存储介质部分的实施例与方法部分的实施例相互对应,因此一种计算机可读存储介质部分的实施例请参照方法部分的实施例描述,这里不再详细赘述。
一种计算机可读存储介质计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行以实现上述任一实施例所提供的对FPGA板卡进行管控的方法的步骤。
本发明所提供的一种计算机可读存储介质,控制器可以读取可读存储介质中存储的程序,即可以实现上述任一实施例提供的对FPGA板卡进行管控的方法,可以解决现有技术中因无法及时对FPGA板卡进行相应的异常处理,导致的FPGA板卡报废率高的问题,降低FPGA板卡报废率。
以上对本发明所提供的对FPGA板卡进行管控的方法、装置、设备及存储介质进行了详细介绍。本文中运用几个实例对本发明的原理及实施方式进行了阐述,以上实施例的说明,只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制,本领域技术人员,在没有创造性劳动的前提下,对本发明所做出的修改、等同替换、改进等,均应包含在本申请中。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个操作与另一个操作区分开来,而不一定要求或者暗示这些实体或者操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”等类似词,使得包括一系列要素的单元、设备或系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种单元、设备或系统所固有的要素。

Claims (10)

1.一种对FPGA板卡进行管控的方法,其特征在于,包括:
获取FPGA板卡的运行数据;
判断所述运行数据是否大于第一设定阈值;
如果是,则判断大于所述第一设定阈值的异常运行数据的变化率是否大于第二设定阈值;
如果是,则控制电源断电,并报警提示。
2.根据权利要求1所述的对FPGA板卡进行管控的方法,其特征在于,所述获取FPGA板卡的运行数据具体包括:
接收主机周期性发送的获取指令;
依据所述获取指令获取所述运行数据;
则对应的,当所述运行数据小于所述第一设定阈值时,将所述运行数据存储至指定寄存器。
3.根据权利要求1所述的对FPGA板卡进行管控的方法,其特征在于,所述获取FPGA板卡的运行数据具体包括:
预先设定访问逻辑;
依据所述访问逻辑实时获取所述运行数据;
则对应的,当所述运行数据小于所述第一设定阈值时,则继续依据所述访问逻辑实时获取所述运行数据。
4.根据权利要求1所述的对FPGA板卡进行管控的方法,其特征在于,所述运行数据具体包括所述FPGA板卡运行时的温度和/或功率。
5.根据权利要求4所述的对FPGA板卡进行管控的方法,其特征在于,当所述运行数据为所述温度时,所述判断所述运行数据是否大于第一设定阈值具体包括:
判断所述温度是否大于第一设定阈值;
如果是,则判断大于所述第一设定阈值的温度的变化率是否大于所述第二设定阈值;
如果是,则进入所述控制电源断电,并报警提示的步骤,如果否,则降低所述FPGA板卡的运行频率和/或控制风扇转动。
6.根据权利要求4所述的对FPGA板卡进行管控的方法,其特征在于,
当所述运行数据为所述功率时,所述判断所述运行数据是否大于第一设定阈值具体包括:
判断所述功率是否大于第一设定阈值;
如果是,则判断大于所述第一设定阈值的功率的变化率是否大于所述第二设定阈值;
如果是,则进入所述控制电源断电,并报警提示的步骤,如果否,则降低所述FPGA板卡的运行频率,并点亮目标指示灯。
7.根据权利要求1所述的对FPGA板卡进行管控的方法,其特征在于,在所述控制电源断电,并报警提示之后,还包括:
记录所述异常运行数据。
8.一种对FPGA板卡进行管控的装置,其特征在于,包括:
获取单元,用于获取FPGA板卡的运行数据;
第一判断单元,用于判断所述运行数据是否大于第一设定阈值,如果是,则触发第二判断单元;
所述第二判断单元,用于判断大于所述第一设定阈值的异常运行数据的变化率是否大于第二设定阈值,如果是,则触发控制单元;
所述控制单元,用于控制电源断电,并报警提示。
9.一种对FPGA板卡进行管控的设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求1至7任意一项所述对FPGA板卡进行管控的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1至7任意一项所述对FPGA板卡进行管控的方法的步骤。
CN201711460518.3A 2017-12-28 2017-12-28 对fpga板卡进行管控的方法、装置、设备及存储介质 Pending CN108052436A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711460518.3A CN108052436A (zh) 2017-12-28 2017-12-28 对fpga板卡进行管控的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711460518.3A CN108052436A (zh) 2017-12-28 2017-12-28 对fpga板卡进行管控的方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN108052436A true CN108052436A (zh) 2018-05-18

Family

ID=62128710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711460518.3A Pending CN108052436A (zh) 2017-12-28 2017-12-28 对fpga板卡进行管控的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN108052436A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109781279A (zh) * 2019-02-28 2019-05-21 中车青岛四方机车车辆股份有限公司 列车轴箱温度监测方法及装置
CN111858241A (zh) * 2020-07-10 2020-10-30 浪潮电子信息产业股份有限公司 一种fpga云平台的监控方法、装置、设备及存储介质
CN113468021A (zh) * 2021-06-28 2021-10-01 阿波罗智联(北京)科技有限公司 监控性能数据的方法、装置、设备以及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793310A (zh) * 2014-02-20 2014-05-14 山东超越数控电子有限公司 一种服务器主板实时监控的方法
CN106126398A (zh) * 2016-06-22 2016-11-16 北京信安世纪科技有限公司 硬件设备的监控方法和装置
CN106598814A (zh) * 2016-12-26 2017-04-26 郑州云海信息技术有限公司 一种实现服务器系统过热保护的设计方法
CN106598807A (zh) * 2016-12-14 2017-04-26 郑州云海信息技术有限公司 一种板卡、一种主板和一种温度监控系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793310A (zh) * 2014-02-20 2014-05-14 山东超越数控电子有限公司 一种服务器主板实时监控的方法
CN106126398A (zh) * 2016-06-22 2016-11-16 北京信安世纪科技有限公司 硬件设备的监控方法和装置
CN106598807A (zh) * 2016-12-14 2017-04-26 郑州云海信息技术有限公司 一种板卡、一种主板和一种温度监控系统及方法
CN106598814A (zh) * 2016-12-26 2017-04-26 郑州云海信息技术有限公司 一种实现服务器系统过热保护的设计方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109781279A (zh) * 2019-02-28 2019-05-21 中车青岛四方机车车辆股份有限公司 列车轴箱温度监测方法及装置
CN109781279B (zh) * 2019-02-28 2021-02-09 中车青岛四方机车车辆股份有限公司 列车轴箱温度监测方法及装置
CN111858241A (zh) * 2020-07-10 2020-10-30 浪潮电子信息产业股份有限公司 一种fpga云平台的监控方法、装置、设备及存储介质
CN113468021A (zh) * 2021-06-28 2021-10-01 阿波罗智联(北京)科技有限公司 监控性能数据的方法、装置、设备以及存储介质
CN113468021B (zh) * 2021-06-28 2024-02-09 阿波罗智联(北京)科技有限公司 监控性能数据的方法、装置、设备以及存储介质

Similar Documents

Publication Publication Date Title
DE102015115533B4 (de) Vorrichtung, computerlesbare Speichermedien und Verfahren für eine Kontrollstrategie für eine Laufwerksanordnung
CN109086155A (zh) 服务器故障定位方法、装置、设备及计算机可读存储介质
CN102141942B (zh) 一种设备的监控保护方法及装置
EP4066180A1 (en) Method and apparatus for detecting fault, method and apparatus for training model, and device and storage medium
US20150106660A1 (en) Controller access to host memory
CN106339058A (zh) 动态管理电力供应的方法和系统
CN108052436A (zh) 对fpga板卡进行管控的方法、装置、设备及存储介质
US20120102580A1 (en) Out Of Band Vital Product Data Collection
CN103500133A (zh) 故障定位方法及装置
CN105404581B (zh) 一种数据库的评测方法和装置
CN112286709B (zh) 一种服务器硬件故障的诊断方法、诊断装置及诊断设备
CN110515802A (zh) 一种服务器开机故障的监测方法、系统及相关组件
US10013261B2 (en) Techniques for managing or controlling computing devices
CN112596568B (zh) 一种读取电压调节器报错信息的方法、系统、设备及介质
US20230275809A1 (en) Unobservable node identification
CN111625389B (zh) 一种vr的故障数据获取方法、装置及相关组件
CN112035285A (zh) 基于高通平台的硬件看门狗电路系统及其监控方法
CN102693180A (zh) 一种硬件状态的监测方法和系统
CN109185208A (zh) 一种风扇调速方法及相关装置
CN113900718B (zh) 一种bmc与bios资产信息的解耦方法、系统及装置
CN109976478B (zh) 多cpu散热控制系统和散热控制方法
CN111542048A (zh) 侦码设备采集功能重启方法、装置、服务器及存储介质
GB2497404A (en) Managing waste water of computing system
CN113703851B (zh) 服务器背板的配置方法、装置、系统、设备及存储介质
US20240126355A1 (en) Hyperscale power control for improved datacenter utilization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180518

RJ01 Rejection of invention patent application after publication