CN110399220A - 一种fpga加速卡的管理方法及相关装置 - Google Patents
一种fpga加速卡的管理方法及相关装置 Download PDFInfo
- Publication number
- CN110399220A CN110399220A CN201910656873.0A CN201910656873A CN110399220A CN 110399220 A CN110399220 A CN 110399220A CN 201910656873 A CN201910656873 A CN 201910656873A CN 110399220 A CN110399220 A CN 110399220A
- Authority
- CN
- China
- Prior art keywords
- accelerator card
- monitoring data
- monitoring
- data
- fpga accelerator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007726 management method Methods 0.000 title claims abstract description 89
- 238000012544 monitoring process Methods 0.000 claims abstract description 139
- 230000005540 biological transmission Effects 0.000 claims abstract description 16
- 238000000034 method Methods 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 15
- 238000005538 encapsulation Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 230000005856 abnormality Effects 0.000 claims description 7
- 238000004806 packaging method and process Methods 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 239000011111 cardboard Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000009975 flexible effect Effects 0.000 description 1
- 239000000976 ink Substances 0.000 description 1
- 208000020442 loss of weight Diseases 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3089—Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本申请公开了一种FPGA加速卡的管理方法,包括:板卡BMC通过总线模块对FPGA加速卡的传感器进行信息采集,得到监控数据;通过USB接口将所述监控数据发送至上位机,以便所述上位机根据接收到的监控数据执行监控管理操作,得到并发送操作数据;根据接收到的操作数据对所述FPGA加速卡执行操作,以便实现对所述FPGA加速卡进行管理。通过板卡BMC先收集到监控数据,然后通过USB接口向上位机发送数据,而不是采用专用的接口进行数据传输,降低了监控管理的难度和实现成本。本申请还公开了一种FPGA加速卡的管理系统、服务器的机箱管理装置以及计算机可读存储介质,具有以上有益效果。
Description
技术领域
本申请涉及服务器设备管理技术领域,特别涉及一种FPGA加速卡的管理方法、管理系统、服务器的机箱管理装置以及计算机可读存储介质。
背景技术
在大数据时代,服务器处理的数据量不断增加。为了保证数据处理效率,通常采用异构计算的架构保持数据处理的实时性。其中,异构计算的架构是指通过FPGA(Field-Programmable Gate Array现场可编程门阵列)加速卡将CPU(Central Processing Unit,中央处理器)中的大量并行数据放置在FPGA中进行处理,CPU负责进行调度和控制,可以满足大量数据处理的要求,同时FPGA的低延迟、低能耗比、高性价比和灵活性使得FPGA在数据中心得到广泛的应用。
目前,在应用FPGA板卡的过程中需要对FPGA加速卡进行监控管理。由于,对FPGA加速卡进行监控管理并不是通用标准,并且各个服务器内部的监控管理标准并不唯一,需要对FPGA加速卡进行监控管理时,则需要对待部署的服务器进行额外的开发以便实现对FPGA加速卡进行监控。但是,额外的开发包括硬件的重新设计以及软件层面的新功能添加,增加部署的成本和难度。
因此,如何降低实现对FPGA加速卡进行监控管理的难度是本领域技术人员关注的重点问题。
发明内容
本申请的目的是提供一种FPGA加速卡的管理方法、管理系统、服务器的机箱管理装置以及计算机可读存储介质,通过板卡BMC(Baseboard Management Controller,基板管理控制器)先收集到监控数据,然后通过USB接口向上位机发送数据,而不是采用专用的接口进行数据传输,降低了监控管理的难度和实现成本。
为解决上述技术问题,本申请提供一种FPGA加速卡的管理方法,包括:
板卡BMC通过总线模块对FPGA加速卡的传感器进行信息采集,得到监控数据;
通过USB接口将所述监控数据发送至上位机,以便所述上位机根据接收到的监控数据执行监控管理操作,得到并发送操作数据;
根据接收到的操作数据对所述FPGA加速卡执行操作,以便实现对所述FPGA加速卡进行管理。
可选的,板卡BMC通过总线模块对FPGA加速卡的传感器进行信息采集,得到监控数据,包括:
所述板卡BMC通过所述总线模块按照预设频率对所述FPGA加速卡的传感器进行信息采集,得到所述监控数据。
可选的,通过USB接口将所述监控数据发送至上位机,包括:
根据USB协议将所述监控数据进行封装处理,得到USB封装监控数据;
将所述USB封装监控数据发送至所述上位机。
可选的,所述上位机根据接收到的监控数据执行监控管理操作,得到并发送操作数据,包括:
所述上位机根据所述监控数据判断所述FPGA加速卡是否出现异常情况;
若是,则根据监控数据进行异常处理,得到处理指令,将所述处理指令作为所述操作数据;
若否,则将正常指令作为所述操作数据;
将所述操作数据发送至所述板卡BMC中。
可选的,还包括:
所述上位机将所述监控数据记录为工作日志,并将所述工作日志进行保存。
本申请还提供一种FPGA加速卡的管理系统,包括:
监控数据获取模块,用于通过总线模块对FPGA加速卡的传感器进行信息采集,得到监控数据;
监控数据发送模块,用于通过USB接口将所述监控数据发送至上位机,以便所述上位机根据接收到的监控数据执行监控管理操作,得到并发送操作数据;
FPGA加速卡控制模块,用于根据接收到的操作数据对所述FPGA加速卡执行操作,以便实现对所述FPGA加速卡进行管理。
可选的,所述监控数据获取模块具体用于通过所述总线模块按照预设频率对所述FPGA加速卡的传感器进行信息采集,得到所述监控数据。
可选的,所述监控数据发送模块,包括:
数据封装单元,用于根据USB协议将所述监控数据进行封装处理,得到USB封装监控数据;
数据发送单元,用于将所述USB封装监控数据发送至所述上位机。
本申请还提供一种服务器的机箱管理装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上所述的管理方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的管理方法的步骤。
本申请所提供的一种FPGA加速卡的管理方法,包括:板卡BMC通过总线模块对FPGA加速卡的传感器进行信息采集,得到监控数据;通过USB接口将所述监控数据发送至上位机,以便所述上位机根据接收到的监控数据执行监控管理操作,得到并发送操作数据;根据接收到的操作数据对所述FPGA加速卡执行操作,以便实现对所述FPGA加速卡进行管理。
通过板卡BMC先获取到用于监控FPGA加速卡的监控数据,然后再采用USB接口向上位机发送监控数据,由于避免采用专用接口,降低了数据传输的成本和难度,提高了FPGA加速卡的通用性,并且也避免了对FPGA设立多余的监控程序,保证FPGA芯片的最大可用性,提高对FPGA加速卡进行监控和管理的灵活性,提高用户体验。
本申请还提供一种FPGA加速卡的管理系统、服务器的机箱管理装置以及计算机可读存储介质,具有以上有益效果,在此不作赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例所提供的第一种FPGA加速卡的管理方法的流程图;
图2为本申请实施例所提供的第二种FPGA加速卡的管理方法的流程图;
图3为本申请实施例所提供的一种FPGA加速卡的管理系统的结构示意图。
具体实施方式
本申请的核心是提供一种FPGA加速卡的管理方法、管理系统、服务器的机箱管理装置以及计算机可读存储介质,通过板卡BMC先收集到监控数据,然后通过USB接口向上位机发送数据,而不是采用专用的接口进行数据传输,降低了监控管理的难度和实现成本。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
现有技术中,在应用FPGA板卡的过程中需要对FPGA加速卡进行监控管理。由于,对FPGA加速卡进行监控管理并不是通用标准,并且各个服务器内部的监控管理标准并不唯一,需要对FPGA加速卡进行监控管理时,则需要对待部署的服务器进行额外的开发以便实现对FPGA加速卡进行监控。但是,额外的开发包括硬件的重新设计以及软件层面的新功能添加,增加部署的成本和难度。
因此,本申请提供一种FPGA加速卡的管理方法,通过板卡BMC先获取到用于监控FPGA加速卡的监控数据,然后再采用USB接口向上位机发送监控数据,由于避免采用专用接口,降低了数据传输的成本和难度,提高了FPGA加速卡的通用性,并且也避免了对FPGA设立多余的监控程序,保证FPGA芯片的最大可用性,提高对FPGA加速卡进行监控和管理的灵活性,提高用户体验。
请参考图1,图1为本申请实施例所提供的第一种FPGA加速卡的管理方法的流程图。
本实施例中,该方法可以包括:
S101,板卡BMC通过总线模块对FPGA加速卡的传感器进行信息采集,得到监控数据;
本步骤主要是获取到监控数据。在一般的场景中,对于服务器安装的板卡都是通过板卡自身的芯片或者处理装置获取到监控数据。但是,由于FPGA应用范围广泛,在不同的应用中FPGA芯片刷写有不同的应用程序,不同的应用程序之间相差巨大。因此,一般在FPGA芯片中不固化专有的监控程序,因此,现有技术中一般需要针对FPGA加速卡单独开发配套的监控程序,并为FPGA设定专用的接口用于传输相关信息。但是,由于FPGA的类型多种多样,针对不同的FPGA加速卡就需要设定对应的程序,会提高监控成本和难度,不利于广泛使用。
因此,本步骤中采用板卡BMC进行信息采集,也就是采用外围电路对FPGA加速卡的传感器进行信息采集。避免影响FPGA芯片,保证FPGA芯片的可用度,同时,板卡BMC外围电路可以通过通用接口进行数据传输,降低监控的成本和难度。
其中,总线模块指的是连接各个传感器和FPGA芯片的模块,通过总线模块板卡BMC可以获取到连接设备的信息。
可选的,本步骤可以包括:
板卡BMC通过总线模块按照预设频率对FPGA加速卡的传感器进行信息采集,得到监控数据。
可见,本实施例中是板卡BMC通过总线模块按照预设频率进行信息采集。其中,预设频率可以根据经验设定,还可以根据传感器参数进行设定,具体的在此不做限定。
S102,通过USB接口将监控数据发送至上位机,以便上位机根据接收到的监控数据执行监控管理操作,得到并发送操作数据;
在S101的基础上,本步骤旨在将监控数据发送至上位机。由于本实施例采用了板卡BMC获取到FPGA加速卡的监控数据,因此只需要通过板卡BMC上的通用的USB(UniversalSerial Bus,通用串行总线)接口向上位机传输数据即可,避免对FPGA安装新的接口,降低实现监控的难度和成本。
具体的,本实施例中采用USB传输数据的方法可以采用现有技术提供的任意一种USB数据传输方法,在此不做限定。
可选的,本步骤可以包括:
步骤一,根据USB协议将监控数据进行封装处理,得到USB封装监控数据;
步骤二,将USB封装监控数据发送至上位机。
可见,本可选方案主要是对如何通过USB接口进行数据传输做进一步说明。
S103,根据接收到的操作数据对FPGA加速卡执行操作,以便实现对FPGA加速卡进行管理。
在S102的基础上,本步骤旨在通过接收到的操作数据对FPGA加速卡进行管理操作,实现管理。例如,限定FPGA芯片的功耗,对FPGA芯片的电源进行管理,提高FPGA芯片的功率等。
此外,本实施例还可以包括:上位机将监控数据记录为工作日志,并将工作日志进行保存。
综上,本实施例通过板卡BMC先获取到用于监控FPGA加速卡的监控数据,然后再采用USB接口向上位机发送监控数据,由于避免采用专用接口,降低了数据传输的成本和难度,提高了FPGA加速卡的通用性,并且也避免了对FPGA设立多余的监控程序,保证FPGA芯片的最大可用性,提高对FPGA加速卡进行监控和管理的灵活性,提高用户体验。
以下通过一个实施例,对本申请提供的一种FPGA加速卡的管理方法做进一步说明。
请参考图2,图2为本申请实施例所提供的第二种FPGA加速卡的管理方法的流程图。
本实施例中,该方法可以包括:
S201,板卡BMC通过总线模块对FPGA加速卡的传感器进行信息采集,得到监控数据;
S202,通过USB接口将监控数据发送至上位机;
S203,上位机根据监控数据判断FPGA加速卡是否出现异常情况;若是,则执行S204;若否,则执行S205;
S204,根据监控数据进行异常处理,得到处理指令,将处理指令作为操作数据;
S205,将正常指令作为操作数据;
S206,将操作数据发送至板卡BMC中;
S207,板卡BMC根据接收到的操作数据对FPGA加速卡执行操作,以便实现对FPGA加速卡进行管理。
可见,本实施例中主要是对上位机接收到监控数据后的操作做进一步说明。也就是根据监控数据判断FPGA加速卡是否出现异常情况,具体的是对监控数据进行阈值判定和状态预测,根据判定结果和预测结果确定是否出现异常情况,或者是否将要出现异常情况。若是,则执行对应的处理得到处理指令,若否,则判定为正常情况,发送正常指令。其中,可以根据阈值判定的结果和状态预测的结果进行异常处理,得到处理指令。实现对FPGA加速卡的监控和管理,避免FPGA加速卡出现异常情况,并对异常情况进行及时的处理,避免更严重的损失。
可见,本实施例通过板卡BMC先获取到用于监控FPGA加速卡的监控数据,然后再采用USB接口向上位机发送监控数据,由于避免采用专用接口,降低了数据传输的成本和难度,提高了FPGA加速卡的通用性,并且也避免了对FPGA设立多余的监控程序,保证FPGA芯片的最大可用性,提高对FPGA加速卡进行监控和管理的灵活性,提高用户体验。
以下通过一个更具体的实施例,对本申请提供的一种FPGA加速卡的管理方法做进一步说明。
一种实施例:
本实施例中的FPGA加速卡与上位机数据接口为USB接口,板卡端板卡BMC芯片连接板卡所有模块,包括电源模块、光模块、温度模块、时钟模块、DDR和FPGA芯片,负责对板卡运行状态进行信息采集、数据上传和控制指令执行,上位机端监控管理软件负责板卡运行状态监测、控制指令下发。
本实施例中监控管理方案以板卡BMC芯片为主,独立于FPGA加速卡的业务数据接口,即PCIe接口和光口,与FPGA加速业务并行且互不干扰,不受业务运行影响。FPGA加速卡开机上电,板卡BMC芯片加载固件后按一定频率对板卡信息各模块传感器信息进行采集,并等待上位机指令;上位机按照数据中心监控管理要求通过USB接口对板卡BMC芯片下发指令,接收数据,完成数据中心对FPGA加速卡板卡的监控管理。整个监控管理数据链路为:OS板卡监控管理软件到USB总线到FPGA加速卡的板卡BMC芯片,实现对板卡运行过程中温度、功耗等状态信息的监测、预警,对板卡SN、PN、MAC等基本信息的获取和显示,同时配合上位机软件完成对板卡的管理控制功能。
本实施例中FPGA加速平台的板卡BMC芯片作为板卡端监控管理功能承载芯片,在板卡端通过通用2线总线(IIC)连接到板卡各个模块,芯片程序开发实现IIC协议、USB协议,通过IIC总线采集板卡信息,通过USB总线与上位机通信。
在整个方案中Card-板卡BMC芯片作为板卡端监控管理功能承载芯片,实现IIC协议、USB协议、数据收发模块、控制模块;通过IIC总线获取板卡基本信息和工作状态,通过USB总线完成与上位机的通信,控制模块完成对时钟模块初始化、电源模块上/下电管理、光模块初始化、异常告警和处理等控制。
进一步的,本实施例中进行监控管理的大致流程为板卡BMC芯片开机上电,加载固件完成初始化,然后依次对板卡其他需要控制初始化的模块进行初始化设置,完成后板卡BMC芯片主程序启动按照设定频率对板卡信息进行采集,等待上位机指令;上位机监控管理软件开启后按照设定频率下发指令获取板卡BMC芯片的采集信息,对板卡状态信息进行显示和监测,对于监测到的异常信息进行处理,等待数据中心管理人员下发操作指令。
具体的,该监控管理方案的步骤如下:
步骤1,板卡上电,板卡BMC芯片初始化;
步骤2,板卡BMC芯片对需要特定初始化模块(光模块、时钟模块)进行配置和初始化;
步骤3,板卡BMC芯片IIC模块按照设定频率采集板卡各传感器信息;
步骤4,板卡BMC芯片进入主循环等待上位机指令;
步骤5,数据中心上位机监控管理软件通过USB接口发送读取指令到板卡BMC,板卡BMC根据上位机指令将指定信息上报;
步骤6,数据中心上位机监控管理软件对接收到的板卡信息处理;
步骤7,对部分信息进行显示,同时通过阈值判定和状态预测等对板卡运行状态进行判定,若判定出现异常进行异常处理,对板卡发送处理指令,若判定运行状态正常继续按照设定频率获取板卡数据,更新显示;
步骤8,板卡端接收上位机指令,进行数据上报或者异常处理,将结果反馈到上位机;
步骤9,上位机端完成监控管理并记录工作日志,进行保存存档。
其中,板卡BMC芯片完成对板卡信息采集和管理指令执行,通过USB接口数据上传数据中心上位机,上位机软件端完成信息处理,记录日志,完成监控管理保障数据中心FPGA加速卡运行。
可见,本实施例通过板卡BMC先获取到用于监控FPGA加速卡的监控数据,然后再采用USB接口向上位机发送监控数据,由于避免采用专用接口,降低了数据传输的成本和难度,提高了FPGA加速卡的通用性,并且也避免了对FPGA设立多余的监控程序,保证FPGA芯片的最大可用性,提高对FPGA加速卡进行监控和管理的灵活性,提高用户体验。
下面对本申请实施例提供的一种FPGA加速卡的管理系统进行介绍,下文描述的一种FPGA加速卡的管理系统与上文描述的一种FPGA加速卡的管理方法可相互对应参照。
请参考图3,图3为本申请实施例所提供的一种FPGA加速卡的管理系统的结构示意图。
本实施例中,该系统可以包括:
监控数据获取模块100,用于通过总线模块对FPGA加速卡的传感器进行信息采集,得到监控数据;
监控数据发送模块200,用于通过USB接口将监控数据发送至上位机,以便上位机根据接收到的监控数据执行监控管理操作,得到并发送操作数据;
FPGA加速卡控制模块300,用于根据接收到的操作数据对FPGA加速卡执行操作,以便实现对FPGA加速卡进行管理。
可选的,该监控数据获取模块100具体用于通过总线模块按照预设频率对FPGA加速卡的传感器进行信息采集,得到监控数据。
可选的,该监控数据发送模块200,可以包括:
数据封装单元,用于根据USB协议将监控数据进行封装处理,得到USB封装监控数据;
数据发送单元,用于将USB封装监控数据发送至上位机。
本申请实施例还提供一种服务器的机箱管理装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如以上实施例所述的管理方法的步骤。
本申请实施例还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如以上实施例所述的管理方法的步骤。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的一种FPGA加速卡的管理方法、管理系统、服务器的机箱管理装置以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
Claims (10)
1.一种FPGA加速卡的管理方法,其特征在于,包括:
板卡BMC通过总线模块对FPGA加速卡的传感器进行信息采集,得到监控数据;
通过USB接口将所述监控数据发送至上位机,以便所述上位机根据接收到的监控数据执行监控管理操作,得到并发送操作数据;
根据接收到的操作数据对所述FPGA加速卡执行操作,以便实现对所述FPGA加速卡进行管理。
2.根据权利要求1所述的管理方法,其特征在于,板卡BMC通过总线模块对FPGA加速卡的传感器进行信息采集,得到监控数据,包括:
所述板卡BMC通过所述总线模块按照预设频率对所述FPGA加速卡的传感器进行信息采集,得到所述监控数据。
3.根据权利要求1所述的管理方法,其特征在于,通过USB接口将所述监控数据发送至上位机,包括:
根据USB协议将所述监控数据进行封装处理,得到USB封装监控数据;
将所述USB封装监控数据发送至所述上位机。
4.根据权利要求1所述的管理方法,其特征在于,所述上位机根据接收到的监控数据执行监控管理操作,得到并发送操作数据,包括:
所述上位机根据所述监控数据判断所述FPGA加速卡是否出现异常情况;
若是,则根据监控数据进行异常处理,得到处理指令,将所述处理指令作为所述操作数据;
若否,则将正常指令作为所述操作数据;
将所述操作数据发送至所述板卡BMC中。
5.根据权利要求1所述的管理方法,其特征在于,还包括:
所述上位机将所述监控数据记录为工作日志,并将所述工作日志进行保存。
6.一种FPGA加速卡的管理系统,其特征在于,包括:
监控数据获取模块,用于通过总线模块对FPGA加速卡的传感器进行信息采集,得到监控数据;
监控数据发送模块,用于通过USB接口将所述监控数据发送至上位机,以便所述上位机根据接收到的监控数据执行监控管理操作,得到并发送操作数据;
FPGA加速卡控制模块,用于根据接收到的操作数据对所述FPGA加速卡执行操作,以便实现对所述FPGA加速卡进行管理。
7.根据权利要求6所述的管理系统,其特征在于,所述监控数据获取模块具体用于通过所述总线模块按照预设频率对所述FPGA加速卡的传感器进行信息采集,得到所述监控数据。
8.根据权利要求6所述的管理系统,其特征在于,所述监控数据发送模块,包括:
数据封装单元,用于根据USB协议将所述监控数据进行封装处理,得到USB封装监控数据;
数据发送单元,用于将所述USB封装监控数据发送至所述上位机。
9.一种服务器的机箱管理装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述的管理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的管理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910656873.0A CN110399220A (zh) | 2019-07-19 | 2019-07-19 | 一种fpga加速卡的管理方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910656873.0A CN110399220A (zh) | 2019-07-19 | 2019-07-19 | 一种fpga加速卡的管理方法及相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110399220A true CN110399220A (zh) | 2019-11-01 |
Family
ID=68324792
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910656873.0A Pending CN110399220A (zh) | 2019-07-19 | 2019-07-19 | 一种fpga加速卡的管理方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110399220A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111258951A (zh) * | 2020-01-08 | 2020-06-09 | 中国科学院计算技术研究所 | 一种实现fpga服务器的方法和系统 |
CN111414268A (zh) * | 2020-02-26 | 2020-07-14 | 华为技术有限公司 | 故障处理方法、装置及服务器 |
CN112541822A (zh) * | 2020-12-04 | 2021-03-23 | 深圳市瑞尚信息科技有限公司 | 一种基于fpga加速卡的金融风控系统 |
CN112948124A (zh) * | 2021-03-26 | 2021-06-11 | 浪潮电子信息产业股份有限公司 | 一种加速任务处理方法、装置、设备及可读存储介质 |
CN113127079A (zh) * | 2021-04-13 | 2021-07-16 | 山东英信计算机技术有限公司 | 一种管理bmc的方法、系统及介质 |
CN114185603A (zh) * | 2021-11-08 | 2022-03-15 | 深圳云天励飞技术股份有限公司 | 一种智能加速卡的控制方法、服务器及智能加速卡 |
CN115981956A (zh) * | 2022-12-28 | 2023-04-18 | 中科可控信息产业有限公司 | Spdk服务进程监控方法、装置、设备、存储介质和程序产品 |
US11841733B2 (en) | 2020-01-08 | 2023-12-12 | Institute Of Computing Technology, Chinese Academy Of Sciences | Method and system for realizing FPGA server |
CN118394558A (zh) * | 2024-06-27 | 2024-07-26 | 苏州元脑智能科技有限公司 | 一种异常检测方法、计算机程序产品和存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8898349B1 (en) * | 2013-10-10 | 2014-11-25 | American Megatrends, Inc. | IPMI over USB data transfer between host computer and baseboard management controller (BMC) |
US20150331694A1 (en) * | 2014-05-14 | 2015-11-19 | American Megatrends, Inc. | Installation of operating system on host computer using virtual storage of bmc |
CN107038104A (zh) * | 2017-04-27 | 2017-08-11 | 郑州云海信息技术有限公司 | 一种远程监控异构加速卡的方法 |
CN108920334A (zh) * | 2018-07-25 | 2018-11-30 | 郑州云海信息技术有限公司 | 一种fpga异构加速卡的监控装置 |
CN109117407A (zh) * | 2018-09-27 | 2019-01-01 | 郑州云海信息技术有限公司 | 一种管理板卡与服务器 |
CN109240966A (zh) * | 2018-08-20 | 2019-01-18 | 郑州云海信息技术有限公司 | 一种基于cpld的加速卡、数据采集方法及装置 |
CN109614293A (zh) * | 2018-12-13 | 2019-04-12 | 广东浪潮大数据研究有限公司 | 一种fpga异构加速卡的管理系统及方法 |
CN109857620A (zh) * | 2019-03-06 | 2019-06-07 | 苏州浪潮智能科技有限公司 | 加速卡辅助功能管理系统、方法、装置及相关组件 |
-
2019
- 2019-07-19 CN CN201910656873.0A patent/CN110399220A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8898349B1 (en) * | 2013-10-10 | 2014-11-25 | American Megatrends, Inc. | IPMI over USB data transfer between host computer and baseboard management controller (BMC) |
US20150331694A1 (en) * | 2014-05-14 | 2015-11-19 | American Megatrends, Inc. | Installation of operating system on host computer using virtual storage of bmc |
CN107038104A (zh) * | 2017-04-27 | 2017-08-11 | 郑州云海信息技术有限公司 | 一种远程监控异构加速卡的方法 |
CN108920334A (zh) * | 2018-07-25 | 2018-11-30 | 郑州云海信息技术有限公司 | 一种fpga异构加速卡的监控装置 |
CN109240966A (zh) * | 2018-08-20 | 2019-01-18 | 郑州云海信息技术有限公司 | 一种基于cpld的加速卡、数据采集方法及装置 |
CN109117407A (zh) * | 2018-09-27 | 2019-01-01 | 郑州云海信息技术有限公司 | 一种管理板卡与服务器 |
CN109614293A (zh) * | 2018-12-13 | 2019-04-12 | 广东浪潮大数据研究有限公司 | 一种fpga异构加速卡的管理系统及方法 |
CN109857620A (zh) * | 2019-03-06 | 2019-06-07 | 苏州浪潮智能科技有限公司 | 加速卡辅助功能管理系统、方法、装置及相关组件 |
Non-Patent Citations (1)
Title |
---|
周国清、周祥: "《面阵激光雷达成像原理 技术及应用》", 31 January 2018, 武汉大学出版社 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111258951A (zh) * | 2020-01-08 | 2020-06-09 | 中国科学院计算技术研究所 | 一种实现fpga服务器的方法和系统 |
US11841733B2 (en) | 2020-01-08 | 2023-12-12 | Institute Of Computing Technology, Chinese Academy Of Sciences | Method and system for realizing FPGA server |
CN111414268B (zh) * | 2020-02-26 | 2022-05-13 | 华为技术有限公司 | 故障处理方法、装置及服务器 |
CN111414268A (zh) * | 2020-02-26 | 2020-07-14 | 华为技术有限公司 | 故障处理方法、装置及服务器 |
CN112541822A (zh) * | 2020-12-04 | 2021-03-23 | 深圳市瑞尚信息科技有限公司 | 一种基于fpga加速卡的金融风控系统 |
CN112948124A (zh) * | 2021-03-26 | 2021-06-11 | 浪潮电子信息产业股份有限公司 | 一种加速任务处理方法、装置、设备及可读存储介质 |
CN112948124B (zh) * | 2021-03-26 | 2023-09-22 | 浪潮电子信息产业股份有限公司 | 一种加速任务处理方法、装置、设备及可读存储介质 |
CN113127079B (zh) * | 2021-04-13 | 2023-01-10 | 山东英信计算机技术有限公司 | 一种管理bmc的方法、系统及介质 |
CN113127079A (zh) * | 2021-04-13 | 2021-07-16 | 山东英信计算机技术有限公司 | 一种管理bmc的方法、系统及介质 |
CN114185603A (zh) * | 2021-11-08 | 2022-03-15 | 深圳云天励飞技术股份有限公司 | 一种智能加速卡的控制方法、服务器及智能加速卡 |
CN114185603B (zh) * | 2021-11-08 | 2024-01-05 | 深圳云天励飞技术股份有限公司 | 一种智能加速卡的控制方法、服务器及智能加速卡 |
CN115981956A (zh) * | 2022-12-28 | 2023-04-18 | 中科可控信息产业有限公司 | Spdk服务进程监控方法、装置、设备、存储介质和程序产品 |
CN118394558A (zh) * | 2024-06-27 | 2024-07-26 | 苏州元脑智能科技有限公司 | 一种异常检测方法、计算机程序产品和存储介质 |
CN118394558B (zh) * | 2024-06-27 | 2024-10-11 | 苏州元脑智能科技有限公司 | 一种异常检测方法、计算机程序产品和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110399220A (zh) | 一种fpga加速卡的管理方法及相关装置 | |
JP6323821B2 (ja) | サーバラック電力管理 | |
CN105938450B (zh) | 自动除错信息收集的方法及系统 | |
US9477295B2 (en) | Non-volatile memory express (NVMe) device power management | |
CN105164635B (zh) | 针对固态存储设备在运行中的性能调整 | |
CN111538461B (zh) | 基于固态硬盘缓存的数据读写方法、装置及存储介质 | |
EP2767880A1 (en) | Data storage method and storage device | |
CN105474192A (zh) | 数据到非易失性存储器的事件触发的存储 | |
EP1579303A2 (en) | Power management system | |
US20130054840A1 (en) | Tag allocation for queued commands across multiple devices | |
CN116541227B (zh) | 故障诊断方法、装置、存储介质、电子装置及bmc芯片 | |
CN108268361A (zh) | 一种bmc监控gpu的方法、系统、装置及存储介质 | |
CN104216771A (zh) | 软件程序的重启方法及装置 | |
CN109408281A (zh) | 用于无头服务器可管理性和自主日志记录的技术 | |
CN117555760B (zh) | 服务器监测方法及装置、基板控制器及嵌入式系统 | |
CN109901664A (zh) | 提供时钟信号的方法、装置、系统、设备及可读存储介质 | |
CN108647124A (zh) | 一种存储跳变信号的方法及其装置 | |
CN117055923A (zh) | 一种固件升级系统、方法、装置、电子设备及存储介质 | |
CN112000545A (zh) | 一种图形处理器板卡和图形处理器管理方法 | |
US20220391722A1 (en) | Reducing impact of collecting system state information | |
CN104025198B (zh) | 相变存储器与开关(pcms)写错误检测 | |
CN115934616A (zh) | 串口信息保存方法、装置、服务器、电子设备和存储介质 | |
CN112463037B (zh) | 一种元数据保存方法、装置、设备、产品 | |
CN108874595A (zh) | 一种hba卡重置方法、系统及hba卡和存储介质 | |
CN115774645A (zh) | 闪存监控系统、方法及其电脑系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191101 |