CN117056154A - 一种智能网卡网口功能的检测方法、系统、装置及介质 - Google Patents
一种智能网卡网口功能的检测方法、系统、装置及介质 Download PDFInfo
- Publication number
- CN117056154A CN117056154A CN202310935367.1A CN202310935367A CN117056154A CN 117056154 A CN117056154 A CN 117056154A CN 202310935367 A CN202310935367 A CN 202310935367A CN 117056154 A CN117056154 A CN 117056154A
- Authority
- CN
- China
- Prior art keywords
- network card
- fpga chip
- bmc
- information
- pcie
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 108010028984 3-isopropylmalate dehydratase Proteins 0.000 claims abstract description 63
- 230000008569 process Effects 0.000 claims abstract description 16
- 230000006870 function Effects 0.000 claims description 59
- 238000001514 detection method Methods 0.000 claims description 26
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 230000001360 synchronised effect Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 8
- 238000007726 management method Methods 0.000 description 8
- 230000008439 repair process Effects 0.000 description 7
- 230000007547 defect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/26—Functional testing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2294—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by remote test
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提出的一种智能网卡网口功能的检测方法、系统、装置及介质,所述方法包括:控制智能网卡上电开机,并在BIOS自检过程中通过IPMI命令获取PCIE网卡的状态信息;根据PCIE网卡的状态信息的判断PCIE网卡是否正常;将判断结果和状态信息记录在BMC日志中;当确定PCIE网卡正常时,利用BIOS获取FPGA芯片的状态信息;根据FPGA的状态信息判断FPGA芯片是否损坏,并将判断结果和FPGA芯片的状态信息记录到BMC日志中;将BMC日志发送到主机端,并进行同步显示。本发明利用BIOS通过IPMI命令对于智能网卡和FPGA进行检测,可以快速的定位智能网卡网口的故障点,便于及时修复和解决。
Description
技术领域
本发明涉及计算机技术领域,更具体的说是涉及一种智能网卡网口功能的检测方法、系统、装置及介质。
背景技术
智能网卡是一种带有处理器和内存的高级网卡,它能够在网络传输数据的同时执行额外的任务,如流量过滤、安全检测、数据加密、流量均衡等。对于智能网卡来说,智能网卡网口可以提供更高效的网络连接,具有增强网络速度和可靠性、提高系统性能、支持网络虚拟化和提供硬件安全的作用。总的来说,智能网卡网口是网络连接不可或缺的重要组成部分,可以提高系统性能,提供更高效、更可靠、更安全的网络连接。
对于智能网卡,FPGA芯片是支持智能网卡网口功能重要的组成部分,具有灵活性高、运算速度快等特点,因此智能网卡通常会采用FPGA芯片来实现高效的网络处理和灵活的编程能力。同时,FPGA芯片还可以实现硬件加速,提高网络处理效率,并使智能网卡更加稳定和可靠。
但是,由于FPGA芯片易受电压、温度等因素影响,受损后难以修复,同时容易出现死锁、数据丢失等问题,因FPGA芯片存在可靠性不高的缺陷,从而影响到智能网卡网口的可靠性。另外,由于BIOS无法直接对FPGA进行识别和操作,因此BIOS无法对FPGA状态进行检测。如果FPGA芯片出现硬件故障,则很难发现。
由此可见,如何实现智能网卡网口功能自动检测,快速定位智能网卡网口的故障点,以便于快速修复,是我们亟待解决的问题。
发明内容
针对以上问题,本发明的目的在于提供一种智能网卡网口功能的检测方法、系统、装置及可读存储介质,利用BIOS通过IPMI命令对于智能网卡和FPGA进行检测,可以快速的定位智能网卡网口的故障点,便于及时修复和解决。
本发明为实现上述目的,通过以下技术方案实现:
第一方面,本发明公开了一种智能网卡网口功能的检测方法,包括:
控制智能网卡上电开机,并在BIOS自检过程中通过IPMI命令获取PCIE网卡的状态信息;
根据PCIE网卡的状态信息的判断PCIE网卡是否正常;
将判断结果和相应的状态信息记录在BMC日志中;
当确定PCIE网卡正常时,利用BIOS获取FPGA芯片的状态信息;
根据FPGA的状态信息判断FPGA芯片是否损坏,并将判断结果和相应的FPGA芯片的状态信息记录到BMC日志中;
将BMC日志发送到主机端,并进行同步显示。
进一步,所述PCIE网卡的状态信息包括:网口的端口号、总线号、设备号、最大带宽值、最大链路速度值和当前的链路速度值。
进一步,所述根据PCIE网卡的状态信息的判断PCIE网卡是否正常,包括:
如果最大带宽值、最大链路速度值和当前的链路速度值均在相应的正常区间,则PCIE网卡正常,否则PCIE网卡异常。
进一步,所述将判断结果和相应的状态信息记录在BMC日志中,包括:
当确定PCIE网卡异常时,通过IPMI命令向BMC发送PCIE网卡已损坏的信息,并记录在BMC日志中;
当确定PCIE网卡正常时,通过IPMI命令向BMC发送PCIE网卡正常的信息,并记录在BMC日志中。
进一步,所述利用BIOS获取FPGA芯片的状态信息,包括:
控制BIOS通过IPMI命令获取FPGA芯片的版本号、电压值、温度、SPI状态和计数器数值。
进一步,所述根据FPGA的状态信息判断FPGA芯片是否损坏,并将判断结果和相应的FPGA芯片的状态信息记录到BMC日志中,包括:
如果FPGA芯片的电压值和温度均未超过相应的阈值,则FPGA芯片正常,否则FPGA芯片已损坏;
通过IPMI命令获取FPGA芯片的版本信息;
当确定FPGA芯片已损坏时,通过IPMI命令将FPGA芯片的版本信息、FPGA芯片已损坏的信息发送至BMC,并记录在BMC日志中;
当确定FPGA芯片正常时,通过IPMI命令将FPGA芯片的版本信息、FPGA芯片正常的信息发送至BMC,并记录在BMC日志中。
进一步,所述将BMC日志发送到主机端,并进行同步显示,包括:
主机端通过IPMI命令向智能网卡端的BMC发送日志请求;
智能网卡端收到日志请求后,将BMC日志发送至主机端;
主机端接收BMC日志,并在其BMC中进行显示。
第二方面,本发明还公开了一种智能网卡网口功能的检测系统,包括:
网卡信息获取单元,配置用于控制智能网卡上电开机,并在BIOS自检过程中通过IPMI命令获取PCIE网卡的状态信息;
网卡状态检测单元,配置用于根据PCIE网卡的状态信息的判断PCIE网卡是否正常;
网卡状态记录单元,配置用于将判断结果和相应的状态信息记录在BMC日志中;
芯片信息获取单元,配置用于当确定PCIE网卡正常时,利用BIOS获取FPGA芯片的状态信息;
芯片状态检测和记录单元,配置用于根据FPGA的状态信息判断FPGA芯片是否损坏,并将判断结果和相应的FPGA芯片的状态信息记录到BMC日志中;
记录显示单元,配置用于将BMC日志发送到主机端,并进行同步显示。
第三方面,本发明还公开了一种智能网卡网口功能的检测装置,包括:
存储器,用于存储智能网卡网口功能的检测程序;
处理器,用于执行所述智能网卡网口功能的检测程序时实现如上文任一项所述智能网卡网口功能的检测方法的步骤。
第四方面,本发明还公开了一种可读存储介质,所述可读存储介质上存储有智能网卡网口功能的检测程序,所述智能网卡网口功能的检测程序被处理器执行时实现如上文任一项所述智能网卡网口功能的检测方法的步骤。
对比现有技术,本发明有益效果在于:本发明公开了一种智能网卡网口功能的检测方法、系统、装置及可读存储介质,在智能网卡上电后首先对PCIE网卡进行检测,并对于当前状态汇报给智能网卡BMC端进行记录。如果PCIE网卡正常无损坏,通过IPMI命令利用BIOS继续对于FPGA芯片进行检测,并对当前状态,例如正常、版本未烧录和损坏等和FPGA芯片损坏等信息汇报给智能网卡BMC端进行记录。最后,通过智能网卡的BMC与主机端进行通信,在主机端的BMC进行相应信息显示。本发明实现了智能网卡网口功能的自动检测,能够快速的定位智能网卡网口的故障点,无需人为去分析故障,有效的提高了故障的检测效率,便于快速维护,进而有效的提高了智能网卡网口功能的可靠性。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明具体实施方式中一种智能网卡网口功能的检测方法的方法流程图。
图2是本发明具体实施方式中一种智能网卡网口功能的检测系统的系统结构图。
图3是本发明具体实施方式中一种智能网卡网口功能的检测装置的结构示意图。
图中,1、网卡信息获取单元;2、网卡状态检测单元;3、网卡状态记录单元;4、芯片信息获取单元;5、芯片状态检测和记录单元;6、记录显示单元;101、处理器;102、存储器;103、输入接口;104、输出接口;105、通讯单元;106、键盘;107、显示器;108、鼠标。
具体实施方式
本发明的核心是提供一种智能网卡网口功能的检测方法,相关技术中,由于FPGA芯片易受电压、温度等因素影响,受损后难以修复,同时容易出现死锁、数据丢失等问题,因FPGA芯片存在可靠性不高的缺陷,从而影响到智能网卡网口的可靠性。由于BIOS无法直接对FPGA进行识别和操作,因此BIOS无法对FPGA状态进行检测。如果FPGA芯片出现硬件故障,则很难发现。
而本发明提供的智能网卡网口功能的检测方法,首先,在服务器开机时,利用BIOS进行自检和初始化,此过程首先对于PCIE网卡进行检测,并对于当前状态汇报给智能网卡BMC端进行记录。如果PCIE网卡正常无损坏,则通过IPMI命令利用BIOS继续对于FPGA芯片进行检测,并对当前状态,例如正常、版本未烧录和损坏等和FPGA芯片损坏等信息汇报给智能网卡BMC端进行记录。最后,通过智能网卡BMC与主机端进行通信,在主机端的BMC进行相应信息显示。由此可见,本发明利用BIOS通过IPMI命令对于智能网卡和FPGA进行检测,可以快速的定位智能网卡网口的故障点,便于及时修复和解决。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
下面对本发明中出现的关键术语进行解释。
BMC,执行伺服器远端管理控制器,英文全称为Baseboard ManagementController,为基板管理控制器。
BIOS,BIOS是英文"Basic Input Output System"的缩略语,直译过来后中文名称就是"基本输入输出系统"。它的全称应该是ROM-BIOS,意思是只读存储器基本输入输出系统。其实,它是一组固化到计算机内主板上一个ROM芯片上的程序,它保存着计算机最重要的基本输入输出的程序、系统设置信息、开机上电自检程序和系统启动自举程序。其主要功能是为计算机提供最底层的、最直接的硬件设置和控制。BIOS设置程序是储存在BIOS芯片中的,只有在开机时才可以进行设置。
IPMI,是智能型平台管理接口(Intelligent Platform Management Interface)的缩写,是管理基于Intel结构的企业系统中所使用的外围设备采用的一种工业标准。用户可以利用IPMI监视服务器的物理健康特征,如温度、电压、风扇工作状态、电源状态等。而且更为重要的是IPMI是一个开放的免费标准,用户无需为使用该标准而支付额外的费用。IPMI的核心是一个专用芯片/控制器(叫做服务器处理器或基板管理控制器(BMC)),其并不依赖于服务器的处理器、BIOS或操作系统来工作,可谓非常地独立,是一个单独在系统内运行的无代理管理子系统,只要有BMC与IPMI固件其便可开始工作,而BMC通常是一个安装在服务器主板上的独立的板卡,也有服务器主板提供对IPMI支持的。IPMI良好的自治特性便克服了以往基于操作系统的管理方式所受的限制,例如操作系统不响应或未加载的情况下其仍然可以进行开关机、信息提取等操作。
FPGA,FPGA是英文Field-Programmable Gate Array的缩写,即现场可编程门阵列,它是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的产物。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1所示,本实施例提供了一种智能网卡网口功能的检测方法,包括如下步骤:
S1:控制智能网卡上电开机,并在BIOS自检过程中通过IPMI命令获取PCIE网卡的状态信息。
其中,PCIE网卡的状态信息包括:网口的端口号、总线号、设备号、最大带宽值、最大链路速度值和当前的链路速度值。
在具体实施方式中,智能网卡上电后,在BIOS自检过程中通过命令ipmitool-Ilanplus-H bmcip-U admin-P admin raw 0x3c 0x2 0x04 0x00 0x00获取PCIE网卡信息,在其中获取的网卡状态信息包括PortID、BusNumber、DeviceNumber、MaxLinkWidth、MaxLinkSpeed和CurrentLinkSpeed。
S2:根据PCIE网卡的状态信息的判断PCIE网卡是否正常。
具体来说,分别PCIE网卡的状态信息的每一项信息是否在其正常区间内来检测PCIE异常是否存在异常。如果最大带宽值、最大链路速度值和当前的链路速度值均在相应的正常区间,则PCIE网卡正常,否则PCIE网卡异常。
S3:将判断结果和相应的状态信息记录在BMC日志中。
具体来说,当确定PCIE网卡异常时,通过IPMI命令向BMC发送PCIE网卡已损坏的信息,并记录在BMC日志中;当确定PCIE网卡正常时,通过IPMI命令向BMC发送PCIE网卡正常的信息,并记录在BMC日志中。
在具体实施方式中,如果检测到PCIE网卡损坏,则通过IPMI协议向BMC传递信息,并在BMC日志中记录PCIE Damage detected(Critical)。如果检测到PCIE网卡正常,则在BMC日志中记录PCIE Presence detected(Info)。
S4:当确定PCIE网卡正常时,利用BIOS获取FPGA芯片的状态信息。
在具体实施方式中,当确定PCIE网卡正常时,控制BIOS通过IPMI命令获取FPGA芯片的版本号、电压值、温度、SPI状态和计数器数值。
S5:根据FPGA的状态信息判断FPGA芯片是否损坏,并将判断结果和相应的FPGA芯片的状态信息记录到BMC日志中。
具体来说,通过阈值判断FPGA芯片各项状态参数是否正常,以实现FPGA芯片的状态检测。如果FPGA芯片的电压值和温度均未超过相应的阈值,则FPGA芯片正常,否则FPGA芯片已损坏。此时,首先通过IPMI命令获取FPGA芯片的版本信息。当确定FPGA芯片已损坏时,通过IPMI命令将FPGA芯片的版本信息、FPGA芯片已损坏的信息发送至BMC,并记录在BMC日志中;当确定FPGA芯片正常时,通过IPMI命令将FPGA芯片的版本信息、FPGA芯片正常的信息发送至BMC,并记录在BMC日志中。
在具体实施方式中,如果检测到FPGA芯片的电压值、温度等信息超出阈值,则将信息传递给BMC并在BMC日志中记录FPGA Damage detected(Critical)。如果检测到版本未烧录或受到电压、高温等其他造成的版本异常,例如通过IPMI命令(ipmitool-I lanplus-Hbmcip-U admin-P admin-b 0x0a–t 0x30raw 0x38 0x09 8 0 0)获取FPGA版本为00 0000,则将信息传递给BMC并在BMC日志中记录FPGA Presence detected(Info)和FPGA版本丢失、损坏等(Critical)等信息。如果FPGA芯片检测一切正常,则BMC日志中记录PGAPresence detected(Info)和FPGA版本等信息(Info)。
S6:将BMC日志发送到主机端,并进行同步显示。
在具体实施方式中,首先在主机端通过IPMI命令向智能网卡端的BMC发送日志请求。当智能网卡端收到日志请求后,将BMC日志发送至主机端。最后,在主机端接收BMC日志,并在其BMC中进行显示。
本发明提供了一种智能网卡网口功能的检测方法,实现了智能网卡网口功能的自动检测,能够快速的定位智能网卡网口的故障点,无需人为去分析故障,有效的提高了故障的检测效率,便于快速维护,进而有效的提高了智能网卡网口功能的可靠性。
参见图2所示,本发明还公开了一种智能网卡网口功能的检测系统,包括:网卡信息获取单元1、网卡状态检测单元2、网卡状态记录单元3、芯片信息获取单元4、芯片状态检测和记录单元5、记录显示单元6。
网卡信息获取单元1,配置用于控制智能网卡上电开机,并在BIOS自检过程中通过IPMI命令获取PCIE网卡的状态信息。
在具体实施方式中,网卡信息获取单元1具体用于:控制智能网卡上电开机,并在BIOS自检过程中通过IPMI命令获取PCIE网卡的网口的端口号、总线号、设备号、最大带宽值、最大链路速度值和当前的链路速度值。
网卡状态检测单元2,配置用于根据PCIE网卡的状态信息的判断PCIE网卡是否正常。
在具体实施方式中,网卡状态检测单元2具体用于:如果识别到最大带宽值、最大链路速度值和当前的链路速度值均在相应的正常区间,则PCIE网卡判定为正常,否则PCIE网卡判定为异常。
网卡状态记录单元3,配置用于将判断结果和相应的状态信息记录在BMC日志中。
在具体实施方式中,网卡状态记录单元3具体用于:当确定PCIE网卡异常时,通过IPMI命令向BMC发送PCIE网卡已损坏的信息,并记录在BMC日志中;当确定PCIE网卡正常时,通过IPMI命令向BMC发送PCIE网卡正常的信息,并记录在BMC日志中。
芯片信息获取单元4,配置用于当确定PCIE网卡正常时,利用BIOS获取FPGA芯片的状态信息。
在具体实施方式中,芯片信息获取单元4具体用于:当确定PCIE网卡正常时,控制BIOS通过IPMI命令获取FPGA芯片的版本号、电压值、温度、SPI状态和计数器数值。
芯片状态检测和记录单元5,配置用于根据FPGA的状态信息判断FPGA芯片是否损坏,并将判断结果和相应的FPGA芯片的状态信息记录到BMC日志中。
在具体实施方式中,芯片状态检测和记录单元5具体用于:判断FPGA芯片的电压值和温度是否均未超过相应的阈值,如果FPGA芯片的电压值和温度均未超过相应的阈值,则FPGA芯片正常,否则FPGA芯片已损坏;通过IPMI命令获取FPGA芯片的版本信息;当确定FPGA芯片已损坏时,通过IPMI命令将FPGA芯片的版本信息、FPGA芯片已损坏的信息发送至BMC,并记录在BMC日志中;当确定FPGA芯片正常时,通过IPMI命令将FPGA芯片的版本信息、FPGA芯片正常的信息发送至BMC,并记录在BMC日志中。
记录显示单元6,配置用于将BMC日志发送到主机端,并进行同步显示。
在具体实施方式中,记录显示单元6具体用于:控制主机端通过IPMI命令向智能网卡端的BMC发送日志请求;智能网卡端收到日志请求后,将BMC日志发送至主机端;控制主机端接收BMC日志,并在其BMC中进行显示。
由此可见,本发明提供了一种智能网卡网口功能的检测系统,实现了智能网卡上电后首先对PCIE网卡进行检测,并对于当前状态汇报给智能网卡BMC端进行记录。如果PCIE网卡正常无损坏,通过IPMI命令利用BIOS继续对于FPGA芯片进行检测,并对当前状态,例如正常、版本未烧录和损坏等和FPGA芯片损坏等信息汇报给智能网卡BMC端进行记录。最后,通过智能网卡的BMC与主机端进行通信,在主机端的BMC进行相应信息显示。本系统利用BIOS通过IPMI命令对于智能网卡和FPGA进行检测,可以快速的定位智能网卡网口的故障点,便于及时修复和解决。
参见图3所示,本发明还公开了一种智能网卡网口功能的检测装置,包括处理器101和存储器102;其中,所述处理器101执行所述存储器中保存的智能网卡网口功能的检测程序时实现以下步骤:
1、控制智能网卡上电开机,并在BIOS自检过程中通过IPMI命令获取PCIE网卡的状态信息。
2、根据PCIE网卡的状态信息的判断PCIE网卡是否正常。
3、将判断结果和相应的状态信息记录在BMC日志中。
4、当确定PCIE网卡正常时,利用BIOS获取FPGA芯片的状态信息。
5、根据FPGA的状态信息判断FPGA芯片是否损坏,并将判断结果和相应的FPGA芯片的状态信息记录到BMC日志中。
6、将BMC日志发送到主机端,并进行同步显示。
本实施例提供的智能网卡网口功能的检测装置可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。
其中,处理器101可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器101可以采用数字信号处理(Digital Signal Processor,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器101也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(CentralProcessing Unit,CPU);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器101可以在集成有图像处理器(Graphics Processing Unit,GPU),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器101还可以包括人工智能(Artificial Intelligence,AI)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器102可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器102还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器102至少用于存储以下计算机程序,其中,该计算机程序被处理器101加载并执行之后,能够实现前述任一实施例公开的智能网卡网口功能的检测方法的相关步骤。另外,存储器102所存储的资源还可以包括操作系统和数据等,存储方式可以是短暂存储或者永久存储。其中,操作系统可以包括Windows、Unix、Linux等。数据可以包括但不限于上述智能网卡网口功能的检测方法中涉及的数据等。
在具体实施方式中,所述处理器101执行所述存储器102中保存的计算机程序时,可以具体实现以下步骤:控制智能网卡上电开机,并在BIOS自检过程中通过IPMI命令获取PCIE网卡的网口的端口号、总线号、设备号、最大带宽值、最大链路速度值和当前的链路速度值。
在具体实施方式中,所述处理器101执行所述存储器102中保存的计算机程序时,可以具体实现以下步骤:判断PCIE网卡的最大带宽值、最大链路速度值和当前的链路速度值是否均在相应的正常区间,如果是,则PCIE网卡正常,否则PCIE网卡异常。
在具体实施方式中,所述处理器101执行所述存储器102中保存的计算机程序时,可以具体实现以下步骤:当确定PCIE网卡异常时,通过IPMI命令向BMC发送PCIE网卡已损坏的信息,并记录在BMC日志中;当确定PCIE网卡正常时,通过IPMI命令向BMC发送PCIE网卡正常的信息,并记录在BMC日志中。
在具体实施方式中,所述处理器101执行所述存储器102中保存的计算机程序时,可以具体实现以下步骤:当确定PCIE网卡正常时,控制BIOS通过IPMI命令获取FPGA芯片的版本号、电压值、温度、SPI状态和计数器数值。
在具体实施方式中,所述处理器101执行所述存储器102中保存的计算机程序时,可以具体实现以下步骤:判断FPGA芯片的电压值和温度是否均未超过相应的阈值,如果FPGA芯片的电压值和温度均未超过相应的阈值,则FPGA芯片正常,否则FPGA芯片已损坏;通过IPMI命令获取FPGA芯片的版本信息;当确定FPGA芯片已损坏时,通过IPMI命令将FPGA芯片的版本信息、FPGA芯片已损坏的信息发送至BMC,并记录在BMC日志中;当确定FPGA芯片正常时,通过IPMI命令将FPGA芯片的版本信息、FPGA芯片正常的信息发送至BMC,并记录在BMC日志中。
在具体实施方式中,所述处理器101执行所述存储器102中保存的计算机程序时,可以具体实现以下步骤:控制主机端通过IPMI命令向智能网卡端的BMC发送日志请求;智能网卡端收到日志请求后,将BMC日志发送至主机端;控制主机端接收BMC日志,并在其BMC中进行显示。
进一步的,本实施例中的智能网卡网口功能的检测装置,还可以包括:
输入接口103,用于获取外界导入的智能网卡网口功能的检测程序,并将获取到的智能网卡网口功能的检测程序保存至所述存储器102中,还可以用于获取外界终端设备传输的各种指令和参数,并传输至处理器101中,以便处理器101利用上述各种指令和参数展开相应的处理。本实施例中,所述输入接口103具体可以包括但不限于USB接口、串行接口、语音输入接口、指纹输入接口、硬盘读取接口等。
输出接口104,用于将处理器101产生的各种数据输出至与其相连的终端设备,以便于与输出接口相连的其他终端设备能够获取到处理器101产生的各种数据。本实施例中,所述输出接口104具体可以包括但不限于USB接口、串行接口等。
通讯单元105,用于在服务器运行业务优化配置装置和外部服务器之间建立远程通讯连接,以便于智能网卡网口功能的检测装置能够将镜像文件挂载到外部服务器中。本实施例中,通讯单元105具体可以包括但不限于基于无线通讯技术或有线通讯技术的远程通讯单元。
键盘106,用于获取用户通过实时敲击键帽而输入的各种参数数据或指令。
显示器107,用于对运行智能网卡网口功能的检测过程的相关信息进行实时显示。
鼠标108,可以用于协助用户输入数据并简化用户的操作。
本发明还公开了一种可读存储介质,这里所说的可读存储介质包括随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动硬盘、CD-ROM或技术领域内所公知的任意其他形式的存储介质。可读存储介质中存储有智能网卡网口功能的检测程序,所述智能网卡网口功能的检测程序被处理器执行时实现以下步骤:
1、控制智能网卡上电开机,并在BIOS自检过程中通过IPMI命令获取PCIE网卡的状态信息。
2、根据PCIE网卡的状态信息的判断PCIE网卡是否正常。
3、将判断结果和相应的状态信息记录在BMC日志中。
4、当确定PCIE网卡正常时,利用BIOS获取FPGA芯片的状态信息。
5、根据FPGA的状态信息判断FPGA芯片是否损坏,并将判断结果和相应的FPGA芯片的状态信息记录到BMC日志中。
6、将BMC日志发送到主机端,并进行同步显示。
综上所述,本发明利用BIOS通过IPMI命令对于智能网卡和FPGA进行检测,可以快速的定位智能网卡网口的故障点,便于及时修复和解决。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的方法而言,由于其与实施例公开的系统相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。
同理,在本发明各个实施例中的各处理单元可以集成在一个功能模块中,也可以是各个处理单元物理存在,也可以两个或两个以上处理单元集成在一个功能模块中。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的智能网卡网口功能的检测方法、系统、装置及可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (10)
1.一种智能网卡网口功能的检测方法,其特征在于,包括:
控制智能网卡上电开机,并在BIOS自检过程中通过IPMI命令获取PCIE网卡的状态信息;
根据PCIE网卡的状态信息的判断PCIE网卡是否正常;
将判断结果和相应的状态信息记录在BMC日志中;
当确定PCIE网卡正常时,利用BIOS获取FPGA芯片的状态信息;
根据FPGA的状态信息判断FPGA芯片是否损坏,并将判断结果和相应的FPGA芯片的状态信息记录到BMC日志中;
将BMC日志发送到主机端,并进行同步显示。
2.根据权利要求1所述的智能网卡网口功能的检测方法,其特征在于,所述PCIE网卡的状态信息包括:网口的端口号、总线号、设备号、最大带宽值、最大链路速度值和当前的链路速度值。
3.根据权利要求2所述的智能网卡网口功能的检测方法,其特征在于,所述根据PCIE网卡的状态信息的判断PCIE网卡是否正常,包括:
如果最大带宽值、最大链路速度值和当前的链路速度值均在相应的正常区间,则PCIE网卡正常,否则PCIE网卡异常。
4.根据权利要求1所述的智能网卡网口功能的检测方法,其特征在于,所述将判断结果和相应的状态信息记录在BMC日志中,包括:
当确定PCIE网卡异常时,通过IPMI命令向BMC发送PCIE网卡已损坏的信息,并记录在BMC日志中;
当确定PCIE网卡正常时,通过IPMI命令向BMC发送PCIE网卡正常的信息,并记录在BMC日志中。
5.根据权利要求1所述的智能网卡网口功能的检测方法,其特征在于,所述利用BIOS获取FPGA芯片的状态信息,包括:
控制BIOS通过IPMI命令获取FPGA芯片的版本号、电压值、温度、SPI状态和计数器数值。
6.根据权利要求5所述的智能网卡网口功能的检测方法,其特征在于,所述根据FPGA的状态信息判断FPGA芯片是否损坏,并将判断结果和相应的FPGA芯片的状态信息记录到BMC日志中,包括:
如果FPGA芯片的电压值和温度均未超过相应的阈值,则FPGA芯片正常,否则FPGA芯片已损坏;
通过IPMI命令获取FPGA芯片的版本信息;
当确定FPGA芯片已损坏时,通过IPMI命令将FPGA芯片的版本信息、FPGA芯片已损坏的信息发送至BMC,并记录在BMC日志中;
当确定FPGA芯片正常时,通过IPMI命令将FPGA芯片的版本信息、FPGA芯片正常的信息发送至BMC,并记录在BMC日志中。
7.根据权利要求1所述的智能网卡网口功能的检测方法,其特征在于,所述将BMC日志发送到主机端,并进行同步显示,包括:
主机端通过IPMI命令向智能网卡端的BMC发送日志请求;
智能网卡端收到日志请求后,将BMC日志发送至主机端;
主机端接收BMC日志,并在其BMC中进行显示。
8.一种智能网卡网口功能的检测系统,其特征在于,包括:
网卡信息获取单元,配置用于控制智能网卡上电开机,并在BIOS自检过程中通过IPMI命令获取PCIE网卡的状态信息;
网卡状态检测单元,配置用于根据PCIE网卡的状态信息的判断PCIE网卡是否正常;
网卡状态记录单元,配置用于将判断结果和相应的状态信息记录在BMC日志中;芯片信息获取单元,配置用于当确定PCIE网卡正常时,利用BIOS获取FPGA芯片的状态信息;
芯片状态检测和记录单元,配置用于根据FPGA的状态信息判断FPGA芯片是否损坏,并将判断结果和相应的FPGA芯片的状态信息记录到BMC日志中;
记录显示单元,配置用于将BMC日志发送到主机端,并进行同步显示。
9.一种智能网卡网口功能的检测装置,其特征在于,包括:
存储器,用于存储智能网卡网口功能的检测程序;
处理器,用于执行所述智能网卡网口功能的检测程序时实现如权利要求1至7任一项权利要求所述的智能网卡网口功能的检测方法的步骤。
10.一种可读存储介质,其特征在于:所述可读存储介质上存储有智能网卡网口功能的检测程序,所述智能网卡网口功能的检测程序被处理器执行时实现如权利要求1至7任一项权利要求所述的智能网卡网口功能的检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310935367.1A CN117056154A (zh) | 2023-07-27 | 2023-07-27 | 一种智能网卡网口功能的检测方法、系统、装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310935367.1A CN117056154A (zh) | 2023-07-27 | 2023-07-27 | 一种智能网卡网口功能的检测方法、系统、装置及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117056154A true CN117056154A (zh) | 2023-11-14 |
Family
ID=88668362
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310935367.1A Pending CN117056154A (zh) | 2023-07-27 | 2023-07-27 | 一种智能网卡网口功能的检测方法、系统、装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117056154A (zh) |
-
2023
- 2023-07-27 CN CN202310935367.1A patent/CN117056154A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10846160B2 (en) | System and method for remote system recovery | |
US9954727B2 (en) | Automatic debug information collection | |
US6895285B2 (en) | Computer system status monitoring | |
CN111752776B (zh) | 一种服务器的循环上下电测试方法和系统 | |
CN112286709B (zh) | 一种服务器硬件故障的诊断方法、诊断装置及诊断设备 | |
US10762029B2 (en) | Electronic apparatus and detection method using the same | |
CN114866424B (zh) | 服务器管理方法、装置、系统、电子设备及可读存储介质 | |
CN109582505B (zh) | 一种bios选项默认值的恢复系统、方法及装置 | |
CN110769051A (zh) | 基于国产处理器的嵌入式服务器远程管理系统及方法 | |
CN115543872A (zh) | 一种设备管理方法、装置及计算机存储介质 | |
CN113609051A (zh) | 一种扩展板的热插拔方法、系统、装置及计算机存储介质 | |
CN115102937B (zh) | 一种服务器电源自适应通讯方法、设备及介质 | |
CN116723198A (zh) | 一种多节点服务器主机控制方法、装置、设备、存储介质 | |
CN117056154A (zh) | 一种智能网卡网口功能的检测方法、系统、装置及介质 | |
CN115098342A (zh) | 系统日志收集方法、系统、终端及存储介质 | |
CN113849367B (zh) | 服务器及其管理方法、装置、系统、电子设备及存储介质 | |
CN114218001A (zh) | 故障修复方法、装置、电子设备及可读存储介质 | |
CN114253573A (zh) | PCIe设备固件批量升级方法、系统、终端及存储介质 | |
CN113010303A (zh) | 一种处理器间的数据交互方法、装置以及服务器 | |
CN112003727A (zh) | 一种多节点服务器电源测试方法、系统、终端及存储介质 | |
CN117055718B (zh) | 一种服务器功耗检测系统、方法、装置、设备和存储介质 | |
CN213182723U (zh) | 一种提高监管安全性的服务器系统 | |
CN114328044B (zh) | 一种AIC+box拓扑的测试方法、装置和系统 | |
CN116089139A (zh) | 一种串口硬盘故障处理方法、装置、介质 | |
CN114153388B (zh) | 一种硬盘系统和硬盘配置信息刷新方法、装置及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |