CN117176606A - 智能网卡的初始化异常检测方法、系统、服务器及介质 - Google Patents
智能网卡的初始化异常检测方法、系统、服务器及介质 Download PDFInfo
- Publication number
- CN117176606A CN117176606A CN202311134956.6A CN202311134956A CN117176606A CN 117176606 A CN117176606 A CN 117176606A CN 202311134956 A CN202311134956 A CN 202311134956A CN 117176606 A CN117176606 A CN 117176606A
- Authority
- CN
- China
- Prior art keywords
- initialization
- network card
- intelligent network
- programmable logic
- logic device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005856 abnormality Effects 0.000 title claims abstract description 40
- 238000001514 detection method Methods 0.000 title claims abstract description 34
- 230000002159 abnormal effect Effects 0.000 claims abstract description 118
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000007639 printing Methods 0.000 claims abstract description 20
- 230000004044 response Effects 0.000 claims abstract description 10
- 238000004458 analytical method Methods 0.000 claims abstract description 9
- 239000000758 substrate Substances 0.000 claims abstract description 7
- 230000015654 memory Effects 0.000 claims description 33
- 238000004891 communication Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 12
- 238000003780 insertion Methods 0.000 claims description 8
- 230000037431 insertion Effects 0.000 claims description 8
- 238000007726 management method Methods 0.000 description 41
- 238000012545 processing Methods 0.000 description 16
- 230000005540 biological transmission Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 239000000306 component Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 238000005265 energy consumption Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本申请提供智能网卡的初始化异常检测方法、系统、服务器及介质,所述方法包括:响应于待检测智能网卡的第一基本输入输出系统所发送的初始化指令而进行初始化异常检测,以令复杂可编程逻辑器件接收所述第一基本输入输出系统发送的初始化异常信息;令所述复杂可编程逻辑器件对接收到的所述初始化异常信息进行初次解析以获得预设格式的异常数据;令基板管理控制器实时读取所述复杂可编程逻辑器件所输出的预设格式的异常数据进行再次解析以用于显示和/或打印。本申请通过基板管理控制器实时监控读取智能网卡初始化异常时的错误信息,并显示错误信息的类型,可以实时定位异常,明确导致无法读到智能网卡的原因,提高工作效率,减少debug的成本。
Description
技术领域
本申请涉及服务器技术领域,特别是涉及智能网卡的初始化异常检测方法、系统、服务器及介质。
背景技术
目前,智能网卡是近几年兴起的一种新型网络设备,它配合服务器使用,主要承担原来服务器CPU(Central Processing Unit,中央处理器)上的网络处理工作,提高云端和私有数据中心中的服务器性能。智能网卡的出现解决了数据中心虚拟化的需求,可以通过将服务器上高耗能的网络应用卸载到智能网卡上,来释放服务器更多的算力,从而提高能耗比。除此之外,智能网卡作为服务器的网络接入口,可以依靠其灵活可编程的能力,承担加密和安全可信等工作。因此,智能网卡在数据中心的发展中,占据了越来越重要的地位。
但是,智能网卡本身初始化出现异常,会让服务器端的BIOS(Basic Input OutputSystem,基本输入输出系统)读不到该设备,服务器端的BIOS只能定位到当前插槽上的设备异常,具体是什么原因导致的初始化异常,是不清楚的。
发明内容
鉴于上述现有技术的缺点,本发明提供智能网卡的初始化异常检测方法、系统、服务器及介质,用于解决现有技术中难以定位显示智能网卡初始化异常原因等问题。
为实现上述目的及其他相关目的,本申请的第一方面提供一种智能网卡的初始化异常检测方法,应用于服务器,所述方法包括:响应于待检测智能网卡的第一基本输入输出系统所发送的初始化指令而进行初始化异常检测,以令复杂可编程逻辑器件接收所述第一基本输入输出系统发送的初始化异常信息;令所述复杂可编程逻辑器件对接收到的所述初始化异常信息进行初次解析以获得预设格式的异常数据;令基板管理控制器实时读取所述复杂可编程逻辑器件所输出的预设格式的异常数据进行再次解析以用于显示和/或打印。
于本申请的第一方面的一些实施例中,在执行所述响应于待检测智能网卡的第一基本输入输出系统所发送的初始化指令而进行初始化异常检测之前,所述方法还执行如下:响应于待检测智能网卡的插入,令第二基本输入输出系统发出插槽信息读取命令,以读取插槽中所插入的待检测智能网卡的设备信息,以根据所读取的设备信息确定对应插槽是否为空。
于本申请的第一方面的一些实施例中,所述复杂可编程逻辑器件接收所述第一基本输入输出系统发送的初始化异常信息,具体包括:所述第一基本输入输出系统包括第一串行通用输入输出接口;所述复杂可编程逻辑器件包括第二串行通用输入输出接口;令所述第一串行通用输入输出接口与第二串行通用输入输出接口连接串行通用输入输出总线,所述串行通用输入输出总线输出串行通用输入输出信号,以通过所述串行通用输入输出信号传输所述初始化异常信息。
于本申请的第一方面的一些实施例中,所述方法还包括:对接收到的所述初始化异常信息进行初次解析以获得预设格式的异常数据后,将所述预设格式的异常数据存储在所述复杂可编程逻辑器件中,或存储在所述复杂可编程逻辑器件外的能被基板管理控制器定位读取的预设位置中。
于本申请的第一方面的一些实施例中,所述基板管理控制器实时读取所述复杂可编程逻辑器件所输出的预设格式的异常数据,具体包括:若所述预设格式的异常数据存储在所述复杂可编程逻辑器件中,令所述基板管理控制器实时监控读取所述复杂可编程逻辑器件中存储的预设格式的异常数据;若所述预设格式的异常数据存储在所述复杂可编程逻辑器件外的能被基板管理控制器定位读取的预设位置中,令所述基板管理控制器实时定位读取所述预设位置中存储的预设格式的异常数据。
于本申请的第一方面的一些实施例中,所述基板管理控制器对读取的预设格式的异常数据进行再次解析以用于显示和/或打印,包括:令基板管理控制器对预设格式的异常数据进行再次解析后,将再次解析后的异常数据发送给第二基本输入输出系统,在所述第二基本输入输出系统的设置界面显示异常数据;令基板管理控制器对预设格式的异常数据进行再次解析后,通过串口通信方式将再次解析后的异常数据发送至外部打印设备进行打印显示。
为实现上述目的及其他相关目的,本申请的第二方面提供一种智能网卡的初始化异常检测系统,所述系统包括:异常信息获取模块,用于响应于待检测智能网卡的第一基本输入输出系统所发送的初始化指令而进行初始化异常检测,以令复杂可编程逻辑器件接收所述第一基本输入输出系统发送的初始化异常信息;异常数据获取模块,用于令所述复杂可编程逻辑器件对接收到的所述初始化异常信息进行初次解析以获得预设格式的异常数据;异常数据显示模块,用于令基板管理控制器实时读取所述复杂可编程逻辑器件所输出的预设格式的异常数据进行再次解析以用于显示和/或打印。
于本申请的第二方面的一些实施例中,所述系统还包括:插槽信息读取模块,用于响应于待检测智能网卡的插入,令第二基本输入输出系统发出插槽信息读取命令,以读取插槽中所插入的待检测智能网卡的设备信息,以根据所读取的设备信息确定对应插槽是否为空。
为实现上述目的及其他相关目的,本申请的第三方面提供一种服务器,包括:处理器及存储器;所述存储器用于存储计算机程序;所述处理器,用于执行所述存储器存储的计算机程序,以使所述服务器执行如上所述智能网卡的初始化异常检测方法。
为实现上述目的及其他相关目的,本申请的第四方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述智能网卡的初始化异常检测方法。
如上所述,本申请的智能网卡的初始化异常检测方法、系统、服务器及介质,具有以下
有益效果:
通过基板管理控制器实时监控读取智能网卡初始化异常时的错误信息,并显示错误信息的类型,可以实时定位异常,明确导致无法读到智能网卡的原因,提高工作效率,减少debug的成本。
附图说明
图1A显示为本申请一实施例中一种智能网卡的初始化异常检测方法的流程示意图。
图1B显示为本申请一实施例中智能网卡和服务器的结构示意图。
图2显示为本申请一实施例中一种智能网卡的插槽上设备查询方法的流程示意图。
图3显示为本申请一实施例中一种智能网卡的初始化异常检测方法的具体实施例图。
图4显示为本申请一实施例中一种智能网卡的插槽上设备查询方法的具体实施例图。
图5显示为本申请一实施例中一种智能网卡的初始化异常检测系统的结构示意图。
图6显示为本申请一实施例中服务器的结构示意图。
具体实施方式
以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,在下述描述中,参考附图,附图描述了本申请的若干实施例。应当理解,还可使用其他实施例,并且可以在不背离本申请的精神和范围的情况下进行机械组成、结构、电气以及操作上的改变。下面的详细描述不应该被认为是限制性的,并且本申请的实施例的范围仅由公布的专利的权利要求书所限定。这里使用的术语仅是为了描述特定实施例,而并非旨在限制本申请。空间相关的术语,例如“上”、“下”、“左”、“右”、“下面”、“下方”、“下部”、“上方”、“上部”等,可在文中使用以便于说明图中所示的一个元件或特征与另一元件或特征的关系。
在本申请中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”、“固持”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
为了使本发明的目的、技术方案及优点更加清楚明白,通过下述实施例并结合附图,对本发明实施例中的技术方案的进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定发明。
在对本发明进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释:
(1)基本输入/输出系统(Basic Input Output System,BIOS):从层次关系来看,它位于计算机硬件层和操作系统层之间,一般以固件(Firmware)的形式存在,向下负责计算机硬件的管理,向上对操作系统提供统一的硬件使用和管理接口。它为计算机提供最低级的、最直接的硬件控制,计算机的原始操作都是依照固化在BIOS里的内容来完成的。准确地说,BIOS是硬件与软件程序之间的一个“转换器”或者说是接口(虽然它本身也只是一个程序),负责解决硬件的即时需求,并按软件对硬件的操作要求具体执行。计算机用户在使用计算机的过程中,都会接触到BIOS,它在计算机系统中起着非常重要的作用。
(2)基板管理控制器(Baseboard Management Controller,BMC):是执行伺服器远端管理控制器,为基板管理控制器。它是一块具有自己供电系统的独立于服务器的微处理器,是IPMI(Intelligent Platform Management Interface,智能型平台管理接口)实现的核心部分。BMC是一个独立于服务器系统的单元,主要负责管理软件与服务器间的通信。BMC通过I2C总线收集服务器的信息如传感器信息等可以通过LAN等网络端口发送到管理员端,这样服务器管理员就可以轻松的获取服务器的基本信息及健康状况。BMC的功能不仅仅限于此,其还包括远程的对服务器开关机操作,这都是通过IPMI命令来实现的。
(3)串行通用输入输出系统(Serial General Purpose Input Output,SGPIO):SGPIO协议是一种用于串行通信的协议,主要用于连接系统主板和外部设备之间的输入输出控制。SGPIO协议通过使用时钟(CLK)、数据(DATA)和控制(CTRL)信号来完成通信。CLK信号用于同步数据传输,DATA信号用于传输实际的数据,CTRL信号则用于传输控制信息,如传输开始和结束的标志等。在设计SGPIO通信的硬件模块时,需要根据协议规范来编写相应的代码。
(4)复杂可编程逻辑器件(Complex Programmable Logic Device,CPLD):CPLD采用CMOS EPROM、EEPROM、快闪存储器和SRAM等编程技术,从而构成了高密度、高速度和低功耗的可编程逻辑器件。CPLD具有编程灵活、集成度高、设计开发周期短、适用范围宽、开发工具先进、设计制造成本低、对设计者的硬件经验要求低、标准产品无需测试、保密性强、价格大众化等特点,可实现较大规模的电路设计,因此被广泛应用于产品的原型设计和产品生产之中。几乎所有应用中小规模通用数字集成电路的场合均可应用CPLD器件,CPLD器件已成为电子产品不可缺少的组成部分。
如图1A所示,展示了本发明实施例中的一种智能网卡的初始化异常检测方法的流程示意图。应用于服务器;其中,结合图1B说明,智能网卡的结构包括:第一基本输入输出系统;服务器的结构包括:第二基本输入输出系统、复杂可编程逻辑器件、基板管理控制器。
所述方法包括:
步骤S1:响应于待检测智能网卡的第一基本输入输出系统所发送的初始化指令而进行初始化异常检测,以令复杂可编程逻辑器件接收所述第一基本输入输出系统发送的初始化异常信息。
需说明的是,待检测智能网卡的第一基本输入输出系统发送初始化指令启动初始化,此时,智能网卡开始自检,初始化待检测智能网卡本身的基本功能。在智能网卡的第一基本输入输出系统端初始化过程中,出现不可修正错误时,即初始化状态异常时,第一基本输入输出系统将初始化异常信息发送给服务器端的复杂可编程逻辑器件。
其中,初始化异常信息是指导致智能网卡初始化出现异常的原因,主要包括:网卡驱动问题:如果网卡驱动没有正确安装,或者驱动版本过旧或不兼容,可能导致初始化失败;硬件故障:如果网卡本身出现了故障或者损坏,也可能导致初始化失败;系统问题:如果操作系统本身存在问题,也可能导致网卡无法正常初始化。
需解释的是,当智能网卡初始化异常时,服务器端只能检测到智能网卡不存在,并不能确定智能网卡初始化异常的原因,因此,本实施例通过智能网卡的第一基本输入输出系统将初始化异常信息发送给服务器端,以用于确定智能网卡初始化异常的原因。
在一些示例中,所述复杂可编程逻辑器件接收所述第一基本输入输出系统发送的初始化异常信息,具体包括:所述第一基本输入输出系统包括第一串行通用输入输出接口;所述复杂可编程逻辑器件包括第二串行通用输入输出接口;令所述第一串行通用输入输出接口与第二串行通用输入输出接口连接串行通用输入输出总线,所述串行通用输入输出总线输出串行通用输入输出信号,以通过所述串行通用输入输出信号传输所述初始化异常信息。
具体而言,初始化异常信息的传输可以通过串行通用输入输出信号进行传输,在通常情况下,智能网卡初始化是无法看到异常信息的,利用串行通用输入输出信号可以将异常信息传输到服务器以用于后续的判断显示异常原因。使用串行通用输入输出总线可以完成多路并行数据的传输,简化了传输电缆,节约了成本,且数据传输率比较快,提升了数据传输速率。
步骤S2:令所述复杂可编程逻辑器件对接收到的所述初始化异常信息进行初次解析以获得预设格式的异常数据。
需说明的是,当初始化异常信息传输到复杂可编程逻辑器件时,复杂可编程逻辑器件时需要对初始化异常信息进行初次解析,目的是为了解析获取预设格式的异常数据以方便后续基板管理控制器定位读取数据。
需说明的是,基板管理控制器可以通过IPMB(Intelligent Platform ManagementBus)、LPC(low-pin-count-interface)、SMBus(System Management Bus)等各种接口与主机内部的其他软硬件组件进行通信。因此,所述预设格式包括IPMB、LPC、SMBus等通信形式的数据格式。根据实际情况进行选择,本实施例中不做限定。
在一些示例中,对接收到的所述初始化异常信息进行初次解析以获得预设格式的异常数据后,将所述预设格式的异常数据存储在所述复杂可编程逻辑器件中,或存储在所述复杂可编程逻辑器件外的能被基板管理控制器定位读取的预设位置中。
具体而言,获得预设格式的异常数据后,可以将预设格式的异常数据存储在复杂可编程逻辑器件中,与复杂可编程逻辑器件共享内存,也可以在复杂可编程逻辑器件外预设位置用于存储。预设位置是指所述复杂可编程逻辑器件对接收的SGPIO信号格式的初始化异常信息进行初次解析后,以获取可以被基板管理器读取的格式,即预设格式的异常数据,将预设格式的异常数据存储在特定的地址空间中,这个特定的地址空间就是可以被基板管理器定位读取的预设位置,预设位置可以是存储器或者寄存器。
在本实施例中,可以理解,所述存储器可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,ReadOnlyMemory)、可编程只读存储器(PROM,Programmable Read-Only Memory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,SynchronousStaticRandom Access Memory)。本发明实施例描述的存储器旨在包括但不限于这些和任意其它适合类别的存储器。
所述寄存器可以包括COILS寄存器(线圈状态寄存器)、DISCRETE寄存器(离散输入状态寄存器)、INPUT寄存器(输入寄存器)、HOLDING寄存器(保持寄存器)等;其中,COILS寄存器表示线圈寄存器,表示寄存器的单位是1位(bit)数据,类型为开关量,可进行读写;DISCRETE寄存器表示离散输入寄存器,只能读取开关量;HOLDING寄存器表示保持寄存器,该寄存器的单位是2个byte,可以存放具体的数据量,并且是可读写的,INPUT寄存器表示输入寄存器,只能读取保持寄存器数据。
在一些示例中,若所述预设格式的异常数据存储在所述复杂可编程逻辑器件中,令所述基板管理控制器实时监控读取所述复杂可编程逻辑器件中存储的预设格式的异常数据;若所述预设格式的异常数据存储在所述复杂可编程逻辑器件外的能被基板管理控制器定位读取的预设位置中,令所述基板管理控制器实时定位读取所述预设位置中存储的预设格式的异常数据。
需解释的是,预设格式的异常数据的存储可以根据实际情况选择,本实施例不做限定。如果在智能网卡初始化异常检测过程中,所获得的预设格式的异常数据的数据量比较小,可以使用共享内存的方法,将预设格式的异常数据存储在复杂可编程逻辑器件中,可以直接读取复杂可编程逻辑器件获取异常数据,简化了硬件结构,节省了硬件成本,且通信效率变高。
但是,如果在长时间运行过程中所获得的预设格式的异常数据的数据量大,优选将所述预设格式的异常数据存储在所述复杂可编程逻辑器件外的预设位置中,以避免出现复杂可编程逻辑器件内存不够的情况。
步骤S3:令基板管理控制器实时读取所述复杂可编程逻辑器件所输出的预设格式的异常数据进行再次解析以用于显示和/或打印。
需说明的是,服务器作为网络环境中的硬件基础,存储着越来越多的信息,服务器的稳定运行变得越来越重要。服务器有监控自身运行状态的机制,其中核心部件就是BMC,作为基板管理控制器,BMC能监控MB(MainBoard,主板)和系统的温度、电压、CPU、内存、硬盘状态、板卡信息,调控风扇,显示系统状态,实现远程访问等,保障服务器的稳定运行。因此,在本实施例中,利用基板管理控制器能够获取智能网卡的状态并显示。基板管理控制器可以实时读取预设格式的异常数据并将其解析为能被显示或打印的数据格式以方便用户确定智能网卡初始化异常的原因,才能根据错误原因进行处理,提高工作效率。
在一些示例中,令基板管理控制器对预设格式的异常数据进行再次解析后,将再次解析后的异常数据发送给第二基本输入输出系统,在所述第二基本输入输出系统的设置界面显示异常数据;令基板管理控制器对预设格式的异常数据进行再次解析后,通过串口通信方式将再次解析后的异常数据发送至外部打印设备进行打印显示。
于本实施例中,通过基板管理控制器最终读取智能网卡初始化异常的异常数据,但是通常情况下是看不到异常数据的,即初始化异常的错误信息是不显示出来的,是因为在正常情况下,智能网卡初始化不会连接显示器,所以无法看到异常信息,如果想要连接显示器显示异常信息,需要对初始化异常信息进行处理才可以显示在显示器上。
因此,为了将导致初始化异常的错误信息显示出来,先将初始化异常信息传输给服务器,在服务器中先通过复杂可编程逻辑器件对初始化异常信息进行初次解析,以获取能被基板管理控制器读取的异常数据,然后在基板管理控制器内对异常数据进行再次解析,此时是为了解析成能够被显示或打印的数据格式。
具体而言,可以显示的数据格式是指将异常数据解析成能被第二基本输入输出系统读取的数据格式,然后显示在第二基本输入输出系统的设置界面上。而可以打印的数据格式是指服务器通过串口通信方式外接打印设备,将再次解析后的异常数据通过串口通信发送至外部打印设备打印显示出来。通过界面显示或打印显示可以直观地看到并确认智能网卡初始化出现异常的错误类型,从而提高工作效率,减少debug的成本。
于本申请一实施例中,结合图2说明,在执行所述响应于待检测智能网卡的第一基本输入输出系统所发送的初始化指令而进行初始化异常检测之前,所述方法还执行如下:响应于待检测智能网卡的插入,令第二基本输入输出系统发出插槽信息读取命令,以读取插槽中所插入的待检测智能网卡的设备信息,以根据所读取的设备信息确定对应插槽是否为空。
需说明的是,智能网卡插入服务器的插槽中,服务器的第二基本输入输出系统会发出插槽信息读取命令以读取插槽的设备信息,通过插槽的设备信息可以判断插槽是否插入智能网卡,如果设备信息显示插槽上存在设备,则说明智能网卡存在,初始化运行正常;如果设备信息显示插槽上不存在设备,则说明插槽上的智能网卡存在异常,但是具体的导致异常的原因不确定,需要进行智能网卡初始化异常检测以确定智能网卡初始化异常的原因。
为了更好的描述智能网卡的初始化异常检测方法,提供以下具体实施例进行说明,如图3所示,具体实施例如下:
步骤S301:智能网卡初始化;
步骤S302:智能网卡的第一基本输入输出系统发送初始化异常信息至服务器的复杂可编程逻辑器件;
步骤S303:复杂可编程逻辑器件对所述初始化异常信息进行初次解析以获得预设格式的异常数据;
步骤S304:将所述复杂可编程逻辑器件所输出的预设格式的异常数据发送至基板管理控制器;
步骤S305:基板管理控制器对所述复杂可编程逻辑器件所输出的预设格式的异常数据进行再次解析以用于显示和/或打印。
在智能网卡初始化之前,即在步骤S301之前,还包括如下步骤,结合图4说明:
步骤S401:智能网卡发出插入指令;
步骤S402:第二基本输入输出系统响应于待检测智能网卡的插入指令,令第二基本输入输出系统发出插槽信息读取命令;
步骤S403:根据插槽信息读取命令读取插槽中所插入的待检测智能网卡的设备信息,以根据所读取的设备信息确定对应插槽是否为空。
需强调的是,本申请通过服务器中的基板管理控制器实时监控读取智能网卡初始化异常时的错误信息,还可以显示错误信息的类型,能确定导致智能网卡初始化异常的具体原因或者具体错误类型,以便于及时处理,提高了工作效率,减少了debug的成本。
与上述实施例原理相似的是,本发明提供一种智能网卡的初始化异常检测系统。以下结合附图提供具体实施例:
如图5所示,展示了本发明一实施例中的智能网卡的初始化异常检测系统的结构示意图。本实施例中,所述智能网卡的初始化异常检测系统500包括:
异常信息获取模块501,用于响应于待检测智能网卡的第一基本输入输出系统所发送的初始化指令而进行初始化异常检测,以令复杂可编程逻辑器件接收所述第一基本输入输出系统发送的初始化异常信息;
异常数据获取模块502,用于令所述复杂可编程逻辑器件对接收到的所述初始化异常信息进行初次解析以获得预设格式的异常数据;
异常数据显示模块503,用于令基板管理控制器实时读取所述复杂可编程逻辑器件所输出的预设格式的异常数据进行再次解析以用于显示和/或打印。
所述系统还包括:
插槽信息读取模块,用于响应于待检测智能网卡的插入,令第二基本输入输出系统发出插槽信息读取命令,以读取插槽中所插入的待检测智能网卡的设备信息,以根据所读取的设备信息确定对应插槽是否为空。
应理解的是,以上系统的各个模块或单元的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块或单元可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块或单元通过处理元件调用软件的形式实现,部分模块或单元通过硬件的形式实现。
例如,以上这些模块或单元可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital signal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
因本实施例中智能网卡的初始化异常检测系统的实施方式,与上文中提供的智能网卡的初始化异常检测方法的实施方式类似,故不再赘述。
如图6所示,展示本申请一实施例中服务器的结构示意图。本实例提供的服务器60,包括:存储器61及处理器62。所述存储器61用于存储计算机程序;所述处理器62运行计算机程序,实现如图1所述的智能网卡的初始化异常检测方法。
可选的,所述存储器61的数量均可以是一或多个,所述处理器62的数量均可以是一或多个。
可选的,所述基于服务器60中的处理器62会按照如图1所述的步骤,将一个或多个以应用程序的进程对应的指令加载到存储器61中,并由处理器62来运行存储在第一存储器61中的应用程序,从而实现如图1所述的智能网卡的初始化异常检测方法中的各种功能。
可选的,所述存储器61,可能包括但不限于高速随机存取存储器、非易失性存储器。例如一个或多个磁盘存储设备、闪存设备或其他非易失性固态存储设备;所述处理器62,可能包括但不限于中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可选的,所述处理器62可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述智能网卡的初始化异常检测方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
于本申请提供的实施例中,所述计算机可读写存储介质可以包括只读存储器、随机存取存储器、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁存储设备、闪存、U盘、移动硬盘、或者能够用于存储具有指令或数据结构形式的期望的程序代码并能够由计算机进行存取的任何其它介质。另外,任何连接都可以适当地称为计算机可读介质。例如,如果指令是使用同轴电缆、光纤光缆、双绞线、数字订户线(DSL)或者诸如红外线、无线电和微波之类的无线技术,从网站、服务器或其它远程源发送的,则所述同轴电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线电和微波之类的无线技术包括在所述介质的定义中。然而,应当理解的是,计算机可读写存储介质和数据存储介质不包括连接、载波、信号或者其它暂时性介质,而是旨在针对于非暂时性、有形的存储介质。如申请中所使用的磁盘和光盘包括压缩光盘(CD)、激光光盘、光盘、数字多功能光盘(DVD)、软盘和蓝光光盘,其中,磁盘通常磁性地复制数据,而光盘则用激光来光学地复制数据。
综上所述,本申请提供智能网卡的初始化异常检测方法、系统、服务器及介质。本申请通过基板管理控制器实时监控读取智能网卡初始化异常时的错误信息,并显示错误信息的类型,可以实时定位异常,明确导致无法读到智能网卡的原因,提高工作效率,减少debug的成本。所以,本申请有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本申请的原理及其功效,而非用于限制本申请。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本申请所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本申请的权利要求所涵盖。
Claims (10)
1.一种智能网卡的初始化异常检测方法,其特征在于,应用于服务器,所述方法包括:
响应于待检测智能网卡的第一基本输入输出系统所发送的初始化指令而进行初始化异常检测,以令复杂可编程逻辑器件接收所述第一基本输入输出系统发送的初始化异常信息;
令所述复杂可编程逻辑器件对接收到的所述初始化异常信息进行初次解析以获得预设格式的异常数据;
令基板管理控制器实时读取所述复杂可编程逻辑器件所输出的预设格式的异常数据进行再次解析以用于显示和/或打印。
2.根据权利要求1所述的智能网卡的初始化异常检测方法,其特征在于,在执行所述响应于待检测智能网卡的第一基本输入输出系统所发送的初始化指令而进行初始化异常检测之前,所述方法还执行如下:
响应于待检测智能网卡的插入,令第二基本输入输出系统发出插槽信息读取命令,以读取插槽中所插入的待检测智能网卡的设备信息,以根据所读取的设备信息确定对应插槽是否为空。
3.根据权利要求1所述的智能网卡的初始化异常检测方法,其特征在于,所述复杂可编程逻辑器件接收所述第一基本输入输出系统发送的初始化异常信息,具体包括:
所述第一基本输入输出系统包括第一串行通用输入输出接口;所述复杂可编程逻辑器件包括第二串行通用输入输出接口;
令所述第一串行通用输入输出接口与第二串行通用输入输出接口连接串行通用输入输出总线,所述串行通用输入输出总线输出串行通用输入输出信号,以通过所述串行通用输入输出信号传输所述初始化异常信息。
4.根据权利要求1所述的智能网卡的初始化异常检测方法,其特征在于,所述方法还包括:对接收到的所述初始化异常信息进行初次解析以获得预设格式的异常数据后,将所述预设格式的异常数据存储在所述复杂可编程逻辑器件中,或存储在所述复杂可编程逻辑器件外的能被基板管理控制器定位读取的预设位置中。
5.根据权利要求1所述的智能网卡的初始化异常检测方法,其特征在于,所述基板管理控制器实时读取所述复杂可编程逻辑器件所输出的预设格式的异常数据,具体包括:
若所述预设格式的异常数据存储在所述复杂可编程逻辑器件中,令所述基板管理控制器实时监控读取所述复杂可编程逻辑器件中存储的预设格式的异常数据;
若所述预设格式的异常数据存储在所述复杂可编程逻辑器件外的能被基板管理控制器定位读取的预设位置中,令所述基板管理控制器实时定位读取所述预设位置中存储的预设格式的异常数据。
6.根据权利要求1所述的智能网卡的初始化异常检测方法,其特征在于,所述基板管理控制器实时读取所述复杂可编程逻辑器件所输出的预设格式的异常数据进行再次解析以用于显示和/或打印,包括:
令基板管理控制器对预设格式的异常数据进行再次解析后,将再次解析后的异常数据发送给第二基本输入输出系统,在所述第二基本输入输出系统的设置界面显示异常数据;
令基板管理控制器对预设格式的异常数据进行再次解析后,通过串口通信方式将再次解析后的异常数据发送至外部打印设备进行打印显示。
7.一种智能网卡的初始化异常检测系统,其特征在于,所述系统包括:
异常信息获取模块,用于响应于待检测智能网卡的第一基本输入输出系统所发送的初始化指令而进行初始化异常检测,以令复杂可编程逻辑器件接收所述第一基本输入输出系统发送的初始化异常信息;
异常数据获取模块,用于令所述复杂可编程逻辑器件对接收到的所述初始化异常信息进行初次解析以获得预设格式的异常数据;
异常数据显示模块,用于令基板管理控制器实时读取所述复杂可编程逻辑器件所输出的预设格式的异常数据进行再次解析以用于显示和/或打印。
8.根据权利要求7所述的智能网卡的初始化异常检测系统,其特征在于,所述系统还包括:
插槽信息读取模块,用于响应于待检测智能网卡的插入,令第二基本输入输出系统发出插槽信息读取命令,以读取插槽中所插入的待检测智能网卡的设备信息,以根据所读取的设备信息确定对应插槽是否为空。
9.一种服务器,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器,用于执行所述存储器存储的计算机程序,以使所述服务器执行如权利要求1至6中任一项所述的智能网卡的初始化异常检测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述智能网卡的初始化异常检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311134956.6A CN117176606A (zh) | 2023-09-04 | 2023-09-04 | 智能网卡的初始化异常检测方法、系统、服务器及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311134956.6A CN117176606A (zh) | 2023-09-04 | 2023-09-04 | 智能网卡的初始化异常检测方法、系统、服务器及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117176606A true CN117176606A (zh) | 2023-12-05 |
Family
ID=88937026
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311134956.6A Pending CN117176606A (zh) | 2023-09-04 | 2023-09-04 | 智能网卡的初始化异常检测方法、系统、服务器及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117176606A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116107819A (zh) * | 2022-12-16 | 2023-05-12 | 苏州浪潮智能科技有限公司 | 一种服务器启动故障检测系统、方法、装置以及介质 |
CN116225802A (zh) * | 2023-02-16 | 2023-06-06 | 超聚变数字技术有限公司 | 一种故障测试方法、装置及计算设备 |
CN116521478A (zh) * | 2023-04-21 | 2023-08-01 | 苏州浪潮智能科技有限公司 | 一种板卡状态监控方法、系统、电子设备及介质 |
-
2023
- 2023-09-04 CN CN202311134956.6A patent/CN117176606A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116107819A (zh) * | 2022-12-16 | 2023-05-12 | 苏州浪潮智能科技有限公司 | 一种服务器启动故障检测系统、方法、装置以及介质 |
CN116225802A (zh) * | 2023-02-16 | 2023-06-06 | 超聚变数字技术有限公司 | 一种故障测试方法、装置及计算设备 |
CN116521478A (zh) * | 2023-04-21 | 2023-08-01 | 苏州浪潮智能科技有限公司 | 一种板卡状态监控方法、系统、电子设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9916270B2 (en) | Virtual intelligent platform management interface (IPMI) satellite controller and method | |
JP6530774B2 (ja) | ハードウェア障害回復システム | |
CN109471770B (zh) | 一种系统管理方法和装置 | |
US20150106660A1 (en) | Controller access to host memory | |
US20070055793A1 (en) | System of managing peripheral interfaces in IPMI architecture and method thereof | |
CN102662785A (zh) | 一种Android系统内核错误信息获取方法及装置 | |
US10606677B2 (en) | Method of retrieving debugging data in UEFI and computer system thereof | |
JP2016518654A (ja) | サーバ制御方法及びサーバ制御装置 | |
CN105183575A (zh) | 处理器故障的诊断方法、装置及系统 | |
CN112286709A (zh) | 一种服务器硬件故障的诊断方法、诊断装置及诊断设备 | |
CN102567171A (zh) | 一种测试刀片服务器主板的方法 | |
JP2017091077A (ja) | 擬似故障の発生プログラム、発生方法、及び発生装置 | |
CN112000535A (zh) | 一种基于SAS Expander卡的硬盘异常识别方法及处理方法 | |
CN113672306B (zh) | 服务器组件自检异常恢复方法、装置、系统及介质 | |
CN117251333A (zh) | 一种硬盘信息获取方法、装置、设备及存储介质 | |
CN114003445B (zh) | Bmc的i2c监控功能测试方法、系统、终端及存储介质 | |
US8819484B2 (en) | Dynamically reconfiguring a primary processor identity within a multi-processor socket server | |
CN109117299B (zh) | 服务器的侦错装置及其侦错方法 | |
CN117707884A (zh) | 一种监控电源管理芯片的方法、系统、设备和介质 | |
CN115599617B (zh) | 总线检测方法、装置、服务器及电子设备 | |
US20170364368A1 (en) | Setting method of accessing system parameters and server using the same | |
CN114564334B (zh) | 一种mrpc数据处理方法、系统及相关组件 | |
CN106610878B (zh) | 双控制器系统的故障调试方法 | |
CN117176606A (zh) | 智能网卡的初始化异常检测方法、系统、服务器及介质 | |
CN112015600A (zh) | 日志信息处理系统、日志信息处理方法及装置和交换机 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |