CN113641543A - 一种检测网卡故障的方法,装置及介质 - Google Patents

一种检测网卡故障的方法,装置及介质 Download PDF

Info

Publication number
CN113641543A
CN113641543A CN202110943810.0A CN202110943810A CN113641543A CN 113641543 A CN113641543 A CN 113641543A CN 202110943810 A CN202110943810 A CN 202110943810A CN 113641543 A CN113641543 A CN 113641543A
Authority
CN
China
Prior art keywords
network card
ncsi
fault
network
available
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110943810.0A
Other languages
English (en)
Inventor
王启勇
韩亮亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Power Commercial Systems Co Ltd
Original Assignee
Inspur Power Commercial Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Power Commercial Systems Co Ltd filed Critical Inspur Power Commercial Systems Co Ltd
Priority to CN202110943810.0A priority Critical patent/CN113641543A/zh
Publication of CN113641543A publication Critical patent/CN113641543A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Small-Scale Networks (AREA)

Abstract

本发明公开了一种检测网卡故障的方法,包括:运行驱动代码以驱动NCSI网口,根据驱动结果判断是否存在可用的NCSI网口,若存在可用的NCSI网口,确定网卡正常,若不存在可用的NCSI网口,确定网卡故障,并将判断结果发送至产线检测端。本发明提供的检测网卡故障的方法,通过对驱动代码层代码以驱动NCSI网口,根据驱动结果判断是否有可用的NCSI网口以判断NCSI功能是否正常,进而判断网卡是否故障,该方法不仅能检测BMC侧和HOST侧的功能是否正常,所有影响NCSI功能的问题均能检测出来,避免了传统在HOST侧检测网卡的性能以判断网卡是否正常,不能保证BMC侧功能正常的问题,提高了对网卡是否正常的判断准确率,进而提高网卡的良品率。

Description

一种检测网卡故障的方法,装置及介质
技术领域
本发明涉及计算机领域,特别是涉及一种检测网卡故障的方法,装置及介质。
背景技术
服务器通常会配置一张具备网络控制器边带接口(Network ControllerSideband Interface,简称NCSI)功能的网卡,具备NCSI功能的网卡共享口可以同时供基板管理控制器(Baseboard Management Controller,简称BMC)侧和主板(HOST)侧使用,节省服务器有限的硬件空间。
图1为配置有具备NCSI功能网卡的服务器结构示意图。如图1所示,服务器主板1上有一个主板接口4,NCSI线缆3的一端与服务器的主板接口4连接,另一端与网卡插槽5旁的接口连接。当NCSI线缆3连接不牢靠时,会导致NCSI功能失去响应,影响网卡2的性能,降低用户使用服务器的体验感。目前,通常在HOST侧检测网卡2的性能以判断网卡2性能是否正常。
由于具备NCSI功能的网卡2共享口可以同时供BMC侧和HOST侧使用,所以在HOST侧检测网卡2的性能,不能保证BMC侧的功能正常,由此可见,仅在HOST侧检测网卡2的性能不够全面。
因此,如何解决在HOST侧检测具备NCSI功能的网卡2的性能不全面,提升用户体验感,是本领域技术人员亟待解决的问题。
发明内容
本发明的目的是提供一种检测网卡故障的方法,装置及介质,提高了对网卡是否正常的判断准确率,进而提高网卡的良品率。
为了解决上述技术问题,本发明提供了一种检测网卡故障的方法,包括:
运行驱动代码以驱动NCSI网口;
根据驱动结果判断是否存在可用的NCSI网口,若存在可用的所述NCSI网口,确定网卡正常;若不存在可用的所述NCSI网口,确定所述网卡故障;
将判断结果发送至产线检测端。
优选地,所述检测网卡故障的方法还包括:
获取厂商刷写的EEPROM的初始数据,以及所述EEPROM的实际数据;
对比所述初始数据和所述实际数据是否相等,若相等,确定所述网卡正常,若不相等,确定所述网卡故障。
优选地,所述将判断结果发送至产线检测端,包括:
创建检测接口;
通过所述检测接口判断是否存在目标文件,其中,所述目标文件在确定不存在可用的所述NCSI网口的情况下生成;
若存在所述目标文件,则将所述网卡故障的判断结果发送至所述产线检测端;
若不存在所述目标文件,则将所述网卡正常的判断结果发送至所述产线检测端。
优选地,所述初始数据为所述厂商刷写的所述EEPROM除MAC地址以外的数据,所述实际数据为实际的所述EEPROM除MAC地址的数据。
优选地,在所述根据驱动结果判断是否存在可用的NCSI网口之后,还包括:
判断运行所述驱动代码的当前次数是否达到第一预设次数;
若达到所述第一预设次数,则判断存在可用的所述NCSI网口的次数是否占所述第一预设次数的第一预设值,若是,确定所述网卡正常,若否,确定所述网卡故障;
若未达到所述第一预设次数,返回所述运行驱动代码以驱动NCSI网口的步骤。
优选地,在所述对比所述初始数据和所述实际数据是否相等之后,还包括:
判断获取所述实际数据的当前次数是否达到第二预设次数;
若达到所述第二预设次数,判断所述初始数据和所述实际数据相等的次数是否占所述第二预设次数的第二预设值,若是,确定所述网卡正常,若否,确定所述网卡故障;
若未达到所述第二预设次数,返回所述获取厂商刷写的EEPROM的初始数据,以及所述EEPROM的实际数据的步骤。
优选地,在所述将判断结果发送至产线检测端之后,还包括:
若确定所述网卡故障,则控制报警装置工作。
为了解决上述技术问题,本发明还提供了一种检测网卡故障的装置,包括:
运行模块,用于运行驱动代码以驱动NCSI网口;
判断模块,用于根据驱动结果判断是否存在可用的NCSI网口,若存在可用的所述NCSI网口,确定网卡正常;若不存在可用的所述NCSI网口,确定所述网卡故障;
发送模块,用于将判断结果发送至产线检测端。
为了解决上述技术问题,本发明还提供了一种检测网卡故障的装置,包括存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现所述的检测网卡故障的方法的步骤。
为了解决上述技术问题,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的检测网卡故障的方法的步骤。
本发明所提供的一种检测网卡故障的方法,包括:运行驱动代码以驱动NCSI网口,根据驱动结果判断是否存在可用的NCSI网口,若存在可用的NCSI网口,确定网卡正常,若不存在可用的NCSI网口,确定网卡故障,并将判断结果发送至产线检测端。当前,通常在HOST侧检测网卡的性能以判断网卡性能是否正常,由于具备NCSI功能的网卡共享口可以同时供BMC侧和HOST侧使用,因此在HOST侧检测网卡的性能,不能保证BMC侧功能正常,本发明提供的检测网卡故障的方法,通过对驱动代码层代码以驱动NCSI网口,根据驱动结果判断是否有可用的NCSI网口以判断NCSI功能是否正常,进而判断网卡是否故障,该方法不仅能检测BMC侧和HOST侧的功能是否正常,所有影响NCSI功能的问题均能检测出来,进而提高网卡的良品率。
此外,本发明还提供一种检测网卡故障的装置及介质,效果同上。
附图说明
为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为配置有具备NCSI功能网卡的服务器结构示意图;
图2为本发明提供的检测网卡故障的方法流程图;
图3为本发明提供的另一种检测网卡故障的方法流程图;
图4为本发明提供的一种检测网卡故障的装置示意图;
图5为基于检测NCSI以及EEPROM数据的检测网卡故障的方法流程图;
图6为本发明另一实施例提供的检测网卡故障的装置的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
本发明的核心是提供一种检测网卡2故障的方法,装置及介质,通过检测NCSI的功能以判断具备NCSI功能的网卡2是否故障,不仅能检测BMC侧和HOST侧的功能是否正常,所有影响NCSI功能的问题均能检测出来,避免了传统只检测HOST侧网卡2性能以判断网卡2是否故障不能全面的弊端,提高了网卡2的良品率。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
如图1可知,具备NCSI功能网卡2的服务器主板1上有一个主板接口4,NCSI线缆3的一端与服务器的主板接口4连接,另一端与网卡插槽5旁的接口连接。当NCSI线缆3连接不牢靠时,会导致NCSI功能失去响应,影响网卡2的性能,降低用户使用服务器的体验感。目前,通常采用在HOST侧检测网卡2的性能以判断网卡2性能是否正常,由于具备NCSI功能的网卡2共享口可以同时供BMC侧和HOST侧使用,所以在HOST侧检测网卡2的性能,不能保证BMC侧的功能正常,由此可见,仅在HOST侧检测网卡2的性能不够全面。
为了解决仅在HOST侧检测网卡2的性能不够全面的问题,本发明提出了一种检测网卡2故障的方法。图2为本发明提供的检测网卡故障的方法流程图,如图2所示,该方法包括:
S10:运行驱动代码以驱动NCSI网口。
S11:根据驱动结果判断是否存在可用的NCSI网口,若存在可用的NCSI网口,进入步骤S12,若不存在可用的NCSI网口,进入步骤S13。
S12:确定网卡正常。
S13:确定网卡故障。
S14:判断结果发送至产线检测端。
在具体实施例中,通过运行驱动代码以驱动NCSI网口,将影响NCSI功能的问题暴露在最早期,根据驱动结果判断是否存在可用的NCSI网口,若存在可用的NCSI网口,确定网卡2正常,若不存在可用的NCSI网口,确定网卡2故障,最后将判断结果发送至产线检测端。需要说明的是,产线检测端是可以让检测人员直观观察到网卡2故障的装置,可以是一个报警装置,也可以是一个显示屏,本发明对此不作限定。
在具体实施中,由于NCSI的驱动属于内核态,打印只能通过dmesg,而dmesg容量有限,打印多的时候,想要的信息容易被覆盖。因此,为了避免有效信息被覆盖,当根据驱动结果判断出不存在NCSI网口后生成目标文件,并创建检测端口,由检测端口来检测是否有目标文件的存在进而判断网卡2是否故障,并将检测结果传输至产线检测端。
当然,目前通常采用在HOST侧检测网卡2的性能以判断网卡2性能是否正常的手段,除了不能保证BMC侧的功能正常外,若网卡2的电可擦编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,简称EEPROM)的数据改变也会影响网卡2的正常使用,因此仅通过检测HOST侧网卡2的收发包性能无法检测到网卡2的EEPROM数据是否改变。所以,在上述实施例的基础上,获取厂商刷写的网卡2的EEPROM初始数据和实际数据,对比初始数据和实际数据是否相等以判断网卡2的EEPROM值是否被修改,进而判断网卡2是否故障。
需要说明的是,在具体实施中,可以先执行通过运行驱动代码并根据驱动结果判断是否存在可用的NCSI网口以判断网卡2是否故障,再执行获取厂商刷写的网卡2的EEPROM初始数据和实际数据,并对比初始数据和实际数据是否相等以判断网卡2是否故障。也可以先执行获取厂商刷写的网卡2的EEPROM初始数据和实际数据,并对比初始数据和实际数据是否相等以判断网卡2是否故障,再执行通过运行驱动代码并根据驱动结果判断是否存在可用的NCSI网口以判断网卡2是否故障,当然,也可以同时执行,本发明对此不作限定。此外,需要注意的是,获取厂商刷写的网卡2的EEPROM初始数据和实际数据时,应当将EEPROM中的MAC地址进行排除。
在具体实施例中,为了避免一次判断是否存在可用的NCSI网口以判断网卡2是否故障,以及一次判断网卡2的EEPROM初始数据和实际数据是否相等以判断网卡2是否故障带了的误差,以及避免判断错误或者获取数据错误的情况发生,可以对是否存在可用的NCSI网口判断第一预设次数,对判断网卡2的EEPROM初始数据和实际数据是否相等判断第二预设次数,在根据判断结果确定网卡2是否故障。
本发明实施例提供的检测网卡故障的方法,包括:运行驱动代码以驱动NCSI网口,根据驱动结果判断是否存在可用的NCSI网口,若存在可用的NCSI网口,确定网卡正常,若不存在可用的NCSI网口,确定网卡故障,并将判断结果发送至产线检测端。当前,通常在HOST侧检测网卡的性能以判断网卡性能是否正常,由于具备NCSI功能的网卡共享口可以同时供BMC侧和HOST侧使用,因此在HOST侧检测网卡的性能,不能保证BMC侧功能正常,本发明提供的检测网卡故障的方法,通过对驱动代码层代码以驱动NCSI网口,根据驱动结果判断是否有可用的NCSI网口以判断NCSI功能是否正常,进而判断网卡是否故障,该方法不仅能检测BMC侧和HOST侧的功能是否正常,所有影响NCSI功能的问题均能检测出来,进而提高网卡的良品率。
在具体实施例中,若网卡的EEPROM里的数据被修改会导致网卡性能无法达到预期效果,这就要求检测网卡时提前检测出网卡的EEPROM里的实际数据与厂家刷写的初始数据是否相等以判断网卡是否正常。传统在HOST侧检测网卡性能的方法,主要通过测试网卡的收发包性能来判断网卡是否工作正常,但是收发包测试并不能检测出网卡的EEPROM里的数据是否被修改。因此,本发明实施例增加设置检测网卡的EEPROM里的数据是否被修改的方法以判断网卡是否正常,图3为本发明提供的另一种检测网卡故障的方法流程图,如图3所示,该方法包括:
S20:获取厂商刷写的EEPROM的初始数据,以及EEPROM的实际数据。
S21:对比初始数据和实际数据是否相等,若相等,进入步骤S12,若不相等,进入步骤S13。
S12:确定网卡正常。
S13:确定网卡故障。
S14:判断结果发送至产线检测端。
在具体实施中,先获取厂商刷写的EEPROM的初始数据,以及EEPROM的实际数据,并对比初始数据和实际数据是否相等,若初始数据和实际数据相等,则确定网卡正常,若初始数据和实际数据不相等,确定网卡故障。
由此可见,本发明实施例提供的检测网卡故障的方法,通过直接获取厂商刷写的EEPROM的初始数据,以及EEPROM的实际数据,并对比初始数据和实际数据是否相等以判断网卡是否故障,避免了传统HOST侧检测网卡性能的方法不能检测EEPROM里的数据是否被修改而无法检测出网卡故障的弊端,提高了检测网卡故障的准确率,进而提高了网卡的良品率。
在上述实施例的基础上,由于NCSI的驱动属于内核态,可以通过打印函数printk将判断结果打印出来,虽然printk打印结果可以在系统串口下实时看到,但当同时测试大量机器时,不可能每台机器都接一个系统串口,此外,由于NCSI的驱动属于内核态,所以printk打印只能通过dmesg,BMC正常工作后,printk打印收集一键日志,查看采集的dmesg信息以判断网卡是否正常,这种方式不仅繁琐,而且dmesg容量有限,可能会导致有效信息被覆盖。为了避免上述情况,在判断出不存在可用的NCSI网口后,生成目标文件,并创建检测接口,通过检测接口判断是否存在目标文件以确定网卡是否故障,若存在目标文件,则确定网卡故障,若不存在目标文件,则确定网卡正常,并将该结果传输至产线检测端。需要说明的是,判断结果传输至产线检测端,可以是数字的形式,也可以是文本或英文的形式,本发明对此不作限定。
例如,以数字形式为例进行说明,通过检测接口判断是否存在目标文件,若存在目标文件,则输出数字1以表示确定网卡故障,若不存在目标文件,则输出0以表示网卡正常,并将该结果传输至产线检测端,产线检测端通过判断是否接收到数字1以判断网卡是否正常。
本发明实施例,通过创建检测接口以及在检测出不存在可用的NCSI网口口生成目标文件的方式,当检测接口判断出存在目标文件时,则确定网卡故障,若不存在目标文件,则确定网卡正常,有效避免了传统通过printk打印结果导致结果由于dmesg容量有限而被覆盖,提高了对网卡故障的检测正确率,进而提高了网卡的良品率。
在具体实施中,网卡的MAC地址对网卡的性能没有影响,因此在获取厂商刷写的EEPROM的初始数据,以及EEPROM的实际数据时,应当相应去除MAC地址,避免因为对比出MAC地址的不同导致对网卡性能判断错误。
本发明实施例提供的检测网卡故障的方法,通过获取厂商刷写的EEPROM除MAC地址以外的初始数据,以及实际的EEPROM除MAC地址的实际数据,并对比初始数据和实际数据是否相等以判断网卡是否正常,可以避免由于对比出MAC地址的不同导致对网卡性能判断错误,提高了对网卡故障的检测正确率,进而提高了网卡的良品率。
在上述实施例的基础上,考虑到通过对是否存在可用的NCSI网口判断一次以确定网卡是否故障可能会出现误差,以及可能会出现判断错误或获取信息错误的情况发生,因此根据驱动结果判断是否存在可用的NCSI网口之后,先判断驱动代码运行的当前次数是否达到第一预设次数,若达到第一预设次数,则继续判断存在可用的NCSI网口的次数是否占第一预设次数的第一预设值,若是,确定网卡正常,若否,确定网卡故障,若未达到第一预设次数,则返回运行驱动代码以驱动NCSI网口的步骤。
例如,判断驱动代码运行的当前次数是否达到5次,若达到5次,则继续判断存在可用的NCSI网口的次数是否占5次的60%,若是,确定网卡正常,若否,确定网卡故障,若未达到5次,则返回运行驱动代码以驱动NCSI网口的步骤。
本发明实施例提供的检测网卡故障的方法,通过设置驱动代码运行的当前次数必须达到第一预设次数,以及通过可用的NCSI网口的次数是否占第一预设次数的第一预设值的方式以判断网卡是否正常,提高了对网卡故障的判断准确性。
在上述实施例的基础上,同样考虑到通过对网卡的EEPROM初始数据和实际数据是否相等判断一次以确定网卡是否故障可能会出现误差,以及可能会出现判断错误或获取数据错误的情况发生,因此对比一次初始数据和实际数据是否相等后,判断获取实际数据的当前次数是否达到第二预设次数,若达到第二预设次数,继续判断初始数据和实际数据相等的次数是否占第二预设次数的第二预设值,若是,确定网卡正常,若否,确定网卡故障,若未达到第二预设次数,返回获取EEPROM的实际数据的步骤。
本发明实施例提供的检测网卡故障的方法,通过设置获取实际数据的当前次数必须达到第二预设次数,以及通过判断初始数据和实际数据相等的次数是否占第二预设次数的第二预设值的方式以判断网卡是否正常,提高了对网卡故障的判断准确性,进而提高了网卡的良品率。
在具体实施中,为了让检测工作人员更直观的知道网卡是否故障,则增加设置一个报警装置,当判断结果传输至产线检测端后,若网卡故障,则报警装置的红色指示灯亮,若网卡正常,则绿色指示灯亮。需要说明的是,报警装置可以是指示灯,也可以是蜂鸣器,还可以是一个显示屏,直接显示“网卡故障”或“网卡正常”的文字,对此本发明不作限定。
本发明实施例提供的检测网卡故障的方法,通过增加设置一个报警装置,可以让检测人员直观的了解到网卡是否故障,提高网卡检测正确率的同时,提高用户使用网卡的体验感。
在上述实施例中,对于检测网卡故障的方法进行了详细描述,本发明还提供一种检测网卡故障的装置对应的实施例。需要说明的是,本发明从两个角度对装置部分的实施例进行描述,一种是基于功能模块的角度,另一种是基于硬件结构的角度。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
图4为本发明提供的一种检测网卡故障的装置示意图。如图4所说,该装置包括:
运行模块40,用于运行驱动代码以驱动NCSI网口;
判断模块41,用于根据驱动结果判断是否存在可用的NCSI网口,若存在可用的NCSI网口,确定网卡正常;若不存在可用的NCSI网口,确定网卡故障;
发送模块42,用于将判断结果发送至产线检测端。
本发明实施例提供的检测网卡故障的方法,包括:运行驱动代码以驱动NCSI网口,根据驱动结果判断是否存在可用的NCSI网口,若存在可用的NCSI网口,确定网卡正常,若不存在可用的NCSI网口,确定网卡故障,并将判断结果发送至产线检测端。当前,通常在HOST侧检测网卡的性能以判断网卡性能是否正常,由于具备NCSI功能的网卡共享口可以同时供BMC侧和HOST侧使用,因此在HOST侧检测网卡的性能,不能保证BMC侧功能正常,本发明提供的检测网卡故障的方法,通过对驱动代码层代码以驱动NCSI网口,根据驱动结果判断是否有可用的NCSI网口以判断NCSI功能是否正常,进而判断网卡是否故障,该方法不仅能检测BMC侧和HOST侧的功能是否正常,所有影响NCSI功能的问题均能检测出来,进而提高网卡的良品率。
图5为基于检测NCSI以及EEPROM数据的检测网卡故障的方法流程图,为了使本领域的技术人员更好的理解本发明的技术方案,下面结合图5对上述本发明作进一步详细说明。
如图5所示,该方法包括:
S10:运行驱动代码以驱动NCSI网口。
S11:根据驱动结果判断是否存在可用的NCSI网口,并进入步骤S100。
S100:判断驱动代码运行的当前次数是否达到第一预设次数,若达到第一预设次数,判断存在可用的NCSI网口的次数是否占第一预设次数的第一预设值,若未达到第一预设次数,返回运行驱动代码以驱动NCSI网口的步骤。
S101:判断存在可用的NCSI网口的次数是否占第一预设次数的第一预设值,若是,进入步骤S12,若否,进入步骤S13。
S12:确定网卡正常。
S13:确定网卡故障。
S14:判断结果发送至产线检测端。
在具体实施中,通过运行驱动代码以驱动NCSI网口,根据驱动结果判断是否存在可用的NCSI网口,接着判断驱动代码运行的当前次数是否达到第一预设次数,若达到第一预设次数,进入步骤S101以判断可用的NCSI网口的次数是否占第一预设次数的第一预设值,若是,确定网卡正常,若否,确定网卡故障。若未达到第一预设次数,返回步骤S10重新运行驱动代码以驱动NCSI网口。最后,将结果发送至产线端。
由于通过检测网口状态的方法,则需要配置VLAN环境,对于很多厂家来说,环境配置需求的成本和配置的复杂度大大提高,严重影响产线的测试效率。通过对驱动层代码进行优化以驱动NCSI网口,将有关NCSI网口的问题暴露在最早期,不受服务器对网卡配置环境的要求影响,且能够将影响NCSI功能的问题检测出来。
S20:获取厂商刷写的EEPROM的初始数据,以及EEPROM的实际数据。
S21:对比初始数据和实际数据是否相等,并进入步骤S200。
S200:判断获取实际数据的当前次数是否达到第二预设次数,若达到第二预设次数,判断初始数据和实际数据相等的次数是否占第二预设次数的第二预设值,若未达到第二预设次数,返回获取厂商刷写的EEPROM的初始数据,以及EEPROM的实际数据的步骤。
S201:判断初始数据和实际数据相等的次数是否占第二预设次数的第二预设值,若是,进入步骤S12,若否,进入步骤S13。
S12:确定网卡正常。
S13:确定网卡故障。
S14:判断结果发送至产线检测端。
在判断是否有可用的NCSI网口以判断网卡是否故障的基础上,获取厂商刷写的EEPROM的初始数据,以及EEPROM的实际数据,并对比初始数据和实际数据是否相等,接着判断获取实际数据的当前次数是否达到第二预设次数,若达到第二预设次数,则进入步骤S201以判断初始数据和实际数据相等的次数是否占第二预设次数的第二预设值,若是,确定网卡正常,若否,确定网卡故障。若未达到第二预设次数,返回步骤S20重新获取厂商刷写的EEPROM的初始数据,以及EEPROM的实际数据。最后,将结果发送至产线端。
需要说明的是,判断是否有可用的NCSI网口以判断网卡是否故障和判断网卡的EEPROM数据是否被修改以判断网卡是否故障可以同时进行,也可以先执行判断是否有可用的NCSI网口以判断网卡是否故障,在执行判断网卡的EEPROM数据是否被修改以判断网卡是否故障。当然,也可以先执行判断网卡的EEPROM数据是否被修改以判断网卡是否故障,在执行判断是否有可用的NCSI网口以判断网卡是否故障,本发明对此不作限定。最后将结果发送至产线检测度端以便检测人员知道网卡是否故障。
此外,值得注意的是,判断是否有可用的NCSI网口以判断网卡是否故障和判断网卡的EEPROM数据是否被修改以判断网卡是否故障中任意一个方式检测出网卡故障,则确定网卡故障,当同时满足存在可用NCSI网口,以及网卡的EEPROM数据未被修改时,确定网卡正常。
本发明实施例提供的检测网卡故障的方法,通过判断是否有可用的NCSI网口以判断网卡是否故障,以及判断网卡的EEPROM数据是否被修改以判断网卡是否故障,避免了传统在HOST侧检测网卡的性能以判断网卡性能是否正常无法检测BMC侧功能是否正常,以及无法确定EEPROM数据是否被修改而导致网卡故障,提高了检测网卡故障的准确率,进而提高了网卡的良品率。
图6为本发明另一实施例提供的检测网卡故障的装置的结构图,如图6所示,检测网卡故障的装置包括:存储器60,用于存储计算机程序;
处理器61,用于执行计算机程序时实现如上述实施例所提到的检测网卡故障的方法的步骤。
本实施例提供的检测网卡故障的装置可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。
其中,处理器61可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器61可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器61也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器61可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器61还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器60可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器60还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器60至少用于存储以下计算机程序601,其中,该计算机程序被处理器61加载并执行之后,能够实现前述任一实施例公开的检测网卡故障的方法相关步骤。另外,存储器60所存储的资源还可以包括操作系统602和数据603等,存储方式可以是短暂存储或者永久存储。其中,操作系统602可以包括Windows、Unix、Linux等。数据603可以包括但不限于涉及检测网卡故障过程中涉及的数据等。
在一些实施例中,检测网卡故障的装置还可包括有显示屏62、输入输出接口63、通信接口64、电源65以及通信总线66。
本领域技术人员可以理解,图6中示出的结构并不构成对检测网卡故障的装置的限定,可以包括比图示更多或更少的组件。
本发明实施例提供的检测网卡故障的装置,包括存储器和处理器,处理器在执行存储器存储的程序时,能够实现如下方法:检测网卡故障的方法。
本发明实施例提供的检测网卡故障的装置,避免了传统在HOST侧检测网卡的性能以判断网卡性能是否正常无法检测BMC侧功能是否正常,以及无法确定EEPROM数据是否被修改而导致网卡故障,提高了检测网卡故障的准确率,进而提高了网卡的良品率。
最后,本发明还提供一种计算机可读存储介质对应的实施例。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述方法实施例中记载的步骤。
可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本发明所提供的一种检测网卡故障的方法,装置及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种检测网卡故障的方法,其特征在于,包括:
运行驱动代码以驱动NCSI网口;
根据驱动结果判断是否存在可用的NCSI网口,若存在可用的所述NCSI网口,确定网卡正常;若不存在可用的所述NCSI网口,确定所述网卡故障;
将判断结果发送至产线检测端。
2.根据权利要求1所述的检测网卡故障的方法,其特征在于,还包括:
获取厂商刷写的EEPROM的初始数据,以及所述EEPROM的实际数据;
对比所述初始数据和所述实际数据是否相等,若相等,确定所述网卡正常,若不相等,确定所述网卡故障。
3.根据权利要求1所述的检测网卡故障的方法,其特征在于,所述将判断结果发送至产线检测端,包括:
创建检测接口;
通过所述检测接口判断是否存在目标文件,其中,所述目标文件在确定不存在可用的所述NCSI网口的情况下生成;
若存在所述目标文件,则将所述网卡故障的判断结果发送至所述产线检测端;
若不存在所述目标文件,则将所述网卡正常的判断结果发送至所述产线检测端。
4.根据权利要求2所述的检测网卡故障的方法,其特征在于,所述初始数据为所述厂商刷写的所述EEPROM除MAC地址以外的数据,所述实际数据为实际的所述EEPROM除MAC地址的数据。
5.根据权利要求1所述的检测网卡故障的方法,其特征在于,在所述根据驱动结果判断是否存在可用的NCSI网口之后,还包括:
判断运行所述驱动代码的当前次数是否达到第一预设次数;
若达到所述第一预设次数,则判断存在可用的所述NCSI网口的次数是否占所述第一预设次数的第一预设值,若是,确定所述网卡正常,若否,确定所述网卡故障;
若未达到所述第一预设次数,返回所述运行驱动代码以驱动NCSI网口的步骤。
6.根据权利要求2所述的检测网卡故障的方法,其特征在于,在所述对比所述初始数据和所述实际数据是否相等之后,还包括:
判断获取所述实际数据的当前次数是否达到第二预设次数;
若达到所述第二预设次数,判断所述初始数据和所述实际数据相等的次数是否占所述第二预设次数的第二预设值,若是,确定所述网卡正常,若否,确定所述网卡故障;
若未达到所述第二预设次数,返回所述获取厂商刷写的EEPROM的初始数据,以及所述EEPROM的实际数据的步骤。
7.根据权利要求1-6任意一项所述的检测网卡故障的方法,其特征在于,在所述将判断结果发送至产线检测端之后,还包括:
若确定所述网卡故障,则控制报警装置工作。
8.一种检测网卡故障的装置,其特征在于,包括:
运行模块,用于运行驱动代码以驱动NCSI网口;
判断模块,用于根据驱动结果判断是否存在可用的NCSI网口,若存在可用的所述NCSI网口,确定网卡正常;若不存在可用的所述NCSI网口,确定所述网卡故障;
发送模块,用于将判断结果发送至产线检测端。
9.一种检测网卡故障的装置,其特征在于,包括存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的检测网卡故障的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的检测网卡故障的方法的步骤。
CN202110943810.0A 2021-08-17 2021-08-17 一种检测网卡故障的方法,装置及介质 Pending CN113641543A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110943810.0A CN113641543A (zh) 2021-08-17 2021-08-17 一种检测网卡故障的方法,装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110943810.0A CN113641543A (zh) 2021-08-17 2021-08-17 一种检测网卡故障的方法,装置及介质

Publications (1)

Publication Number Publication Date
CN113641543A true CN113641543A (zh) 2021-11-12

Family

ID=78422560

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110943810.0A Pending CN113641543A (zh) 2021-08-17 2021-08-17 一种检测网卡故障的方法,装置及介质

Country Status (1)

Country Link
CN (1) CN113641543A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090113455A1 (en) * 2007-10-24 2009-04-30 Inventec Corporation Network card testing method
CN101707589A (zh) * 2009-09-25 2010-05-12 曙光信息产业(北京)有限公司 用于多端口网卡的端口自动切换实现方法和装置
CN105791052A (zh) * 2016-04-01 2016-07-20 浪潮电子信息产业股份有限公司 一种用于批量测试具有ncsi功能网卡的方法
CN108965062A (zh) * 2018-08-07 2018-12-07 郑州云海信息技术有限公司 一种板载网卡的网口测试方法、装置、设备及存储介质
CN109039829A (zh) * 2018-09-18 2018-12-18 郑州云海信息技术有限公司 一种网卡性能测试方法、装置、终端及存储介质
CN109831341A (zh) * 2019-03-19 2019-05-31 中国电子科技集团公司第三十六研究所 一种冗余双网卡的快速切换方法及装置
CN110851319A (zh) * 2019-09-29 2020-02-28 苏州浪潮智能科技有限公司 一种自动验证Linux服务器网卡异常的方法及系统
CN111027104A (zh) * 2019-11-26 2020-04-17 深圳中电长城信息安全系统有限公司 一种防止网卡标识数据丢失的方法、装置及主板
CN112866061A (zh) * 2021-01-26 2021-05-28 浪潮电子信息产业股份有限公司 一种板载网口的ncsi测试方法、装置、设备及介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090113455A1 (en) * 2007-10-24 2009-04-30 Inventec Corporation Network card testing method
CN101707589A (zh) * 2009-09-25 2010-05-12 曙光信息产业(北京)有限公司 用于多端口网卡的端口自动切换实现方法和装置
CN105791052A (zh) * 2016-04-01 2016-07-20 浪潮电子信息产业股份有限公司 一种用于批量测试具有ncsi功能网卡的方法
CN108965062A (zh) * 2018-08-07 2018-12-07 郑州云海信息技术有限公司 一种板载网卡的网口测试方法、装置、设备及存储介质
CN109039829A (zh) * 2018-09-18 2018-12-18 郑州云海信息技术有限公司 一种网卡性能测试方法、装置、终端及存储介质
CN109831341A (zh) * 2019-03-19 2019-05-31 中国电子科技集团公司第三十六研究所 一种冗余双网卡的快速切换方法及装置
CN110851319A (zh) * 2019-09-29 2020-02-28 苏州浪潮智能科技有限公司 一种自动验证Linux服务器网卡异常的方法及系统
CN111027104A (zh) * 2019-11-26 2020-04-17 深圳中电长城信息安全系统有限公司 一种防止网卡标识数据丢失的方法、装置及主板
CN112866061A (zh) * 2021-01-26 2021-05-28 浪潮电子信息产业股份有限公司 一种板载网口的ncsi测试方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN112948157B (zh) 服务器故障定位方法、装置、系统及计算机可读存储介质
CN110489259B (zh) 一种内存故障检测方法及设备
CN105183575A (zh) 处理器故障的诊断方法、装置及系统
CN112286709A (zh) 一种服务器硬件故障的诊断方法、诊断装置及诊断设备
CN114138644A (zh) Bmc调试方法及监控方法、系统、装置、设备、介质
CN104199693A (zh) 一种获取开机时间的方法、装置及终端
CN112000535A (zh) 一种基于SAS Expander卡的硬盘异常识别方法及处理方法
CN113672306B (zh) 服务器组件自检异常恢复方法、装置、系统及介质
CN107818032A (zh) 一种主板、信息打印方法、系统、装置及存储介质
CN113608684A (zh) 内存信息获取方法、装置、系统、电子设备及存储介质
CN112866061A (zh) 一种板载网口的ncsi测试方法、装置、设备及介质
CN113641543A (zh) 一种检测网卡故障的方法,装置及介质
CN115766410A (zh) 一种机器工作状态切换方法、系统、装置及介质
CN114461142B (zh) 一种读写Flash数据的方法、系统、装置及介质
CN112596983A (zh) 一种服务器内连接器的监测方法
CN114996069A (zh) 一种主板测试方法、装置以及介质
CN114816822A (zh) 一种基于内存故障的服务器管理方法、装置以及系统
CN209343321U (zh) 一种计算机故障检测装置
JP6217086B2 (ja) 情報処理装置、エラー検出機能診断方法およびコンピュータプログラム
CN112231170A (zh) 一种数据交互卡监管方法、系统、终端及存储介质
CN116089139A (zh) 一种串口硬盘故障处理方法、装置、介质
CN110413459B (zh) 外接phy卡的识别方法、装置、设备及可读存储介质
CN114184361B (zh) 一种交换机风扇信息检测方法、装置以及介质
CN110476153A (zh) 访问指令sram的方法和电子设备
CN114297064A (zh) 处理器报错定位方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination