CN111371642A - 网卡故障检测方法、装置、设备及存储介质 - Google Patents

网卡故障检测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111371642A
CN111371642A CN202010125289.5A CN202010125289A CN111371642A CN 111371642 A CN111371642 A CN 111371642A CN 202010125289 A CN202010125289 A CN 202010125289A CN 111371642 A CN111371642 A CN 111371642A
Authority
CN
China
Prior art keywords
network card
fault
packet sending
detection
fault detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010125289.5A
Other languages
English (en)
Other versions
CN111371642B (zh
Inventor
乔鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangfor Technologies Co Ltd
Original Assignee
Sangfor Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangfor Technologies Co Ltd filed Critical Sangfor Technologies Co Ltd
Priority to CN202010125289.5A priority Critical patent/CN111371642B/zh
Publication of CN111371642A publication Critical patent/CN111371642A/zh
Application granted granted Critical
Publication of CN111371642B publication Critical patent/CN111371642B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种网卡故障检测方法、装置、设备及存储介质。其中,该方法包括:确定需要故障检测,获取网卡发包对应的发包返回值;若发包返回值小于或等于第一设定值,记录网卡对应的发包数;对于连续N次的故障检测,若每次的故障检测的发包返回值均小于或等于所述第一设定值,基于第一次和第N次故障检测对应的发包数,得到网卡是否存在网卡发包故障的检测结果;其中,N为大于1的自然数。本发明实施例可以快速识别出网卡发包故障,且基于连续N次的故障检测进行确认,有效降低了网卡发包故障的误判。

Description

网卡故障检测方法、装置、设备及存储介质
技术领域
本发明涉及网络通信领域,尤其涉及一种网卡故障检测方法、装置、设备及存储介质。
背景技术
网卡又称为网络接口板、或通信适配器、或网络适配器(Network Adapter)、或网络接口卡(NIC)。
相关技术中,网卡往往由于软件bug(漏洞)的原因,可能出现不能正常发包的情形(又称为网卡发包故障),即网卡将数据包从本网卡发送失败。
如何快速检测网卡发包故障,是亟待解决的技术问题。
发明内容
有鉴于此,本发明实施例提供了一种网卡故障检测方法、装置、设备及存储介质,旨在能够快速检测出网卡发包故障。
本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种网卡故障检测方法,包括:
确定需要故障检测,获取网卡发包对应的发包返回值;
若发包返回值小于或等于第一设定值,记录网卡对应的发包数;
对于连续N次的故障检测,若每次的故障检测的发包返回值均小于或等于所述第一设定值,基于第一次和第N次故障检测对应的发包数,得到网卡是否存在网卡发包故障的检测结果;其中,N为大于1的自然数。
本发明实施例还提供了一种网卡故障检测装置,包括:
检测模块,用于确定需要故障检测,获取网卡发包对应的发包返回值;
记录模块,用于若发包返回值小于或等于第一设定值,记录网卡对应的发包数;
故障确定模块,用于对于连续N次的故障检测,若每次的故障检测的发包返回值均小于或等于所述第一设定值,基于第一次和第N次故障检测对应的发包数,得到网卡是否存在网卡发包故障的检测结果;其中,N为大于1的自然数。
本发明实施例又提供了一种网络设备,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器,用于运行计算机程序时,执行本发明任一实施例所述方法的步骤。
本发明实施例还提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现本发明任一实施例所述方法的步骤。
本发明实施例提供的技术方案,若连续N次的故障检测对应的发包返回值均小于或等于第一设定值,基于N次故障检测中的第一次和第N次故障检测对应的发包数,得到网卡是否存在网卡发包故障的检测结果。可以快速识别出网卡发包故障,且基于连续N次的故障检测进行确认,有效降低了网卡发包故障的误判。
附图说明
图1为本发明实施例网卡故障检测方法的流程示意图;
图2为本发明应用实施例网卡故障检测方法中故障检测的流程示意图;
图3为本发明应用实施例网卡故障检测方法中故障修复的流程示意图;
图4为本发明实施例网卡故障检测装置的结构示意图;
图5为本发明实施例网络设备的结构示意图。
具体实施方式
下面结合附图及实施例对本发明再作进一步详细的描述。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
本发明实施例提供了一种网卡故障检测方法,如图1所示,该方法包括:
步骤101,确定需要故障检测,获取网卡发包对应的发包返回值;
这里,在网卡存在发包流量时检测网卡是否存在检测标记,若网卡存在发包流量且网卡存在检测标记,则确定需要故障检测。网卡存在发包流量是指网卡处于发送数据包的状态,即网卡中存在待发出的数据包。网卡上的检测标记可以周期性设置,以在网卡存在发包流量时,根据设定的频率启动故障检测。发包返回值是指网卡当次发包成功对应的数据包的数值,实际应用中,可以获取发包函数返回值得到发包返回值,发包函数返回值表征本次发包中有多少个数据包成功放入到发包队列中。
步骤102,若发包返回值小于或等于第一设定值,记录网卡对应的发包数;
这里,若发包返回值小于或等于第一设定值,则确定网卡当次发包失败,记录网卡对应的发包数,这里,网卡对应的发包数是指网卡累积成功发送的数据包的数值。
实际应用中,判断获取的发包返回值是否小于或等于零,若发包返回值小于或等于零,则表明存在网卡处于以下状态之一:
1.发包队列满了,调用发包函数失败。
2.由于网卡故障,导致发包函数返回值<=0。
当发包返回值小于或等于零,判定网卡存在故障迹象。
步骤103,对于连续N次的故障检测,若每次的故障检测的发包返回值均小于或等于所述第一设定值,基于第一次和第N次故障检测对应的发包数,得到网卡是否存在网卡发包故障的检测结果。
这里,N为大于1的自然数。若连续N次故障检测的发包返回值均小于或等于零,基于第一次和第N次故障检测对应的发包数,得到网卡是否存在网卡发包故障的检测结果。具体地,若第一次和第N次故障检测对应的发包数的差值小于或等于第二设定值,得到网卡存在网卡发包故障的检测结果。
实际应用中,为了避免误判,对于连续N次故障检测对应的发包数,比较第一次和第N次对应的发包数,若两者的差值为零,即第一次和第N次故障检测网卡的发包数相等,则表明网卡在此期间一直都没有成功发送数据包,可以判定网卡存在网卡发包故障。
由于网卡可能存在多核转发,本发明实施例通过比较发现故障迹象与确认故障前网卡的发包数来确认网卡是否存在网卡发包故障。如果发现故障迹象与确认故障前网卡的发包数不同,表明网卡还是可用的,可能是某个核一直都没有抢到资源来发包。如果发现故障迹象与确认故障前网卡的发包数相同,则表明网卡一直都没有成功发出数据包,可以判定网卡存在网卡发包故障,可以有效降低网卡发包故障的误判。
在一应用示例中,N为30,对于连续30次的故障检测,每次故障检测均存在故障迹象,即每次故障检测的发包返回值均小于或等于零,第一次故障检测时,记录的网卡的发包数为tx1,第30次故障时,检测记录的网卡的发包数据为tx2,若tx1=tx2,则表明连续检30次故障检测均存在故障迹象,且网卡一直未成功发出数据包,得到网卡存在网卡发包故障的检测结果。
在一实施例中,网卡故障检测方法还包括:周期性设置所述检测标记,并在启动相应的故障检测后,清除相应的检测标记。
实际应用中,可以基于定时器设定的频率设置检测标记,并在故障检测启动后清除相应的检测标记,从而在网卡存在发包流量时按照设定的频率启动故障检测。
在一实施例中,网卡故障检测方法还包括:基于检测结果确定网卡存在网卡发包故障,取消所述周期性设置所述检测标记。
这里,若网卡处于网卡发包故障,可以取消定时器为网卡设置检测标记,并在网卡的网卡发包故障修复后,恢复定时器周期性为网卡设置检测标记的功能。
为了能够及时修复网卡的网卡发包故障,在一实施例中,网卡故障检测方法还包括:
若网卡存在网卡发包故障,备份网卡的运行环境参数;
基于所述运行环境参数对网卡进行故障修复操作,以修复网卡。
实际应用中,备份的网卡运行环境参数,可以包括:网卡速率、网卡MAC地址(物理地址)、网卡MTU(最大传输单元)、网卡admin状态、网卡双工配置、网卡协商配置等。后续可以基于备份的运行环境参数对网卡进行重新配置,以修复网卡。
在一实施例中,所述基于所述运行环境参数对网卡进行故障修复操作,包括:
将所述网卡反初始化;
对反初始化后的网卡进行初始化;
基于所述运行环境参数对初始化后的网卡进行配置。
这里,反初始化是指将网卡配置的参数清零,还原初始状态。初始化是指恢复网卡的默认配置或者预先设定的人工配置,这时,网卡的寄存器都被设置为初始化的值。对于初始化后的网卡,根据备份的运行环境参数进行配置,即可修复网卡。
在一实施例中,所述方法还包括:确定故障修复操作中存在未执行成功的情形,重复执行所述基于所述运行环境参数对网卡进行故障修复操作,以修复网卡。
这里,未执行成功是指网卡在故障修复过程中,若对网卡的反初始化、初始化及基于运行环境参数对初始化后的网卡进行配置中的任一出现故障,则确定修复出现故障,需要再次启动网卡修复流程,以修复网卡。实际应用中,可以基于设定的时间间隔启动下一次的网卡修复流程,以实现周期性的网卡修复,从而提高修复的成功率。
在一实施例中,所述方法还包括:确定重复执行所述基于所述运行环境参数对网卡进行故障修复操作的次数达到设定次数,生成故障报警信息。
若多次故障修复尚未成功,可以判断修复的次数是否达到设定次数,若是,则生成故障报警信息,以提示工作人员进行人工修复。
实际应用中,网卡的故障检测由故障检测线程执行,网卡的故障修复由故障修复线程执行,这样可以使得性能优化。为了让故障修复线程能够及时修复网卡,往往需要通过一个单独的消息通道(比如通过管道),通知故障修复线程启动故障修复流程,这样会消耗网络设备更多的资源。
基于此,在一实施例中,所述方法还包括:
第一线程基于网卡存在网卡发包故障的检测结果生成网卡故障标记;
第二线程周期性检测是否存在网卡故障标记;
若存在网卡故障标记,备份网卡的运行环境参数;
基于所述运行环境参数对网卡进行故障修复操作,以修复网卡。
这里,第一线程可以是故障检测线程,第二线程可以是故障修复线程,故障检测线程可以在确定网卡存在网卡发包故障时,生成网卡故障标记;故障修复线程周期性检测是否存在网卡故障标记,确定存在网卡故障标记时,启动故障修复流程,即备份网卡的运行环境参数,并基于所述运行环境参数对网卡进行故障修复操作,以修复网卡。
通过第二线程周期性检测网卡故障标记,确定存在网卡故障标记后,启动故障修复流程,可以实现对故障检测流程的复用,即在没有检测到网卡发包故障时,不会触发故障修复流程;此外,可以实现对周期性设置检测标记的定时器的复用,即周期性检测网卡故障标记、确定修复出现故障时,周期性修复网卡故障均可以复用该定时器,以进一步节省网络设备的资源消耗。
下面结合应用实施例对本发明再作进一步详细的描述。
本应用实施例中,网卡故障检测方法包括故障检测和故障修复两个部分。如图2所示,故障检测具体包括:
步骤201、为网卡设置检测标记;
这里,定时器周期性为网卡设置到时检测标记,比如,每间隔1秒设置为网卡设置检测标记。
步骤202、网卡发包时检测是否需要故障检测;
确定网卡存在发包流量时,基于网卡是否存在检测标记,判断网卡是否需要故障检测。
步骤203,需要故障检测,获取发包函数返回值;
若网卡存在发包流量,且网卡存在检测标记,则启动故障检测,获取发包函数返回值。可以理解的是,故障检测是由网卡的发包流量和定时器共同驱动的,即只有同时存在发包流量和检测标记时,才启动网卡的故障检测,如果网卡一直没有发包流量,则不会启动故障检测。
步骤204,判断发包函数返回值是否小于或等于零;
当发包函数返回值小于或等于零,这时,网卡很有可能出现故障,可以称之为故障迹象。
步骤205,记录第一次监测到发包函数返回值小于或等于零时,网卡的tx数tx1;
这里,记录第一次故障迹象时网卡的发包数tx1,是为了和最终确认网卡故障时tx2进行比较,再次确认网卡是否存在网卡发包故障。将网卡发包故障误的可能性降低。
步骤206,当故障迹象连续发生30次,比较tx1与现在的tx数tx2;
这里,连续检测了30次,且连续30次均存在故障迹象,表明网卡存在网卡发包故障的可能性很大,能够有效降低网卡发包故障误判的可能性。
步骤207,tx1=tx2,判定网卡存在网卡发包故障。
若tx1=tx2,则表明连续检30次故障检测均存在故障迹象,且网卡一直未成功发出数据包,得到网卡存在网卡发包故障的检测结果,生成标记网卡存在网卡发包故障的网卡故障标记,且定时器取消为网卡设置检测标记。
如图3所示,故障修复具体包括:
步骤301、为网卡设置到时检测;
故障修复线程基于设定的时间间隔启动到时检测,这里的到时检测是指检测网卡是否存在网卡故障标记。这里,可以复用故障检测中的定时器,时间间隔可以为定时器的时长的数倍。
步骤302,查看网卡是否存在网卡故障标记;
故障修复线程在达到设定的时间间隔,启动到时检测,查看网卡是否存在网卡故障标记。
步骤303,对故障网卡进行修复;
确定网卡存在网卡故障标记,启动对网卡的故障修复。
步骤304,备份故障网卡的配置;
这里,备份网卡的运行环境参数,比如:网卡速率、网卡MAC地址、网卡MTU、网卡admin状态、网卡双工配置、网卡协商配置等。
步骤305,对故障网卡进行重置;
这里,对故障网卡进行反初始化和初始化。
步骤306,将故障网卡的配置进行下发;
将备份的运行环境参数下发给网卡,重新配置网卡,完成网卡的故障修复。
步骤307,去掉网卡的网卡故障标记。
确定网卡故障修复完成,去掉网卡的网卡故障标记,并恢复定时器周期性为网卡设置检测标记。
为了实现本发明实施例的方法,本发明实施例还提供一种网卡故障检测装置,该网卡故障检测装置与上述网卡故障检测方法对应,上述网卡故障检测方法实施例中的各步骤也完全适用于本网卡故障检测装置实施例。
如图4所示,该网卡故障检测装置包括:检测模块401、记录模块402及故障确定模块403,其中,检测模块401用于确定需要故障检测,获取网卡发包对应的发包返回值;记录模块402用于若发包返回值小于或等于第一设定值,记录网卡对应的发包数;故障确定模块403用于对于连续N次的故障检测,若每次的故障检测的发包返回值均小于或等于所述第一设定值,基于第一次和第N次故障检测对应的发包数,得到网卡是否存在网卡发包故障的检测结果;其中,N为大于1的自然数。
在一实施例中,检测模块401具体用于:若网卡存在检测标记且网卡存在发包流量,则确定需要故障检测。
在一实施例中,网卡故障检测装置还包括:标记模块404,用于周期性设置所述检测标记,并在启动相应的故障检测后,清除相应的检测标记。
在一实施例中,故障确定模块403还用于:基于检测结果确定网卡存在网卡发包故障,取消标记模块404周期性设置所述检测标记。
在一实施例中,故障确定模块403具体用于:若第一次和第N次故障检测对应的发包数的差值小于或等于第二设定值,得到网卡存在网卡发包故障的检测结果。
在一实施例中,网卡故障检测装置还包括:故障修复模块405,用于:
若网卡存在网卡发包故障,备份网卡的运行环境参数;
基于所述运行环境参数对网卡进行故障修复操作,以修复网卡。
在一实施例中,故障确定模块403还用于:基于网卡存在网卡发包故障的检测结果生成网卡故障标记;故障修复模块405具体用于:
周期性检测是否存在网卡故障标记;
若存在网卡故障标记,备份网卡的运行环境参数;
基于所述运行环境参数对网卡进行故障修复操作,以修复网卡。
在一实施例中,故障修复模块405基于所述运行环境参数对网卡进行故障修复操作,包括:
将所述网卡反初始化;
对反初始化后的网卡进行初始化;
基于所述运行环境参数对初始化后的网卡进行配置。
在一实施例中,故障修复模块405还用于:
确定故障修复操作中存在未执行成功的情形,重复执行所述基于所述运行环境参数对网卡进行故障修复操作,以修复网卡。
在一实施例中,故障修复模块405还用于:
确定重复执行所述基于所述运行环境参数对网卡进行故障修复操作的次数达到设定次数,生成故障报警信息。
实际应用时,检测模块401、记录模块402、故障确定模块403、标记模块404及故障修复模块405,可以由网卡故障检测装置中的处理器来实现。当然,处理器需要运行存储器中的计算机程序来实现它的功能。
需要说明的是:上述实施例提供的网卡故障检测装置在进行网卡故障检测时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将装置的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的网卡故障检测装置与网卡故障检测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
基于上述程序模块的硬件实现,且为了实现本发明实施例的方法,本发明实施例还提供一种网络设备。图5仅仅示出了该网络设备的示例性结构而非全部结构,根据需要可以实施图5示出的部分结构或全部结构。
如图5所示,本发明实施例提供的网络设备500包括:至少一个处理器501、存储器502、用户接口503和至少一个网络接口504。网络设备500中的各个组件通过总线系统505耦合在一起。可以理解,总线系统505用于实现这些组件之间的连接通信。总线系统505除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图5中将各种总线都标为总线系统505。
其中,用户接口503可以包括显示器、键盘、鼠标、轨迹球、点击轮、按键、按钮、触感板或者触摸屏等。
本发明实施例中的存储器502用于存储各种类型的数据以支持网络设备的操作。这些数据的示例包括:用于在网络设备上操作的任何计算机程序。
本发明实施例揭示的网卡故障检测方法可以应用于处理器501中,或者由处理器501实现。处理器501可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,网卡故障检测方法的各步骤可以通过处理器501中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器501可以是通用处理器、数字信号处理器(DSP,Digital SignalProcessor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器501可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器502,处理器501读取存储器502中的信息,结合其硬件完成本发明实施例提供的网卡故障检测方法的步骤。
在示例性实施例中,网络设备可以被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,ProgrammableLogic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、FPGA、通用处理器、控制器、微控制器(MCU,Micro Controller Unit)、微处理器(Microprocessor)、或者其他电子元件实现,用于执行前述方法。
可以理解,存储器502可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random AccessMemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本发明实施例描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
在示例性实施例中,本发明实施例还提供了一种存储介质,即计算机存储介质,具体可以是计算机可读存储介质,例如包括存储计算机程序的存储器502,上述计算机程序可由网络设备的处理器501执行,以完成本发明实施例方法所述的步骤。计算机可读存储介质可以是ROM、PROM、EPROM、EEPROM、Flash Memory、磁表面存储器、光盘、或CD-ROM等存储器。
需要说明的是:“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
另外,本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (13)

1.一种网卡故障检测方法,其特征在于,包括:
确定需要故障检测,获取网卡发包对应的发包返回值;
若发包返回值小于或等于第一设定值,记录网卡对应的发包数;
对于连续N次的故障检测,若每次的故障检测的发包返回值均小于或等于所述第一设定值,基于第一次和第N次故障检测对应的发包数,得到网卡是否存在网卡发包故障的检测结果;其中,N为大于1的自然数。
2.根据权利要求1所述的方法,其特征在于,所述确定需要故障检测,包括:
若网卡存在检测标记且网卡存在发包流量,则确定需要故障检测。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
周期性设置所述检测标记,并在启动相应的故障检测后,清除相应的检测标记。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
基于检测结果确定网卡存在网卡发包故障,取消所述周期性设置所述检测标记。
5.根据权利要求1所述的方法,其特征在于,所述基于第一次和第N次故障检测对应的发包数,得到网卡是否存在网卡发包故障的检测结果,包括:
若第一次和第N次故障检测对应的发包数的差值小于或等于第二设定值,得到网卡存在网卡发包故障的检测结果。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若网卡存在网卡发包故障,备份网卡的运行环境参数;
基于所述运行环境参数对网卡进行故障修复操作,以修复网卡。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
第一线程基于网卡存在网卡发包故障的检测结果生成网卡故障标记;
第二线程周期性检测是否存在网卡故障标记;
若存在网卡故障标记,备份网卡的运行环境参数;
基于所述运行环境参数对网卡进行故障修复操作,以修复网卡。
8.根据权利要求6或者7所述的方法,其特征在于,所述基于所述运行环境参数对网卡进行故障修复操作,包括:
将所述网卡反初始化;
对反初始化后的网卡进行初始化;
基于所述运行环境参数对初始化后的网卡进行配置。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
确定故障修复操作中存在未执行成功的情形,重复执行所述基于所述运行环境参数对网卡进行故障修复操作,以修复网卡。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
确定重复执行所述基于所述运行环境参数对网卡进行故障修复操作的次数达到设定次数,生成故障报警信息。
11.一种网卡故障检测装置,其特征在于,包括:
检测模块,用于确定需要故障检测,获取网卡发包对应的发包返回值;
记录模块,用于若发包返回值小于或等于第一设定值,记录网卡对应的发包数;
故障确定模块,用于对于连续N次的故障检测,若每次的故障检测的发包返回值均小于或等于所述第一设定值,基于第一次和第N次故障检测对应的发包数,得到网卡是否存在网卡发包故障的检测结果;其中,N为大于1的自然数。
12.一种网络设备,其特征在于,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,
所述处理器,用于运行计算机程序时,执行权利要求1至10任一项所述方法的步骤。
13.一种存储介质,所述存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1至10任一项所述方法的步骤。
CN202010125289.5A 2020-02-27 2020-02-27 网卡故障检测方法、装置、设备及存储介质 Active CN111371642B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010125289.5A CN111371642B (zh) 2020-02-27 2020-02-27 网卡故障检测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010125289.5A CN111371642B (zh) 2020-02-27 2020-02-27 网卡故障检测方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111371642A true CN111371642A (zh) 2020-07-03
CN111371642B CN111371642B (zh) 2022-06-21

Family

ID=71210136

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010125289.5A Active CN111371642B (zh) 2020-02-27 2020-02-27 网卡故障检测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111371642B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115022217A (zh) * 2022-06-14 2022-09-06 深信服科技股份有限公司 一种网卡检测方法、装置及电子设备和存储介质
CN115086208A (zh) * 2022-06-14 2022-09-20 深信服科技股份有限公司 一种网卡检测方法、装置及电子设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101145988A (zh) * 2007-07-19 2008-03-19 中兴通讯股份有限公司 一种通讯链路故障的检测及恢复方法
CN102185733A (zh) * 2011-04-13 2011-09-14 深圳宝德科技集团股份有限公司 一种网卡测试方法及系统
CN102833144A (zh) * 2011-06-15 2012-12-19 鸿富锦精密工业(深圳)有限公司 网卡数据传输方法及系统
US20130137380A1 (en) * 2011-11-25 2013-05-30 Askey Computer Corporation Method and system for testing a wireless network device
CN103944750A (zh) * 2014-03-14 2014-07-23 华为技术有限公司 一种绑定网卡故障处理方法及装置
CN107147546A (zh) * 2017-05-31 2017-09-08 河南康联安防科技股份有限公司 双网心跳监测方法及系统
EP3252995A1 (en) * 2016-06-02 2017-12-06 Orange Polska Spolka Akcyjna Method for detecting network failures

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101145988A (zh) * 2007-07-19 2008-03-19 中兴通讯股份有限公司 一种通讯链路故障的检测及恢复方法
CN102185733A (zh) * 2011-04-13 2011-09-14 深圳宝德科技集团股份有限公司 一种网卡测试方法及系统
CN102833144A (zh) * 2011-06-15 2012-12-19 鸿富锦精密工业(深圳)有限公司 网卡数据传输方法及系统
US20130137380A1 (en) * 2011-11-25 2013-05-30 Askey Computer Corporation Method and system for testing a wireless network device
CN103944750A (zh) * 2014-03-14 2014-07-23 华为技术有限公司 一种绑定网卡故障处理方法及装置
EP3252995A1 (en) * 2016-06-02 2017-12-06 Orange Polska Spolka Akcyjna Method for detecting network failures
CN107147546A (zh) * 2017-05-31 2017-09-08 河南康联安防科技股份有限公司 双网心跳监测方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115022217A (zh) * 2022-06-14 2022-09-06 深信服科技股份有限公司 一种网卡检测方法、装置及电子设备和存储介质
CN115086208A (zh) * 2022-06-14 2022-09-20 深信服科技股份有限公司 一种网卡检测方法、装置及电子设备和存储介质

Also Published As

Publication number Publication date
CN111371642B (zh) 2022-06-21

Similar Documents

Publication Publication Date Title
US8677189B2 (en) Recovering from stack corruption faults in embedded software systems
JP4681900B2 (ja) コンピュータの停止状況監視方法、情報処理装置及びプログラム
CN111371642B (zh) 网卡故障检测方法、装置、设备及存储介质
CN107590016B (zh) 掉电重启识别方法及装置
CN108737153B (zh) 区块链灾备系统、方法、服务器和计算机可读存储介质
US20120131318A1 (en) Server and method for performing data recovery of the server
CN111143132A (zh) 一种bios恢复方法、装置、设备及可读存储介质
CN113467981A (zh) 异常处理的方法和装置
CN114217925B (zh) 一种实现异常自动重启的业务程序运行监控方法及系统
CN113672471A (zh) 一种软件监控方法、装置、设备及存储介质
US20080209254A1 (en) Method and system for error recovery of a hardware device
CN115904793B (zh) 一种基于多核异构系统的内存转存方法、系统及芯片
CN107179911B (zh) 一种重启管理引擎的方法和设备
JP2006065440A (ja) プロセス管理システム
JP2007028118A (ja) ノード装置の故障判断方法
CN115098291A (zh) 一种系统重启原因记录的方法、系统、存储介质及设备
CN110532160B (zh) 一种bmc记录服务器系统热重启事件的方法
JP4534995B2 (ja) ディジタル形保護継電装置のリスタート方式
CN110427280B (zh) 一种缓存管理方法、系统、计算机设备及存储介质
CN105391575A (zh) 一种金库控制方法及系统
CN111782515A (zh) web应用的状态检测方法、装置、服务器和存储介质
CN109815064B (zh) 节点隔离方法、装置、节点设备及计算机可读存储介质
CN113849432B (zh) 服务器固件数据存储方法、启动方法、装置、设备及介质
CN112685086B (zh) 一种信息处理方法及电子设备
CN115904516A (zh) 基于信任根的基板管理控制器启动方法及其相关组件

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant