CN113645085B - 智能网卡的异常检测方法、装置、电子设备及存储介质 - Google Patents

智能网卡的异常检测方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113645085B
CN113645085B CN202111200679.5A CN202111200679A CN113645085B CN 113645085 B CN113645085 B CN 113645085B CN 202111200679 A CN202111200679 A CN 202111200679A CN 113645085 B CN113645085 B CN 113645085B
Authority
CN
China
Prior art keywords
target
detection
network card
intelligent network
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111200679.5A
Other languages
English (en)
Other versions
CN113645085A (zh
Inventor
于泉泉
付水论
王焕超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202111200679.5A priority Critical patent/CN113645085B/zh
Publication of CN113645085A publication Critical patent/CN113645085A/zh
Application granted granted Critical
Publication of CN113645085B publication Critical patent/CN113645085B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种智能网卡的异常检测方法、装置、电子设备及存储介质。该方法包括:监测智能网卡在上电运行时的目标运行状态;基于运行状态与异常检测策略之间的对应关系,确定所述目标运行状态对应的目标异常检测策略;按照所述目标异常检测策略对所述智能网卡进行检测,得到所述智能网卡对应的异常检测结果;执行所述异常检测结果对应的异常处理操作。本申请实施例采用监测智能网卡在上电运行时的目标运行状态,并根据目标运行状态执行不同的异常检测策略,以此通过不同的异常检测策略能够覆盖多种异常事件,还能够对智能网卡出现的异常进行快速定位,不再需要凭借人工经验进行异常定位,解决了现有技术中异常定位不准确以及效率低的问题。

Description

智能网卡的异常检测方法、装置、电子设备及存储介质
技术领域
本申请涉及网卡检测技术领域,尤其涉及一种智能网卡的异常检测方法、装置、电子设备及存储介质。
背景技术
随着网络的高速发展,许多供应商都推出了智能网卡(SmartNIC),智能网卡份额逐步扩大。预计到2024年,权威预测智能网卡市场将达到6亿美元,占整个以太网适配器市场的23%。智能网卡正在进入不断扩张的云数据中心市场和新兴的电信边缘市场。
智能网卡能够提升应用程序和虚拟化性能,实现软件定义网络(SDN)和网络功能虚拟化(NFV)的诸多优势,将网络虚拟化、负载均衡和其他低级功能从服务器CPU中移除,确保为应用提供最大的处理能力。与此同时,智能网卡还能够提供分布式计算资源,使得用户可以开发自己的软件或提供接入服务,从而加速特定应用程序。
随着数据的指数级增长,企业和云提供商要求服务器和计算资源具有更高的性能,以便对大量数据进行实时分析。由于智能网卡在整个数据中心中扮演的作用越来越重要,如何更好的监控、管理智能网卡的工作状态,及时识别风险、排除故障就变得十分必要。
现有故障检测方案存在以下问题:(1)故障定位迟缓、定位不准确。许多故障现场获取到的有效数据少,现场需要开箱操作,有时候低概率严重故障仍需要依赖环境复现,给售后维护和故障定位工作带来极大困难。
(2)目前故障定位需要工程师具有丰富的故障诊断经验,并且需要紧急罗列形成故障的主因,受工程师主观因素影响较大,容易形成无用功。也没有故障严重性等级的概念,造成许多产品在量产之前许多的严重常见的故障没法提前识别到,使得产品的可靠性差。
(3)故障自动检测所覆盖的故障种类少,故障定位策略调整困难。故障诊断往往针对一种或几种故障有效,当产品升级换代改进或者平台升级后,无法复用已有的故障诊断策略。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种智能网卡的异常检测方法、装置、电子设备及存储介质。
根据本申请实施例的一个方面,提供了一种智能网卡的异常检测方法,包括:
监测智能网卡在上电运行时的目标运行状态;
基于运行状态与异常检测策略之间的对应关系,确定所述目标运行状态对应的目标异常检测策略;
按照所述目标异常检测策略对所述智能网卡进行检测,得到所述智能网卡对应的异常检测结果;
执行所述异常检测结果对应的异常处理操作。
进一步地,所述监测智能网卡在上电运行时的目标运行状态,包括:
获取所述智能网卡在上电运行时的各个检测对象对应的目标检测数据,根据所述目标检测数据确定所述智能网卡的目标运行状态;
或,
获取所述智能网卡在上电运行时出现的目标异常事件,根据所述目标异常事件确定所述智能网卡的目标运行状态。
进一步地,在获取所述智能网卡在上电运行时的各个检测对象对应的目标检测数据之后,所述方法还包括:
获取当前时间戳;
将所述当前时间戳与所述目标检测数据关联存储。
进一步地,所述根据所述目标检测数据确定所述智能网卡的目标运行状态,包括:
在所述目标检测数据落入第一数据范围的情况下,确定所述智能网卡的目标运行状态属于正常状态,其中,所述第一数据范围为所述智能网卡处于正常状态下的检测得到的;
在所述目标检测数据未落入所述第一数据范围的情况下,确定所述智能网卡的目标运行状态属于异常状态。
进一步地,所述按照所述目标异常检测策略对所述智能网卡进行检测,得到所述智能网卡对应的异常检测结果,包括:
在所述目标运行状态属于正常状态的情况下,调用预设结构树,其中,所述预设结构树中包括:多个级联的异常事件,以及与所述异常事件关联的预设检测对象的第二数据范围;
将所述目标检测数据中与所述预设检测对象相匹配的检测数据,确定为第一检测数据;
在所述第一检测数据落入所述第二数据范围的情况下,从所述预设结构树中获取所述第一检测数据对应的异常事件;
将所述第一检测数据对应的异常事件确定为所述异常检测结果。
进一步地,所述按照所述目标异常检测策略对所述智能网卡进行检测,得到所述智能网卡对应的异常检测结果,包括:
在所述目标运行状态属于异常状态的情况下,获取预设异常事件集合,其中,所述预设异常事件集合中包括多个异常事件,以及异常事件对应的第三数据范围;
在所述目标检测数据落入所述第三数据范围的情况下,将所述第三数据范围对应的异常事件确定为所述异常检测结果。
进一步地,所述按照所述目标异常检测策略对所述智能网卡进行检测,得到所述智能网卡对应的异常检测结果,包括:
调用预设结构树,其中,所述预设结构树中包括:多个级联的异常事件,以及与所述异常事件关联的预设检测对象的第二数据范围;
基于所述预设结构树,确定存在所述目标异常事件关联的子异常事件的情况下,从所述第二数据范围中获取所述子异常事件对应的第三数据范围;
获取至少一个目标历史时间戳,并获取所述目标历史时间戳对应的第二检测数据,其中,所述目标历史时间戳是与当前时间戳相邻的至少一个历史时间戳;
在所述第二检测数据落入所述第三数据范围的情况下,从所述预设结构树中获取所述第二检测数据对应的异常事件;
将所述第二检测数据对应的异常事件确定为所述异常检测结果。
根据本申请实施例的另一个方面,还提供了一种智能网卡的异常检测装置,包括:
监测模块,用于监测智能网卡在上电运行时的目标运行状态;
查询模块,用于基于运行状态与异常检测策略之间的对应关系,确定所述目标运行状态对应的目标异常检测策略;
检测模块,用于按照所述目标异常检测策略对所述智能网卡进行检测,得到所述智能网卡对应的异常检测结果;
执行模块,用于执行所述异常检测结果对应的异常处理操作。
根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的步骤。
根据本申请实施例的另一方面,还提供了一种电子装置,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行上述方法中的步骤。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法中的步骤。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例采用监测智能网卡在上电运行时的目标运行状态,并根据目标运行状态执行不同的异常检测策略,以此通过不同的异常检测策略能够覆盖多种异常事件,还能够对智能网卡出现的异常进行快速定位,不再需要凭借人工经验进行异常定位,解决了现有技术中异常定位不准确以故障检测效率低的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种智能网卡的异常检测方法的流程图;
图2为本申请另一实施例提供的一种智能网卡的异常检测方法的流程图;
图3为本申请另一实施例提供的一种智能网卡的异常检测方法的流程图;
图4为本申请另一实施例提供的一种智能网卡的异常检测方法的流程图;
图5为本申请实施例提供的一种预设结构树的示意图;
图6为本申请实施例提供的一种智能网卡的异常检测装置的框图;
图7为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个类似的实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在覆盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本申请实施例提供了一种智能网卡的异常检测方法、装置、电子设备及存储介质。本发明实施例所提供的方法可以应用于任意需要的电子设备,例如,可以为服务器、终端等电子设备,在此不做具体限定,为描述方便,后续简称为电子设备。
根据本申请实施例的一方面,提供了一种智能网卡的异常检测方法的方法实施例。图1为本申请实施例提供的一种智能网卡的异常检测方法的流程图,如图1所示,该方法包括:
步骤S11,监测智能网卡在上电运行时的目标运行状态。
在本申请实施例中,步骤S11,监测智能网卡在上电运行时的目标运行状态,包括:监测智能网卡在上电运行时的各个检测对象对应的目标检测数据,根据目标检测数据确定智能网卡的目标运行状态。
在本申请实施例中,智能网卡通过BMC(Baseboard Manager Controller 基板管理控制器)作为主控管理单元,通过总线或者GPIO的方式检测各个检测对象对应的目标检测数据,检测对象包括:系统级芯片、可变电阻器、存储器、FPGA(Field Programmable GateArray)模块、数字转换器、温度传感器、线缆、监控线路等等。检测对象对应的目标检测数据包括:电压、电流、温度等等。
在本申请实施例中,根据目标检测数据确定智能网卡的目标运行状态,包括:在目标检测数据落入第一数据范围的情况下,确定智能网卡的目标运行状态属于正常状态,在目标检测数据未落入第一数据范围的情况下,确定智能网卡的目标运行状态属于异常状态。其中,第一数据范围为智能网卡处于正常状态下的检测得到的。
在本申请另一实施例中,步骤S11,监测智能网卡在上电运行时的目标运行状态,还包括:监测智能网卡在上电运行时出现的目标异常事件,根据目标异常事件确定智能网卡的目标运行状态。
在本申请实施例中,智能网卡通过BMC(Baseboard Manager Controller 基板管理控制器)作为主控管理单元,在上电运行时监测各个检测对象是否正常启动,如果存在未启动或启动后异常的检测对象,则根据该检测对象得到目标异常事件,此时智能网卡的目标运行状态为异常。
在本申请实施例中,在监测智能网卡在上电运行时的各个检测对象对应的目标检测数据之后,方法还包括:获取当前时间戳,将当前时间戳与目标检测数据关联存储。
在本申请实施例中,将智能网卡在上电运行时的各个检测对象对应的检测数据按照时间戳进行存储,能够在智能网卡出现突发异常时,可以按照时间戳提取检测数据,并根据检测数据分析智能网卡的异常事件。
步骤S12,基于运行状态与异常检测策略之间的对应关系,确定目标运行状态对应的目标异常检测策略。
在本申请实施例中,为了保证准确的检测智能网卡异常,本申请实施例预先设置了不同运行状态对应的异常检测策略,例如:目标运行状态为异常状态的情况下,异常检测策略是通过预设异常事件集合检测。或,目标运行状态为正常状态的情况下,异常检测策略是通过预设结构树检测。
步骤S13,按照目标异常检测策略对智能网卡进行检测,得到智能网卡对应的异常检测结果。
在本申请实施例中,步骤S13,按照目标异常检测策略对智能网卡进行检测,得到智能网卡对应的异常检测结果,如图2所示,包括以下步骤A1-A4:
步骤A1,在目标运行状态属于正常状态的情况下,调用预设结构树,其中,预设结构树中包括:多个级联的异常事件,以及与异常事件关联的预设检测对象的第二数据范围。
步骤A2,将目标检测数据中与预设检测对象相匹配的检测数据,确定为第一检测数据。
步骤A3,在第一检测数据落入第二数据范围的情况下,从预设结构树中获取第一检测数据对应的异常事件。
步骤A4,将第一检测数据对应的异常事件确定为异常检测结果。
在本申请实施例中,预设结构树中包括多个级联的异常事件,预设结构树中最小单元是异常事件关联的预设检测对象的第二数据范围。例如:异常事件为VR供电异常,与VR供电异常级联的子异常事件包括:PVCCL电压异常、PVCCH电压异常、PVCCSDM电压异常、PVCCGXE电压异常,每个子异常事件还关联不同的电压范围(即预设检测对象的第二数据范围),例如:PVCCL电压异常这个子事件关联的第二数据范围包括PVCCL电压的范围,即V1至V2。
在本申请实施例中,从目标检测数据中提取与预设检测对象相匹配的第一检测数据,并使用第一检测数据与第二数据范围进行对比,如果第一检测数据落入第二数据范围,则可以直接确定异常事件。
作为一个示例,预设检测对象包括:PVCCL和PVCCH。然后从目标检测数据中提取PVCCL电压以及PVCCH电压。然后使用PVCCL电压以及PVCCH电压分别与相应第二数据范围进行对比,确定该数据是否落入第二数据范围,如果该数据均落入第二数据范围,则将确定PVCCL电压异常以及PVCCH电压异常。此时将PVCCL电压异常以及PVCCH电压异常确定为异常检测结果。
本申请实施例采用预设结构树中的数据范围与目标检测数据进行对比,能够快速并且准确的定位智能网卡的异常,并将该异常标记为临时异常,整个过程不再需要凭借人工经验进行处理。
在本申请实施例中,步骤S13,按照目标异常检测策略对智能网卡进行检测,得到智能网卡对应的异常检测结果,如图3所示,包括以下步骤B1-B2:
步骤B1,在目标运行状态属于异常状态的情况下,获取预设异常事件集合,其中,预设异常事件集合中包括多个异常事件,以及异常事件对应的第三数据范围。
步骤B2,在目标检测数据落入第三数据范围的情况下,将第三数据范围对应的异常事件确定为异常检测结果。
在本申请实施例中,目标运行状态属于异常状态的情况下,可以直接将目标检测数据与预设异常事件集合中的第三数据范围进行对比,能够快速并且准确的定位智能网卡的异常,并将该异常标记为固有异常。
在本申请实施例中,步骤S13,按照目标异常检测策略对智能网卡进行检测,得到智能网卡对应的异常检测结果,如图4所示,包括以下步骤C1-C5:
步骤C1,调用预设结构树,其中,预设结构树中包括:多个级联的异常事件,以及与异常事件关联的预设检测对象的第二数据范围。
步骤C2,基于预设结构树,确定存在目标异常事件关联的子异常事件的情况下,从第二数据范围中获取子异常事件对应的第三数据范围。
步骤C3,获取至少一个目标历史时间戳,并获取目标历史时间戳对应的第二检测数据,其中,目标历史时间戳是与当前时间戳相邻的至少一个历史时间戳。
步骤C4,在第二检测数据落入第三数据范围的情况下,从预设结构树中获取第二检测数据对应的异常事件。
步骤C5,将第二检测数据对应的异常事件确定为异常检测结果。
在本申请实施例中,当智能网卡在上电运行时出现的目标异常事件时,直接调用预设结构树,并从预设结构树中获取目标异常事件存在级联关系的子异常事件,以及确定子异常事件对应的第三数据范围。然后获取与当前时间戳相邻的历史时间戳,并查询历史时间戳对应的检测数据,然后使用历史时间戳对应的检测数据与第三数据范围进行对比,能够快速排查出智能网卡当前的异常事件。
作为一个示例,如图5所示,FPGA程序加载异常为一级异常事件,预设结构树中与FPGA程序加载异常存在级联关系的二级异常事件包括:VR供电异常,上电时序异常,总线链路异常以及器件异常。
其中,与VR供电异常存在级联关系的三级异常事件包括:PVCCL电压异常、PVCCH电压异常、PVCCSDM电压异常以及PVCCGXE电压异常。与上电时序异常存在级联关系的三级异常事件包括:VR PWRGD输出异常、配置管脚输入电平异常。与总线链路异常存在级联关系的三级异常事件包括:时钟频率设置异常以及复位信号被使能。与器件异常存在级联关系的三级异常事件包括:BMC通道挂死、CPLD未工作以及FPGA过温。
然后获取与当前时间戳相邻的历史时间戳,并查询历史时间戳对应的检测数据,该检测数据为各个检测对象对应的检测数据,例如:芯片的检测数据、可变电阻器的检测数据、存储器的检测数据、数字转换器的检测数据、温度传感器的检测数据等等,获取检测数据落入第三数据范围的检测对象,并从预设结构树中获取与该检测对象关联的异常事件。
步骤S14,执行异常检测结果对应的异常处理操作。
在本申请实施例中,执行异常检测结果对应的异常处理操作包括:获取异常处理列表,其中,异常处理列表中包括:预设异常事件与报警类型之间的对应关系。然后基于该对应关系,确定异常检测结果中携带的异常事件对应的目标报警类型,按照目标报警类型执行报警操作。
本申请实施例采用监测智能网卡在上电运行时的目标运行状态,并根据目标运行状态执行不同的异常检测策略,以此通过不同的异常检测策略能够覆盖多种异常事件,还能够对智能网卡出现的异常进行快速定位,不再需要凭借人工经验进行异常定位,解决了现有技术中异常定位不准确以故障检测效率低的问题。
图6为本申请实施例提供的一种智能网卡的异常检测装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图6所示,该装置包括:
监测模块61,用于监测智能网卡在上电运行时的目标运行状态;
查询模块62,用于基于运行状态与异常检测策略之间的对应关系,确定目标运行状态对应的目标异常检测策略;
检测模块63,用于按照目标异常检测策略对智能网卡进行检测,得到智能网卡对应的异常检测结果;
执行模块64,用于执行异常检测结果对应的异常处理操作。
在本申请实施例中,监测模块61,用于监测智能网卡在上电运行时的各个检测对象对应的目标检测数据,根据目标检测数据确定智能网卡的目标运行状态;
或,监测模块61,用于监测智能网卡在上电运行时出现的目标异常事件,根据目标异常事件确定智能网卡的目标运行状态。
在本申请实施例中,智能网卡的异常检测装置还包括存储模块,用于获取当前时间戳;将当前时间戳与目标检测数据关联存储。
在本申请实施例中,监测模块61,用于在目标检测数据落入第一数据范围的情况下,确定智能网卡的目标运行状态属于正常状态,其中,第一数据范围为智能网卡处于正常状态下的检测得到的;在目标检测数据未落入第一数据范围的情况下,确定智能网卡的目标运行状态属于异常状态。
在本申请实施例中,检测模块63,用于在目标运行状态属于正常状态的情况下,调用预设结构树,其中,预设结构树中包括:多个级联的异常事件,以及与异常事件关联的预设检测对象的第二数据范围;将目标检测数据中与预设检测对象相匹配的检测数据,确定为第一检测数据;在第一检测数据落入第二数据范围的情况下,从预设结构树中获取第一检测数据对应的异常事件;将第一检测数据对应的异常事件确定为异常检测结果。
在本申请实施例中,检测模块63,用于在目标运行状态属于异常状态的情况下,获取预设异常事件集合,其中,预设异常事件集合中包括多个异常事件,以及异常事件对应的第三数据范围;在目标检测数据落入第三数据范围的情况下,将第三数据范围对应的异常事件确定为异常检测结果。
在本申请实施例中,检测模块63,用于调用预设结构树,其中,预设结构树中包括:多个级联的异常事件,以及与异常事件关联的预设检测对象的第二数据范围;基于预设结构树,确定目标异常事件存在子异常事件的情况下,从第二数据范围中获取子异常事件对应的第三数据范围;获取至少一个目标历史时间戳,并获取目标历史时间戳对应的第二检测数据,其中,目标历史时间戳是与当前时间戳相邻的至少一个历史时间戳;在第二检测数据落入第三数据范围的情况下,从预设结构树中获取第二检测数据对应的异常事件;将第二检测数据对应的异常事件确定为异常检测结果。
本申请实施例还提供一种电子设备,如图7所示,电子设备可以包括:处理器1501、通信接口1502、存储器1503和通信总线1504,其中,处理器1501,通信接口1502,存储器1503通过通信总线1504完成相互间的通信。
存储器1503,用于存放计算机程序;
处理器1501,用于执行存储器1503上所存放的计算机程序时,实现上述实施例的步骤。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的智能网卡的异常检测方法。
在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的智能网卡的异常检测方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidState Disk)等。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。
以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种智能网卡的异常检测方法,其特征在于,包括:
监测智能网卡在上电运行时的目标运行状态;
基于运行状态与异常检测策略之间的对应关系,确定所述目标运行状态对应的目标异常检测策略;
按照所述目标异常检测策略对所述智能网卡进行检测,得到所述智能网卡对应的异常检测结果;
执行所述异常检测结果对应的异常处理操作;
其中,所述监测智能网卡在上电运行时的目标运行状态,包括:
获取所述智能网卡在上电运行时的各个检测对象对应的目标检测数据,根据所述目标检测数据确定所述智能网卡的目标运行状态;
或,
获取所述智能网卡在上电运行时出现的目标异常事件,根据所述目标异常事件确定所述智能网卡的目标运行状态;
所述按照所述目标异常检测策略对所述智能网卡进行检测,得到所述智能网卡对应的异常检测结果,包括:
调用预设结构树,其中,所述预设结构树中包括:多个级联的异常事件,以及与所述异常事件关联的预设检测对象的第二数据范围;
基于所述预设结构树,确定存在所述目标异常事件关联的子异常事件的情况下,从所述第二数据范围中获取所述子异常事件对应的第三数据范围;
获取至少一个目标历史时间戳,并获取所述目标历史时间戳对应的第二检测数据,其中,所述目标历史时间戳是与当前时间戳相邻的至少一个历史时间戳;
在所述第二检测数据落入所述第三数据范围的情况下,从所述预设结构树中获取所述第二检测数据对应的异常事件;
将所述第二检测数据对应的异常事件确定为所述异常检测结果。
2.根据权利要求1所述的方法,其特征在于,在获取所述智能网卡在上电运行时的各个检测对象对应的目标检测数据之后,所述方法还包括:
获取当前时间戳;
将所述当前时间戳与所述目标检测数据关联存储。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标检测数据确定所述智能网卡的目标运行状态,包括:
在所述目标检测数据落入第一数据范围的情况下,确定所述智能网卡的目标运行状态属于正常状态,其中,所述第一数据范围为所述智能网卡处于正常状态下的检测得到的;
在所述目标检测数据未落入所述第一数据范围的情况下,确定所述智能网卡的目标运行状态属于异常状态。
4.根据权利要求3所述的方法,其特征在于,所述按照所述目标异常检测策略对所述智能网卡进行检测,得到所述智能网卡对应的异常检测结果,包括:
在所述目标运行状态属于正常状态的情况下,调用预设结构树,其中,所述预设结构树中包括:多个级联的异常事件,以及与所述异常事件关联的预设检测对象的第二数据范围;
将所述目标检测数据中与所述预设检测对象相匹配的检测数据,确定为第一检测数据;
在所述第一检测数据落入所述第二数据范围的情况下,从所述预设结构树中获取所述第一检测数据对应的异常事件;
将所述第一检测数据对应的异常事件确定为所述异常检测结果。
5.根据权利要求3所述的方法,其特征在于,所述按照所述目标异常检测策略对所述智能网卡进行检测,得到所述智能网卡对应的异常检测结果,包括:
在所述目标运行状态属于异常状态的情况下,获取预设异常事件集合,其中,所述预设异常事件集合中包括多个异常事件,以及异常事件对应的第三数据范围;
在所述目标检测数据落入所述第三数据范围的情况下,将所述第三数据范围对应的异常事件确定为所述异常检测结果。
6.一种智能网卡的异常检测装置,其特征在于,包括:
监测模块,用于监测智能网卡在上电运行时的目标运行状态;
查询模块,用于基于运行状态与异常检测策略之间的对应关系,确定所述目标运行状态对应的目标异常检测策略;
检测模块,用于按照所述目标异常检测策略对所述智能网卡进行检测,得到所述智能网卡对应的异常检测结果;
执行模块,用于执行所述异常检测结果对应的异常处理操作;
其中,监测模块,用于获取所述智能网卡在上电运行时的各个检测对象对应的目标检测数据,根据所述目标检测数据确定所述智能网卡的目标运行状态;
或,获取所述智能网卡在上电运行时出现的目标异常事件,根据所述目标异常事件确定所述智能网卡的目标运行状态;
所述检测模块,用于调用预设结构树,其中,所述预设结构树中包括:多个级联的异常事件,以及与所述异常事件关联的预设检测对象的第二数据范围;基于所述预设结构树,确定存在所述目标异常事件关联的子异常事件的情况下,从所述第二数据范围中获取所述子异常事件对应的第三数据范围;获取至少一个目标历史时间戳,并获取所述目标历史时间戳对应的第二检测数据,其中,所述目标历史时间戳是与当前时间戳相邻的至少一个历史时间戳;在所述第二检测数据落入所述第三数据范围的情况下,从所述预设结构树中获取所述第二检测数据对应的异常事件;将所述第二检测数据对应的异常事件确定为所述异常检测结果。
7.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至5中任一项所述的方法步骤。
8.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:
存储器,用于存放计算机程序;
处理器,用于通过运行存储器上所存放的程序来执行权利要求1-5中任一项所述的方法步骤。
CN202111200679.5A 2021-10-15 2021-10-15 智能网卡的异常检测方法、装置、电子设备及存储介质 Active CN113645085B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111200679.5A CN113645085B (zh) 2021-10-15 2021-10-15 智能网卡的异常检测方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111200679.5A CN113645085B (zh) 2021-10-15 2021-10-15 智能网卡的异常检测方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113645085A CN113645085A (zh) 2021-11-12
CN113645085B true CN113645085B (zh) 2022-02-22

Family

ID=78426981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111200679.5A Active CN113645085B (zh) 2021-10-15 2021-10-15 智能网卡的异常检测方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113645085B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114338475B (zh) * 2021-12-30 2023-12-01 北京天融信网络安全技术有限公司 一种link速率异常检测方法、装置、电子设备及存储介质
CN114564093B (zh) * 2022-02-21 2023-08-08 苏州浪潮智能科技有限公司 一种设备散热方法、装置、电子设备及存储介质
CN116016274B (zh) * 2022-12-29 2023-11-24 天航长鹰(江苏)科技有限公司 一种异常通讯检测方法和系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112987675A (zh) * 2021-05-06 2021-06-18 北京瑞莱智慧科技有限公司 一种异常检测的方法、装置、计算机设备和介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101945009B (zh) * 2010-09-14 2012-11-28 国网电力科学研究院 基于案例和模式匹配的电力通信网故障定位方法及装置
CN103412217A (zh) * 2013-08-02 2013-11-27 中科天工电气控股有限公司 箱式变电站智能在线故障诊断系统
CN106992877B (zh) * 2017-03-08 2019-07-09 中国人民解放军国防科学技术大学 基于sdn架构的网络故障检测与修复方法
CN109150587B (zh) * 2018-07-25 2022-05-24 新华三信息安全技术有限公司 一种维护方法和装置
CN113296485A (zh) * 2020-02-24 2021-08-24 北京国电智深控制技术有限公司 一种故障根源获取方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112987675A (zh) * 2021-05-06 2021-06-18 北京瑞莱智慧科技有限公司 一种异常检测的方法、装置、计算机设备和介质

Also Published As

Publication number Publication date
CN113645085A (zh) 2021-11-12

Similar Documents

Publication Publication Date Title
CN113645085B (zh) 智能网卡的异常检测方法、装置、电子设备及存储介质
CN108600029B (zh) 一种配置文件更新方法、装置、终端设备及存储介质
US9176803B2 (en) Collecting data from a system in response to an event based on an identification in a file of the data to collect
CN114328102B (zh) 设备状态监控方法、装置、设备及计算机可读存储介质
CN109343853B (zh) 一种应用程序的异常识别方法及设备
CN113259183B (zh) 一种网络继电器的控制方法、装置、电子设备及存储介质
WO2019034095A1 (zh) 软件处理方法、装置、电子设备及计算机可读存储介质
CN112306802A (zh) 系统的数据获取方法、装置、介质和电子设备
WO2014180450A1 (zh) 通信运营商网管设备的检测方法及装置、计算机存储介质
CN114793132A (zh) 一种光模块的检测方法、装置、电子设备及存储介质
CN111866921A (zh) 一种5g基站业务故障查找方法、装置、设备及可存储介质
CN112988439B (zh) 服务器故障发现方法、装置、电子设备及存储介质
CN115037653B (zh) 业务流量监控方法、装置、电子设备和存储介质
CN110955587A (zh) 一种待更换设备确定方法及装置
US11237892B1 (en) Obtaining data for fault identification
WO2019241199A1 (en) System and method for predictive maintenance of networked devices
CN112214437B (zh) 一种存储设备及通信方法、装置、计算机可读存储介质
CN114780378A (zh) 基于业务接口的系统稳定性检测溯源方法及相关设备
CN115729727A (zh) 故障修复方法、装置、设备及介质
CN112817827A (zh) 运维方法、装置、服务器、设备、系统及介质
CN113708986A (zh) 服务器监控装置、方法及计算机可读存储介质
CN114115753B (zh) 一种存储设备、基于存储设备的请求处理方法及装置
JP7436737B1 (ja) マルチベンダーを支援するサーバ管理システム
CN113656207B (zh) 故障处理方法、装置、电子设备和介质
CN115981982A (zh) 一种设备管理方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant