CN115168146A - 一种异常检测方法和装置 - Google Patents
一种异常检测方法和装置 Download PDFInfo
- Publication number
- CN115168146A CN115168146A CN202210772886.6A CN202210772886A CN115168146A CN 115168146 A CN115168146 A CN 115168146A CN 202210772886 A CN202210772886 A CN 202210772886A CN 115168146 A CN115168146 A CN 115168146A
- Authority
- CN
- China
- Prior art keywords
- target component
- information
- electronic device
- detection
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3065—Monitoring arrangements determined by the means or processing involved in reporting the monitored data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请实施例公开了一种异常检测方法,包括:响应于一触发条件,获得针对电子设备的目标部件的检测信息,所述检测信息包括至少两种不同类型的检测信息;基于所述至少两种不同类型的检测信息确定对应目标部件的状态信息;其中,不同触发条件下获得的检测信息相同或不同。本申请实施例同时还公开了一种异常检测装置。
Description
技术领域
本申请涉及计算机领域中的信息检测技术,尤其涉及一种异常检测方法和装置。
背景技术
电子设备(例如服务器)上一般都有很多的设备,这些设备可能因为各种不同的原因造成初始化失败丢失。一旦出现这种情况时,需要服务器厂商的售后团队收集机器日志(例如首次故障数据捕获(First Failure Data Capture,FFDC))数据并返回研发分析,进而通过收集的这些日志数据来分析丢失的原因;但是,相关技术中的这种分析方法分析周期较长,导致效率较低,且只能被动分析。
发明内容
本申请的技术方案是这样实现的:
一种异常检测方法,包括:
响应于一触发条件,获得针对电子设备的目标部件的检测信息,所述检测信息包括至少两种不同类型的检测信息;
基于所述至少两种不同类型的检测信息确定对应目标部件的状态信息;
其中,不同触发条件下获得的检测信息相同或不同。
上述方案中,所述触发条件包括以下至少之一:
响应于获得开机启动或重新启动的控制指令;
响应于启动目标应用;
响应于获得针对电子设备的目标管理操作;
响应于电子设备从第一形态/姿态切换至第二形态/姿态;
响应于电子设备从第一运行模式切换至第二运行模式。
上述方案中,获得针对电子设备的目标部件的检测信息,包括以下至少之一:
获得电子设备与目标部件之间的物理连接信息;
获得电子设备对目标部件执行初始化的配置信息;
获得电子设备对目标部件的使用信息。
上述方案中,所述获得电子设备与目标部件之间的物理连接信息,包括:
通过对目标部件与电子设备之间的输入输出端口进行侦测,以获得所述物理连接信息;或,
通过设置于预定接入位置处的传感器获得所述物理连接信息,所述预定接入位置是目标部件应该接入的位置。
上述方案中,所述获得电子设备对目标部件执行初始化的配置信息,包括以下至少之一:
获得电子设备为目标部件分配的通信地址信息;
获得电子设备在初始化过程中为所述目标部件分配的硬件资源信息;
获得电子设备在初始化过程中针对目标部件配置的固件信息;
获得电子设备在初始化过程中针对目标部件配置的驱动信息。
上述方案中,所述基于所述至少两种不同类型的检测信息确定对应目标部件的状态信息,包括:
将所述检测信息与对应的预置状态表进行比对,以定位所述目标部件当前所处状态,所述预置状态表包括所述目标部件在各状态下对应的检测值;或,
按目标顺序依次校验所述至少两种不同类型的检测信息,以基于校验结果定位所述目标部件当前所处状态,所述目标顺序是基于所述目标部件的属性信息确定的。
上述方案中,基于所述至少两种不同类型的检测信息确定对应目标部件的状态信息,包括:
基于第一类型的检测信息确定所述目标部件的接入状态;
在确定所述目标部件接入的情况下,基于第二类型的检测信息确定所述目标部件处于使用状态及当前使用情况,或,确定所述目标部件处于异常状态及对应该异常状态的异常原因。
上述方案中,还包括:
基于目标部件的状态信息通过目标输出部件输出对应提示信息。
上述方案中,基于目标部件的状态信息输出对应提示信息,包括以下至少之一:
如果所述状态信息表征所述目标部件未接入,输出重新接入所述目标部件的提示信息;
如果所述状态信息表征所述目标部件未分配通信地址,输出所述目标部件硬件故障的提示信息;
如果所述状态信息表征所述目标部件无法配置硬件资源,输出重新配置资源的提示信息;
如果所述状态信息表征所述目标部件加载失败,输出所述目标部件软件故障的提示信息;
如果状态信息表征所述目标部件被占用,输出是否停止所述占用或等待的提示信息。
一种异常检测装置,包括:
获取模块,用于响应于一触发条件,获得针对电子设备的目标部件的检测信息,所述检测信息包括至少两种不同类型的检测信息;
处理模块,用于基于所述至少两种不同类型的检测信息确定对应目标部件的状态信息;
其中,不同触发条件下获得的检测信息相同或不同。
本申请的实施例所提供的异常检测方法和装置,可以响应于一触发条件,获得针对电子设备的目标部件的检测信息,检测信息包括至少两种不同类型的检测信息,基于至少两种不同类型的检测信息确定对应目标部件的状态信息,不同触发条件下获得的检测信息相同或不同,如此,可以在电子设备中的目标部件丢失之前主动通过目标部件的至少两种不同类型的检测信息,确定目标部件的状态信息,以知晓目标部件是否存在异常以及异常类型,而不需要售后人员先去收集电子设备的日志,进而给到研发人员来分析,解决了相关技术中的分析方法存在分析周期长的问题,提高了分析效率,且实现了对设备可能丢失的主动分析。
附图说明
图1为本申请的实施例提供的一种异常检测方法的流程示意图;
图2为本申请的实施例提供的另一种异常检测方法的流程示意图;
图3为本申请的实施例提供的一种异常检测装置的结构示意图;
图4为本申请的实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
本申请的实施例提供一种异常检测方法,该方法应用于电子设备中,参照图1所示,该方法包括以下步骤:
步骤101、响应于一触发条件,获得针对电子设备的目标部件的检测信息。
其中,该检测信息包括至少两种不同类型的检测信息。
在本申请实施例中,触发条件可以是针对电子设备发生的能够触发执行本申请实施例提供的异常检测方法的一种或多种条件;在一种可行的实现方式中,触发条件可以是如下至少之一:关于电子设备的启动的控制指令、关于电子设备中的目标应用、关于电子设备的目标管理操作、关于电子设备的形态/姿态切换、关于电子设备的模式切换等。
需要说明的是,检测信息可以包括目标部件的连接方式、目标部件的一些固件信息、目标部件的资源信息、目标部件的驱动信息等;在一种可行的实现方式中,连接方式可以包括硬件连接和通信连接;资源信息可以包括资源分配情况。并且,不同触发条件对应的检测信息的获取方式和检测信息的类型是不同。其中,目标部件可以是电子设备中的内置部件,也可以是电子设备上的外接部件;其中,外接部件可以是通过电子设备中的外接总线接口接入电子设备的;在一种可行的实现方式中,外接总线接口可以包括高速串行计算机扩展总线标准(peripheral component interconnect express,PCIe)接口。
步骤102、基于至少两种不同类型的检测信息确定对应目标部件的状态信息。
其中,不同触发条件下获得的检测信息相同或不同。
在本申请实施例中,目标部件的状态信息可以包括目标部件当前所在的插槽的槽位是否被占用、目标部件的状态是否异常、若目标部件异常,异常类型是什么等。需要说明的是,可以先根据检测信息确定目标部件是否在电子设备中,如果在的话继续根据检测信息确定目标部件如果存在异常时的异常类型。其中,异常类型可以表征目标部件异常的原因。
本申请的实施例所提供的异常检测方法,可以响应于一触发条件,获得针对电子设备的目标部件的检测信息,检测信息包括至少两种不同类型的检测信息,基于至少两种不同类型的检测信息确定对应目标部件的状态信息,不同触发条件下获得的检测信息相同或不同,如此,可以在电子设备中的目标部件丢失之前主动通过目标部件的至少两种不同类型的检测信息,确定目标部件的状态信息,以知晓目标部件是否存在异常以及异常类型,而不需要售后人员先去收集电子设备的日志,进而给到研发人员来分析,解决了相关技术中的分析方法存在分析周期长的问题,提高了分析效率,且实现了对设备可能丢失的主动分析。
基于前述实施例,本申请的实施例提供一种异常检测方法,参照图2所示,该方法包括以下步骤:
步骤201、电子设备响应于一触发条件,获得电子设备与目标部件之间的物理连接信息。
其中,检测信息还可以包括:电子设备与目标部件之间的物理连接信息、电子设备对目标部件执行初始化的配置信息和电子设备对目标部件的使用信息等信息。需要说明的是,物理连接信息可以指的是电子设备与目标部件之间的硬件连接信息;并且,物理连接信息具体可以包括电子设备与目标部件之间具有物理连接或者不具有物理连接。
在本申请实施例中,步骤201中的获得电子设备与目标部件之间的物理连接信息,可以通过以下方式来实现:
步骤201a、电子设备通过对目标部件与电子设备之间的输入输出端口进行侦测,以获得物理连接信息。或,
其中,目标部件与电子设备之间的输入输出端口可以指的是电子设备上的用来连接目标部件的通用输入/输出针(General Purpose Input Output,GPIO PIN)、两线式串行总线(Inter-Integrated Circuit,I2C)、串行外设接口(Serial Peripheral Interface,SPI)等。并且,物理连接信息可以是通过侦测对应的总线的电平的变化来确定出来的。
步骤201b、电子设备通过设置于预定接入位置处的传感器获得物理连接信息。
其中,预定接入位置是目标部件应该接入的位置。
在本申请实施例中,预定接入位置可以指的是电子设备上的用来连接目标部件的插槽的槽口所在的位置,但是不影响目标部件的接入。需要说明的是,传感器可以指的是能够确定物理连接信息的目标逻辑器件;在一种可行的实现方式中,传感器可以包括:可编程阵列逻辑(Field Programmable Gate Array,FPGA)器件、霍尔传感器(hallsensor)、接近传感器、红外传感器等。其中,物理连接信息可以是根据插槽的置位信息确定出来的;如果置位信息为1,表示电子设备中具有目标部件(即物理连接信息为连接有目标部件),如果置位信息为0表示电子设备中不具有该目标部件(即物理连接信息为未连接有目标部件)。此外,如果目标部件是外接部件,那么预定接入位置可以指的是电子设备的转接卡(Riser)上的某个插槽(slot)。
步骤202、电子设备响应于一触发条件,获得电子设备对目标部件执行初始化的配置信息。
其中,配置信息可以指的是目标部件在进行初始化的过程中对应的一些配置信息;在一种可行的实现方式中,配置信息可以包括:通信地址信息、硬件资源信息、固件信息和/或驱动信息等。
在本申请实施例中,步骤202中的获得电子设备对目标部件执行初始化的配置信息,可以通过以下至少之一方式来实现(需要说明的是,步骤202a~202d可以是依次执行的,也可以是根据目标部件的属性信息来确定选哪几个步骤来执行):
步骤202a、电子设备获得电子设备为目标部件分配的通信地址信息。
其中,为目标部件分配的通信地址信息可以包括:现场可更换单元(FieldReplace Unit,FRU)信息、PCIe总线(bus)等信息;在一种可行的实现方式中,FRU信息可以是由基板管理控制器(Baseboard Management Controller,BMC)通过I2C检测得到的;PCIebus信息可以是在统一可扩展固件接口(Unified Extensible Firmware Interface,UEFI)开机过程中,在PCIe初始化的过程中通过查看PCIe通道(Lane)是否有拉起(Link up)成功,以及检测对应的链路激活位(Link Active)是否成功置位来得到的。
步骤202b、电子设备获得电子设备在初始化过程中为目标部件分配的硬件资源信息。
在本申请实施例中,为目标部件分配的硬件资源信息可以包括UEFI在开机过程中,在PCIe设备初始化仿真(PCIe device emulation)的过程中给每个目标部件分配的存储器(Memory)或者,输入输出(Input Output,IO)资源等资源信息。
步骤202c、电子设备获得电子设备在初始化过程中针对目标部件配置的固件信息。
在本申请实施例中,固件信息可以指的是UEFI在开机过程中,目标部件对应的固件的人机界面基础设施(Human Interface Infrastructure,HII)信息;在一种可行的实现方式中,固件信息可以包括设备的生厂商(card manufacture)、设备名称(card name)、序列号(serial number,SN)等信息。
步骤202d、电子设备获得电子设备在初始化过程中针对目标部件配置的驱动信息。
在本申请实施例中,针对目标部件配置的驱动信息可以指的是UEFI在开机过程中,即在目标部件初始化过程中驱动的加载情况。需要说明的是,配置的驱动信息可以表征针对目标部件初始化过程中驱动是否加载成功。
在本申请其他实施例中,在获取通信地址信息中的PCIe bus信息、硬件资源信息、固件信息和驱动信息时,可以是基于目标部件所在的目标插槽的标识,以及插槽与根端口(Root Port)的第一对应关系得到的。其中,目标插槽的标识可以指的是目标插槽的Slotnumber;需要说明的是,第一对应关系可以是通过如下方式获取的:
a1、确定待监测设备的插槽的标识和待监测设备的转接卡的标识。
a2、基于转接卡与根端口的第二对应关系、转接卡的标识和插槽的标识,确定第一对应关系。
步骤203、电子设备响应于一触发条件,获得电子设备对目标部件的使用信息。
其中,该检测信息包括至少两种不同类型的检测信息。
需要说明的是,对目标部件的使用信息可以指的是目标部件对应的接入位置是否被占用、目标部件的使用情况等。
在本申请其他实施例中,步骤201~203中的触发条件包括以下至少之一:
响应于获得开机启动或重新启动的控制指令。
其中,控制指令可以是用于开启电子设备或者重新启动电子设备的指令。在一种可行的实现方式中,可以是用户触发电子设备的开关按键以开启电子设备后,响应于该开机指令。
响应于启动目标应用。
其中,目标应用可以指的是UEFI应用,也可以指的是电子设备在启动过程中运行的应用;需要说明的是,运行的应用可以包括调试(debug)应用、硬件扫描检测应用、权限识别验证应用(如人脸识别、指纹识别等)、访问目标硬件的应用(如需要存储、声音、影响支持的应用等)等。在一种可行的实现方式中,可以是相对电子设备进行病毒扫描功能时,启动了电子设备中的硬件扫描检测应用后,响应于启动该硬件扫描检测应用。
响应于获得针对电子设备的目标管理操作。
其中,目标管理操作可以指的是对该电子设备产生了租赁管理、资产管理等其他管理操作。在一种可行的实现方式中,如果电子设备是用于租赁给其他用户使用的公有设备时,就需要对电子设备进行租赁管理;一旦,有用户租借该电子设备时,就启动针对该电子设备的租赁管理,此时就可以响应于该租赁管理操作,对电子设备进行后续的处理。
响应于电子设备从第一形态/姿态切换至第二形态/姿态。
其中,触发条件也可以指的是电子设备的形态/姿态发生了变化。在一种可行的实现方式中,如果电子设备的显示屏幕发生了折叠,此时就认为需要对电子设备采用本申请所提供的异常检测方法来进行目标部件的异常检测,那么就可以响应于该形态的变化。
响应于电子设备从第一运行模式切换至第二运行模式。
其中,电子设备可以从自主运行切换到作为其他设备的辅助设备,对应的电子设备的运行模型可以从第一运行模式切换至第二运行模式;需要说明的是,作为其他设备的辅助设备可以包括支持其他设备的算力任务、支持其他设备的图像采集、支持其他设备的显示输出、支持其他设备的声音输出等。在一种可行的实现方式中,基于电子设备所处的应用场景的变化,可能需要让电子设备成为支持其他设备的显示输出的设备;此时,因为电子设备的运行模式发生了变化,那么在电子设备从自主运行模式切换到支持其他设备的显示输出的运行模式时,就可以响应该模式切换操作,进行电子设备的目标部件的异常检测。
需要说明的是,步骤201~203之间可以选择至少其中一个步骤来执行;当然,步骤201~203也可以是依次执行步骤201~203。并且,步骤201~203之后均可以执行步骤204或者步骤205;在一种可行的实现方式中,图2中是以步骤201~203依次执行来示出的。需要说明的是,步骤201~203依次执行的时候,必须是在步骤201中获取的物理连接信息表征电子设备上连接有目标部件的时候,才会执行后续的步骤202和步骤203。
步骤204、电子设备将检测信息与对应的预置状态表进行比对,以定位目标部件当前所处状态。
其中,预置状态表包括目标部件在各状态下对应的检测值。
需要说明的是,电子设备在获取到通过FPGA、UEFI和BMC获取到的至少两种不同类型的检测信息后,可以将获取到的检测信息都给到BMC,最后由BMC直接进行信息的值之间的比对,从而可以从预置状态表中确定出与获取的检测信息的值匹配的信息,并确定预置状态中与获取的检测信息的值匹配的信息所对应的状态即为目标部件当前所处状态。
在本申请实施例中,可以预先基于电子设备中的部件在过往历史中初始化成功后产生的一些历史数据,生成预置状态表。
步骤205、电子设备按目标顺序依次校验至少两种不同类型的检测信息,以基于校验结果定位目标部件当前所处状态。
其中,目标顺序是基于目标部件的属性信息确定的。
需要说明的是,电子设备可以先基于目标部件的属性信息确定出一进行检测信息校验的目标顺序,之后按照该目标顺序依次对至少两种不同类型的检测信息进行校验。也就是说,在对检测信息检验的时候一定得是按照确定的目标顺序来校验的。
在本申请其他实施例中,步骤204和步骤205中,基于至少两种不同类型的检测信息确定对应目标部件的状态信息,可以通过以下方式来实现:
b1、电子设备基于第一类型的检测信息确定目标部件的接入状态。
其中,接入状态可以指的是目标部件当前是否接入了该电子设备;需要说明的是,接入状态可以包括目标部件接入了电子设备中,也可以包括目标部件未接入电子设备中。在一种可行的实现方式中,第一类型的检测信息可以包括物理连接信息。
b2、在确定目标部件接入的情况下,电子设备基于第二类型的检测信息确定目标部件处于使用状态及当前使用情况,或,确定目标部件处于异常状态及对应该异常状态的异常原因。
在本申请实施例中,第二类型的检测信息可以是用来在确定电子设备中接入了目标部件时,进一步确定目标部件当前是否处于使用状态;或,目标部件当前是否处于异常状态;需要说明的是,如果确定目标部件处于使用状态,那相应的会确定目标部件的使用情况;或者,如果确定目标部件成处于异常状态,那相应的会确定目标部件出现异常的异常原因。
基于前述实施例,在本申请的其他实施例中,该方法还可以包括以下步骤:
步骤206、电子设备基于目标部件的状态信息通过目标输出部件输出对应提示信息。
其中,目标输出部件可以指的是电子设备中自身的显示设备、电子设备中能够输出灯效的设备、电子设备中的声音输出部件等;当然,目标输出部件也包括与之电子设备建立网络连接的其他设备的输出部件。需要说明的是,提示信息可以是基于目标部件的状态信息确定的。在一种可行的实现方式中,若状态信息表征目标部件存在异常,提示信息可以包括异常输出警示及如何修复异常;若状态信息表征目标部件被占用,提示信息可以包括是否停止占用或等待等。
在本申请其他实施例中,步骤206可以通过以下至少之一步骤来实现:
步骤206a、如果状态信息表征目标部件未接入,电子设备输出重新接入目标部件的提示信息。
其中,如果目标部件的状态信息表征目标部件没有接入电子设备中(即物理连接信息表征目标部件没有接入电子设备),此时电子设备可以输出重新接入目标部件的提示信息给用户,以便用户重新将目标部件接入到电子设备中。
步骤206b、如果状态信息表征目标部件未分配通信地址,电子设备输出目标部件硬件故障的提示信息。
其中,如果目标部件的状态信息表征目标部件没有分配通信地址(即FRU信息存在异常或PCIe bus存在异常),此时电子设备可以输出目标部件的硬件故障的提示信息,以便让用户联系目标部件的硬件供应商更换硬件或者更换主板。需要说明的是,在UEFI PCIetraining失败的时候,也会输出目标部件的硬件故障的提示信息。
步骤206c、如果状态信息表征目标部件无法配置硬件资源,电子设输出重新配置资源的提示信息。
其中,如果目标部件的状态信息表征目标部件没法配置硬件资源(即分配的硬件资源不足),此时电子设备可以输出重新分配资源的提示信息给用户,以便分配新内存空间或调整目标部件间的加载顺序。在一种可行的实现方式中,UEFI PCIe device emulation失败的时候,可以表征目标部件无法配置硬件资源。
步骤206d、如果状态信息表征目标部件加载失败,电子设输出目标部件软件故障的提示信息。
其中,状态信息表征目标部件加载失败可以包括UEFI PCIe的驱动加载失败或目标部件的UEFI PCIe固件加载失败;此时,可以输出驱动存在问题或固件存在问题的提示信息,以便联系硬件供应商更新驱动或固件。
步骤206e、如果状态信息表征目标部件被占用,电子设备输出是否停止占用或等待的提示信息。
其中,在目标部件被占用的时候,可以输出是否停止该占用也就是停止该目标部件当前所提供的服务,或者,等待目标部件当前所提供的服务完成后再进行后续操作。
需要说明的是,本实施例中与其他实施例相同或相关步骤的解释,可以参照其他实施例中的说明,此处不再赘述。
本申请的实施例所提供的异常检测方法,可以在电子设备中的目标部件丢失之前主动通过目标部件的至少两种不同类型的检测信息,确定目标部件的状态信息,以知晓目标部件是否存在异常以及异常类型,而不需要售后人员先去收集电子设备的日志,进而给到研发人员来分析,解决了相关技术中的分析方法存在分析周期长的问题,提高了分析效率,且实现了对设备可能丢失的主动分析。
基于前述实施例,本申请的实施例提供一种异常检测装置,该装置可以应用于图1和2对应的实施例提供的异常检测方法中,参照图3所示,该装置3可以包括:获取模块31和处理模块32,其中:
获取模块31,用于响应于一触发条件,获得针对电子设备的目标部件的检测信息;检测信息包括至少两种不同类型的检测信息;
处理模块32,用于基于至少两种不同类型的检测信息确定对应目标部件的状态信息;
其中,不同触发条件下获得的检测信息相同或不同。
在本申请其他实施例中,触发条件包括以下至少之一:
响应于获得开机启动或重新启动的控制指令;
响应于启动目标应用;
响应于获得针对电子设备的目标管理操作;
响应于电子设备从第一形态/姿态切换至第二形态/姿态;
响应于电子设备从第一运行模式切换至第二运行模式。
在本申请其他实施例中,获取模块31还用于执行以下至少之一步骤:
获得电子设备与目标部件之间的物理连接信息;
获得电子设备对目标部件执行初始化的配置信息;
获得电子设备对目标部件的使用信息。
在本申请其他实施例中,获取模块31还用于执行以下步骤:
通过对目标部件与电子设备之间的输入输出端口进行侦测,以获得物理连接信息;或,
通过设置于预定接入位置处的传感器获得物理连接信息,预定接入位置是目标部件应该接入的位置。
在本申请其他实施例中,获取模块31还用于执行以下至少之一步骤:
获得电子设备为目标部件分配的通信地址信息;
获得电子设备在初始化过程中为目标部件分配的硬件资源信息;
获得电子设备在初始化过程中针对目标部件配置的固件信息;
获得电子设备在初始化过程中针对目标部件配置的驱动信息。
在本申请其他实施例中,处理模块32还用于执行以下步骤:
将至少两种不同类型的检测信息与对应的预置状态表进行比对,以定位目标部件当前所处状态,预置状态表包括目标部件在各状态下对应的检测值;或,
按目标顺序依次校验至少两种不同类型的检测信息,以基于校验结果定位目标部件当前所处状态,目标顺序是基于目标部件的属性信息确定的。
在本申请其他实施例中,处理模块32还用于执行以下步骤:
基于第一类型的检测信息确定目标部件的接入状态;
在确定目标部件接入的情况下,基于第二类型的检测信息确定目标部件处于使用状态及当前使用情况,或,确定目标部件处于异常状态及对应该异常状态的异常原因。
在本申请其他实施例中,处理模块32还用于执行以下步骤:
基于目标部件的状态信息通过目标输出部件输出对应提示信息。
在本申请其他实施例中,处理模块32还用于执行以下至少之一步骤:
如果状态信息表征目标部件未接入,输出重新接入目标部件的提示信息;
如果状态信息表征目标部件未分配通信地址,输出目标部件硬件故障的提示信息;
如果状态信息表征目标部件无法配置硬件资源,输出重新配置资源的提示信息;
如果状态信息表征目标部件加载失败,输出目标部件软件故障的提示信息;
如果状态信息表征目标部件被占用,输出是否停止占用或等待的提示信息。
需要说明的是,本实施例中各个模块之间的交互过程,可以参照图1和2对应的实施例提供的异常检测方法中的实现过程,此处不再赘述。
本申请的实施例所提供的异常检测装置,可以在电子设备中的目标部件丢失之前主动通过目标部件的至少两种不同类型的检测信息,确定目标部件的状态信息,以知晓目标部件是否存在异常以及异常类型,而不需要售后人员先去收集电子设备的日志,进而给到研发人员来分析,解决了相关技术中的分析方法存在分析周期长的问题,提高了分析效率,且实现了对设备可能丢失的主动分析。
基于前述实施例,本申请的实施例提供一种电子设备,该电子设备可以应用于图1和2对应的实施例提供的异常检测方法中,参照图4所示,该电子设备4可以包括:处理器41、存储器42和通信总线43,其中:
通信总线43用于实现处理器41和存储器42之间的通信连接;
处理器41用于执行存储器42中的异常检测程序,以实现如下步骤:
响应于一触发条件,获得针对电子设备的目标部件的检测信息;检测信息包括至少两种不同类型的检测信息;
基于至少两种不同类型的检测信息确定对应目标部件的状态信息;
其中,不同触发条件下获得的检测信息相同或不同。
在本申请的其他实施例中,如果检测信息是通过系统PFGA获取的插槽的置位信息、通过BMC获取的FRU信息和通过UEFI获取的初始化信息的时候,异常检测方法具体步骤可以如下所示:
A、系统FPGA能检测某个Riser上的某个slot的当前针(present pin)置位,如果present pin=1表示该slot上此时插有PCIe设备。
B、BMC通过I2C检测全部目标部件的FRU信息,PCIe slot上面目标部件的FRU信息也会在里面;其中,可以根据FRU ID/I2C地址(address)判断每个slot。
C、UEFI在开机过程中,在PCIe设备(即目标部件)初始化早期初始化(PCIe earlyinit)的过程中,会查看每个PCIe Lane是否Link up成功,以及检测对应的Link Active是否成功置位。在PCIe device emulation的时候会对每个目标部件分配Bus,以及Memory/IOresource等,最后如果该目标部件有FW的话会加载该FW,并获取到对应的HII信息(例如card manufacture,card name,SN等信息)。
D、在进行了A、B和C步骤的基础上,UEFI建立一个包含下面信息的表格,并且在最后开机硬件自检(End of POST)的时候将表格信息传递给BMC。其中,表格内容包括如下信息:
c1、Slot number–UEFI从FPGA得知目前使用的Riser型号,然后结合硬件拉线可以得知Riser上的Slot是从哪个Root Port出来的;再按照项目定义slot number。这里就得知了Slot number和Root Port的对应关系。
c2、PCIe early init时期记录的某个Root Port在PCIe training的结果:Linkup/Link Active成功还是Link Down失败,;并且这些结果是Root Port关联记录的。
c3、PCIe device emulation的时候记录了是否有resource分配失败,例如(存储资源丢失)memory out of resource导致设备的UEFI驱动加载失败;并且,resource分配失败与否的结果也是与Root Port关联记录的。
E、BMC提供关于目标部件的检测信息的对比结果,并给出可能导致异常的原因的分析:
d1、某个Slot的present pin=1,此时表示有目标部件安插在此处,接着需要判断该目标部件是否初始化成功(可以按照Slot number/Root Port信息对比):
若BMC FRU信息不正常,可能目标部件的硬件损坏,提示联系设备硬件供应商或者更换主板。
若UEFI PCIe training失败,可能目标部件的硬件损坏,提示联系设备硬件供应商或者更换主板。
若UEFI PCIe device emulation失败,可能电子设备的内存不足,提示调整目标部件间的加载顺序。
若UEFI PCIe驱动加载失败,可能是驱动问题,提示联系设备硬件供应商更新驱动。
d2、当present pin=0时,表示FPGA没有看到有目标部件安装在电子设备上,此时可以提供一个选项让用户确认是否有目标部件,并提示用户可能是安装不当,请重新检查安装。
需要说明的是,本实施例中处理器所执行的步骤的具体实现过程,可以参照图1和2对应的实施例提供的异常检测方法中的实现过程,此处不再赘述。
本申请的实施例所提供的电子设备,可以在电子设备中的目标部件丢失之前主动通过目标部件的至少两种不同类型的检测信息,确定目标部件的状态信息,以知晓目标部件是否存在异常以及异常类型,而不需要售后人员先去收集电子设备的日志,进而给到研发人员来分析,解决了相关技术中的分析方法存在分析周期长的问题,提高了分析效率,且实现了对设备可能丢失的主动分析。
基于前述实施例,本申请的实施例提供一种计算机可读存储介质,该计算机可读存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现如图1和2对应的实施例提供的异常检测方法的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。
Claims (10)
1.一种异常检测方法,包括:
响应于一触发条件,获得针对电子设备的目标部件的检测信息,所述检测信息包括至少两种不同类型的检测信息;
基于所述至少两种不同类型的检测信息确定对应目标部件的状态信息;
其中,不同触发条件下获得的检测信息相同或不同。
2.根据权利要求1所述的方法,其中,所述触发条件包括以下至少之一:
响应于获得开机启动或重新启动的控制指令;
响应于启动目标应用;
响应于获得针对电子设备的目标管理操作;
响应于电子设备从第一形态/姿态切换至第二形态/姿态;
响应于电子设备从第一运行模式切换至第二运行模式。
3.根据权利要求1或2所述的方法,其中,所述获得针对电子设备的目标部件的检测信息,包括以下至少之一:
获得电子设备与目标部件之间的物理连接信息;
获得电子设备对目标部件执行初始化的配置信息;
获得电子设备对目标部件的使用信息。
4.根据权利要求3所述的方法,其中,所述获得电子设备与目标部件之间的物理连接信息,包括:
通过对目标部件与电子设备之间的输入输出端口进行侦测,以获得所述物理连接信息;或,
通过设置于预定接入位置处的传感器获得所述物理连接信息,所述预定接入位置是目标部件应该接入的位置。
5.根据权利要求3所述的方法,其中,所述获得电子设备对目标部件执行初始化的配置信息,包括以下至少之一:
获得电子设备为目标部件分配的通信地址信息;
获得电子设备在初始化过程中为所述目标部件分配的硬件资源信息;
获得电子设备在初始化过程中针对目标部件配置的固件信息;
获得电子设备在初始化过程中针对目标部件配置的驱动信息。
6.根据权利要求1、2、4或5中任一项所述的方法,其中,所述基于所述至少两种不同类型的检测信息确定对应目标部件的状态信息,包括:
将所述至少两种不同类型的检测信息与对应的预置状态表进行比对,以定位所述目标部件当前所处状态,所述预置状态表包括所述目标部件在各状态下对应的检测值;或,
按目标顺序依次校验所述至少两种不同类型的检测信息,以基于校验结果定位所述目标部件当前所处状态,所述目标顺序是基于所述目标部件的属性信息确定的。
7.根据权利要求6所述的方法,其中,基于所述至少两种不同类型的检测信息确定对应目标部件的状态信息,包括:
基于第一类型的检测信息确定所述目标部件的接入状态;
在确定所述目标部件接入的情况下,基于第二类型的检测信息确定所述目标部件处于使用状态及当前使用情况,或,确定所述目标部件处于异常状态及对应该异常状态的异常原因。
8.根据权利要求7所述的方法,其中,还包括:
基于目标部件的状态信息通过目标输出部件输出对应提示信息。
9.根据权利要求8所述的方法,其中,基于目标部件的状态信息输出对应提示信息,包括以下至少之一:
如果所述状态信息表征所述目标部件未接入,输出重新接入所述目标部件的提示信息;
如果所述状态信息表征所述目标部件未分配通信地址,输出所述目标部件硬件故障的提示信息;
如果所述状态信息表征所述目标部件无法配置硬件资源,输出重新配置资源的提示信息;
如果所述状态信息表征所述目标部件加载失败,输出所述目标部件软件故障的提示信息;
如果状态信息表征所述目标部件被占用,输出是否停止所述占用或等待的提示信息。
10.一种异常检测装置,包括:
获取模块,用于响应于一触发条件,获得针对电子设备的目标部件的检测信息,所述检测信息包括至少两种不同类型的检测信息;
处理模块,用于基于所述至少两种不同类型的检测信息确定对应目标部件的状态信息;
其中,不同触发条件下获得的检测信息相同或不同。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210772886.6A CN115168146A (zh) | 2022-06-30 | 2022-06-30 | 一种异常检测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210772886.6A CN115168146A (zh) | 2022-06-30 | 2022-06-30 | 一种异常检测方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115168146A true CN115168146A (zh) | 2022-10-11 |
Family
ID=83489449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210772886.6A Pending CN115168146A (zh) | 2022-06-30 | 2022-06-30 | 一种异常检测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115168146A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116678446A (zh) * | 2023-08-03 | 2023-09-01 | 北京小米移动软件有限公司 | 配件识别方法、装置、电子设备及存储介质 |
-
2022
- 2022-06-30 CN CN202210772886.6A patent/CN115168146A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116678446A (zh) * | 2023-08-03 | 2023-09-01 | 北京小米移动软件有限公司 | 配件识别方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107122321B (zh) | 硬件修复方法、硬件修复系统以及计算机可读取存储装置 | |
US10055296B2 (en) | System and method for selective BIOS restoration | |
US9954727B2 (en) | Automatic debug information collection | |
US20070234123A1 (en) | Method for detecting switching failure | |
CN109587005B (zh) | 连接检测方法、装置、计算机设备以及可读存储介质 | |
CN109254783A (zh) | 一种服务器系统安装方法、装置、设备及可读存储介质 | |
EP3218818B1 (en) | Dual purpose boot registers | |
EP2590072A1 (en) | System control device, information processing system, and data migration and restoration method for information processing system | |
CN115168146A (zh) | 一种异常检测方法和装置 | |
CN107544879A (zh) | 服务器的诊断方法、装置及机器可读存储介质 | |
CN114064216A (zh) | 一种虚拟机初始化方法、装置、终端设备及存储介质 | |
CN114510381A (zh) | 故障注入方法、装置、设备和存储介质 | |
TW201734779A (zh) | 通知開機階段的方法及伺服器系統 | |
WO2024119787A1 (zh) | Amd服务器系统安装断电处理方法、装置、设备及介质 | |
CN115599617B (zh) | 总线检测方法、装置、服务器及电子设备 | |
KR20150116020A (ko) | 무선 네트워크를 이용한 컴퓨터 진단 및 복구 장치와 그 방법 | |
CN115756648A (zh) | 一种双基板管理控制器芯片的主动恢复方法及终端 | |
CN115098342A (zh) | 系统日志收集方法、系统、终端及存储介质 | |
TWI554876B (zh) | 節點置換處理方法與使用其之伺服器系統 | |
CN111694587A (zh) | 服务器pnor固件升级方法、装置、设备及存储介质 | |
JP7389877B2 (ja) | ネットワークの最適なブートパスの方法及びシステム | |
CN112084049B (zh) | 用于监控基板管理控制器的常驻程序的方法 | |
CN116382968B (zh) | 外部设备的故障检测方法以及装置 | |
CN112732486B (zh) | 一种冗余固件切换方法、装置、设备及存储介质 | |
TWI715005B (zh) | 用於監控基板管理控制器之常駐程序的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |