CN115941438A - 故障信息的处理方法及装置、存储介质及电子装置 - Google Patents

故障信息的处理方法及装置、存储介质及电子装置 Download PDF

Info

Publication number
CN115941438A
CN115941438A CN202211393337.4A CN202211393337A CN115941438A CN 115941438 A CN115941438 A CN 115941438A CN 202211393337 A CN202211393337 A CN 202211393337A CN 115941438 A CN115941438 A CN 115941438A
Authority
CN
China
Prior art keywords
target
server
fault
message
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211393337.4A
Other languages
English (en)
Other versions
CN115941438B (zh
Inventor
信仕尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202211393337.4A priority Critical patent/CN115941438B/zh
Publication of CN115941438A publication Critical patent/CN115941438A/zh
Application granted granted Critical
Publication of CN115941438B publication Critical patent/CN115941438B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本申请实施例提供了一种故障信息的处理方法及装置、存储介质及电子装置,其中,该故障信息的处理方法包括:通过第一服务器向第二服务器发送目标报文;获取目标报文的目标传输状态;在目标故障信息中获取第一组故障描述字段以及对应的字段取值,在目标传输状态中获取第二组故障描述字段以及对应的字段取值,并在第一服务器上将第一组故障描述字段以及对应的字段取值和第二组故障描述字段以及对应的字段取值记录在故障描述信息中;在第一服务器上获取故障查询请求;响应于故障查询请求,在第一服务器上存储的故障描述信息中获取并返回与目标查询参数匹配的故障描述字段以及对应的字段取值。

Description

故障信息的处理方法及装置、存储介质及电子装置
技术领域
本申请实施例涉及计算机领域,具体而言,涉及一种故障信息的处理方法及装置、存储介质及电子装置。
背景技术
服务器作为网络系统和计算平台的核心,存储有大量重要的数据,往往通过BMC(Baseboard Management Controller,基板管理控制器)来实现对计算机或者服务器,或者其他硬件驱动设备等等的状态的监控。
现有技术中,在进行压力测试模拟服务器发生故障或者在服务器真实发生故障的情况下,BMC会向其它的服务器发送携带有故障信息的故障报文,测试人员只能在接收故障报文的服务器端逐条处理每条故障报文以及查看故障报文的发送情况。这样的方式,一方面,故障报文中携带有繁杂的内容,需要测试人员具备相关的专业能力才能看懂,另一方面,逐条处理故障报文中的相关信息会浪费较多的时间成本和人力成本,效率较低。
针对相关技术中,处理服务器的故障信息的效率较低的技术问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种故障信息的处理方法及装置、存储介质及电子装置,以至少解决相关技术中处理服务器的故障信息的效率较低的问题。
根据本申请的一个实施例,提供了一种故障信息的处理方法,包括:通过第一服务器向第二服务器发送目标报文,其中,所述目标报文中携带有所述第一服务器上的基板管理控制器BMC上报的目标故障信息,所述目标故障信息是所述第一服务器发生的故障的故障信息;获取所述目标报文的目标传输状态,其中,所述目标传输状态用于表示是否成功将所述目标报文从所述第一服务器传输到所述第二服务器;在所述目标故障信息中获取第一组故障描述字段以及对应的字段取值,在所述目标传输状态中获取第二组故障描述字段以及对应的字段取值,并在所述第一服务器上将所述第一组故障描述字段以及对应的字段取值和所述第二组故障描述字段以及对应的字段取值记录在故障描述信息中,其中,所述故障描述信息中记录了预设的故障描述字段集合以及对应的字段取值,所述故障描述字段集合包括所述第一组故障描述字段和所述第二组故障描述字段;在所述第一服务器上获取故障查询请求,其中,所述故障查询请求中携带有与所述故障描述字段集合中的至少部分字段对应的目标查询参数;响应于所述故障查询请求,在所述第一服务器上存储的所述故障描述信息中获取并返回与所述目标查询参数匹配的故障描述字段以及对应的字段取值。
在一个示例性实施例中,所述获取所述目标报文的目标传输状态,包括:在检测到所述第一服务器向所述第二服务器发送所述目标报文的情况下,通过所述第一服务器上的目标接口获取所述目标报文被发送后的返回参数,其中,所述返回参数包括第一状态参数和/或第二状态参数,所述第一状态参数用于表示所述第一服务器是否成功发送所述目标报文,所述第二状态参数用于表示所述第二服务器是否成功接收所述目标报文;根据所述返回参数确定所述目标传输状态。
在一个示例性实施例中,所述通过所述第一服务器上的目标接口获取所述目标报文被发送后的返回参数,包括:通过所述目标接口获取所述第一服务器记录的所述第一状态参数;通过所述目标接口获取所述第二服务器返回的所述第二状态参数;所述根据所述返回参数确定所述目标传输状态,包括:在所述第一状态参数表示所述第一服务器成功发送所述目标报文、且所述第二状态参数表示所述第二服务器成功接收所述目标报文的情况下,将所述目标传输状态确定为用于表示成功将所述目标报文从所述第一服务器传输到所述第二服务器。
在一个示例性实施例中,所述在所述目标故障信息中获取第一组故障描述字段以及对应的字段取值,包括:在检测到所述BMC上报了所述目标故障信息的情况下,通过所述第一服务器中的第一线程,在所述目标故障信息中提取所述第一组故障描述字段以及对应的字段取值;或者在检测到所述第一服务器向所述第二服务器发送所述目标报文的情况下,通过所述第一服务器中的第二线程,在所述目标报文中提取所述目标故障信息,并在所述目标故障信息中提取所述第一组故障描述字段以及对应的字段取值。
在一个示例性实施例中,所述在所述目标故障信息中提取所述第一组故障描述字段以及对应的字段取值,包括:在所述目标故障信息中查找所述故障描述字段集合中的故障描述字段;在所述目标故障信息中查找到所述故障描述字段集合中的故障描述字段的情况下,将查找到的故障描述字段确定为所述第一组故障描述字段,并在所述目标故障信息中获取所述第一组故障描述字段对应的字段取值。
在一个示例性实施例中,所述在所述第一服务器上获取故障查询请求,包括:通过在所述第一服务器上设置的目标命令接口,在所述第一服务器对应的交互界面上获取目标查询命令,其中,所述目标查询命令中携带有所述目标查询参数,所述目标查询命令用于在所述第一服务器上存储的所述故障描述信息中查询与所述目标查询参数匹配的故障描述字段以及对应的字段取值。
在一个示例性实施例中,响应于所述故障查询请求,在所述第一服务器上存储的所述故障描述信息中获取并返回与所述目标查询参数匹配的故障描述字段以及对应的字段取值,包括:在所述目标查询参数包括目的地址参数以及传输状态参数的情况下,在所述故障描述信息中获取与所述目的地址参数以及所述传输状态参数匹配的第三组故障描述字段以及对应的字段取值,其中,所述目标地址参数用于表示允许接收目标类型的报文的服务器的地址,所述目标类型的报文是在所述第一服务器上检测到故障时发送的报文,所述目标类型的报文中携带有检测到的故障的故障信息,所述目标类型的报文包括所述目标报文,所述第一服务器被设置为允许将所述目标类型的报文发送到一组服务器中的至少部分服务器,所述一组服务器包括所述第二服务器;所述第三组故障描述字段包括服务器标识字段以及报文传输状态字段,所述服务器标识字段用于标识所述一组服务器中的服务器,所述传输状态参数用于表示所述目标地址参数所对应的服务器是否成功接收所述目标类型的报文,或者,表示所述目标地址参数所对应的服务器接收所述目标类型的报文的成功次数,或者,表示所述目标地址参数所对应的服务器接收所述目标类型的报文的失败次数,或者,表示所述目标地址参数所对应的服务器接收所述目标类型的报文的总次数,所述报文传输状态字段用于表示是否成功将所述目标类型的报文从所述第一服务器发送到所述一组服务器中的服务器,或者,表示将所述目标类型的报文从所述第一服务器发送到所述一组服务器中的服务器的成功次数,或者,表示将所述目标类型的报文从所述第一服务器发送到所述一组服务器中的服务器的失败次数,或者,表示将所述目标类型的报文从所述第一服务器发送到所述一组服务器中的服务器的总次数;返回查找到的所述第三组故障描述字段以及对应的字段取值。
根据本申请的另一个实施例,提供了一种故障信息的处理装置,包括:发送模块,用于通过第一服务器向第二服务器发送目标报文,其中,所述目标报文中携带有所述第一服务器上的基板管理控制器BMC上报的目标故障信息,所述目标故障信息是所述第一服务器发生的故障的故障信息;第一获取模块,用于获取所述目标报文的目标传输状态,其中,所述目标传输状态用于表示是否成功将所述目标报文从所述第一服务器传输到所述第二服务器;处理模块,用于在所述目标故障信息中获取第一组故障描述字段以及对应的字段取值,在所述目标传输状态中获取第二组故障描述字段以及对应的字段取值,并在所述第一服务器上将所述第一组故障描述字段以及对应的字段取值和所述第二组故障描述字段以及对应的字段取值记录在故障描述信息中,其中,所述故障描述信息中记录了预设的故障描述字段集合以及对应的字段取值,所述故障描述字段集合包括所述第一组故障描述字段和所述第二组故障描述字段;第二获取模块,用于在所述第一服务器上获取故障查询请求,其中,所述故障查询请求中携带有与所述故障描述字段集合中的至少部分字段对应的目标查询参数;第三获取模块,用于响应于所述故障查询请求,在所述第一服务器上存储的所述故障描述信息中获取并返回与所述目标查询参数匹配的故障描述字段以及对应的字段取值。
根据本申请的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项故障信息的处理方法实施例中的步骤。
根据本申请的又一个实施例,还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项故障信息的处理方法实施例中的步骤。
通过本申请实施例,在服务器发生故障的情况下,可以将故障描述信息存储在上述服务器本地,在需要对上述服务器的故障信息进行处理的情况下,可以直接从上述服务器上本地存储的故障描述信息中获取所希望查询的故障信息,避免了从其它服务器上读取存储的故障描述信息,进而再对上述服务器的故障信息进行处理,极大的降低了处理服务器的故障信息所需的时间成本,大大提升了处理服务器的故障信息的效率。因此,可以解决处理服务器的故障信息的效率较低问题,达到提升处理服务器的故障信息的效率的效果。
附图说明
图1是根据本申请实施例的一种网络架构图;
图2是根据本申请实施例的一种故障信息的处理方法的应用场景示意图;
图3是根据本申请实施例的故障信息的处理的流程图;
图4是根据本申请实施例的一种第二服务器的示意图;
图5是根据本申请实施例的一种获取故障描述信息的示意图;
图6是根据本申请实施例的一种提取第一组故障描述字段及对应的字段取值的示意图一;
图7是根据本申请实施例的一种提取第一组故障描述字段及对应的字段取值的示意图二;
图8是根据本申请实施例的一种获取并返回与目标查询参数匹配的故障描述字段以及对应的字段取值的示意图;
图9是根据本申请实施例的一种故障信息的处理方法的示意图;
图10是根据本申请实施例的一种故障信息的处理装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请的实施例。
需要说明的是,本申请实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
图1是根据本申请实施例的一种网络架构图,本申请实施例可以运行于图1所示的网络架构上,如图1所示,该网络架构可以但不限于包括:服务器102、服务器104和服务器106。
可以但不限于以服务器102作为第一服务器,对本申请实施例的故障信息的处理方法的应用场景进行解释说明。图2是根据本申请实施例的一种故障信息的处理方法的应用场景示意图,如图2所示,在服务器102发生故障的情况下,服务器102上的BMC 104可以但不限于将故障信息上报至服务器102,一方面,服务器102会将故障信息拼接为SNMP(SimpleNetwork Management Protocol,简单网络管理协议)报文,并将故障报文发送至SNMP服务器108(即第二服务器),并通过服务器102上的目标接口110接收SNMP服务器108返回的返回参数;另一方面,服务器102会从故障信息和返回参数中提取故障描述信息,并将故障描述信息存储在服务器102上的EEPROM(Electrically Erasable Programmable Read OnlyMemory,带电可擦可编程只读存储器)106中,服务器102的运维人员可以但不限于从字段1,字段2,……,字段k中为待查询故障字段1,待查询故障字段2,……,待查询故障字段n选择所要查询的字段,可以但不限于根据待查询故障字段1为字段1,待查询故障字段2为字段2,……,待查询字段n为字段k生成故障查询请求,并向服务器102上的目标命令接口112发起故障查询请求,目标命令接口112在接收到故障查询请求的情况下,可以但不限于从EEPROM 106中存储的故障描述信息中获取并返回字段1,字段2……,字段k以及对应的字段取值的查询结果。
在本实施例中提供了一种运行于上述网络架构中的每个服务器的故障信息的处理方法,图3是根据本申请实施例的故障信息的处理的流程图,如图3所示,该流程包括如下步骤:
步骤S302,通过第一服务器向第二服务器发送目标报文,其中,所述目标报文中携带有所述第一服务器上的基板管理控制器BMC上报的目标故障信息,所述目标故障信息是所述第一服务器发生的故障的故障信息;
步骤S304,获取所述目标报文的目标传输状态,其中,所述目标传输状态用于表示是否成功将所述目标报文从所述第一服务器传输到所述第二服务器;
步骤S306,在所述目标故障信息中获取第一组故障描述字段以及对应的字段取值,在所述目标传输状态中获取第二组故障描述字段以及对应的字段取值,并在所述第一服务器上将所述第一组故障描述字段以及对应的字段取值和所述第二组故障描述字段以及对应的字段取值记录在故障描述信息中,其中,所述故障描述信息中记录了预设的故障描述字段集合以及对应的字段取值,所述故障描述字段集合包括所述第一组故障描述字段和所述第二组故障描述字段;
步骤S308,在所述第一服务器上获取故障查询请求,其中,所述故障查询请求中携带有与所述故障描述字段集合中的至少部分字段对应的目标查询参数;
步骤S310,响应于所述故障查询请求,在所述第一服务器上存储的所述故障描述信息中获取并返回与所述目标查询参数匹配的故障描述字段以及对应的字段取值。
通过上述步骤,在服务器发生故障的情况下,可以将故障描述信息存储在上述服务器本地,在需要对上述服务器的故障信息进行处理的情况下,可以直接从上述服务器上本地存储的故障描述信息中获取所希望查询的故障信息,避免了从其它服务器上读取存储的故障描述信息,进而再对上述服务器的故障信息进行处理,极大的降低了处理服务器的故障信息所需的时间成本,大大提升了处理服务器的故障信息的效率。因此,可以解决处理服务器的故障信息的效率较低问题,达到提升处理服务器的故障信息的效率的效果。
其中,上述步骤的执行主体可以为服务器等,但不限于此。
步骤S302和步骤S304的执行顺序是可以互换的,即可以先执行步骤S304,然后再执行S302。
在上述步骤S302提供的技术方案中,在第一服务器真实发生故障,或者对第一服务器进行压力测试模拟第一服务器发生故障的情况下,第一服务器上的基板管理控制器BMC可以但不限于将目标故障信息上报至第一服务器,第一服务器可以但不限于将目标故障信息携带在目标报文中,并通过第一服务器向第二服务器发送目标报文,实现了第二服务器对第一服务器运行情况的实时监控,提升了第一服务器运行的稳定性。
可选的,在本实施例中,可以但不限于由一个或者多个服务器接收第一服务器所发送的目标报文,图4是根据本申请实施例的一种第二服务器的示意图,如图4所示,在服务器102(即上述的第一服务器)产生故障的情况下,可以但不限于允许服务器1,服务器2,……,服务器N中的一个或者多个服务器(即上述的第二服务器)接收服务器102所产生的故障的故障信息的故障报文。
在上述步骤S304提供的技术方案中,在第一服务器真实发生故障,或者对第一服务器进行压力测试模拟第一服务器发生故障的情况下,第一服务器上的基板管理控制器BMC可以但不限于将目标故障信息上报至第一服务器,可以但不限于将目标故障信息携带在目标报文中,并通过第一服务器向第二服务器发送目标报文,在这样的情况下,可以但不限于获取目标报文的目标传输状态,进而对目标报文是否成功发送至第二服务器进行监控,实现了通过获取目标报文的传输状态对第一服务器所产生的故障的故障信息的上报情况的监控,提升了获取目标报文的传输状态的及时性。
在一个示范性实施例中,可以但不限于通过以下方式获取所述目标报文的目标传输状态:在检测到所述第一服务器向所述第二服务器发送所述目标报文的情况下,通过所述第一服务器上的目标接口获取所述目标报文被发送后的返回参数,其中,所述返回参数包括第一状态参数和/或第二状态参数,所述第一状态参数用于表示所述第一服务器是否成功发送所述目标报文,所述第二状态参数用于表示所述第二服务器是否成功接收所述目标报文;根据所述返回参数确定所述目标传输状态。
可选的,在本实施例中,在检测到第一服务器向第二服务器发送目标报文的情况下,可以但不限于通过第一服务器上的目标接口获取目标报文被发送后的第一返回参数和/或第二状态参数,实现了根据第一服务器是否成功发送目标报文和/或第二服务器是否成功接收目标报文,来综合判断目标报文的传输状态,提升了目标传输状态的准确度。
可选的,在本实施例中,第一返回参数可以但不限于为WIFEXITED(Status),第二返回参数可以但不限于为WEXITSTATUS(Status),可以但不限于通过第一服务器上的linux操作系统上的API(Application Programming Interface,应用程序接口)接口获取第一返回参数和/或第二状态参数。
在一个示范性实施例中,可以但不限于通过以下方式获取目标报文被发送后的返回参数:通过所述目标接口获取所述第一服务器记录的所述第一状态参数;通过所述目标接口获取所述第二服务器返回的所述第二状态参数。
可选的,在本实施例中,在通过第一服务器向第二服务器发送目标报文的情况下,可以但不限于根据第一服务器是否成功发送目标报文在第一服务器上记录第一状态参数;第二服务器可以但不限于根据是否成功接收目标报文,生成并向第一服务器返回第二状态参数。
在一个示范性实施例中,可以但不限于通过以下方式确定目标传输状态:在所述第一状态参数表示所述第一服务器成功发送所述目标报文、且所述第二状态参数表示所述第二服务器成功接收所述目标报文的情况下,将所述目标传输状态确定为用于表示成功将所述目标报文从所述第一服务器传输到所述第二服务器。
可选的,在本实施例中,在第一状态参数表示第一服务器发送目标报文失败的情况下,或者,第一服务器发送目标报文成功且第二状态参数表示第二服务器接收目标报文失败的情况下,将目标传输状态确定为用于表示将目标报文从第一服务器传输到第二服务器失败。
可选的,在本实施例中,第一返回参数的返回值可以但不限于包括0(表示失败)和1(表示成功),第二返回参数的返回值可以但不限于包括0(表示失败)和1(表示成功),可以但不限于以第一返回参数为WIFEXITED(Status),第二返回参数为WEXITSTATUS(Status)为例,对根据第一状态参数和/或第二状态参数的返回值,确定目标报文的目标传输状态的几种情形进行解释说明,可以但不限于包括以下几种情形:
情形一:在第一状态参数的返回值为1,并且第二状态参数的返回值为1的情况下,可以表明第一服务器成功发送目标报文、且第二服务器成功接收目标报文,在这样的情况下,将目标传输状态确定为成功将目标报文从第一服务器传输到第二服务器;
情形二:在第一状态参数的返回值为0的情况下,可以表明第一服务器发送目标报文失败,在这样的情况下,将目标传输状态确定为将目标报文从第一服务器传输到第二服务器失败;
情形三:在第一状态参数的返回值为1,并且第二状态参数的返回值为0的情况下,可以表明第一服务器成功发送目标报文、且第二服务器接收目标报文失败,在这样的情况下,将目标传输状态确定为将目标报文从第一服务器传输到第二服务器失败。
在上述步骤S306提供的技术方案中,第一组故障描述字段可以但不限于为目标故障信息中的部分或者全部描述字段,第二组故障描述字段可以但不限于为目标传输状态中的部分或者全部描述字段。图5是根据本申请实施例的一种获取故障描述信息的示意图,如图5所示,目标故障信息中可以但不限于携带了故障ID(Identity document,身份证标识号)(01,02,……,m,……,N),故障的发生时间(9月1日,9月2日,……,10月1日,……,10月7日),故障的类型(CPU(Central Processing Unit,中央处理器),内存,……,PCIE(Peripheral Component Interconnect Express,高速串行计算机扩展总线标准)网卡,……,PCIE网卡),以及故障等级(05,03,……,01,……,02),……,故障IP(InternetProtocol,网际互连协议)(116.179.33.205,27.17.177.243,……,198.168.33.205,……,198.168.33.275)等等故障信息。
目标传输状态中可以但不限于携带了故障ID 01所对应的故障报文1的第一返回参数和第二返回参数,故障ID 02所对应的故障报文2的第一返回参数和第二返回参数,……,故障ID m所对应的故障报文m的第一返回参数和第二返回参数,……,故障ID N所对应的故障报文N的第一返回参数和第二返回参数。故障报文1的第一返回参数可以但不限于为0(表示故障报文1发送至第二服务器失败),第二返回参数可以但不限于为0(表示第二服务器接收故障报文1失败),故障报文2的第一返回参数可以但不限于为1(表示故障报文2发送至第二服务器成功),第二返回参数可以但不限于为0(表示第二服务器接收故障报文2失败),……,故障报文m的第一返回参数可以但不限于为1(表示故障报文m发送至第二服务器成功),第二返回参数可以但不限于为1(表示第二服务器成功接收故障报文m),……,故障报文N的第一返回参数可以但不限于为1(表示故障报文N发送至第二服务器成功),第二返回参数可以但不限于为1(表示第二服务器成功接收故障报文N)。
可以但不限于从目标故障信息中提取故障ID 01至故障ID m及对应的故障时间、故障IP、故障等级以及故障类型等等信息作为第一组故障描述字段及其对应的取值。可以但不限于从目标传输状态中提取故障报文1至故障报文m及所对应的第一返回参数和第二返回参数,并根据故障报文1至故障报文m及所对应的第一返回参数和第二返回参数,获取故障报文1至故障报文m的故障报文传输状态分别为N(表示传输失败),N,……,Y(表示传输成功)作为第二组故障描述字段及其对应的取值。可以但不限于将第一组故障描述字段及其对应的取值,以及第二组故障描述字段及其对应的取值记录在第一服务器上的故障描述信息中。
在一个示范性实施例中,在目标故障信息中获取第一组故障描述字段以及对应的字段取值可以但不限于包括以下情形之一:
情形一:在检测到所述BMC上报了所述目标故障信息的情况下,通过所述第一服务器中的第一线程,在所述目标故障信息中提取所述第一组故障描述字段以及对应的字段取值。
可选的,在本实施例中,可以但不限于在检测到BMC上报了目标故障信息的情况下,提取第一组故障描述字段及对应的字段取值。图6是根据本申请实施例的一种提取第一组故障描述字段及对应的字段取值的示意图一,如图6所示,在服务器102发生故障的情况下,服务器102上的BMC 104可以但不限于将目标故障信息上报至服务器102,一方面,服务器102会将故障信息拼接为SNMP报文,并将SNMP报文发送至SNMP服务器108(即第二服务器),并通过服务器102上的目标接口110接收SNMP服务器108返回的返回参数;另一方面,在检测到BMC上报了目标故障信息的情况下,可以通过服务器102中的第一线程01从目标故障信息中提取第一组故障描述字段及对应的字段取值,并根据提取到的第一组故障描述字段及对应的字段取值,以及返回参数提取故障描述信息,并将故障描述信息存储在服务器102上的EEPROM 106中。
服务器102的运维人员可以但不限于从字段1,字段2,……,字段k中为待查询故障字段1,待查询故障字段2,……,待查询故障字段n选择所要查询的字段,可以但不限于根据待查询故障字段1为字段1,待查询故障字段2为字段2,……,待查询字段n为字段k生成故障查询请求,并向服务器102上的目标命令接口112发起故障查询请求,目标命令接口112在接收到故障查询请求的情况下,可以但不限于从EEPROM 106中存储的故障描述信息中获取并返回字段1,字段2……,字段k以及对应的字段取值的查询结果。
情形二:在检测到所述第一服务器向所述第二服务器发送所述目标报文的情况下,通过所述第一服务器中的第二线程,在所述目标报文中提取所述目标故障信息,并在所述目标故障信息中提取所述第一组故障描述字段以及对应的字段取值。
可选的,在本实施例中,在检测到第一服务器向第二服务器发送目标报文的情况下,可以但不限于通过第一服务器中的第二线程,从目标报文中提取第一组故障描述字段以及对应的字段取值。图7是根据本申请实施例的一种提取第一组故障描述字段及对应的字段取值的示意图二,如图7所示,在服务器102发生故障的情况下,服务器102上的BMC 104将携带有目标故障信息的SNMP报文发送至SNMP服务器108(即第二服务器),并通过服务器102上的目标接口110接收SNMP服务器108返回的返回参数;另一方面,在检测到服务器102向SNMP服务器108发送目标报文的情况下,可以通过服务器102中的第二线程02从SNMP报文中提取目标故障信息,并在目标故障信息中提取第一组故障描述字段及对应的字段取值。然后根据提取到的第一组故障描述字段及对应的字段取值,以及返回参数提取故障描述信息,并将故障描述信息存储在服务器102上的EEPROM 106中。
服务器102的运维人员可以但不限于从字段1,字段2,……,字段k中为待查询故障字段1,待查询故障字段2,……,待查询故障字段n选择所要查询的字段,可以但不限于根据待查询故障字段1为字段1,待查询故障字段2为字段2,……,待查询字段n为字段k生成故障查询请求,并向服务器102上的目标命令接口112发起故障查询请求,目标命令接口112在接收到故障查询请求的情况下,可以但不限于从EEPROM 106中存储的故障描述信息中获取并返回字段1,字段2……,字段k以及对应的字段取值的查询结果。
在一个示范性实施例中,可以但不限于通过以下方式在目标故障信息中提取第一组故障描述字段以及对应的字段取值:在所述目标故障信息中查找所述故障描述字段集合中的故障描述字段;在所述目标故障信息中查找到所述故障描述字段集合中的故障描述字段的情况下,将查找到的故障描述字段确定为所述第一组故障描述字段,并在所述目标故障信息中获取所述第一组故障描述字段对应的字段取值。
可选的,在本实施例中,目标故障信息中可以但不限于记录了故障描述字段及其对应的字段取值,故障描述字段集合中的故障描述字段可以但不限于包括目标故障信息中的部分或者全部故障描述字段。在从目标故障信息中提取所希望记录的第一组故障描述字段以及对应的字段取值的情况下,可以但不限于从目标故障信息中查找故障描述字段集合中的故障描述字段,在从目标故障信息中查找到故障描述字段集合中的故障描述字段的情况下,将查找到的故障描述字段确定为第一组故障描述字段,并在目标故障信息中获取第一组故障描述字段对应的字段取值。
可选的,在本实施例中,在从目标故障信息中未查找到故障描述字段集合中的部分故障描述字段的情况下,可以表明目标故障信息中未记录有故障描述字段集合中的所有故障描述字段,在这样的情况下,可以将查找到的故障描述字段确定为第一组故障描述字段,并在目标故障信息中获取第一组故障描述字段对应的字段取值,将未查找到的故障描述字段的字段取值确定为空白。
在上述步骤S308提供的技术方案中,在将第一组故障描述字段以及对应的字段取值,以及第二组故障描述字段以及对应的字段取值记录在第一服务器上的故障描述信息中的情况下,服务器的运维人员可以通过在第一服务器上发起携带有目标查询参数的故障查询请求的方式,从故障描述信息中查询所希望查询的故障描述字段以及对应的字段取值。通过这样的方式,避免了在第二服务器上逐条查询故障报文的详细信息,而是在发生故障的第一服务器上记录相关故障描述字段以及对应的字段取值,极大的减少了服务器的运维人员在处理第一服务器的故障信息时所需要的时间,大大提升了处理服务器的故障信息的效率。
可选的,在本实施例中,可以但不限于通过发起故障查询请求的方式,从第一服务器上记录的故障描述信息中获取故障描述字段集合中的一个或者多个字段及其所对应的字段取值。通过这样的方式,为服务器的运维人员提供了简单方便的查询路径,大大降低了服务器的运维人员查询所希望查询的故障信息的难度,大大提升了服务器的故障信息以及故障报文的可读性。
在一个示范性实施例中,可以但不限于通过以下方式获取故障查询请求:通过在所述第一服务器上设置的目标命令接口,在所述第一服务器对应的交互界面上获取目标查询命令,其中,所述目标查询命令中携带有所述目标查询参数,所述目标查询命令用于在所述第一服务器上存储的所述故障描述信息中查询与所述目标查询参数匹配的故障描述字段以及对应的字段取值。
可选的,在本实施例中,第一服务器上设置的目标命令接口可以但不限于通过获取在第一服务器对应的交互界面上对所希望查询的故障描述字段执行的编辑操作的方式,获取目标查询命令。在这样的情况下,目标命令接口可以从第一服务器上记录的故障描述信息中查询与目标查询参数匹配的故障描述字段以及对应的字段取值。
图8是根据本申请实施例的一种获取并返回与目标查询参数匹配的故障描述字段以及对应的字段取值的示意图,如图8所示,目标查询命令中可以但不限于携带了故障时间范围为9月1日至9月30日,故障类型为CPU故障以及故障报文的成功发送次数的目标查询参数,在第一服务器上的目标命令接口112获取到目标查询命令的情况下,可以但不限于从第一服务器上记录的故障描述信息中获取故障时间范围为9月1日至9月30日,故障类型为CPU故障,故障报文的成功发送次数及其对应的取值。可以但不限于按照故障的发生时间统计故障等级、故障IP、故障类型以及故障报文的传输状态、以及故障报文的发送成功次数等等。
比如:9月1日共发生了故障ID 01和故障ID 02,故障ID 01的故障等级为05,故障IP为192.168.01.201,故障类型为CPU,故障报文传输状态为Y(传输成功),故障ID 02的故障等级为03,故障IP为192.168.20.102,故障类型为CPU,故障报文传输状态为N(传输失败),那么在9月1日故障ID 01的故障报文的成功发送次数为1,故障ID 02的故障报文的成功发送次数为0。
又比如:在9月30日只发生了故障ID N,故障ID N1的故障等级为01,故障IP为192.168.253.255,故障类型为CPU,故障报文传输状态为Y(传输成功),故障ID 02的故障等级为03,故障IP为192.168.20.102,故障类型为CPU,故障报文传输状态为N(传输失败),那么在9月30日故障ID N的故障报文的成功发送次数为1。
以此类推,可以统计出9月1日至9月30日,每天所发生的故障的故障等级、故障IP、故障类型以及故障报文的传输状态、以及故障报文的发送成功次数。通过这样的方式,实现了批量快速的查询所希望查询的故障信息和故障次数等等信息,避免了逐条查阅第二服务器所接收到的故障报文,极大的提升了查阅服务器的故障信息的效率。
在上述步骤S310提供的技术方案中,在将第一组故障描述字段以及对应的字段取值,以及第二组故障描述字段以及对应的字段取值记录在第一服务器上的故障描述信息中的情况下,服务器的运维人员可以通过在第一服务器上发起携带有目标查询参数的故障查询请求的方式,从故障描述信息中查询所希望查询的故障描述字段以及对应的字段取值。在这样的情况下,可以响应故障查询请求,在第一服务器上存储的故障描述信息中获取并返回与目标查询参数匹配的故障描述字段以及对应的字段取值。通过这样的方式,避免了逐条从第二服务器上的故障报文中获取相关的故障信息,大大提升了获取相关的故障信息的效率。
在一个示范性实施例中,可以但不限于通过以下方式在第一服务器上存储的故障描述信息中获取并返回与目标查询参数匹配的故障描述字段以及对应的字段取值:在所述目标查询参数包括目的地址参数以及传输状态参数的情况下,在所述故障描述信息中获取与所述目的地址参数以及所述传输状态参数匹配的第三组故障描述字段以及对应的字段取值,其中,所述目标地址参数用于表示允许接收目标类型的报文的服务器的地址,所述目标类型的报文是在所述第一服务器上检测到故障时发送的报文,所述目标类型的报文中携带有检测到的故障的故障信息,所述目标类型的报文包括所述目标报文,所述第一服务器被设置为允许将所述目标类型的报文发送到一组服务器中的至少部分服务器,所述一组服务器包括所述第二服务器;所述第三组故障描述字段包括服务器标识字段以及报文传输状态字段,所述服务器标识字段用于标识所述一组服务器中的服务器,所述传输状态参数用于表示所述目标地址参数所对应的服务器是否成功接收所述目标类型的报文,或者,表示所述目标地址参数所对应的服务器接收所述目标类型的报文的成功次数,或者,表示所述目标地址参数所对应的服务器接收所述目标类型的报文的失败次数,或者,表示所述目标地址参数所对应的服务器接收所述目标类型的报文的总次数,所述报文传输状态字段用于表示是否成功将所述目标类型的报文从所述第一服务器发送到所述一组服务器中的服务器,或者,表示将所述目标类型的报文从所述第一服务器发送到所述一组服务器中的服务器的成功次数,或者,表示将所述目标类型的报文从所述第一服务器发送到所述一组服务器中的服务器的失败次数,或者,表示将所述目标类型的报文从所述第一服务器发送到所述一组服务器中的服务器的总次数;返回查找到的所述第三组故障描述字段以及对应的字段取值。
可选的,在本实施例中,第一服务器可以但不限于将目标报文发送至一组服务器中的一个或者多个服务器,可以但不限于在返回第三组故障描述字段以及对应的字段取值的情况下,可以根据返回的第三组故障描述字段以及对应的字段取值确定目标地址参数所对应的服务器的传输报文的失败次数是否大于或者等于次数阈值。
在确定目标地址参数所对应的服务器的传输报文的失败次数大于或者等于次数阈值的情况下,可以但不限于对第一服务器和目标地址参数所对应的服务器之间的传输链路进行诊断,或者,可以重建第一服务器和目标地址参数所对应的服务器之间的传输链路,或者,在第一服务器对应的交互界面上发出提示信息,提示该服务器可能出现了问题,使得运维人员可以及时对服务器的运行情况进行诊断和维护,或者,抛弃第一服务器和目标地址参数所对应的服务器之间的传输链路,并将后续第一服务器所发送的目标报文发送至其它允许接收故障报文的服务器。
可选的,在本实施例中,目标类型的报文可以但不限于包括满足SNMP协议的报文,第二服务器可以但不限于为SNMP服务器。在这样的情况下,在BMC上报目标故障信息的情况下,第一服务器可以但不限于将目标故障信息封装为满足SNMP协议的目标报文,可以但不限于将目标报文发送至SNMP服务器。
为了更好的理解上述的故障信息的处理方法,下面结合可选的实施例对本申请实施例中的故障信息的处理流程进行解释说明,图9是根据本申请实施例的一种故障信息的处理方法的示意图,如图9所示,可以但不限于在第一服务器中的BMC中创建相关SNMPtrapd的统计线程;
在BMC上报目标故障信息的情况下,可以但不限于通过SNMP trap发送SNMP报文(即上述的通过第一服务器向第二服务器发送目标报文),在这样的情况下,SNMP trapd的统计线程通过管道的方式与SNMP计数线程之间进行通信,SNMP计数线程可以但不限于将SNMP报文和目标故障信息发送至第一服务器上的BMC中的发送报文解析模块。
发送报文解析模块可以但不限于从目标故障信息中解析出当前发送SNMP报文的等级Event_Level,当前发送SNMP报文类型:Event_Type(内存,CPU,PCIE或者卫星设备等等),可以但不限于从SNMP报文中解析出当前SNMP报文所发送至的服务器的目的IP地址。可以但不限于通过linux api接口(即上述的目标接口)接收并对目标报文的返回值进行判断,详细来说,可以但不限于通过综合WIFEXITED(Status)和/或WEXITSTATUS(Status),判断SNMP报文是否成功传输至第二服务器,并在第一服务器上进行count计数,确定SNMP报文的传输情况(可以但不限于包括传输成功的次数,传输失败的次数和总发送次数以及是否传输成功等等),将当前发送SNMP报文的等级Event_Level,当前发送SNMP报文类型:Event_Type,当前SNMP报文所发送至的服务器的目的IP地址,传输成功的次数,传输失败的次数和总发送次数以及是否传输成功等等故障描述信息记录在第一服务器上的EEPROM中,方便后续服务器的运维人员进行查阅。
在服务器的运维人员在进行查询的时候,可以但不限于最大支持当前时间往前一个月的统计数据量查看,可以但不限于向ipmi OEM raw命令接口(即上述的目标命令接口)通过传入传参形式为自定义Netfn,Cmd,Date(0表示今天,1表示昨天,3表示前天,以此类推),0x00(表示查询所有SNMP报文的传输情况)/0x01(表示CPU)/0x02(表示内存)/0x03(表示PCIE)等,0x00(表示SNMP报文的发送总次数)/0x01(表示成功传输SNMP报文的次数)/0x02(表示传输SNMP报文的失败次数),Index(表示目的服务器IP的索引)的命令行,实现对所希望查阅的故障信息和故障报文的发送情况的统计。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
在本实施例中还提供了一种故障信息的处理装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图10是根据本申请实施例的一种故障信息的处理装置的结构框图,如图10所示,该装置包括:
发送模块1002,用于通过第一服务器向第二服务器发送目标报文,其中,所述目标报文中携带有所述第一服务器上的基板管理控制器BMC上报的目标故障信息,所述目标故障信息是所述第一服务器发生的故障的故障信息;
第一获取模块1004,用于获取所述目标报文的目标传输状态,其中,所述目标传输状态用于表示是否成功将所述目标报文从所述第一服务器传输到所述第二服务器;
处理模块1006,用于在所述目标故障信息中获取第一组故障描述字段以及对应的字段取值,在所述目标传输状态中获取第二组故障描述字段以及对应的字段取值,并在所述第一服务器上将所述第一组故障描述字段以及对应的字段取值和所述第二组故障描述字段以及对应的字段取值记录在故障描述信息中,其中,所述故障描述信息中记录了预设的故障描述字段集合以及对应的字段取值,所述故障描述字段集合包括所述第一组故障描述字段和所述第二组故障描述字段;
第二获取模块1008,用于在所述第一服务器上获取故障查询请求,其中,所述故障查询请求中携带有与所述故障描述字段集合中的至少部分字段对应的目标查询参数;
第三获取模块1010,用于响应于所述故障查询请求,在所述第一服务器上存储的所述故障描述信息中获取并返回与所述目标查询参数匹配的故障描述字段以及对应的字段取值。
可选的,所述第一获取模块,包括:
第一获取单元,用于在检测到所述第一服务器向所述第二服务器发送所述目标报文的情况下,通过所述第一服务器上的目标接口获取所述目标报文被发送后的返回参数,其中,所述返回参数包括第一状态参数和/或第二状态参数,所述第一状态参数用于表示所述第一服务器是否成功发送所述目标报文,所述第二状态参数用于表示所述第二服务器是否成功接收所述目标报文;
确定单元,用于根据所述返回参数确定所述目标传输状态。
可选的,所述第一获取单元,用于:通过所述目标接口获取所述第一服务器记录的所述第一状态参数;通过所述目标接口获取所述第二服务器返回的所述第二状态参数;
所述确定单元,用于:在所述第一状态参数表示所述第一服务器成功发送所述目标报文、且所述第二状态参数表示所述第二服务器成功接收所述目标报文的情况下,将所述目标传输状态确定为用于表示成功将所述目标报文从所述第一服务器传输到所述第二服务器。
可选的,所述处理模块,包括:
第一提取单元,用于在检测到所述BMC上报了所述目标故障信息的情况下,通过所述第一服务器中的第一线程,在所述目标故障信息中提取所述第一组故障描述字段以及对应的字段取值;或者
第二提取单元,用于在检测到所述第一服务器向所述第二服务器发送所述目标报文的情况下,通过所述第一服务器中的第二线程,在所述目标报文中提取所述目标故障信息,并在所述目标故障信息中提取所述第一组故障描述字段以及对应的字段取值。
可选的,所述处理模块,用于通过执行以下步骤来在所述目标故障信息中提取所述第一组故障描述字段以及对应的字段取值:
在所述目标故障信息中查找所述故障描述字段集合中的故障描述字段;
在所述目标故障信息中查找到所述故障描述字段集合中的故障描述字段的情况下,将查找到的故障描述字段确定为所述第一组故障描述字段,并在所述目标故障信息中获取所述第一组故障描述字段对应的字段取值。
可选的,所述第二获取模块,包括:
第二获取单元,用于通过在所述第一服务器上设置的目标命令接口,在所述第一服务器对应的交互界面上获取目标查询命令,其中,所述目标查询命令中携带有所述目标查询参数,所述目标查询命令用于在所述第一服务器上存储的所述故障描述信息中查询与所述目标查询参数匹配的故障描述字段以及对应的字段取值。
可选的,所述第三获取模块,包括:
第三获取单元,用于在所述目标查询参数包括目的地址参数以及传输状态参数的情况下,在所述故障描述信息中获取与所述目的地址参数以及所述传输状态参数匹配的第三组故障描述字段以及对应的字段取值,其中,所述目标地址参数用于表示允许接收目标类型的报文的服务器的地址,所述目标类型的报文是在所述第一服务器上检测到故障时发送的报文,所述目标类型的报文中携带有检测到的故障的故障信息,所述目标类型的报文包括所述目标报文,所述第一服务器被设置为允许将所述目标类型的报文发送到一组服务器中的至少部分服务器,所述一组服务器包括所述第二服务器;所述第三组故障描述字段包括服务器标识字段以及报文传输状态字段,所述服务器标识字段用于标识所述一组服务器中的服务器,所述传输状态参数用于表示所述目标地址参数所对应的服务器是否成功接收所述目标类型的报文,或者,表示所述目标地址参数所对应的服务器接收所述目标类型的报文的成功次数,或者,表示所述目标地址参数所对应的服务器接收所述目标类型的报文的失败次数,或者,表示所述目标地址参数所对应的服务器接收所述目标类型的报文的总次数,所述报文传输状态字段用于表示是否成功将所述目标类型的报文从所述第一服务器发送到所述一组服务器中的服务器,或者,表示将所述目标类型的报文从所述第一服务器发送到所述一组服务器中的服务器的成功次数,或者,表示将所述目标类型的报文从所述第一服务器发送到所述一组服务器中的服务器的失败次数,或者,表示将所述目标类型的报文从所述第一服务器发送到所述一组服务器中的服务器的总次数;
返回单元,用于返回查找到的所述第三组故障描述字段以及对应的字段取值。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本申请的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本申请的实施例还提供了一种电子设备,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本申请实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请实施例不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请实施例,对于本领域的技术人员来说,本申请实施例可以有各种更改和变化。凡在本申请实施例的原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请实施例的保护范围之内。

Claims (10)

1.一种故障信息的处理方法,其特征在于,包括:
通过第一服务器向第二服务器发送目标报文,其中,所述目标报文中携带有所述第一服务器上的基板管理控制器BMC上报的目标故障信息,所述目标故障信息是所述第一服务器发生的故障的故障信息;
获取所述目标报文的目标传输状态,其中,所述目标传输状态用于表示是否成功将所述目标报文从所述第一服务器传输到所述第二服务器;
在所述目标故障信息中获取第一组故障描述字段以及对应的字段取值,在所述目标传输状态中获取第二组故障描述字段以及对应的字段取值,并在所述第一服务器上将所述第一组故障描述字段以及对应的字段取值和所述第二组故障描述字段以及对应的字段取值记录在故障描述信息中,其中,所述故障描述信息中记录了预设的故障描述字段集合以及对应的字段取值,所述故障描述字段集合包括所述第一组故障描述字段和所述第二组故障描述字段;
在所述第一服务器上获取故障查询请求,其中,所述故障查询请求中携带有与所述故障描述字段集合中的至少部分字段对应的目标查询参数;
响应于所述故障查询请求,在所述第一服务器上存储的所述故障描述信息中获取并返回与所述目标查询参数匹配的故障描述字段以及对应的字段取值。
2.根据权利要求1所述的方法,其特征在于,所述获取所述目标报文的目标传输状态,包括:
在检测到所述第一服务器向所述第二服务器发送所述目标报文的情况下,通过所述第一服务器上的目标接口获取所述目标报文被发送后的返回参数,其中,所述返回参数包括第一状态参数和/或第二状态参数,所述第一状态参数用于表示所述第一服务器是否成功发送所述目标报文,所述第二状态参数用于表示所述第二服务器是否成功接收所述目标报文;
根据所述返回参数确定所述目标传输状态。
3.根据权利要求2所述的方法,其特征在于,
所述通过所述第一服务器上的目标接口获取所述目标报文被发送后的返回参数,包括:通过所述目标接口获取所述第一服务器记录的所述第一状态参数;通过所述目标接口获取所述第二服务器返回的所述第二状态参数;
所述根据所述返回参数确定所述目标传输状态,包括:在所述第一状态参数表示所述第一服务器成功发送所述目标报文、且所述第二状态参数表示所述第二服务器成功接收所述目标报文的情况下,将所述目标传输状态确定为用于表示成功将所述目标报文从所述第一服务器传输到所述第二服务器。
4.根据权利要求1所述的方法,其特征在于,所述在所述目标故障信息中获取第一组故障描述字段以及对应的字段取值,包括:
在检测到所述BMC上报了所述目标故障信息的情况下,通过所述第一服务器中的第一线程,在所述目标故障信息中提取所述第一组故障描述字段以及对应的字段取值;或者
在检测到所述第一服务器向所述第二服务器发送所述目标报文的情况下,通过所述第一服务器中的第二线程,在所述目标报文中提取所述目标故障信息,并在所述目标故障信息中提取所述第一组故障描述字段以及对应的字段取值。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述在所述目标故障信息中提取所述第一组故障描述字段以及对应的字段取值,包括:
在所述目标故障信息中查找所述故障描述字段集合中的故障描述字段;
在所述目标故障信息中查找到所述故障描述字段集合中的故障描述字段的情况下,将查找到的故障描述字段确定为所述第一组故障描述字段,并在所述目标故障信息中获取所述第一组故障描述字段对应的字段取值。
6.根据权利要求1至4中任一项所述的方法,其特征在于,所述在所述第一服务器上获取故障查询请求,包括:
通过在所述第一服务器上设置的目标命令接口,在所述第一服务器对应的交互界面上获取目标查询命令,其中,所述目标查询命令中携带有所述目标查询参数,所述目标查询命令用于在所述第一服务器上存储的所述故障描述信息中查询与所述目标查询参数匹配的故障描述字段以及对应的字段取值。
7.根据权利要求1至4中任一项所述的方法,其特征在于,所述响应于所述故障查询请求,在所述第一服务器上存储的所述故障描述信息中获取并返回与所述目标查询参数匹配的故障描述字段以及对应的字段取值,包括:
在所述目标查询参数包括目的地址参数以及传输状态参数的情况下,在所述故障描述信息中获取与所述目的地址参数以及所述传输状态参数匹配的第三组故障描述字段以及对应的字段取值,其中,所述目标地址参数用于表示允许接收目标类型的报文的服务器的地址,所述目标类型的报文是在所述第一服务器上检测到故障时发送的报文,所述目标类型的报文中携带有检测到的故障的故障信息,所述目标类型的报文包括所述目标报文,所述第一服务器被设置为允许将所述目标类型的报文发送到一组服务器中的至少部分服务器,所述一组服务器包括所述第二服务器;所述第三组故障描述字段包括服务器标识字段以及报文传输状态字段,所述服务器标识字段用于标识所述一组服务器中的服务器,所述传输状态参数用于表示所述目标地址参数所对应的服务器是否成功接收所述目标类型的报文,或者,表示所述目标地址参数所对应的服务器接收所述目标类型的报文的成功次数,或者,表示所述目标地址参数所对应的服务器接收所述目标类型的报文的失败次数,或者,表示所述目标地址参数所对应的服务器接收所述目标类型的报文的总次数,所述报文传输状态字段用于表示是否成功将所述目标类型的报文从所述第一服务器发送到所述一组服务器中的服务器,或者,表示将所述目标类型的报文从所述第一服务器发送到所述一组服务器中的服务器的成功次数,或者,表示将所述目标类型的报文从所述第一服务器发送到所述一组服务器中的服务器的失败次数,或者,表示将所述目标类型的报文从所述第一服务器发送到所述一组服务器中的服务器的总次数;
返回查找到的所述第三组故障描述字段以及对应的字段取值。
8.一种故障信息的处理装置,其特征在于,包括:
发送模块,用于通过第一服务器向第二服务器发送目标报文,其中,所述目标报文中携带有所述第一服务器上的基板管理控制器BMC上报的目标故障信息,所述目标故障信息是所述第一服务器发生的故障的故障信息;
第一获取模块,用于获取所述目标报文的目标传输状态,其中,所述目标传输状态用于表示是否成功将所述目标报文从所述第一服务器传输到所述第二服务器;
处理模块,用于在所述目标故障信息中获取第一组故障描述字段以及对应的字段取值,在所述目标传输状态中获取第二组故障描述字段以及对应的字段取值,并在所述第一服务器上将所述第一组故障描述字段以及对应的字段取值和所述第二组故障描述字段以及对应的字段取值记录在故障描述信息中,其中,所述故障描述信息中记录了预设的故障描述字段集合以及对应的字段取值,所述故障描述字段集合包括所述第一组故障描述字段和所述第二组故障描述字段;
第二获取模块,用于在所述第一服务器上获取故障查询请求,其中,所述故障查询请求中携带有与所述故障描述字段集合中的至少部分字段对应的目标查询参数;
第三获取模块,用于响应于所述故障查询请求,在所述第一服务器上存储的所述故障描述信息中获取并返回与所述目标查询参数匹配的故障描述字段以及对应的字段取值。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求1至7任一项中所述的方法的步骤。
10.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述权利要求1至7任一项中所述的方法的步骤。
CN202211393337.4A 2022-11-08 2022-11-08 故障信息的处理方法及装置、存储介质及电子装置 Active CN115941438B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211393337.4A CN115941438B (zh) 2022-11-08 2022-11-08 故障信息的处理方法及装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211393337.4A CN115941438B (zh) 2022-11-08 2022-11-08 故障信息的处理方法及装置、存储介质及电子装置

Publications (2)

Publication Number Publication Date
CN115941438A true CN115941438A (zh) 2023-04-07
CN115941438B CN115941438B (zh) 2024-10-15

Family

ID=86655117

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211393337.4A Active CN115941438B (zh) 2022-11-08 2022-11-08 故障信息的处理方法及装置、存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN115941438B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140325364A1 (en) * 2013-04-29 2014-10-30 Moogsoft, Inc. Alert dashboard system and method from event clustering
CN104702427A (zh) * 2013-12-06 2015-06-10 华为技术有限公司 获取故障信息的方法及系统
US20160266988A1 (en) * 2013-11-22 2016-09-15 Huawei Technologies Co., Ltd. Data Processing Method, Device, and System for Storage Unit
CN109885505A (zh) * 2019-03-21 2019-06-14 浪潮商用机器有限公司 一种故障定位的方法、系统及相关组件
CN112804377A (zh) * 2021-04-08 2021-05-14 紫光恒越技术有限公司 数据查询方法、电子设备、服务器、存储设备和网关设备
CN115296977A (zh) * 2022-06-29 2022-11-04 青岛海尔科技有限公司 故障信息处理方法、装置、存储介质及电子装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140325364A1 (en) * 2013-04-29 2014-10-30 Moogsoft, Inc. Alert dashboard system and method from event clustering
US20160266988A1 (en) * 2013-11-22 2016-09-15 Huawei Technologies Co., Ltd. Data Processing Method, Device, and System for Storage Unit
CN104702427A (zh) * 2013-12-06 2015-06-10 华为技术有限公司 获取故障信息的方法及系统
CN109885505A (zh) * 2019-03-21 2019-06-14 浪潮商用机器有限公司 一种故障定位的方法、系统及相关组件
CN112804377A (zh) * 2021-04-08 2021-05-14 紫光恒越技术有限公司 数据查询方法、电子设备、服务器、存储设备和网关设备
CN115296977A (zh) * 2022-06-29 2022-11-04 青岛海尔科技有限公司 故障信息处理方法、装置、存储介质及电子装置

Also Published As

Publication number Publication date
CN115941438B (zh) 2024-10-15

Similar Documents

Publication Publication Date Title
CN108600029B (zh) 一种配置文件更新方法、装置、终端设备及存储介质
CN108459939B (zh) 一种日志收集方法、装置、终端设备及存储介质
US10467316B2 (en) Systems and methods for web analytics testing and web development
CN111563016B (zh) 日志采集分析方法、装置、计算机系统及可读存储介质
CN110096419A (zh) 接口日志的获取方法、接口日志管理服务器及业务服务器
CN110764980A (zh) 日志处理方法和装置
CN110851471A (zh) 分布式日志数据处理方法、装置以及系统
CN110932918A (zh) 日志数据采集方法、装置及存储介质
CN111427796A (zh) 系统测试方法、装置及电子设备
KR20180037342A (ko) 어플리케이션 에러 모니터링 및 통계관리 서비스 및 방법
CN102866932A (zh) 提供和收集与程序的异常终止相关的数据的方法和设备
CN115858221A (zh) 存储设备的管理方法、装置、存储介质及电子设备
CN110177024B (zh) 热点设备的监控方法及客户端、服务端、系统
CN115061924A (zh) 自动化测试案例的生成方法、生成装置
CN116069838A (zh) 一种数据处理方法、装置、计算机设备及存储介质
CN110011845B (zh) 日志采集方法及系统
CN117290244A (zh) 接口测试案例的生成方法、装置、计算机设备及存储介质
CN111367795A (zh) 基于benchmark服务的性能测试方法及相关设备
CN115941438B (zh) 故障信息的处理方法及装置、存储介质及电子装置
CN112131180B (zh) 数据上报方法、装置以及存储介质
CN114371866A (zh) 业务系统的版本重构测试方法、装置和设备
CN112948195A (zh) 接口测试的方法、装置、电子设备和存储介质
CN110362464B (zh) 软件分析方法及设备
CN113141366B (zh) 报文报送方法及装置、存储介质和电子设备
CN109409833B (zh) 一种缺陷处理方法与装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant