CN114356617B - 注错测试方法、装置、系统及计算设备 - Google Patents

注错测试方法、装置、系统及计算设备 Download PDF

Info

Publication number
CN114356617B
CN114356617B CN202111430253.9A CN202111430253A CN114356617B CN 114356617 B CN114356617 B CN 114356617B CN 202111430253 A CN202111430253 A CN 202111430253A CN 114356617 B CN114356617 B CN 114356617B
Authority
CN
China
Prior art keywords
bmc
data
slave device
abnormality
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111430253.9A
Other languages
English (en)
Other versions
CN114356617A (zh
Inventor
齐雪宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202111430253.9A priority Critical patent/CN114356617B/zh
Publication of CN114356617A publication Critical patent/CN114356617A/zh
Application granted granted Critical
Publication of CN114356617B publication Critical patent/CN114356617B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Testing And Monitoring For Control Systems (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明公开了一种注错测试方法、装置、系统及计算设备,涉及计算机设备领域,该注错测试方法,应用于MCU,MCU与BMC连接,包括:获取BMC输出的处理数据;根据处理数据的数据标识,确定处理数据中的异常数据的可能异常原因;根据异常数据对应的可能异常原因,确定与各个可能异常原因对应的至少一种方式并利用至少一种方式对BMC的连接设备进行注错;获取注错后的注错数据,将注错数据与异常数据进行对比,确定异常数据的准确异常原因。采用该方法保证可以快速确定异常数据的准确异常原因。实现了对BMC的连接设备的监控,便于确定连接设备的故障原因,且提高了工作效率。

Description

注错测试方法、装置、系统及计算设备
技术领域
本发明涉及计算机设备领域,具体涉及一种注错测试方法、装置、系统及计算设备。
背景技术
平台管理(platform management)表示的是一系列的监视和控制功能,比如:监视系统的温度、电压、风扇、电源等,并做相应的调节工作;如果系统不正常,通过复位的方式来重新启动系统;记录各种硬件的信息和日志记录,告警提示等等。以上功能可以集成到一个控制器上来实现,这个控制器被称为基板管理控制器(Baseboard Manager Controller,简称BMC)。
在BMC正常工作过程时,会通过I2C/PECI等总线去获取设备在工作时的各种数据,由于有时I2C通讯会出现数据错误、总线拥挤或者其他异常情况,导致BMC获取到异常的数据,瞬时读值存在较大波动甚至错误。
在现有技术中,通常利用BMC内部算法逻辑对BMC获取到的原始数据进行处理。示例性的,BMC通常可以选择取平均值的方式排除单次异常值。其中一种平均值的取值方式为滑动窗口比较器,即选取本次读值与前面相邻的9次读值(本次以滑动窗口宽度为10次读值为例进行说明),10次的读值为一组,按照大小排序;删除读值最大的3次数据,删除读值最小的3次数据;剩余的4次数据取平均值,即为本次的记录值。利用上述方法,从而达到数据的稳定性。
但是上述方法,很难记录到异常数据,因此,很难对设备的运行进行监控。
发明内容
有鉴于此,本发明实施例提供了一种注错测试方法、装置、系统及计算设备,旨在解决对难以对设备进行监控的问题。
根据第一方面,本发明实施例提供了一种注错测试方法,应用于MCU,MCU与BMC连接,包括:
获取BMC输出的处理数据;
根据处理数据的数据标识,确定处理数据中的异常数据的可能异常原因;
根据异常数据对应的可能异常原因,确定与各个可能异常原因对应的至少一种方式并利用至少一种方式对BMC的连接设备进行注错;
获取注错后的注错数据,将注错数据与异常数据进行对比,确定异常数据的准确异常原因。
本发明实施例提供的注错测试方法,通过获取BMC输出的处理数据,根据处理数据的数据标识,确定处理数据中的异常数据的可能异常原因,而不需要人为对处理数据的中的异常数据的异常原因进行猜测。根据异常数据对应的可能异常原因,确定与各个可能异常原因对应的至少一种方式并利用至少一种方式对BMC的连接设备进行注错,从而保证可以快速确定异常数据的准确异常原因。获取注错后的注错数据,将注错数据与异常数据进行对比,确定异常数据的准确异常原因。保证确定的异常数据的准确异常原因的准确性。因此实现了对BMC的连接设备的监控,便于确定连接设备的故障原因,且提高了工作效率。
结合第一方面,在第一方面第一实施方式中,当确定出的与各个可能异常原因对应的方式为至少两种时,根据异常数据对应的可能异常原因,确定与各个可能异常原因对应的至少一种方式并利用至少一种方式对BMC的连接设备进行注错,包括:
获取异常数据的异常类型;
根据异常类型对各个可能异常原因对应的方式进行优先级排序;
根据优先级排序,利用至少两种方式对连接设备进行注错。
本发明实施例提供的注错测试方法,获取异常数据的异常类型,并根据异常类型对各个可能异常原因对应的方式进行优先级排序;根据优先级排序,利用至少两种方式对连接设备进行注错。从而可以提高对连接设备进行注错测试的效率。
结合第一方面,在第一方面第二实施方式中,可能异常原因包括连接设备的开关机异常,利用至少一种方式对BMC的连接设备进行注错,包括:
触发MCU连接的CPLD的瞬间强制关机逻辑,实现对连接设备的关机;
或者,
向BMC发送关机指令,以使BMC控制连接设备的电源关闭。
本发明实施例提供的注错测试方法,通过触发MCU连接的CPLD的瞬间强制关机逻辑,实现对连接设备的关机。或者向BMC发送关机指令,以使BMC控制连接设备的电源关闭。实现了对连接设备开关机的复现,不需要用户手动对连接设备进行开机关机,从而不仅实现了对连接设备开关机的复现,且能够快速确定异常数据的异常原因是不是由于连接设备的开关机异常造成的。提高了确定连接设备故障原因的效率。
结合第一方面,在第一方面第三实施方式中,可能异常原因包括主从设备通信混乱,利用至少一种方式对BMC的连接设备进行注错,包括:
获取BMC连接的至少从设备的第一标识信息;
根据第一标识信息,向各从设备发送第一访问消息;
接收各从设备反馈的第一响应信息,以扰乱BMC与各从设备之间的通信;
其中,第一响应消息包括各从设备向MCU反馈的信息以及各从设备向BMC反馈的消息。
本发明实施例提供的注错测试方法,MCU伪装成主设备与BMC连接的至少一个从设备进行通信,从而扰乱了BMC与各从设备之间的通信,从而便于快速确定异常数据的异常原因是不是由于主从设备通信混乱造成的。提高了确定连接设备故障原因的效率。
结合第一方面,在第一方面第四实施方式中,可能异常原因包括与BMC连接的从设备故障,利用至少一种方式对BMC的连接设备进行注错,包括:
接收BMC发送的至少一个故障从设备的第二标识信息;
根据各第二标识信息,代替各故障从设备接收BMC发送的第二访问信息;
基于第二访问信息,向BMC反馈第二响应信息,以解决故障从设备不能与BMC通信的问题。
本发明实施例提供的注错测试方法,MCU伪装成至少一个故障从设备与BMC进行通信,从而使得BMC与各故障从设备之间进行正常通信,从而便于快速确定异常数据的异常原因是不是由于与BMC连接的从设备故障造成的。提高了确定连接设备故障原因的效率。
结合第一方面,在第一方面第五实施方式中,可能异常原因包括目标从设备异常,目标从设备与中继芯片连接,中继芯片与MCU连接,利用至少一种方式对BMC的连接设备进行注错,包括:
基于与中继芯片之间的连接,关闭中继芯片,以隔离目标从设备。
本发明实施例提供的注错测试方法,MCU关闭中继芯片,从而使得目标从设备被隔离。从而便于快速确定异常数据的异常原因是不是由于目标从设备异常造成的。提高了确定连接设备故障原因的效率。
结合第一方面,在第一方面第六实施方式中,可能异常原因包括信号拥堵,利用至少一种方式对BMC的连接设备进行注错,包括:
控制BMC与连接设备之间的至少一根通信信号停止通信,以造成信号拥堵。
本发明实施例提供的注错测试方法,MCU控制BMC与连接设备之间的至少一根通信信号停止通信,从而造成信号拥堵,便于快速确定异常数据的异常原因是不是由于信号拥堵造成的。提高了确定连接设备故障原因的效率。
根据第二方面,本发明实施例还提供了一种注错测试装置,应用于MCU,MCU与BMC连接,包括:
获取模块,用于获取BMC输出的处理数据;
第一确定模块,用于根据处理数据的数据标识,确定处理数据中的异常数据的可能异常原因;
注错模块,用于根据异常数据对应的可能异常原因,确定与各个可能异常原因对应的至少一种方式并利用至少一种方式对BMC的连接设备进行注错;
第二确定模块,用于获取注错后的注错数据,将注错数据与异常数据进行对比,根据对比结果,确定异常数据的准确异常原因。
本发明实施例提供的注错测试装置,通过获取BMC输出的处理数据,并根据处理数据的数据标识,确定处理数据中的异常数据的可能异常原因,而不需要人为对处理数据的中的异常数据的异常原因进行猜测。根据异常数据对应的可能异常原因,确定与各个可能异常原因对应的至少一种方式并利用至少一种方式对BMC的连接设备进行注错,从而保证可以快速确定异常数据的准确异常原因。获取注错后的注错数据,将注错数据与异常数据进行对比,确定异常数据的准确异常原因。保证确定的异常数据的准确异常原因的准确性。因此实现了对BMC的连接设备的监控,便于确定连接设备的故障原因,且提高了工作效率。
根据第三方面,本发明实施例提供了一种注错测试系统,系统包括BMC、MCU以及连接设备,BMC与MCU基于总线通信,BMC与连接设备也基于总线通信,其中:
MCU获取BMC输出的处理数据;
MCU根据处理数据的数据标识,确定处理数据中的异常数据的可能异常原因;
MCU根据异常数据对应的可能异常原因,确定与各个可能异常原因对应的至少一种方式并利用至少一种方式对BMC的连接设备进行注错;
MCU获取注错后的注错数据,将注错数据与异常数据进行对比,确定异常数据的准确异常原因。
根据第四方面,本发明实施例提供了一种计算设备,包括存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行第一方面或者第一方面的任意一种实施方式中的注错测试方法。
根据第五方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储计算机指令,计算机指令用于使计算机执行第一方面或者第一方面的任意一种实施方式中的注错测试方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是应用本发明实施例提供的注错测试方法的流程图;
图2是应用本发明另一实施例提供的注错测试方法的流程图;
图3是应用本发明实施例提供的注错测试装置的功能模块图;
图4是应用本发明实施例提供的电子设备的硬件结构示意图;
图5是应用本发明实施例提供的注错测试系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本申请实施例提供的注错测试的方法,其执行主体可以是注错测试的装置,该注错测试的装置可以通过软件、硬件或者软硬件结合的方式实现成为计算机设备的部分或者全部,其中,该计算机设备可以是服务器或者终端,其中,本申请实施例中的服务器可以为一台服务器,也可以为由多台服务器组成的服务器集群,本申请实施例中的终端可以是智能手机、个人电脑、平板电脑、可穿戴设备以及智能机器人等其他智能硬件设备。下述方法实施例中,均以执行主体是电子设备为例来进行说明。
在本申请一个实施例中,如图1所示,提供了一种注错测试方法,以该方法应用于MCU为例进行说明,MCU与BMC连接,包括以下步骤:
S11、获取BMC输出的处理数据。
具体地,MCU可以基于与BMC之间的通信线路获取BMC输出的处理数据。其中,通信线路可以是I2C总线,也可以是其他通信线路,本申请实施例不做具体限定。
S12、根据处理数据的数据标识,确定处理数据中的异常数据的可能异常原因。
具体地,MCU可以根据处理数据的数据标识,确定处理数据中的异常数据。其中,数据标识可以是处理数据输出的数据日志,数据日志中包括异常的数据。
MCU根据异常数据的属性信息,确定异常数据的可能异常原因。其中,属性信息可以是异常数据对应的数据名称,比如是电压数据异常还是电流数据异常,异常数据对应的设备名称,比如是哪个设备输出的电流或者电压数据。
S13、根据异常数据对应的可能异常原因,确定与各个可能异常原因对应的至少一种方式并利用至少一种方式对BMC的连接设备进行注错。
具体地,MCU在确定了异常数据对应的可能异常原因之后,针对可能异常原因确定与各个可能异常原因对应的至少一种方式并利用至少一种方式对BMC的连接设备进行注错。
S14、获取注错后的注错数据,将注错数据与异常数据进行对比,确定异常数据的准确异常原因。
具体地,在对连接设备进行注错之后,MCU可以获取注错后的注错数据,将注错后的注错数据与异常数据进行对比,若注错数据与异常数据相同,则确定异常数据的准确异常原因是该注错数据对应的可能异常原因;若注错数据与异常数据不同,则确定异常数据的准确异常原因不是该注错数据对应的可能异常原因。
本发明实施例提供的注错测试方法,通过获取BMC输出的处理数据,并根据处理数据的数据标识,确定处理数据中的异常数据的可能异常原因,而不需要人为对处理数据的中的异常数据的异常原因进行猜测。根据异常数据对应的可能异常原因,确定与各个可能异常原因对应的至少一种方式并利用至少一种方式对BMC的连接设备进行注错,从而保证可以快速确定异常数据的准确异常原因。获取注错后的注错数据,将注错数据与异常数据进行对比,确定异常数据的准确异常原因。保证确定的异常数据的准确异常原因的准确性。因此实现了对BMC的连接设备的监控,便于确定连接设备的故障原因,且提高了工作效率。
在本申请一个可选的实施例中,如图2所示,当确定出的与各个可能异常原因对应的方式为至少两种时,上述S13中的“根据异常数据对应的可能异常原因,确定与各个可能异常原因对应的至少一种方式并利用至少一种方式对BMC的连接设备进行注错”包括以下步骤:
S21、获取异常数据的异常类型。
具体地,MCU可以获取异常数据的属性信息,其中,属性信息可以是异常数据对应的数据名称,比如是电压数据异常还是电流数据异常,异常数据对应的设备名称,比如是哪个设备输出的电流或者电压数据等信息。
MCU确定异常数据发生的时间以及持续时间,并将异常数据与正常数据进行对比,确定异常数据的异常情况。
然后,MCU根据异常数据的属性信息、异常发生时间、持续时间以及异常情况等信息,确定异常数据的异常类型。
S22、根据异常类型对各个可能异常原因对应的方式进行优先级排序。
具体地,MCU在获取到异常数据的异常类型之后,确定异常类型对应的至少一种可能异常原因,并确定与各个所述可能异常原因对应的至少一种方式。
当异常数据对应的可能异常原因是至少两种时,MCU根据异常类型对至少两个钟可能异常原因进行优先级排序。
当与各个可能异常原因对应的方式为至少两种时,MCU根据异常类型对各个可能异常原因对应的方式进行优先级排序。
S23、根据优先级排序,利用至少两种方式对连接设备进行注错。
具体地,在确定各个可能异常原因对应的至少两种方式的优先级排序之后,MCU根据优先级排序利用至少两种方式对连接设备进行注错。
在本申请一种可选的实施方式中,若确定的异常数据的可能异常原因是至少两种,则MCU可以根据异常类型对异常数据对应的各个可能异常原因进行优先级排序,然后根据各个可能异常原因对应的优先级排序,确定按照优先级排序依次确定各个可能异常原因对应的至少一种方式。然后利用至少一种方式对BMC的连接设备进行注错。
本发明实施例提供的注错测试方法,获取异常数据的异常类型,并根据异常类型对各个可能异常原因对应的方式进行优先级排序;根据优先级排序,利用至少两种方式对连接设备进行注错。从而可以提高对连接设备进行注错测试的效率。
在本申请一个可选的实施例中,可能异常原因包括BMC处理异常,上述注错测试方法还可以包括:
(1)获取输入至BMC的原始数据。
(2)将原始数据与处理数据进行对比,根据对比结果确定处理数据中异常数据的准确异常原因是否为BMC处理异常。
具体地,MCU可以基于与BMC之间的通信线路获取输入至BMC的原始数据。其中,通信线路可以是I2C总线,也可以是其他通信线路,本申请实施例不做具体限定。
示例性的,BMC可以与传感器设备基于I2C总线连接,传感器设备设置于BMC的连接设备上,用于采集连接设备对应的原始数据,并基于I2C总线将原始数据传输至BMC。MCU也基于上述I2C总线与BMC以及传感器设备连接,从而传感器设备将传输至BMC的原始数据也可以传输至MCU,从而使得MCU可以获取输入至BMC的原始数据。
在本申请一个可选的实施方式中,MCU也可以与存储设备连接,将获取到的原始数据存储至存储设备中,以便于利用原始数据对BMC以及BMC的连接设备进行监控和故障追溯。
然后,MCU将BMC输出的处理数据与原始数据进行对比,若原始数据正常而BMC输出的处理数据异常,则证明BMC对原始数据处理过程中出故障了。
在本申请实施例中,MCU通过获取输入至BMC的原始数据,从而可以对原始数据进行分析研究,并且可以保存输入至BMC的原始数据,从而可以利用原始数据对BMC以及BMC的连接设备进行监控和故障追溯。此外,还将原始数据与处理数据进行对比,此而验证BMC对原始数据的处理过程是否出现故障。
在本申请一个可选的实施例中,可能异常原因包括连接设备的开关机异常,上述步骤S13中的“利用至少一种方式对BMC的连接设备进行注错”,可以包括:
触发MCU连接的CPLD的瞬间强制关机逻辑,实现对连接设备的关机;
或者,
向BMC发送关机指令,以使BMC控制连接设备的电源关闭。
具体地,当可能异常原因包括连接设备的开关机异常时,MCU可以通过触发MCU连接的CPLD的瞬间强制关机逻辑,实现对连接设备的关机,从而实现对连接设备开关机的复现。MCU还可以向BMC发送关机指令,BMC在接收到MCU发送的关机指令之后,关闭连接设备的电源,从而加快复现与开关机动作相关的异常问题。
通过对连接设备开关机的复现,获取开关机复现的数据,检测开关机复现的数据与BMC输出的处理数据的中的异常数据是否一致,若是,则确定异常数据的准确异常原因是连接设备的开关机异常;若否,则确定异常数据的准确异常原因不是连接设备的开关机异常。
本发明实施例提供的注错测试方法,MCU伪装成至少一个故障从设备与BMC进行通信,从而使得BMC与各故障从设备之间进行正常通信,从而便于快速确定异常数据的异常原因是不是由于与BMC连接的从设备故障造成的。提高了确定连接设备故障原因的效率。
在本申请一个可选的实施例中,可能异常原因包括主从设备通信混乱,上述步骤S13中的“利用至少一种方式对BMC的连接设备进行注错”,可以包括如下步骤:
(1)获取BMC连接的至少从设备的第一标识信息。
(2)根据第一标识信息,向各从设备发送第一访问消息。
(3)接收各从设备反馈的第一响应信息,以扰乱BMC与各从设备之间的通信。
其中,第一响应消息包括各从设备向MCU反馈的信息以及各从设备向BMC反馈的消息。
具体地,MCU可以充当主设备获取BMC连接的至少从设备的第一标识信息,并根据第一标识信息向各从设备发送第一访问消息。从而使得各从设备既接收BMC发送的第一访问消息,也接收MCU发送的第一访问消息,从而导致各从设备在向BMC以及MCU反馈第一响应消息时出错,将发送给MCU的第一响应消息发送给BMC,从而使得BMC接收到错误的第一响应消息,从而导致BMC对错误的第一响应消息进行处理,输出异常数据。
此外,MCU也可以接收各从设备反馈的第一响应信息,其中MCU接收到的第一响应信息可能是各从设备向MCU反馈的信息也可以是各从设备向BMC反馈的消息。因此,上述情况可能会造成BMC与各从设备之间的通信混乱。
MCU获取BMC在主从设备通信混乱对应的注错方式下,输出的注错数据,将注错数据与异常数据进行对比,若注错数据与异常数据一致,则确定异常数据的准确异常原因是主从设备通信混乱;若不一致,则确定异常数据的准确异常原因不是主从设备通信混乱。
本发明实施例提供的注错测试方法,MCU伪装成主设备与BMC连接的至少一个从设备进行通信,从而扰乱了BMC与各从设备之间的通信,从而便于快速确定异常数据的异常原因是不是由于主从设备通信混乱造成的。提高了确定连接设备故障原因的效率。
在本申请一个可选的实施例中,,可能异常原因包括与BMC连接的从设备故障,上述步骤S13中的“利用至少一种方式对BMC的连接设备进行注错”,可以包括如下步骤:
(1)接收BMC发送的至少一个故障从设备的第二标识信息;
(2)根据各第二标识信息,代替各故障从设备接收BMC发送的第二访问信。
(3)基于第二访问信息,向BMC反馈第二响应信息,以解决故障从设备不能与BMC通信的问题。
具体地,BMC可以向各个从设备发送访问信息,若接收到从设备返回的反馈信息,则确定从设备正常;若没有接收到从设备返回的反馈信息,则确定从设备故障。BMC可以获取至少一个故障从设备的第二标识信息,并将至少一个故障从设备的第二标识信息发送给MCU。MCU接收BMC发送的至少一个故障从设备的第二标识信息,并根据各第二标识信息,代替至少一个故障从设备接收BMC发送的第二访问信息。MCU基于接收到的第二访问信息,向BMC反馈第二响应信息,从而使得BMU和各从设备进行正常通信,以解决故障从设备不能与BMC通信的问题。
MCU获取BMC在与BMC连接的从设备故障对应的注错方式下,输出的注错数据,将注错数据与异常数据进行对比,若注错数据正常,则确定异常数据的准确异常原因是与BMC连接的从设备故障;若注错数据异常,则确定异常数据的准确异常原因不是与BMC连接的从设备故障。
本发明实施例提供的注错测试方法,MCU伪装成至少一个故障从设备与BMC进行通信,从而使得BMC与各故障从设备之间进行正常通信,从而便于快速确定异常数据的异常原因是不是由于与BMC连接的从设备故障造成的。提高了确定连接设备故障原因的效率。
在本申请一个可选的实施例中,可能异常原因包括目标从设备异常,目标从设备与中继芯片连接,中继芯片与MCU连接,上述步骤S13中的“利用至少一种方式对BMC的连接设备进行注错”,可以包括如下步骤:
基于与中继芯片之间的连接,关闭中继芯片,以隔离目标从设备。
具体地,MCU基于与中继芯片之间的连接关闭中继芯片,从而隔离目标从设备,使得目标设备不能正常工作。
MCU获取中继芯片关闭状态下,BMC输出的注错数据,将注错数据与异常数据进行对比,若注错数据与异常信息一致,则确定异常数据的准确异常原因是目标从设备异常;若注错数据与异常信息不一致,则确定异常数据的准确异常原因不是目标从设备异常。
本发明实施例提供的注错测试方法,MCU关闭中继芯片,从而使得目标从设备被隔离。从而便于快速确定异常数据的异常原因是不是由于目标从设备异常造成的。提高了确定连接设备故障原因的效率。
在本申请一个可选的实施例中,可能异常原因包括信号拥堵,上述步骤S13中的“利用至少一种方式对BMC的连接设备进行注错”,可以包括如下步骤:
控制BMC与连接设备之间的至少一根通信信号停止通信,以造成信号拥堵。
具体地,MCU控制BMC与连接设备之间的至少一根通信信号停止通信,即拉低BMC与连接设备之间的至少一根通信信号,从造成信号拥堵。
MCU获取在信号拥堵状态下下,BMC输出的注错数据,将注错数据与异常数据进行对比,若注错数据与异常信息一致,则确定异常数据的准确异常原因是通信信号拥堵;若注错数据与异常信息不一致,则确定异常数据的准确异常原因不是通信信号拥堵。
本发明实施例提供的注错测试方法,MCU控制BMC与连接设备之间的至少一根通信信号停止通信,从而造成信号拥堵,便于快速确定异常数据的异常原因是不是由于信号拥堵造成的。提高了确定连接设备故障原因的效率。
应该理解的是,虽然图1和图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1和图2中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
如图3所示,本实施例提供一种注错测试装置,应用于MCU,MCU与BMC连接,包括:
获取模块31,用于获取BMC输出的处理数据。
第一确定模块32,用于根据处理数据的数据标识,确定处理数据中的异常数据的可能异常原因。
注错模块33,用于根据异常数据对应的可能异常原因,确定与各个可能异常原因对应的至少一种方式并利用至少一种方式对BMC的连接设备进行注错;
第二确定模块34,用于获取注错后的注错数据,将注错数据与异常数据进行对比,根据对比结果,确定异常数据的准确异常原因。
在本申请一个实施例中,当确定出的与各个可能异常原因对应的方式为至少两种时,上述注错模块33,还用于获取异常数据的异常类型;根据异常类型对各个可能异常原因对应的方式进行优先级排序;根据优先级排序,利用至少两种方式对连接设备进行注错。
在本申请一个实施例中,可能异常原因包括连接设备的开关机异常,上述注错模块33,具体用于触发MCU连接的CPLD的瞬间强制关机逻辑,实现对连接设备的关机;或者,向BMC发送关机指令,以使BMC控制连接设备的电源关闭。
在本申请一个实施例中,可能异常原因包括主从设备通信混乱,上述注错模块33,具体用于获取BMC连接的至少从设备的第一标识信息;根据第一标识信息,向各从设备发送第一访问消息;接收各从设备反馈的第一响应信息,以扰乱BMC与各从设备之间的通信;其中,第一响应消息包括各从设备向MCU反馈的信息以及各从设备向BMC反馈的消息。
在本申请一个实施例中,可能异常原因包括与BMC连接的从设备故障,上述注错模块33,具体用于接收BMC发送的至少一个故障从设备的第二标识信息;根据各第二标识信息,代替各故障从设备接收BMC发送的第二访问信息;基于第二访问信息,向BMC反馈第二响应信息,以解决故障从设备不能与BMC通信的问题。
在本申请一个实施例中,可能异常原因包括目标从设备异常,目标从设备与中继芯片连接,中继芯片与MCU连接,上述注错模块33,具体用于基于与中继芯片之间的连接,关闭中继芯片,以隔离目标从设备。
在本申请一个实施例中,可能异常原因包括信号拥堵,上述注错模块33,具体用于控制BMC与连接设备之间的至少一根通信信号停止通信,以造成信号拥堵。
关于注错测试装置的具体限定以及有益效果可以参见上文中对于注错测试方法的限定,在此不再赘述。上述注错测试装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于电子设备中的处理器中,也可以以软件形式存储于电子设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本发明实施例还提供一种计算设备,具有上述图3所示的注错测试装置。
如图4所示,图4是本发明可选实施例提供的一种计算设备的结构示意图,如图4所示,该计算设备可以包括:至少一个处理器41,例如CPU(Central Processing Unit,中央处理器)、MCU(Microcontroller Unit,微控制单元),至少一个通信接口43,存储器44,至少一个通信总线42。其中,通信总线42用于实现这些组件之间的连接通信。其中,通信接口43可以包括显示屏(Display)、键盘(Keyboard),可选通信接口43还可以包括标准的有线接口、无线接口。存储器44可以是高速RAM存储器(Random Access Memory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器44可选的还可以是至少一个位于远离前述处理器41的存储装置。其中处理器41可以结合图3所描述的装置,存储器44中存储应用程序,且处理器41调用存储器44中存储的程序代码,以用于执行上述任一方法步骤。
其中,通信总线42可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。通信总线42可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器44可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard diskdrive,缩写:HDD)或固态硬盘(英文:solid-state drive,缩写:SSD);存储器44还可以包括上述种类的存储器的组合。
其中,处理器41可以是中央处理器(英文:central processing unit,缩写:CPU),网络处理器(英文:network processor,缩写:NP)或者CPU和NP的组合。
其中,处理器41还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:ASIC),可编程逻辑器件(英文:programmable logic device,缩写:PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(英文:complex programmable logic device,缩写:CPLD),现场可编程逻辑门阵列(英文:field-programmable gate array,缩写:FPGA),通用阵列逻辑(英文:generic arraylogic,缩写:GAL)或其任意组合。
可选地,存储器44还用于存储程序指令。处理器41可以调用程序指令,实现如本申请图1至2实施例中所示的注错测试方法。
如图5所示,图5是本发明实施例提供了一种注错测试系统,系统包括BMC51、MCU52以及连接设备53,BMC51与MCU52基于总线通信,BMC51与连接设备53也基于总线通信,其中:
MCU52获取输入至BMC51的原始数据。
MCU52根据处理数据的数据标识,确定处理数据中的异常数据的可能异常原因。
MCU52根据异常数据对应的可能异常原因,确定与各个可能异常原因对应的至少一种方式并利用至少一种方式对BMC51的连接设备53进行注错;
MCU52获取注错后的注错数据,将注错数据与异常数据进行对比,确定异常数据的准确异常原因。
本发明实施例还提供了一种非暂态计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的注错测试方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard DiskDrive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (5)

1.一种注错测试方法,其特征在于,应用于MCU,所述MCU与BMC连接,所述方法包括:
获取所述BMC输出的处理数据;
根据所述处理数据的数据标识,确定所述处理数据中的异常数据的可能异常原因;
根据所述异常数据对应的可能异常原因,确定与各个所述可能异常原因对应的至少一种方式并利用所述至少一种方式对所述BMC的连接设备进行注错;
获取注错后的注错数据,将所述注错数据与所述异常数据进行对比,确定所述异常数据的准确异常原因;
所述可能异常原因包括所述连接设备的开关机异常,所述利用所述至少一种方式对所述BMC的连接设备进行注错,包括:
触发所述MCU连接的CPLD的瞬间强制关机逻辑,实现对所述连接设备的关机;
或者,
向所述BMC发送关机指令,以使所述BMC控制所述连接设备的电源关闭;
所述可能异常原因包括主从设备通信混乱,所述利用所述至少一种方式对所述BMC的连接设备进行注错,包括:
获取所述BMC连接的至少一个从设备的第一标识信息;
根据所述第一标识信息,向各所述从设备发送第一访问消息;
接收各所述从设备反馈的第一响应信息,以扰乱所述BMC与各所述从设备之间的通信;
其中,所述第一响应信息包括各所述从设备向所述MCU反馈的信息以及各所述从设备向所述BMC反馈的消息;
所述可能异常原因包括与所述BMC连接的从设备故障,所述利用所述至少一种方式对所述BMC的连接设备进行注错,包括:
接收所述BMC发送的至少一个故障从设备的第二标识信息;
根据各所述第二标识信息,代替各所述故障从设备接收所述BMC发送的第二访问信息;
基于所述第二访问信息,向所述BMC反馈第二响应信息,以解决故障从设备不能与所述BMC通信的问题;
所述可能异常原因包括目标从设备异常,所述目标从设备与中继芯片连接,所述中继芯片与所述MCU连接,所述利用所述至少一种方式对所述BMC的连接设备进行注错,包括:
基于与所述中继芯片之间的连接,关闭所述中继芯片,以隔离所述目标从设备;
所述可能异常原因包括信号拥堵,所述利用所述至少一种方式对所述BMC的连接设备进行注错,包括:
控制所述BMC与所述连接设备之间的至少一根通信信号停止通信,以造成信号拥堵。
2.根据权利要求1所述的方法,其特征在于,当确定出的与各个所述可能异常原因对应的方式为至少两种时,所述根据所述异常数据对应的可能异常原因,确定与各个所述可能异常原因对应的至少一种方式并利用所述至少一种方式对所述BMC的连接设备进行注错,包括:
获取所述异常数据的异常类型;
根据所述异常类型对各个所述可能异常原因对应的方式进行优先级排序;
根据所述优先级排序,利用所述至少两种方式对所述连接设备进行注错。
3.一种注错测试装置,其特征在于,应用于MCU,所述MCU与BMC连接,所述装置包括:
获取模块,用于获取所述BMC输出的处理数据;
第一确定模块,用于根据所述处理数据的数据标识,确定所述处理数据中的异常数据的可能异常原因;
注错模块,用于根据所述异常数据对应的可能异常原因,确定与各个所述可能异常原因对应的至少一种方式并利用所述至少一种方式对所述BMC的连接设备进行注错;
第二确定模块,用于获取注错后的注错数据,将所述注错数据与所述异常数据进行对比,根据对比结果,确定所述异常数据的准确异常原因;
可能异常原因包括连接设备的开关机异常,所述注错模块,具体用于触发MCU连接的CPLD的瞬间强制关机逻辑,实现对连接设备的关机;或者,向BMC发送关机指令,以使BMC控制连接设备的电源关闭;
可能异常原因包括主从设备通信混乱,所述注错模块,具体用于获取BMC连接的至少一个从设备的第一标识信息;根据第一标识信息,向各从设备发送第一访问消息;接收各从设备反馈的第一响应信息,以扰乱BMC与各从设备之间的通信;其中,第一响应信息包括各从设备向MCU反馈的信息以及各从设备向BMC反馈的消息;
可能异常原因包括与BMC连接的从设备故障,所述注错模块,具体用于接收BMC发送的至少一个故障从设备的第二标识信息;根据各第二标识信息,代替各故障从设备接收BMC发送的第二访问信息;基于第二访问信息,向BMC反馈第二响应信息,以解决故障从设备不能与BMC通信的问题;
可能异常原因包括目标从设备异常,目标从设备与中继芯片连接,中继芯片与MCU连接,所述注错模块,具体用于基于与中继芯片之间的连接,关闭中继芯片,以隔离目标从设备;
可能异常原因包括信号拥堵,所述注错模块,具体用于控制BMC与连接设备之间的至少一根通信信号停止通信,以造成信号拥堵。
4.一种注错测试系统,其特征在于,所述系统包括BMC、MCU以及连接设备,所述BMC与所述MCU基于总线通信,所述BMC与所述连接设备也基于所述总线通信,其中:
所述MCU获取所述BMC输出的处理数据;
所述MCU根据所述处理数据的数据标识,确定所述处理数据中的异常数据的可能异常原因;
所述MCU根据所述异常数据对应的可能异常原因,确定与各个所述可能异常原因对应的至少一种方式并利用所述至少一种方式对所述BMC的连接设备进行注错;
所述MCU获取注错后的注错数据,将所述注错数据与所述异常数据进行对比,确定所述异常数据的准确异常原因;
所述可能异常原因包括所述连接设备的开关机异常,所述利用所述至少一种方式对所述BMC的连接设备进行注错,包括:
触发所述MCU连接的CPLD的瞬间强制关机逻辑,实现对所述连接设备的关机;
或者,
向所述BMC发送关机指令,以使所述BMC控制所述连接设备的电源关闭;
所述可能异常原因包括主从设备通信混乱,所述利用所述至少一种方式对所述BMC的连接设备进行注错,包括:
获取所述BMC连接的至少一个从设备的第一标识信息;
根据所述第一标识信息,向各所述从设备发送第一访问消息;
接收各所述从设备反馈的第一响应信息,以扰乱所述BMC与各所述从设备之间的通信;
其中,所述第一响应信息包括各所述从设备向所述MCU反馈的信息以及各所述从设备向所述BMC反馈的消息;
所述可能异常原因包括与所述BMC连接的从设备故障,所述利用所述至少一种方式对所述BMC的连接设备进行注错,包括:
接收所述BMC发送的至少一个故障从设备的第二标识信息;
根据各所述第二标识信息,代替各所述故障从设备接收所述BMC发送的第二访问信息;
基于所述第二访问信息,向所述BMC反馈第二响应信息,以解决故障从设备不能与所述BMC通信的问题;
所述可能异常原因包括目标从设备异常,所述目标从设备与中继芯片连接,所述中继芯片与所述MCU连接,所述利用所述至少一种方式对所述BMC的连接设备进行注错,包括:
基于与所述中继芯片之间的连接,关闭所述中继芯片,以隔离所述目标从设备;
所述可能异常原因包括信号拥堵,所述利用所述至少一种方式对所述BMC的连接设备进行注错,包括:
控制所述BMC与所述连接设备之间的至少一根通信信号停止通信,以造成信号拥堵。
5.一种计算设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1-2中任一项所述的注错测试方法。
CN202111430253.9A 2021-11-29 2021-11-29 注错测试方法、装置、系统及计算设备 Active CN114356617B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111430253.9A CN114356617B (zh) 2021-11-29 2021-11-29 注错测试方法、装置、系统及计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111430253.9A CN114356617B (zh) 2021-11-29 2021-11-29 注错测试方法、装置、系统及计算设备

Publications (2)

Publication Number Publication Date
CN114356617A CN114356617A (zh) 2022-04-15
CN114356617B true CN114356617B (zh) 2024-03-08

Family

ID=81097097

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111430253.9A Active CN114356617B (zh) 2021-11-29 2021-11-29 注错测试方法、装置、系统及计算设备

Country Status (1)

Country Link
CN (1) CN114356617B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107516414A (zh) * 2017-08-21 2017-12-26 中国电力科学研究院 一种用电信息采集系统故障诊断分析方法及系统
CN110868337A (zh) * 2019-11-15 2020-03-06 腾讯科技(深圳)有限公司 容错共识机制测试方法、装置、存储介质和计算机设备
CN111901171A (zh) * 2020-07-29 2020-11-06 腾讯科技(深圳)有限公司 异常检测和归因方法、装置、设备及计算机可读存储介质
CN111913824A (zh) * 2020-06-23 2020-11-10 中国建设银行股份有限公司 确定数据链路故障原因的方法及相关设备
CN112445679A (zh) * 2020-11-13 2021-03-05 上海优扬新媒信息技术有限公司 一种信息检测方法、装置、服务器及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190361767A1 (en) * 2018-05-24 2019-11-28 Microsoft Technology Licensing, Llc Automatically reacting to data ingest exceptions in a data pipeline system based on determined probable cause of the exception

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107516414A (zh) * 2017-08-21 2017-12-26 中国电力科学研究院 一种用电信息采集系统故障诊断分析方法及系统
CN110868337A (zh) * 2019-11-15 2020-03-06 腾讯科技(深圳)有限公司 容错共识机制测试方法、装置、存储介质和计算机设备
CN111913824A (zh) * 2020-06-23 2020-11-10 中国建设银行股份有限公司 确定数据链路故障原因的方法及相关设备
CN111901171A (zh) * 2020-07-29 2020-11-06 腾讯科技(深圳)有限公司 异常检测和归因方法、装置、设备及计算机可读存储介质
CN112445679A (zh) * 2020-11-13 2021-03-05 上海优扬新媒信息技术有限公司 一种信息检测方法、装置、服务器及存储介质

Also Published As

Publication number Publication date
CN114356617A (zh) 2022-04-15

Similar Documents

Publication Publication Date Title
CN114168401B (zh) 一种日志记录方法、装置及电子设备
CN106610712B (zh) 基板管理控制器复位系统及方法
US20200033928A1 (en) Method of periodically recording for events
CN108845912A (zh) 服务接口调用故障的报警方法及计算设备
CN104320308A (zh) 一种服务器异常检测的方法及装置
CN116580657A (zh) 故障检测方法、装置、设备及计算机可读存储介质
CN116820820A (zh) 服务器故障监测方法及系统
CN113672306B (zh) 服务器组件自检异常恢复方法、装置、系统及介质
US9158646B2 (en) Abnormal information output system for a computer system
KR101555225B1 (ko) 전동기 제어반 고장 예측 진단 장치
CN111190761B (zh) 日志输出方法、装置、存储介质及电子设备
CN114356617B (zh) 注错测试方法、装置、系统及计算设备
EP4206697A1 (en) Self-locking and detection circuit and apparatus, and control method
CN113589092B (zh) 疲劳机、设备上下电测试系统及上下电测试方法
CN115729756A (zh) 陪测硬盘、基于陪测硬盘陪测服务器的方法及系统
CN115185724A (zh) 故障处理方法、装置、电子设备以及存储介质
CN115328814A (zh) 基于镜像对的故障注入方法、装置、设备和存储介质
CN115080132A (zh) 信息处理方法、装置、服务器及存储介质
CN114374627A (zh) 基板管理控制器重启的方法、装置、系统及服务器
CN114356061B (zh) 电源故障检测方法、装置、系统以及检测设备
CN111865719A (zh) 一种交换机故障注入自动化测试方法和装置
CN110928213A (zh) 异常处理方法、装置、设备和异常处理器
CN113986142B (zh) 磁盘故障监控方法、装置、计算机设备及存储介质
CN114942687B (zh) 基于监控的复位安全机制、实现方法及复位电路
CN113917320B (zh) 一种换流阀故障预警方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant