CN117234801A - 一种服务器故障自动复现方法及系统 - Google Patents
一种服务器故障自动复现方法及系统 Download PDFInfo
- Publication number
- CN117234801A CN117234801A CN202311195886.5A CN202311195886A CN117234801A CN 117234801 A CN117234801 A CN 117234801A CN 202311195886 A CN202311195886 A CN 202311195886A CN 117234801 A CN117234801 A CN 117234801A
- Authority
- CN
- China
- Prior art keywords
- fault
- power
- experimental object
- module
- machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000012360 testing method Methods 0.000 claims abstract description 46
- 238000012544 monitoring process Methods 0.000 claims abstract description 4
- 238000004891 communication Methods 0.000 claims description 12
- 238000003825 pressing Methods 0.000 claims description 8
- 238000003860 storage Methods 0.000 claims description 7
- 238000002474 experimental method Methods 0.000 abstract description 8
- 230000032683 aging Effects 0.000 abstract description 6
- 230000008569 process Effects 0.000 abstract description 2
- 230000002159 abnormal effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 108010028984 3-isopropylmalate dehydratase Proteins 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000001816 cooling Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本发明提出了一种服务器故障自动复现方法及系统,其中,方法包括:获取故障机器的系统配置参数以及故障日志,并将系统配置参数保存为待测参数;根据待测参数配置实验对象以复现故障机器的系统配置;选择预设的故障复现模式,根据相应的故障复现模式控制实验对象执行上下电操作并监控实验对象的日志数据并与故障日志进行对比以识别待复现的故障;响应于复现到故障,根据故障复现模式选择记录故障复现次数或保留试验对象的故障现场。本发明能够在实验对象中自动识别复现到的目标故障并保留故障现场,且通过配置实现对象与故障机器具有相同的系统配置参数,能够更加容易的复现到目标故障,且上述过程大部分能够自动完成,有助于提升老化测试效率。
Description
技术领域
本发明涉及自动控制及通信技术领域,尤其涉及一种服务器故障自动复现方法及系统。
背景技术
目前机器生产组装完成后都需要经过老化测试,通过后才能入库然后交付客户。但老化测试时间短,测试环境较好,问题无法全部拦截。在用户使用过程中,可能会随着开关机等操作,概率性的出现一些问题,由于客户现场无法一直保留故障现象,因而需要测试人员复现现场问题,再作进一步定位分析。然而,问题的复现并不容易,这是由于即使是同样的机型,在不同用户的设置存在差异时,概率出现的问题也不尽相同,并且由于现场的客服或维护人员收集现场资料时无法完整的将机器设置传达至研发人员,致使研发人员无法快速复现到问题。例如,针对开关机时出现的概率问题,研发人员通过手动反复上下电的方式复现问题比较耗时,虽然目前也有一些测试工装可以解放双手,通过设定通电时间、断电时间与循环次数,工装便可以自动化的执行对设备的上下电测试。但对于上电后按开机按键的操作还需要人为执行;同时,如果复现到问题,往往需要保留环境,而这种工装无法识别机器是否复现了问题,即便是复现到了问题,工装也会按照预设时间定时下电,导致环境无法保留。
因此,针对开关机时出现的概率问题如何实现全自动的问题复现并保留环境是本领域亟需解决的技术问题。
发明内容
为了解决上述技术问题,在本发明的第一方面,提出了一种服务器故障自动复现方法,所述方法包括:获取故障机器的系统配置参数以及故障日志,并将所述系统配置参数保存为待测参数;根据所述待测参数配置实验对象以复现故障机器的系统配置;选择预设的故障复现模式,根据相应的故障复现模式控制所述实验对象执行上下电操作并监控所述实验对象的日志数据并与所述故障日志进行对比以识别待复现的故障;响应于复现到故障,根据所述故障复现模式选择记录故障复现次数或保留所述试验对象的故障现场。
在一个或多个实施例中,所述获取故障机器的系统配置参数包括:通过网络接口远程获取所述故障机器的系统配置参数,所述系统配置参数包括所述故障机器的BMC版本及其参数配置和BIOS版本及其参数配置。
在一个或多个实施例中,所述获取故障机器的故障日志包括:获取故障机器的BMC及BIOS的串口日志、BMC的IDE日志以及系统下的Message日志。
在本发明的第二方面,提出了一种服务器故障自动复现系统,包括:主控装置,配置用于实现如权利要求1-3任一项所述的一种服务器故障自动复现方法的步骤;点按装置,配置用于根据所述主控装置的上下电指令点按实验对象的开机按钮以执行开关机操作;实验对象,所述实验对象分别与所述主控装置进行电连接和通信连接,所述点按装置固设于所述实验对象的开机按钮附近,所述实验对象包括一个或多个实验服务器,当存在多个实验服务器时,对应需要多个点按装置。
在一个或多个实施例中,所述主控装置包括:AC输入接口,配置用于接入交流电源;多个AC-DC输出接口,配置用于将交流电源转换为直流电源并提供多个直流电源接口,其中,所述多个直流电源接口中至少包括一个用于为所述实验对象供电的直流电源接口;第一电源开关,连接于所述AC输入接口与所述AC输入接口之间,配置用于根据上下电指令控制连通所述AC输入接口与所述AC-DC输出接口之间的电连接,或者断开所述AC输入接口与所述AC-DC输出接口之间的电连接;配置输入模块,配置用于输入故障机器的IP地址以远程访问所述故障机器,并选择实验对象并为所述实验对象配置故障复现模式;网络接口,配置用于接入网络以获取所述故障机器的系统配置参数以及故障日志,并将所述系统配置参数保存为待测参数;串口模块,与所述实验对象的串口电连接,配置用于获取所述实验对象的日志数据;拓展接口,配置用于连接外接设备,并根据预设的Pin脚定义自动识别外接设备并进行通信,所述外接设备至少包括所述点按装置;存储模块,配置用于存储主控装置的系统及所述故障机器的参数配置及故障日志;电源模块,配置用于引入交流电源并转换为直流输出;主控模块,分别与所述第一电源开关、所述配置输入模块、所述网络接口、所述串口模块、所述拓展接口、所述存储模块以及所述电源模块电连接,配置用于实现如权利要求1-3任一项所述的一种服务器故障自动复现方法的步骤。
在一个或多个实施例中,所述配置输入模块包括:触摸屏、智能手机或平板电脑。
在一个或多个实施例中,所述主控设备的控制系统采用安卓系统。
在一个或多个实施例中,所述点按装置包括:主体;设置于所述主体上的固定支架、伺服电机、通信接口以及设置于所述主体内部的控制模块与电源模块;以及转动臂,所述转动臂与所述伺服电机的转动轴固定连接;其中,所述通信接口、所述伺服电机与所述电源模块分别与所述控制模块连接,所述控制模块配置用于通过所述通信接口获取所述主控设备的上下电指令并控制所述伺服电机的转动轴做定向定量转动,并带动所述转动臂以通过所述转动臂点按所述实验对象的开机按钮;所述固定支架配置用于固定所述点按装置,并使得所述转动臂位于所述实验对象的开关按钮附近。
在一个或多个实施例中,所述转动臂呈条状并具有点按端,所述点按端为光滑的圆端;当所述伺服电机带动所述转动臂旋转到水平位置时,所述转动臂的点按端超出所述主体的侧边并垂直按压所述实验对象的开关按钮;当所述伺服电机带动所述转动臂旋转到竖直位置时,所述转动臂的点按端远离所述开关按钮以解除对所述开关按钮的按压。
在一个或多个实施例中,所述转动臂呈圆盘状并具有点按端,所述点按端为设置在所述圆盘边缘的凸起;当所述伺服电机带动所述圆盘旋转并使得所述凸起处于水平位置时,所述凸起垂直按压所述实验对象的开关按钮;当所述伺服电机带动所述圆盘旋转并使得所述凸起处于竖直位置时,所述凸起远离所述开关按钮以解除对所述开关按钮的按压。
本发明的有益效果包括:本发明分别从软件和硬件两个方面做出了改进;在软件方面,本发明提出了一种服务器故障自动复现方法,旨在通过获取故障机器的故障日志与实验对象的日志数据进行对比来识别是否复现到故障;在硬件方面,本发明提出了一种服务器故障自动复现系统,具体是由执行上述一种服务器故障自动复现方法的主控装置、实验对象(实验服务器)以及用于根据主控装置的指令执行点按操作的点按装置三个部分组成,配合软件方能够实现全自动的故障复现且能够自动保留故障现场,从而解放了测试人员的手动操作,有助于提升老化测试效率。此外,本发明的的主控装置还具有以下功能:
(1)自动读取、下发参数;
(2)支持设备AC控制,复现问题模式中可以自动收集日志并自动诊断,然后记录;
(3)支持外界模块,丰富装置的功能;
(4)支持多种复现问题模式,最大程度上提升复现问题的可能性,节省人力的投入时间;
(5)采用Android系统与触控屏,方便操作。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明实施例的一种服务器故障自动复现方法的工作流程图;
图2为本发明实施例的一种服务器故障自动复现系统的结构示意图;
图3为本发明实施例的主控装置的结构示意图;
图4为本发明实施例的主控装置的实物布局示意图;
图5为本发明实施例的点按装置的结构示意图;
图6为本发明实施例的转动臂的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
针对开关机时出现的概率问题如何实现全自动的问题复现并保留环境的技术问题,本发明分别从软件和硬件两个方面做出了改进;在软件方面,本发明提出了一种服务器故障自动复现方法,旨在通过获取故障机器的故障日志与实验对象的日志数据进行对比来识别是否复现到故障;在硬件方面,本发明提出了一种服务器故障自动复现系统,具体是由执行上述一种服务器故障自动复现方法的主控装置、实验对象(实验服务器)以及用于根据主控装置的指令执行点按操作的点按装置三个部分组成,配合软件方能够实现全自动的故障复现且能够自动保留故障现场,从而解放了测试人员的手动操作,有助于提升老化测试效率。以下将结合附图对本发明的实施方式进行更加详细的阐述。
请参见图1,其示出了本发明实施例的一种服务器故障自动复现方法的工作流程,包括:步骤S1、获取故障机器的系统配置参数以及故障日志,并将系统配置参数保存为待测参数;步骤S2、根据待测参数配置实验对象以复现故障机器的系统配置;步骤S3、选择预设的故障复现模式,根据相应的故障复现模式控制实验对象执行上下电操作并监控实验对象的日志数据并与故障日志进行对比以识别待复现的故障;步骤S4、响应于复现到故障,根据故障复现模式选择记录故障复现次数或保留试验对象的故障现场。
具体的,对于步骤S1获取故障机器的系统配置参数及故障日志的方式,本发明需要在故障机器正常运行时获取上述数据,例如,在故障机器重启后再获取其系统配置参数及故障日志;获取系统配置的目的在于通过步骤S2对实验对象(实验服务器)进行配置,从而还原故障机器的运行环境以提升复现到目标故障的概率,并有助于分析故障的产生原因;步骤S3和步骤S4为执行老化测试的步骤,其中步骤S3实现了对目标故障的自动识别,步骤S4能够实现对故障现场的保留。
在进一步的实施例中,对于步骤S1,本发明获取故障机器的系统配置参数以及故障日志包括:通过网络接口远程获取故障机器的系统配置参数,系统配置参数包括故障机器的BMC版本及其参数配置和BIOS版本及其参数配置;获取故障机器的故障日志包括获取故障机器的BMC及BIOS的串口日志、BMC的IDE日志以及系统下的Message日志。
具体的,本发明将通过网络接口访问BMC(Basic Input Output System,即基础输入输出系统)的API接口或者SSH远程访问的方式获取故障机器的系统配置参数和故障日志数据。
更具体的,用网线将测试装置(即后续实施方式中的主控装置)与故障机器的IPMI管理网口连接,通过触控屏配置测试装置的IP地址与故障机器在同一网段,然后选择测试装置中的读取参数,点击读取BMC参数,即可获取BMC的版本、BIOS的版本、参数配置、IDL日志等内容,并保存在装置中;点击读取系统参数,即可获取硬件部件参数、BIOS配置、message日志等内容,并保存在装置中;此外,若故障机器在开关机前后故障现象不丢失,还可以使用测试装置的串口功能收集BIOS(Basic Input Output System,基本输入输出系统)日志和BMC日志,测试装置可以对BIOS日志做简单分析,并对异常信息作标记,并保存到测试装置中。
在一个可选的实施例中,本发明的测试装置下连接有多个实验对象,多个实验对象的硬件配置各不相同,具体可以为常见硬件配置的组合;在选择实验对象还原故障机器的运行环境时还需要根据故障机器的硬件部件参数选择具有同样硬件配置的实验对象,若不存在硬件配置完全相同的实验对象,则选择硬件差异最小的实验对象作为测试对象。
在进一步的实施例中,步骤S2的具体实施方式包括:测试装置开机后,用网线将测试装置与实验对象的IPMI管理网口连接,通过触控屏配置测试装置的IP地址与实验对象在同一网段,然后选择测试装置中的下发参数,点击下发BMC参数,选择保存的故障机器参数,设备会先分析保存的参数,然后通过API,逐条设置实验对象的参数,完成后实验对象的参数将与故障机器的参数保持一致,如果测试装置已经联网下载了相应的BMC和BIOS固件,本次操作中会先自动升级BMC和BIOS固件,然后再配置参数;或者,在选择保存的故障机器参数,设备会先分析保存的参数后,通过SSH指令一条一条设置实验对象的参数,完成后实验对象的参数将与故障机器的参数保持一致,如果实验对象的系统与故障机器不一致,测试装置将会提示用户先安装相应的系统,然后再次执行本操作。
在进一步的实施例中,步骤S3的具体实施方式包括:当实验对象与故障机器的参数完全一致的时候,便可以使用问题复现功能,本功能需要用网线将装置连接到交换机,同时将实验对象的IPMI管理网口与系统管理网口接入交换机,使得装置可以同时访问实验对象的两个管理网口;然后将串口与实验对象连接,收集实现对象的BMC或BIOS串口日志;将实验对象的AC输入(交流电输入)插在测试装置的AC输出口(交流电输出)上,目的是通过测试装置控制实现对象的AC输入;上述连接测试装置完成后,选择测试装置的问题复现功能,输入相关参数,即可以进入问题复现模式。从模式中,测试装置会根据设置的参数,使得实验对象的AC有相应时间的通电与相应时间的断电,在通电时间内,装置会收集BMC或BIOS串口日志,BMC的IDE日志,系统下的Message日志进行分析,如果日志中存在异常点,装置会与故障机器的日志异常点进行比对,从而确定是否复现到了问题;用户可以设置问题复现模式,一种是测试复现概率,即在一段时间内重复操作,记录问题出现的次数;另一种是抓取问题现象,即在一段时间内如果复现到了问题,则不再执行操作,保持现象待分析。测试装置支持多种问题复现模式,上述为控制上下电的方式,在另一个可选的实施例中,还支持保持实验对象通电,通过BMC控制实验对象开关机的方式复现问题。
在一些实施例中,本发明的测试装置还可以配置以下功能:
上传与下载:测试装置连接网络后,可以进行上传和下载;上传是指将读取的故障机器的相关参数导出一个表格,可以上传至指定IP的电脑上,用户可以根据参数进行硬件搭配;下载是指测试装置可以再验证用户身份后访问公司的服务器,下载与故障机器相同的BMC和BIOS固件,用来给对象机器升级固件;
串口收集:测试装置支持RS232串口,可以直接连接对象设备,读取对象设备的串口日志进行分析。在人工的帮助下,测试装置可以对正常机器启动日志进行学习,可以自动比对不同启动阶段中应该出现的日志信息,在有不属于此阶段的信息出现时,测试装置则判断存在异常点,从而进行弹窗提示。
连接外接设备:测试装置预留扩展接口,可以连接扩展模块。如后续装置实施例中的点按装置。拓展模块与测试装置连接后,测试装置将根据拓展模块的Pin脚定义,自动识别拓展模块为点按装置,此装置可以辅助用户实现按开机按键的操作。另外,在使用问题复现功能的时候,会有使用外设的提示。
在本发明的第二方面,提出了一种服务器故障自动复现系统,请参见图2,包括:主控装置100,配置用于实现上述方法实施例中的一种服务器故障自动复现方法的步骤;点按装置200,配置用于根据主控装置的上下电指令点按实验对象的开机按钮以执行开关机操作;以及实验对象300,实验对象分别与主控装置进行电连接和通信连接,点按装置固设于实验对象的开机按钮附近,实验对象包括一个或多个实验服务器,当存在多个实验服务器时,对应需要多个点按装置。
在进一步的实施例中,请参见图3,本发明的主控装置包括:AC输入接口101,配置用于接入交流电源;多个AC-DC输出接口102,配置用于将交流电源转换为直流电源并提供多个直流电源接口,其中,多个直流电源接口中至少包括一个用于为实验对象供电的直流电源接口;第一电源开关103,连接于AC输入接口与AC输入接口之间,配置用于根据上下电指令控制连通AC输入接口与AC-DC输出接口之间的电连接,或者断开AC输入接口与AC-DC输出接口之间的电连接;配置输入模块104,配置用于输入故障机器的IP地址以远程访问故障机器,并选择实验对象并为实验对象配置故障复现模式;网络接口105,配置用于接入网络以获取故障机器的系统配置参数以及故障日志,并将系统配置参数保存为待测参数;串口模块106,与实验对象的串口电连接,配置用于获取实验对象的日志数据;拓展接口107,配置用于连接外接设备,并根据预设的Pin脚定义自动识别外接设备并进行通信,外接设备至少包括点按装置;存储模块108,配置用于存储主控装置的系统及故障机器的参数配置及故障日志;电源模块109,配置用于引入AC电源并转换为DC输出;主控模块110,分别与第一电源开关、配置输入模块、网络接口、串口模块、拓展接口、存储模块以及电源模块电连接,配置用于实现上述任一方法实施例中的一种服务器故障自动复现方法的步骤。其中,配置输入模块包括:触摸屏、智能手机或平板电脑;主控设备的控制系统采用安卓系统。
在进一步的实施例中,本发明的主控装置还可以配置有风扇111,用于为主控装置散热。
图3为本发明的主控装置的结构示意图,其实物图请参加图4。如图4所示,1为主控装置,2为AC输入口、3为电源开关按键、4为AC输出口、5为触摸屏、6为扩展接口、7为网络接口、8为RS232串口、9为散热风扇。图4示出的是本发明主控装置的一种可选的布局方式,合理的布局能够提升使用感受。
在进一步的实施例中,请参见图5,点按装置包括:主体201;设置于主体上的固定支架202、伺服电机203、通信接口204以及设置于主体内部的控制模块205与电源模块206(未示出);以及转动臂207,转动臂207与伺服电机203的转动轴固定连接;其中,通信接口204、伺服电机203与电源模块206分别与控制模块205连接,控制模块205配置用于通过通信接口204获取主控设备的上下电指令并控制伺服电机203的转动轴做定向定量转动,并带动转动臂207以通过转动臂207点按实验对象的开机按钮;固定支架202配置用于固定点按装置,并使得转动臂207位于实验对象的开关按钮附近。
在进一步的实施例中,转动臂207呈条状并具有点按端,点按端为光滑的圆端;当伺服电机203带动转动臂207旋转到水平位置时,转动臂的点按端超出主体的侧边并垂直按压实验对象的开关按钮;当伺服电机203带动转动臂旋207转到竖直位置时,转动臂的点按端远离开关按钮以解除对开关按钮的按压。
在进一步的实施例中,请参见图6,转动臂207呈圆盘状并具有点按端,点按端为设置在圆盘边缘的凸起;当伺服电机带动圆盘旋转并使得凸起处于水平位置时,凸起垂直按压实验对象的开关按钮;当伺服电机带动圆盘旋转并使得凸起处于竖直位置时,凸起远离开关按钮以解除对开关按钮的按压。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
Claims (10)
1.一种服务器故障自动复现方法,其特征在于,所述方法包括:
获取故障机器的系统配置参数以及故障日志,并将所述系统配置参数保存为待测参数;
根据所述待测参数配置实验对象以复现故障机器的系统配置;
选择预设的故障复现模式,根据相应的故障复现模式控制所述实验对象执行上下电操作并监控所述实验对象的日志数据并与所述故障日志进行对比以识别待复现的故障;
响应于复现到故障,根据所述故障复现模式选择记录故障复现次数或保留所述试验对象的故障现场。
2.根据权利要求1所述的一种服务器故障自动复现方法,其特征在于,所述获取故障机器的系统配置参数包括:
通过网络接口远程获取所述故障机器的系统配置参数,所述系统配置参数包括所述故障机器的BMC版本及其参数配置和BIOS版本及其参数配置。
3.根据权利要求1所述的一种服务器故障自动复现方法,其特征在于,所述获取故障机器的故障日志包括:
获取故障机器的BMC及BIOS的串口日志、BMC的IDE日志以及系统下的Message日志。
4.一种服务器故障自动复现系统,其特征在于,包括:
主控装置,配置用于实现如权利要求1-3任一项所述的一种服务器故障自动复现方法的步骤;
点按装置,配置用于根据所述主控装置的上下电指令点按实验对象的开机按钮以执行开关机操作;
实验对象,所述实验对象分别与所述主控装置进行电连接和通信连接,所述点按装置固设于所述实验对象的开机按钮附近,所述实验对象包括一个或多个实验服务器,当存在多个实验服务器时,对应需要多个点按装置。
5.根据权利要求4所述的一种服务器故障自动复现系统,其特征在于,所述主控装置包括:
AC输入接口,配置用于接入交流电源;
多个AC-DC输出接口,配置用于将交流电源转换为直流电源并提供多个直流电源接口,其中,所述多个直流电源接口中至少包括一个用于为所述实验对象供电的直流电源接口;
第一电源开关,连接于所述AC输入接口与所述AC输入接口之间,配置用于根据上下电指令控制连通所述AC输入接口与所述AC-DC输出接口之间的电连接,或者断开所述AC输入接口与所述AC-DC输出接口之间的电连接;
配置输入模块,配置用于输入故障机器的IP地址以远程访问所述故障机器,并选择实验对象并为所述实验对象配置故障复现模式;
网络接口,配置用于接入网络以获取所述故障机器的系统配置参数以及故障日志,并将所述系统配置参数保存为待测参数;
串口模块,与所述实验对象的串口电连接,配置用于获取所述实验对象的日志数据;
拓展接口,配置用于连接外接设备,并根据预设的Pin脚定义自动识别外接设备并进行通信,所述外接设备至少包括所述点按装置;
存储模块,配置用于存储主控装置的系统及所述故障机器的参数配置及故障日志;
电源模块,配置用于引入交流电源并转换为直流输出;
主控模块,分别与所述第一电源开关、所述配置输入模块、所述网络接口、所述串口模块、所述拓展接口、所述存储模块以及所述电源模块电连接,配置用于实现如权利要求1-3任一项所述的一种服务器故障自动复现方法的步骤。
6.根据权利要求5所述的一种服务器故障自动复现系统,其特征在于,所述配置输入模块包括:触摸屏、智能手机或平板电脑。
7.根据权利要求5所述的一种服务器故障自动复现系统,其特征在于,所述主控设备的控制系统采用安卓系统。
8.根据权利要求4所述的一种服务器故障自动复现系统,其特征在于,所述点按装置包括:
主体;
设置于所述主体上的固定支架、伺服电机、通信接口以及设置于所述主体内部的控制模块与电源模块;以及
转动臂,所述转动臂与所述伺服电机的转动轴固定连接;
其中,所述通信接口、所述伺服电机与所述电源模块分别与所述控制模块连接,所述控制模块配置用于通过所述通信接口获取所述主控设备的上下电指令并控制所述伺服电机的转动轴做定向定量转动,并带动所述转动臂以通过所述转动臂点按所述实验对象的开机按钮;
所述固定支架配置用于固定所述点按装置,并使得所述转动臂位于所述实验对象的开关按钮附近。
9.根据权利要求8所述的一种服务器故障自动复现系统,其特征在于,
所述转动臂呈条状并具有点按端,所述点按端为光滑的圆端;
当所述伺服电机带动所述转动臂旋转到水平位置时,所述转动臂的点按端超出所述主体的侧边并垂直按压所述实验对象的开关按钮;
当所述伺服电机带动所述转动臂旋转到竖直位置时,所述转动臂的点按端远离所述开关按钮以解除对所述开关按钮的按压。
10.根据权利要求8所述的一种服务器故障自动复现系统,其特征在于,
所述转动臂呈圆盘状并具有点按端,所述点按端为设置在所述圆盘边缘的凸起;
当所述伺服电机带动所述圆盘旋转并使得所述凸起处于水平位置时,所述凸起垂直按压所述实验对象的开关按钮;
当所述伺服电机带动所述圆盘旋转并使得所述凸起处于竖直位置时,所述凸起远离所述开关按钮以解除对所述开关按钮的按压。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311195886.5A CN117234801A (zh) | 2023-09-15 | 2023-09-15 | 一种服务器故障自动复现方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311195886.5A CN117234801A (zh) | 2023-09-15 | 2023-09-15 | 一种服务器故障自动复现方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117234801A true CN117234801A (zh) | 2023-12-15 |
Family
ID=89092473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311195886.5A Pending CN117234801A (zh) | 2023-09-15 | 2023-09-15 | 一种服务器故障自动复现方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117234801A (zh) |
-
2023
- 2023-09-15 CN CN202311195886.5A patent/CN117234801A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107632219B (zh) | 一种自动开关机测试系统及其测试方法 | |
CN109254783A (zh) | 一种服务器系统安装方法、装置、设备及可读存储介质 | |
CN103778038A (zh) | 云端测试及远端监控集成电路装置的验证的方法及其系统 | |
CN109800117A (zh) | 一种基于ipmi的dc自动化测试方法及系统 | |
CN105260208A (zh) | 一种服务器自动批量刷新raid卡驱动的方法 | |
CN106445591A (zh) | 一种服务器自动批量刷raid卡fw的方法 | |
CN106980493B (zh) | 固件管理方法和装置 | |
CN106055440B (zh) | 一种通过bmc实现服务器异常断电的测试方法及系统 | |
CN107766189A (zh) | 一种Windows系统下服务器自动重启稳定性的测试方法 | |
TW201342041A (zh) | 測試系統和測試方法 | |
CN105068900A (zh) | 一种远程控制服务器cold reboot的测试方法 | |
CN112256505A (zh) | 一种服务器稳定性测试方法、装置及相关组件 | |
US10929261B1 (en) | Device diagnosis | |
CN105512000A (zh) | 一种操作系统异常信息收集方法、装置及计算机 | |
CN115827358A (zh) | 一种pfr功能的自动化测试系统、方法、装置及存储介质 | |
CN105333008A (zh) | 用于磁悬浮轴承控制系统的监控方法、装置及系统 | |
CN113590401B (zh) | Cpe设备多功能测试方法、装置、计算机设备及存储介质 | |
CN113626306A (zh) | 一种基于Jenkins的BMC自动化测试方法及装置 | |
CN117234801A (zh) | 一种服务器故障自动复现方法及系统 | |
CN113591951A (zh) | 一种智能电视远程运维方法及系统 | |
CN101741577A (zh) | 用于基板管理控制器的测试方法及其测试系统 | |
CN112416805A (zh) | 一种测试管理云平台和方法 | |
CN109871329A (zh) | 一种整机柜服务器进行多节点ac测试的方法及系统 | |
WO2023276039A1 (ja) | サーバ管理装置、サーバ管理方法およびプログラム | |
CN109656764A (zh) | 一种自动验证硬盘独立上下电控制的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |