CN112799904A - 一种服务器批量自动化运行巡检方法、装置及介质 - Google Patents

一种服务器批量自动化运行巡检方法、装置及介质 Download PDF

Info

Publication number
CN112799904A
CN112799904A CN202011610446.8A CN202011610446A CN112799904A CN 112799904 A CN112799904 A CN 112799904A CN 202011610446 A CN202011610446 A CN 202011610446A CN 112799904 A CN112799904 A CN 112799904A
Authority
CN
China
Prior art keywords
server
file
bmc
log
operation inspection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202011610446.8A
Other languages
English (en)
Inventor
邱志伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202011610446.8A priority Critical patent/CN112799904A/zh
Publication of CN112799904A publication Critical patent/CN112799904A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting

Abstract

本发明公开的一种服务器批量自动化运行巡检方法,应用于BMC设置restful的api接口的服务器,包括:创建包括需要批量自动化巡检服务器的BMC的IP、用户名和密码的所述第一文件;从所述第一文件获取所述IP、用户名和密码与所述BMC建立连接;通过crul调用所述BMC的restful的api接口,与所述BMC建立session;将返回的token或者cookie值作为restful的用户名密码登录获取api接口权限;通过api接口获取服务器信息,将所述服务器信息输出到第二文件中;根据所述服务器信息对服务器进行诊断,将诊断结果输出到第三文件中。本发明通过BMCresrful的api接口获取服务器信息;能够自行对所述服务器信息进行分析诊断,并将分析的异常事件集中于所述第三文件中用户通过所述第三文件可以了解服务器异常状态。

Description

一种服务器批量自动化运行巡检方法、装置及介质
技术领域
本发明涉及服务器巡检技术领域,尤其涉及一种服务器批量自动化运行巡检方法、装置及介质。
背景技术
IPMI(IntelligentPlatform Management Interface)即智能平台管理接口是使硬件管理具备“智能化”的新一代通用接口标准。用户可以利用IPMI监视服务器的物理特征,如温度、电压、电扇工作状态、电源供应以及机箱入侵等。Ipmi最大的优势在于它是独立于CPU BIOS和OS的,所以用户无论在开机还是关机的状态下,只要接通电源就可以实现对服务器的监控。
BMC(BaseboardManagement Controller)是IPMI的心脏;在IPMI管理平台中,系统管理软件对各个被管理器件的管理,都是通过与BMC通信来实现的。BMC并不依赖于服务器的处理器、BIOS或操作系统来工作,它有自己的固件、电源、MAC地址与网络接口,可谓非常地独立,是一个单独在系统内运行的无代理管理子系统。通过它IPMI可以监控各个传感器的数据并记录各种事件的日志。现有技术中针对IPMI,设计了InspurDiagLogCollect 工具对服务器的服务器信息进行收集,但是InspurDiagLogCollect收集的信息有限,且无法进行分析和批量处理,需要一台一台服务器进行采集并人工分析。随着BMC的发展,BMC配置restful的api接口,通过restful的api接口获取服务器信息成为可能。
发明内容
为解决上述的问题本发明提供一种服务器批量自动化运行巡检方法,应用于BMC设置restful的api接口的服务器,包括:
创建第一文件,所述第一文件包括需要批量自动化巡检服务器的BMC的 IP、用户名和密码;
从所述第一文件获取所述IP、用户名和密码与所述BMC建立连接;
通过crul调用所述BMC的restful的api接口,与所述BMC建立session;
将返回的token或者cookie值作为restful的用户名密码登录获取api接口权限;
通过api接口获取服务器信息,将所述服务器信息输出到第二文件中;根据所述服务器信息对服务器进行诊断,将诊断结果输出到第三文件中。
更进一步地,需要批量自动化巡检服务器的BMC的IP、用户名和密码分行输入到所述第一文件中,从所述第一文件中逐行获取所述IP、用户名和密码。
更进一步地,根据所述IP、用户名和密码发送icmp包到所述BMC,判断是否能与所述BMC连接,如果不能连接则报错并提示退出,如果能连接则建立连接。
更进一步地,所述服务器信息包括固件版本、CPU、内存、电源、raid卡、硬盘、PCIE卡和日志信息。
更进一步地,所述日志信息包括BMC日志和黑盒日志,其中,所述黑盒日志包括blackbox日志和blackboxpeci日志。
更进一步地,根据所述服务器信息对服务器进行诊断包括:
所述BMC日志中配置严重性判定参数,所述严重性判定参数的数值大小与日志中记录的事件异常的严重性相关联,根据所述事件严重性判定参数筛选所述事件日志中的异常事件,将异常事件与异常事件发生的时间节点输出到所述第三文件中;
从所述服务器信息判断每次关机是否记录有OS graceful shutdown或者powerbotton信息,将无OS graceful shutdown或者powerbotton关机事件以及发生的时间节点输出到所述第三文件中;
对传感器状态进行读取判定,通过“check sensorname status”遍历全部的传感器,如果为[failed],则传感器读取失败,如果为[OK],则传感器读取成功,获取读取失败的传感器日志输出到所述第三文件;
判断是否存在所述blackbox日志,如果存在则将blackbox日志存在信息输出到所述第三文件;判断是否存在所述blackboxpeci日志,如果存在则将 blackboxpeci日志存在信息输出到所述第三文件。
更进一步地,将返回的token或者cookie值与服务器关联保存;
登录相应的所述服务器时,以保存的token或者cookie值作为restful的用户名密码尝试登录;
如果失败,则通过crul调用所述服务器的BMC的restful的api接口,与所述BMC建立session。
更进一步地,所述第二文件和所述第三文件的名称中包括服务器主机名和生成时间。
本发明提供一种服务器批量自动化运行巡检装置,包括处理模块、存储模块、总线模块、接口模块、输入模块和显示模块,所述存储模块存储至少一条指令执行所述指令实现所述的服务器批量自动化运行巡检方法。
本发明提供一种服务器批量自动化运行巡检介质,存储至少一条指令,执行所述指令实现所述的服务器批量自动化运行巡检方法。
本申请提出的一种服务器批量自动化运行巡检方法、装置及介质具体有以下有益效果:
本发明提出的一种服务器批量自动化运行巡检方法利用所述第一文件保存需要进行监控的服务器的BMC的IP、用户名以及密码,监控机通过IP、用户名以及密码连接到服务器,所述监控机通过session方式获取BMCresrful 的api接口的权限,并能够通过restful的api接口从多台服务器上批量的获取服务器信息;能够自行对所述服务器信息进行分析诊断,并将分析的异常事件集中于所述第三文件中用户通过所述第三文件可以了解所述服务器状态。批量自动获取,服务器信息获取效率高;具有初步分析诊断功能,方便对服务器状态进行分析。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1是本发明实施例中一种服务器批量自动化运行巡检方法流程图;
图2是本发明实施例中实现监控机与服务器BMC连接流程图;
图3是本发明实施例中通过BMC日志的严重性判定参数获取异常事件的流程图;
图4是本发明实施例中服务器批量自动化运行巡检装置的示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面结合附图对本发明进行说明,其中,图1是本发明实施例中一种服务器批量自动化运行巡检方法流程图;图2是本发明实施例中实现监控机与服务器BMC连接流程图;图3是本发明实施例中通过BMC日志的严重性判定参数获取异常事件的流程图;图4是本发明实施例中服务器批量自动化运行巡检装置的示意图。
参阅图1所示,本发明提供一种服务器批量自动化运行巡检方法,应用于BMC设置restful的api接口的服务器,包括:
创建第一文件,所述第一文件包括需要批量自动化巡检服务器的BMC的 IP、用户名和密码;具体实施过程中,需要批量自动化巡检服务器的BMC的 IP、用户名和密码分行按顺序输入到所述第一文件中,所述IP,所述用户名和所述密码之间通过空格间隔。当多个服务器处于一个局域网内,且多个所述服务器的用户名和密码一致时,所述IP、用户名和密码可以表示为“10.7.11.[182-184]用户名密码”的形式,中括号内为2-253之间的连续整数。
从所述第一文件获取所述IP、用户名和密码,连接所述BMC,并获取 restful的api接口权限。具体的,通过awk命令从所述第一文件逐行获取所述 IP、用户名和密码,获取所述IP、用户名和密码时,判断所述IP、用户名和密码是否缺失,如果有缺失则提醒缺失。
根据所述IP、用户名和密码发送icmp包到相应的所述BMC,判断监控机是否能与相应的所述BMC连接,如果不能连接则报错并提示退出,如果能连接则建立连接。
参阅图2所示,在所述监控机第一次获取BMC的restful的api接口权限时,通过crul调用所述BMC的restful的api接口,通过“POST URL:http s://BMC_IP/api/session”与目标的所述BMC建立session;将返回的token 或者cookie值作为restful的用户名密码登录以获取api接口权限。
通过restful的api接口获取服务器的服务器信息,并保存于第二文件,具体的,通过“GET URL:https://BMC_IP/api/目录”来获取服务器信息;将返回的token或者cookie值与服务器、服务器的sessionID关联保存于所述监控机;所述监控机后续登录相应的所述服务器时,以保存的token或者coo kie值作为restful的用户名密码尝试登录;如果失败,则将尝试登录失败的t oken或者cookie删除,并通过crul调用所述服务器的BMC的restful的api 接口,与所述BMC重新建立session,重新获取token或者cookie值保存。
具体的,涉及到的所述目录包括status/health_summary、version_summar y、settings/active-sessions、settings/network、logs/event、chassis-status、status/cpu_info、sensors、fru、status/memory_info、status/device_inventory、biossetu p、status/adapter_info、status/psu_info、status/diskbackplane_info、status/harddisk_info、status/storage_info、raid/ctrlinfo、status/enclosure_info、status/fan_inf o、agent/hd_info、agent/nic_info、raid/ctrlprop、raid/ctrlmfc、raid/ctrlinfo、rai d/getctrlcount、actions/chassis-led、configuration/runtime、settings/media/remot esession、configuration/project、getpolicy、settings/media/instance、settings/me dia/general、psu/psu_info、settings/mouse、settings/power_policy、settings/fans -mode、powerPeak、status/fan_info、settings/thermal_config、settings/network 、settings/static-ipv6、settings/services、settings/dns/registration、settings/dns/d omain-options、sensors、settings/dns、settings/dns/server-options、settings/netw ork-bond、settings/network-link、settings/network-interfaces、settings/date-time 、settings/smtp、settings/pef/event_filters、settings/pef/alert_policies、settings/n etwork-interfaces、settings/users、settings/pef/lan_destinations、settings/firewall -ip-rules、settings/ncsi-interfaces、settings/ncsi/mode、logs/event、logs/audit?le vel=、logs/system?level=1、settings/log-policy、settings/log-policy、diagnose/se lf-test、diagnose/bios-post-code、getusergroup、settings/user-rule、settings/users 、maintenance/system_admin、settings/active-directory-settings、settings/active-directory-users、settings/ldap-settings、settings/ldap-users、configuration/project 、settings/active-directory-settings、maintenance/dual_image_config、blackbox/b lackbox.log、blackbox/blackboxpeci.log。获取的所述服务器信息包括固件版本、CPU、内存、电源、raid卡、硬盘、PCIE卡和日志信息。所述日志信息包括BMC日志和黑盒日志,所述黑盒日志包括blackbox日志和blackboxpeci 日志。
将获取的所述服务器信息输出到第二文件中;所述第二文件的文件名包括主机名+文件内容(服务器信息)+生成时间,所述主机名为BMC所对应的服务器的名称。
根据所述服务器信息对服务器进行分析诊断,将异常信息保存于第三文件。同样的,所述第三文件的文件名包括主机名+文件内容(异常信息)+生成时间。具体实施过程中,根据所述服务器信息对服务器进行诊断包括:
利用BMC日志进行诊断,所述BMC日志中配置严重性判定参数,如一段BMC日志记录如下{"id":1,"timestamp":28833,"sensor_type":22, "sensor_name":"BMC_Boot_Up","record_type":2,"gen_id1":32, "event_dir_type":9,"event_data1":1,"event_data2":255,"severity":0},其中 severity为所述严重性判定参数,所述严重性判定参数的数值大小与日志中记录的事件异常的严重性相关联,根据所述事件严重性判定参数筛选所述事件日志中的异常事件,将异常事件与异常事件发生的时间节点输出到所述第三文件中。参阅图3所示,具体过程包括获取BMC日志,并遍历所述BMC日志获取BMC日志中事件的所述severity的数值,根据事件的所述severity的数值判断事件是否为异常事件,如果是异常事件则将异常事件与其发生的时间节点输出到所述第三文件,直至分析完全部的所述severity的数值。
发生异常关机时,不会记录OS graceful shutdown/power button信息。从所述服务器信息判断每次关机是否记录有OS graceful shutdown或者power botton信息,将无OSgraceful shutdown或者powerbotton关机事件以及其发生的时间节点输出到所述第三文件中。发生异常关机时,所述服务器信息中会记录legacy off信息,从所述服务器信息中检索是否存在legacy off信息,如果有,将legacy off对应的关机时间及其发生的时间节点输出到所述第三文件中。也可以添加除legacy off以外的其他异常关机关键词进行检索。从而实现对异常关机事件的记录。
对传感器状态进行读取判定,通过“check sensorname status”遍历全部的传感器,如果为[failed],则传感器读取失败,如果为[OK],则传感器读取成功;获取读取失败的传感器的UID,根据UID获取读取失败的传感器日志输出到所述第三文件。其中,sensorname包括Sys Health LED[1-N]、FAN[1-M]、 POWER SUPPLY[1-O],其中N、M、O为正整数。
根据所述服务器信息判断是否存在所述blackbox日志,如果存在则将 blackbox日志存在信息输出到所述第三文件;判断是否存在所述blackboxpeci 日志,如果存在则将blackboxpeci日志存在信息和blackboxpeci日志内容输出到所述第三文件。
所述监控机依次与全部的所述BMC建立连接;进行服务器信息采集分析。
参阅图4所示,本发明提供一种服务器批量自动化运行巡检装置,包括处理模块、存储模块、总线模块、接口模块、输入模块和显示模块,所述存储模块存储至少一条指令,执行所述指令实现,所述的服务器批量自动化运行巡检方法。所述服务器批量自动化运行巡检装置配置windows或者linux系统。
本发明还一种服务器批量自动化运行巡检介质,存储至少一条指令,所述服务器批量自动化运行巡检介质通过接口连接监控机,所述监控机执行所述指令实现所述的服务器批量自动化运行巡检方法。
本发明提出的一种服务器批量自动化运行巡检方法利用所述第一文件保存需要进行监控的服务器的BMC的IP、用户名以及密码,监控机通过IP、用户名以及密码连接到服务器,所述监控机通过session方式获取BMCresrful 的api接口的权限,并能够通过restful的api接口从多台服务器上批量的获取服务器信息;能够自行对所述服务器信息进行分析诊断,并将分析的异常事件集中于所述第三文件中用户通过所述第三文件可以了解所述服务器状态。批量自动获取,服务器信息获取效率高;具有对所述服务器信息初步分析诊断并将异常信息集中到第三文件中的功能,方便维护人员进一步分析所述第三文件对服务器状态进行分析。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种服务器批量自动化运行巡检方法,应用于BMC设置restful的api接口的服务器,其特征在于,包括:
创建第一文件,所述第一文件包括需要批量自动化巡检服务器的BMC的IP、用户名和密码;
从所述第一文件获取所述IP、用户名和密码与所述BMC建立连接;
通过crul调用所述BMC的restful的api接口,与所述BMC建立session;
将返回的token或者cookie值作为restful的用户名密码登录获取api接口权限;
通过api接口获取服务器信息,将所述服务器信息输出到第二文件中;根据所述服务器信息对服务器进行诊断,将诊断结果输出到第三文件中。
2.根据权利要求1所述的服务器批量自动化运行巡检方法,其特征在于,需要批量自动化巡检服务器的BMC的IP、用户名和密码分行输入到所述第一文件中,从所述第一文件中逐行获取所述IP、用户名和密码。
3.根据权利要求2所述的服务器批量自动化运行巡检方法,其特征在于,根据所述IP、用户名和密码发送icmp包到所述BMC,判断是否能与所述BMC连接,如果不能连接则报错并提示退出,如果能连接则建立连接。
4.根据权利要求1所述的服务器批量自动化运行巡检方法,其特征在于,所述服务器信息包括固件版本、CPU、内存、电源、raid卡、硬盘、PCIE卡和日志信息。
5.根据权利要求4所述的服务器批量自动化运行巡检方法,其特征在于,所述日志信息包括BMC日志和黑盒日志,其中,所述黑盒日志包括blackbox日志和blackboxpeci日志。
6.根据权利要求5所述的服务器批量自动化运行巡检方法,其特征在于,根据所述服务器信息对服务器进行诊断包括:
所述BMC日志中配置严重性判定参数,所述严重性判定参数的数值大小与日志中记录的事件异常的严重性相关联,根据所述事件严重性判定参数筛选所述事件日志中的异常事件,将异常事件与异常事件发生的时间节点输出到所述第三文件中;
从所述服务器信息判断每次关机是否记录有OS graceful shutdown或者powerbotton信息,将无OS graceful shutdown或者power botton关机事件以及其发生的时间节点输出到所述第三文件中;
对传感器状态进行读取判定,通过“check sensorname status”遍历全部的传感器,如果为[failed],则传感器读取失败,如果为[OK],则传感器读取成功,获取读取失败的传感器日志输出到所述第三文件;
判断是否存在所述blackbox日志,如果存在则将blackbox日志存在信息输出到所述第三文件;判断是否存在所述blackboxpeci日志,如果存在则将blackboxpeci日志存在信息输出到所述第三文件。
7.根据权利要求1所述的服务器批量自动化运行巡检方法,其特征在于,将返回的token或者cookie值与服务器关联保存;
登录相应的所述服务器时,以保存的token或者cookie值作为restful的用户名密码尝试登录;
如果失败,则通过crul调用所述服务器的BMC的restful的api接口,与所述BMC重新建立session。
8.根据权利要求1所述的服务器批量自动化运行巡检方法,其特征在于,所述第二文件和所述第三文件的名称中包括服务器主机名和生成时间。
9.一种服务器批量自动化运行巡检装置,其特征在于,包括处理模块、存储模块、总线模块、接口模块、输入模块和显示模块,所述存储模块存储至少一条指令执行所述指令实现如权利要求1-8任一所述的服务器批量自动化运行巡检方法。
10.一种服务器批量自动化运行巡检介质,其特征在于,存储至少一条指令,执行所述指令实现如权利要求1-8任一所述的服务器批量自动化运行巡检方法。
CN202011610446.8A 2020-12-30 2020-12-30 一种服务器批量自动化运行巡检方法、装置及介质 Withdrawn CN112799904A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011610446.8A CN112799904A (zh) 2020-12-30 2020-12-30 一种服务器批量自动化运行巡检方法、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011610446.8A CN112799904A (zh) 2020-12-30 2020-12-30 一种服务器批量自动化运行巡检方法、装置及介质

Publications (1)

Publication Number Publication Date
CN112799904A true CN112799904A (zh) 2021-05-14

Family

ID=75804521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011610446.8A Withdrawn CN112799904A (zh) 2020-12-30 2020-12-30 一种服务器批量自动化运行巡检方法、装置及介质

Country Status (1)

Country Link
CN (1) CN112799904A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113419923A (zh) * 2021-07-21 2021-09-21 成都晶宝星云科技有限公司 自动化平台巡检方法
CN114844699A (zh) * 2022-04-29 2022-08-02 济南浪潮数据技术有限公司 一种访问bmc控制台的方法、装置及介质
CN115426252A (zh) * 2022-07-11 2022-12-02 浪潮通信技术有限公司 服务器硬件日志的获取方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113419923A (zh) * 2021-07-21 2021-09-21 成都晶宝星云科技有限公司 自动化平台巡检方法
CN114844699A (zh) * 2022-04-29 2022-08-02 济南浪潮数据技术有限公司 一种访问bmc控制台的方法、装置及介质
CN115426252A (zh) * 2022-07-11 2022-12-02 浪潮通信技术有限公司 服务器硬件日志的获取方法及装置

Similar Documents

Publication Publication Date Title
CN112799904A (zh) 一种服务器批量自动化运行巡检方法、装置及介质
US9954727B2 (en) Automatic debug information collection
Kandula et al. Detailed diagnosis in enterprise networks
US7340649B2 (en) System and method for determining fault isolation in an enterprise computing system
JP4215804B2 (ja) デバイス診断システム
US8806037B1 (en) Remote support automation for a storage server
US20090028053A1 (en) Root-cause approach to problem diagnosis in data networks
US20040228063A1 (en) IPMI dual-domain controller
US20130326029A1 (en) System and methods for configuration management
US20220050765A1 (en) Method for processing logs in a computer system for events identified as abnormal and revealing solutions, electronic device, and cloud server
EP4293517A2 (en) Alerting, diagnosing, and transmitting computer issues to a technical resource in response to a dedicated physical button or trigger
CN111314115A (zh) 一种基于idl日志的告警方法、装置、设备及可读介质
CN111796959B (zh) 宿主机容器自愈方法、装置及系统
CN109240851A (zh) 一种自主式实现批量bmc自恢复的方法及系统
US20180359184A1 (en) Out-of-band telemetry data collection
CN115904419A (zh) 一种基于自动化脚本安装应用软件的方法及装置
US7668941B1 (en) Systems and methods for implementing a TCP/IP stack and web interface within a management module
CN102957563B (zh) Linux集群故障自动恢复方法和Linux集群故障自动恢复系统
CN114510381A (zh) 故障注入方法、装置、设备和存储介质
WO2014022789A2 (en) Systems and methods for configuration management
US11237892B1 (en) Obtaining data for fault identification
CN115687036A (zh) 日志采集方法、装置及日志系统
CN112527594A (zh) 一种硬盘巡检方法、装置及系统
CN113553243A (zh) 远端侦错方法
Arefin et al. Cloudinsight: Shedding light on the cloud

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20210514