CN110750416A - 一种故障信息自动化处理的方法及装置 - Google Patents

一种故障信息自动化处理的方法及装置 Download PDF

Info

Publication number
CN110750416A
CN110750416A CN201910895577.6A CN201910895577A CN110750416A CN 110750416 A CN110750416 A CN 110750416A CN 201910895577 A CN201910895577 A CN 201910895577A CN 110750416 A CN110750416 A CN 110750416A
Authority
CN
China
Prior art keywords
module
information
esxi
key configuration
configuration information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910895577.6A
Other languages
English (en)
Inventor
赵学鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wave Intelligent Technology Co Ltd
Original Assignee
Suzhou Wave Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wave Intelligent Technology Co Ltd filed Critical Suzhou Wave Intelligent Technology Co Ltd
Priority to CN201910895577.6A priority Critical patent/CN110750416A/zh
Publication of CN110750416A publication Critical patent/CN110750416A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine

Abstract

本发明实施例公开了一种故障信息自动化处理的方法及装置,其中该方法包括:当ESXI系统发生故障时,自动收集和保存所述ESXI系统的关键配置文件和所有日志文件;根据所述关键配置文件,自动筛选和保存所述ESXI系统的每个系统模块对应的关键配置信息;根据所述所有日志文件,自动筛选和保存所述ESXI系统的每个系统模块对应的异常日志;输出ESXI告警诊断报告,所述ESXI告警诊断报告包括:每个系统模块对应的关键配置信息和异常日志。如此,能够自动化收集和归类故障信息,提高了故障诊断效率。

Description

一种故障信息自动化处理的方法及装置
技术领域
本发明涉及EXSI操作系统,尤指一种故障信息自动化处理的方法及装置。
背景技术
EXSI操作系统作为硬件和上层应用之间的连接层,控制和管理整个服务器硬件和上层软件资源,并组织调度服务器硬件资源分配和工作,提供软件运行接口及环境。
ESXI操作系统在运行中,由于会跟各类型各厂商各个版本的硬件、驱动和业务软件交互,导致会出现各式各样不同的报错现象和故障。因此在进行故障诊断时,会存在如下问题:
1、对于不同的操作系统模块如:网络、存储、权限、显示等,需要收集和分析的信息都不同,导致信息收集和分析非常复杂和困难,需要分析者对每一个模块的信息收集和分析内容都非常了解,对专业性要求极高;
2、又因为ESXI的命令操作与传统linux指令差异较多,增加了问题分析排查的难度;
3、同时由于ESXI中各类日志有十余种,每个日志文件负责记录的模块和内容都不同,增加更多分析排查工作量。
发明内容
有鉴于此,本发明实施例提供了一种故障信息自动化处理的方法,包括:
当ESXI系统发生故障时,自动收集和保存所述ESXI系统的关键配置文件和所有日志文件;
根据所述关键配置文件,自动筛选和保存所述ESXI系统的每个系统模块对应的关键配置信息;
根据所述所有日志文件,自动筛选和保存所述ESXI系统的每个系统模块对应的异常日志;
输出ESXI告警诊断报告,所述ESXI告警诊断报告包括:每个系统模块对应的关键配置信息和异常日志。
本发明实施例还提供了一种故障信息自动化处理的装置,包括:
收集模块,用于当ESXI系统发生故障时,自动收集和保存所述ESXI系统的关键配置文件和所有日志文件;
关键信息筛选模块,用于根据所述关键配置文件,自动筛选和保存所述ESXI系统的每个系统模块对应的关键配置信息;
异常日志筛选模块,用于根据所述所有日志文件,自动筛选和保存所述ESXI系统的每个系统模块对应的异常日志;
输出模块,用于输出ESXI告警诊断报告,所述ESXI告警诊断报告包括:每个系统模块对应的关键配置信息和异常日志。
本发明实施例还提供了一种故障信息自动化处理的装置,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述故障信息自动化处理的方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有信息处理程序,所述信息处理程序被处理器执行时实现上述故障信息自动化处理的方法的步骤。
本发明实施例提供的技术方案,能够自动化收集和归类故障信息,提高了故障诊断效率。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书、权利要求书以及附图中所描述的方案来实现和获得。
附图说明
附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
图1为本发明一实施例提供的一种故障信息自动化处理的方法的流程示意图;
图2为本发明另一实施例提供的一种故障信息自动化处理的方法的流程示意图;
图3为本发明一实施例提供的一种故障信息自动化处理的装置的结构示意图。
具体实施方式
本申请描述了多个实施例,但是该描述是示例性的,而不是限制性的,并且对于本领域的普通技术人员来说显而易见的是,在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合,并在具体实施方式中进行了讨论,但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外,任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用,或可以替代任何其它实施例中的任何其他特征或元件。
本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合,以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合,以形成另一个由权利要求限定的独特的发明方案。因此,应当理解,在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此,除了根据所附权利要求及其等同替换所做的限制以外,实施例不受其它限制。此外,可以在所附权利要求的保护范围内进行各种修改和改变。
此外,在描述具有代表性的实施例时,说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而,在该方法或过程不依赖于本文所述步骤的特定顺序的程度上,该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的,其它的步骤顺序也是可能的。因此,说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外,针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤,本领域技术人员可以容易地理解,这些顺序可以变化,并且仍然保持在本申请实施例的精神和范围内。
图1为本发明一实施例提供的一种故障信息自动化处理的方法的流程示意图,如图1所示,该方法包括:
步骤101,当ESXI系统发生故障时,自动收集和保存所述ESXI系统的关键配置文件和所有日志文件;
步骤102,根据所述关键配置文件,自动筛选和保存所述ESXI系统的每个系统模块对应的关键配置信息;
步骤103,根据所述所有日志文件,自动筛选和保存所述ESXI系统的每个系统模块对应的异常日志;
步骤104,输出ESXI告警诊断报告,所述ESXI告警诊断报告包括:每个系统模块对应的关键配置信息和异常日志。
其中,所述ESXI系统的系统模块包括以下至少之一:
系统基本信息模块、cpu模块、内存模块、网络模块、存储模块、权限模块、外设部件互连标准PCI设备模块、进程模块、虚拟机模块;
其中,所述系统基本信息模块的关键配置信息包括以下至少之一:主机名、ESXI系统版本、内核版本、时间及时区、基本输入输出系统BIOS版本、启动时长、Kdump信息等;
所述cpu模块的关键配置信息包括以下至少之一:cpu型号、数量、核及线程数、numa配置;
所述内存模块的关键配置信息包括以下至少之一:内存总量、内存使用情况;
所述网络模块的关键配置信息包括以下至少之一:网络配置信息、域名系统DNS和路由信息、网卡设备信息、网络状态;
所述存储模块的关键配置信息包括以下至少之一:硬盘信息、存储链路、文件系统和RAID(磁盘阵列Redundant Arrays of Independent Drives)卡信息;
所述权限模块的关键配置信息包括以下至少之一:用户及用户组信息、权限信息;
所述PCI设备模块的关键配置信息包括:各类PCI设备信息;
所述进程模块的关键配置信息包括:ESXI系统下所有进程信息;
所述虚拟机模块的关键配置信息包括:所有运行在ESXI系统上的虚拟机全部信息。
其中,所述自动收集和保存所述ESXI系统的各种配置信息和各类日志,包括:
调用Vmware vm-support命令自动收集所述ESXI系统的关键配置文件和所有日志文件,并保存到默认目录、指定目录或者目标设备。
其中,所述根据所述关键配置文件,自动筛选和保存所述ESXI系统的每个系统模块对应的关键配置信息,包括:
根据预先配置的系统模块及配置文件对应表,遍历所述关键配置文件,识别并抓取每个系统模块下对应的关键配置文件及关键配置文件中的配置信息;
从每个系统模块下对应的关键配置文件的配置信息中自动筛选和提取关键配置信息;
将提取的关键配置信息按照系统模块进行分类存储;
其中,所述系统模块及配置文件对应表包括了每个系统模块对应的关键配置文件和关键配置信息。
其中,根据所述所有日志文件,自动筛选和保存所述ESXI系统的每个系统模块对应的异常日志,包括:
批量扫描所有日志文件,检索日志中的异常及报错条目,得到异常日志;
判断所述异常日志归属的系统模块;
将所述异常日志按照系统模块进行分类存储。
其中,所述输出ESXI告警诊断报告,包括:
使用高可读性的结构输出所述ESXI告警诊断报告。
其中,该方法还包括:
展示所述ESXI系统的每个系统模块对应的关键配置信息和异常日志。
本实施例提供的技术方案,能够自动化收集和归类故障信息,提高了故障诊断效率。
图2为本发明另一实施例提供的一种故障信息自动化处理的方法的流程示意图。
本实施例可以应用于任何能够执行下述方法的装置或者设备中,例如各种测试工具等。
如图2所示,该方法包括:
步骤201,当ESXI系统发生故障时,调用Vmware vm-support命令自动收集所述ESXI系统的关键配置文件和所有日志文件,并保存到默认目录、指定目录或者目标设备
具体而言,当ESXI系统发生故障或报错时需要分析定位故障问题,此时可以调用vm-support命令开始自动收集ESXI各种配置文件信息和各类日志,生成压缩包保存在默认或指定目录。也可以在运行时使用-s(--save)参数指定转储到目标设备,例如本地硬盘、可移动设备、远程NFS设备、SSH远程设备。
通过该步骤201可以满足各种情况下的配置信息和日志的一键收集和保存。
步骤202,根据预先配置的系统模块及配置文件对应表,遍历所述关键配置文件,识别并抓取每个系统模块下对应的关键配置文件及关键配置文件中的配置信息;从每个系统模块下对应的关键配置文件的配置信息中自动筛选和提取关键配置信息;将提取的关键配置信息按照系统模块进行分类存储;
其中,所述系统模块及配置文件对应表包括了每个系统模块信息对应的关键配置文件和关键配置信息。
例如,该系统模块及配置文件对应表包含了各个系统模块、对应系统模块的关键配置文件名、每个配置文件中需要提取的关键参数项等。
其中,所述ESXI系统的系统模块包括以下至少之一:系统基本信息模块、cpu模块、内存模块、网络模块、存储模块、权限模块、PCI(Peripheral Component Interconnect,外设部件互连标准)设备模块、进程模块、虚拟机模块;
其中,所述系统基本信息模块的关键配置信息包括以下至少之一:主机名、ESXI系统版本、内核版本、时间及时区、BIOS(Basic Input Output System,基本输入输出系统)版本、启动时长、Kdump信息、安装的软件包等;
所述cpu模块的关键配置信息包括以下至少之一:cpu型号、数量、核及线程数、numa(Non Uniform Memory Access Architecture,非统一内存访问架构)配置等;
所述内存模块的关键配置信息包括以下至少之一:内存总量、内存使用情况;
所述网络模块的关键配置信息包括以下至少之一:网络配置信息、域名系统DNS(Domain Name System)和路由信息、网卡设备信息、网络状态;
所述存储模块的关键配置信息包括以下至少之一:硬盘信息、存储链路、文件系统和RAID卡信息;
所述权限模块的关键配置信息包括以下至少之一:用户及用户组信息、权限信息;
所述PCI设备模块的关键配置信息包括:各类PCI设备信息;
所述进程模块的关键配置信息包括:ESXI系统下所有进程信息;
所述虚拟机模块的关键配置信息包括:所有运行在ESXI系统上的虚拟机全部信息。
具体而言,遍历步骤201中保存的关键配置文件,根据预先配置的“系统模块及配置文件对应表”,利用正则匹配+多线程循环遍历识别并抓取每个系统模块下对应的关键配置文件及文件中所提供的配置信息。正则匹配原则是指根据每个关键配置文件,通过关键字找到对应配置项,提取配置项后面的配置参数,例如针对存储模块中文件系统配置,识别Total space:xxx TB|Available space:xxx TB|Free space:xx.xx%|VMFS version:xxx关键参数信息。如此,可以对几百个配置文件进行自动筛选提取关键配置信息,然后将关键配置信息按照系统模块进行分类存储。
通过该步骤202,会对所收集的各类配置信息进行自动归类筛选整理,根据系统模块及配置文件对应关系自动精准抓取每个系统模块对应的配置信息,从中抓取出全部关键配置信息,然后根据系统模块归属进行分类持久化存储。例如,在收集到ESXI vm-support系统信息包后,自动化通过系统模块及配置文件的对应关系来解析support压缩包,并对不同系统模块所需查看的关键配置信息和日志信息进行自动提取、整理和归类保存,为分析人员准确提供报错模块所需的关键配置信息。
步骤203,批量扫描所有日志文件,检索日志中的异常及报错条目,得到异常日志;判断所述异常日志归属的系统模块;将所述异常日志按照系统模块进行分类存储;
其中,针对步骤201中保存的全部日志文件,进行自动化分析,检索日志中异常及报错条目,得到异常日志并判断所属系统模块。
具体而言,可以利用预先设定的异常日志特征点检索日志中的异常及报错条目,该异常日志特征点可以是异常关键字,例如“warning”等。例如,识别异常日志的具体过程为遍历打开每个日志文件并通过过滤“warning”、“error”、“notice”、“unknown”、“fail”、“reset”等关键字,把包含这些关键字的日志条目提取出来。
还可以进一步对异常条目进行初步分析,筛除对系统无危害或无异常的误报,筛选出最终的异常日志。经分析,存在一些包含“warning”等关键字但判断不是异常的无危害误报,因此可以预先总结无危害误报的特征,然后将提取的异常日志和总结的无危害误报进行比较,当异常日志与无危害误报比较一致时,即可判断是无异常的日志。
其中,所述判断所述异常日志归属的系统模块,可以根据日志条目特征进行指纹识别,判断异常日志所属系统模块。此处指纹识别,是指预先总结一些所属系统模块的日志记录中可能会出现的关键字。例如:存储模块对应的日志会包含“SCSI”、“Storage”等关键字;cpu模块对应的日志会包含cpu等关键字;PCI设备模块对应的日志会包含pci等关键字;等等。如此,通过识别日志中包含哪个系统模块对应的关键字,来推断可能属于哪个系统模块。例如日志中包含“Storage”,就可以推断其属于存储模块。
通过该步骤203,例如可以通过对ESXI多个日志文件进行逐个分析,根据匹配规则自动抓取异常和错误日志信息,并自动分析报错信息归属的系统模块,添加到系统模块归类存储集合中。例如,能够根据异常日志特征点,自动对数十日志文件数十万行日志条目高效循环遍历,筛选告警异常信息,并根据日志特征点进行指纹识别,判断异常日志所属系统模块,实现了日志简单预处理与智能分析,简化分析工作量,提高分析效率。
其中,上述步骤202和203并不存在固定的前后顺序,也可以同时进行,图2中的顺序仅为示例性说明,并不是具体的限定。
步骤204,输出ESXI告警诊断报告;
其中,所述ESXI告警诊断报告包括:每个系统模块对应的关键配置信息和异常日志。
其中,所述输出ESXI告警诊断报告,包括:
使用高可读性的结构输出所述ESXI告警诊断报告。
在上述异常日志和关键配置信息识别分类完毕后,会生成一个总的诊断报告,根据系统模块分组、每个系统模块下记录了对应的关键配置信息、筛选出的异常日志条目。技术人员可以参考诊断报告进行初步信息查看,对整个系统的硬件、软件和基本信息有一个快速的了解,并根据异常日志条目得出初步结论。也可以再手工对收集的所有文件逐一查看查漏补缺。
通过该步骤,可以根据系统内归类筛选和分析后生成并存储的分析结果,使用高可读性的结构输出报告结果。
步骤205,展示所述ESXI系统的每个系统模块对应的关键配置信息和异常日志。
具体而言,根据系统模块进行分类展示,展示所有系统模块对应的关键配置信息和异常日志条目,并以高可读性的格式输出到本地。例如,可以执行输出到系统屏幕下显示该告警诊断报告,该高可读性的结构是指以html、pdf、文本等格式展示该报告。
其中,上述步骤204和205可以同时存在也可以择一存在,当同时存在时并不存在固定的前后顺序,图2中的顺序仅为示例性说明,并不是具体的限定。
本步骤中,通过展示分析结果,可以使分析人员对于目标模块分析过程中异常信息和想要查询的关键配置可以直观查看,无需到处查找。
本实施例提供的技术方案,具有如下技术效果:
1,使分析人员无需对全部配置文件及命令输出结果和日志的功能全部掌握,只需根据报错对应模块去查看对应模块下筛选出的关键信息即可准确定位问题;
2,免除对比分析十余种日志文件,系统自动筛选日志中异常条目并判断异常点所属于的系统模块,使分析人员快速从大量日志中定位异常日志,只需关注和排除有异常的日志条目,无需对每个日志几万条记录逐一分析;
3、对于汇总报告的输出简单明了,根据系统模块分别展示,分析人员只需查看问题模块对应的日志和配置信息,相比以前一百多个配置文件和日志逐一分析,大大提高了分析效率,免除了冗余的信息排查工作。
图3为本发明一实施例提供的一种故障信息自动化处理的装置的结构示意图,如图3所示,该装置包括:
收集模块,用于当ESXI系统发生故障时,自动收集和保存所述ESXI系统的关键配置文件和所有日志文件;
关键信息筛选模块,用于根据所述关键配置文件,自动筛选和保存所述ESXI系统的每个系统模块对应的关键配置信息;
异常日志筛选模块,用于根据所述所有日志文件,自动筛选和保存所述ESXI系统的每个系统模块对应的异常日志;
输出模块,用于输出ESXI告警诊断报告,所述ESXI告警诊断报告包括:每个系统模块对应的关键配置信息和异常日志。
其中,
所述ESXI系统的系统模块包括以下至少之一:
系统基本信息模块、cpu模块、内存模块、网络模块、存储模块、权限模块、外设部件互连标准PCI设备模块、进程模块、虚拟机模块;
其中,所述系统基本信息模块的关键配置信息包括以下至少之一:主机名、ESXI系统版本、内核版本、时间及时区、基本输入输出系统BIOS版本、启动时长、Kdump信息等;
所述cpu模块的关键配置信息包括以下至少之一:cpu型号、数量、核及线程数、numa配置;
所述内存模块的关键配置信息包括以下至少之一:内存总量、内存使用情况;
所述网络模块的关键配置信息包括以下至少之一:网络配置信息、域名系统DNS和路由信息、网卡设备信息、网络状态;
所述存储模块的关键配置信息包括以下至少之一:硬盘信息、存储链路、文件系统和RAID卡信息;
所述权限模块的关键配置信息包括以下至少之一:用户及用户组信息、权限信息;
所述PCI设备模块的关键配置信息包括:各类PCI设备信息;
所述进程模块的关键配置信息包括:ESXI系统下所有进程信息;
所述虚拟机模块的关键配置信息包括:所有运行在ESXI系统上的虚拟机全部信息。其中,所述收集模块,具体用于调用Vmware vm-support命令自动收集所述ESXI系统的关键配置文件和所有日志文件,并保存到默认目录、指定目录或者目标设备。
其中,所述关键信息筛选模块,具体用于根据预先配置的系统模块及配置文件对应表,遍历所述关键配置文件,识别并抓取每个系统模块下对应的关键配置文件及关键配置文件中的配置信息;
从每个系统模块下对应的关键配置文件的配置信息中自动筛选和提取关键配置信息;
将提取的关键配置信息按照系统模块进行分类存储;
其中,所述系统模块及配置文件对应表包括了每个系统模块信息及其对应的配置文件信息。
其中,所述异常日志筛选模块,具体用于批量扫描所有日志文件,检索日志中的异常及报错条目,得到异常日志;
判断所述异常日志归属的系统模块;
将所述异常日志按照系统模块进行分类存储。
其中,所述输出模块,具体用于使用高可读性的结构输出所述ESXI告警诊断报告。
其中,该装置还包括:
展示模块,用于展示所述ESXI系统的每个系统模块对应的关键配置信息和异常日志。
上述实施例提供的技术方案,针对ESXI系统各类故障发生后,自动化收集系统全部关键信息,并根据故障模块筛选全部关键配置信息,排除冗余信息干扰,并对收集的全部配置和文件进行自动化分类、归纳,按操作系统问题模块展示对应模块关键信息和日志,辅助分析人员根据问题模块快速获取模块相关配置信息、报错日志,大大提高故障问题定位速度,为解决问题提供全面信息支持;同时还能够对全部日志文件进行初步自动化筛选提取和分析,省却数十万行日志条目逐一检查的工作。解决了目前对于ESXI系统故障和问题人工收集信息、排查分析复杂困难,各个配置项和输出存放过于繁杂,难以直观简洁获取到想要的信息的情况。自动化收集汇总信息和日志,并对收集内容自动化归类、筛选和分析,帮助快速定位和解决问题。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

Claims (10)

1.一种故障信息自动化处理的方法,其特征在于,包括:
当ESXI系统发生故障时,自动收集和保存所述ESXI系统的关键配置文件和所有日志文件;
根据所述关键配置文件,自动筛选和保存所述ESXI系统的每个系统模块对应的关键配置信息;
根据所述所有日志文件,自动筛选和保存所述ESXI系统的每个系统模块对应的异常日志;
输出ESXI告警诊断报告,所述ESXI告警诊断报告包括:每个系统模块对应的关键配置信息和异常日志。
2.根据权利要求1所述的方法,其特征在于,所述ESXI系统的系统模块包括以下至少之一:
系统基本信息模块、cpu模块、内存模块、网络模块、存储模块、权限模块、外设部件互连标准PCI设备模块、进程模块、虚拟机模块;
其中,所述系统基本信息模块的关键配置信息包括以下至少之一:主机名、ESXI系统版本、内核版本、时间及时区、基本输入输出系统BIOS版本、启动时长、Kdump信息等;
所述cpu模块的关键配置信息包括以下至少之一:cpu型号、数量、核及线程数、非统一内存访问架构numa配置;
所述内存模块的关键配置信息包括以下至少之一:内存总量、内存使用情况;
所述网络模块的关键配置信息包括以下至少之一:网络配置信息、域名系统DNS和路由信息、网卡设备信息、网络状态;
所述存储模块的关键配置信息包括以下至少之一:硬盘信息、存储链路、文件系统和磁盘阵列RAID卡信息;
所述权限模块的关键配置信息包括以下至少之一:用户及用户组信息、权限信息;
所述PCI设备模块的关键配置信息包括:各类PCI设备信息;
所述进程模块的关键配置信息包括:ESXI系统下所有进程信息;
所述虚拟机模块的关键配置信息包括:所有运行在ESXI系统上的虚拟机全部信息。
3.根据权利要求1所述的方法,其特征在于,所述自动收集和保存所述ESXI系统的各种配置信息和各类日志,包括:
调用Vmware vm-support命令自动收集所述ESXI系统的关键配置文件和所有日志文件,并保存到默认目录、指定目录或者目标设备。
4.根据权利要求3所述的方法,其特征在于,所述根据所述关键配置文件,自动筛选和保存所述ESXI系统的每个系统模块对应的关键配置信息,包括:
根据预先配置的系统模块及配置文件对应表,遍历所述关键配置文件,识别并抓取每个系统模块下对应的关键配置文件及关键配置文件中的配置信息;
从每个系统模块下对应的关键配置文件的配置信息中自动筛选和提取关键配置信息;
将提取的关键配置信息按照系统模块进行分类存储;
其中,所述系统模块及配置文件对应表包括了每个系统模块对应的关键配置文件和关键配置信息。
5.根据权利要求1所述的方法,其特征在于,根据所述所有日志文件,自动筛选和保存所述ESXI系统的每个系统模块对应的异常日志,包括:
批量扫描所有日志文件,检索日志中的异常及报错条目,得到异常日志;
判断所述异常日志归属的系统模块;
将所述异常日志按照系统模块进行分类存储。
6.根据权利要求1所述的方法,其特征在于,所述输出ESXI告警诊断报告,包括:
使用高可读性的结构输出所述ESXI告警诊断报告。
7.根据权利要求1所述的方法,其特征在于,该方法还包括:
展示所述ESXI系统的每个系统模块对应的关键配置信息和异常日志。
8.一种故障信息自动化处理的装置,其特征在于,包括:
收集模块,用于当ESXI系统发生故障时,自动收集和保存所述ESXI系统的关键配置文件和所有日志文件;
关键信息筛选模块,用于根据所述关键配置文件,自动筛选和保存所述ESXI系统的每个系统模块对应的关键配置信息;
异常日志筛选模块,用于根据所述所有日志文件,自动筛选和保存所述ESXI系统的每个系统模块对应的异常日志;
输出模块,用于输出ESXI告警诊断报告,所述ESXI告警诊断报告包括:每个系统模块对应的关键配置信息和异常日志。
9.一种故障信息自动化处理的装置,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述故障信息自动化处理的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有信息处理程序,所述信息处理程序被处理器执行时实现如权利要求1至7中任一项所述故障信息自动化处理的方法的步骤。
CN201910895577.6A 2019-09-21 2019-09-21 一种故障信息自动化处理的方法及装置 Withdrawn CN110750416A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910895577.6A CN110750416A (zh) 2019-09-21 2019-09-21 一种故障信息自动化处理的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910895577.6A CN110750416A (zh) 2019-09-21 2019-09-21 一种故障信息自动化处理的方法及装置

Publications (1)

Publication Number Publication Date
CN110750416A true CN110750416A (zh) 2020-02-04

Family

ID=69276851

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910895577.6A Withdrawn CN110750416A (zh) 2019-09-21 2019-09-21 一种故障信息自动化处理的方法及装置

Country Status (1)

Country Link
CN (1) CN110750416A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113239650A (zh) * 2021-07-09 2021-08-10 成都爱旗科技有限公司 一种报告生成方法、装置和电子设备
CN113867998A (zh) * 2021-08-25 2021-12-31 苏州浪潮智能科技有限公司 一种收集认证测试中故障瞬时日志的方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105005528A (zh) * 2015-06-26 2015-10-28 浪潮(北京)电子信息产业有限公司 一种日志信息提取方法及装置
CN108920297A (zh) * 2018-07-13 2018-11-30 郑州云海信息技术有限公司 一种诊断黑盒日志中pcie报错信息的方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105005528A (zh) * 2015-06-26 2015-10-28 浪潮(北京)电子信息产业有限公司 一种日志信息提取方法及装置
CN108920297A (zh) * 2018-07-13 2018-11-30 郑州云海信息技术有限公司 一种诊断黑盒日志中pcie报错信息的方法和系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113239650A (zh) * 2021-07-09 2021-08-10 成都爱旗科技有限公司 一种报告生成方法、装置和电子设备
CN113239650B (zh) * 2021-07-09 2021-10-15 成都爱旗科技有限公司 一种报告生成方法、装置和电子设备
CN113867998A (zh) * 2021-08-25 2021-12-31 苏州浪潮智能科技有限公司 一种收集认证测试中故障瞬时日志的方法及系统
CN113867998B (zh) * 2021-08-25 2023-08-15 苏州浪潮智能科技有限公司 一种收集认证测试中故障瞬时日志的方法及系统

Similar Documents

Publication Publication Date Title
US8140565B2 (en) Autonomic information management system (IMS) mainframe database pointer error diagnostic data extraction
CN109240886B (zh) 异常处理方法、装置、计算机设备以及存储介质
EP3432520B1 (en) Efficient storage and querying of time series metrics
US20150324246A1 (en) Correlation of source code with system dump information
CN112416705A (zh) 一种异常信息的处理方法和装置
CN110471945B (zh) 活跃数据的处理方法、系统、计算机设备和存储介质
CN110750416A (zh) 一种故障信息自动化处理的方法及装置
US8949669B1 (en) Error detection, correction and triage of a storage array errors
CN113239007B (zh) 多层次异构日志事务分析方法、系统、设备和存储介质
CN111784176A (zh) 一种数据处理方法、装置、服务器及介质
CN112100035A (zh) 一种页面异常检测方法、系统及相关装置
CN111984444A (zh) 一种异常信息的处理方法和装置
CN113849329A (zh) 一种操作系统的日志分析整合方法和系统
CN114064387A (zh) 日志监控方法、系统、装置及计算机可读存储介质
CN114138537A (zh) 一种面向安卓应用的崩溃信息线上分析方法
CN113572628A (zh) 数据关联方法、装置、计算设备及计算机存储介质
US10936400B2 (en) Dynamic handling of callhome data
CN113806119A (zh) 存储卡处理方法、装置、设备及存储介质
CN116824515B (zh) 一种基于图形故障诊断方法、装置、电子设备和存储介质
US11341027B1 (en) Defect resolution
CN112486823B (zh) 错误码的校验方法、装置、电子设备及可读存储介质
CN113867998B (zh) 一种收集认证测试中故障瞬时日志的方法及系统
CN116719777B (zh) 阅读机器人读取ofd虚拟分区四性数据模仿人处理的技术
CN106470205B (zh) 一种安全配置变更检测方法和装置
CN113781068A (zh) 线上问题解决方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20200204

WW01 Invention patent application withdrawn after publication