CN113867998B - 一种收集认证测试中故障瞬时日志的方法及系统 - Google Patents

一种收集认证测试中故障瞬时日志的方法及系统 Download PDF

Info

Publication number
CN113867998B
CN113867998B CN202110984869.4A CN202110984869A CN113867998B CN 113867998 B CN113867998 B CN 113867998B CN 202110984869 A CN202110984869 A CN 202110984869A CN 113867998 B CN113867998 B CN 113867998B
Authority
CN
China
Prior art keywords
file
log
test
information
logs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110984869.4A
Other languages
English (en)
Other versions
CN113867998A (zh
Inventor
阎秀忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202110984869.4A priority Critical patent/CN113867998B/zh
Publication of CN113867998A publication Critical patent/CN113867998A/zh
Application granted granted Critical
Publication of CN113867998B publication Critical patent/CN113867998B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0781Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种收集认证测试中故障瞬时日志的方法及系统,所述方法包括在认证测试过程中,采用事件关键词检索测试主机的内核日志;筛选出所述内核日志中包含所述事件关键词的日志信息,形成第一文件;经过设定时间段后,再次筛选出所述内核日志中包含所述时间关键词的日志信息,形成第二文件;当所述第一文件和第二文件不同时,收集测试控制器内的故障瞬时日志。本发明通过对测试主机内核日志进行事件关键词的检索,形成第一文件和第二文件,当两者不同时,说明当前事件关键词对应的异常再次发生,则迅速收集故障瞬时日志,快速高效的解决vSAN认证测试中遇到的问题。便于进一步分析问题根本原因,加快认证测试执行进度,节省大量资源。

Description

一种收集认证测试中故障瞬时日志的方法及系统
技术领域
本发明涉及服务器安全技术领域,尤其是一种收集认证测试中故障瞬时日志的方法及系统。
背景技术
VMware vSAN(基于服务器集群搭建的分布式存储)技术方案目前在通信金融等重点行业被广泛用于部署关键应用;为确保vSAN硬件和软件可以稳定运行,在部署应用前服务器硬件及相关部件需要首先通过认证,这样可以保障整体系统稳定性同时可以在出现问题时获得VMware技术支持。在执行vSAN认证测试项时,可能会出现和控制器Controller相关的测试失败,为定位测试失败的具体原因,需要收集相关日志进行问题详细分析,以便确定问题具体原因。
由于vSAN认证测试输出的日志属于应用层相关信息,无法为分析底层硬件问题提供支持,通常需要针对底层硬件再次收集日志信息。Controller在vSAN中属于关键部件,通常可用于分析问题的日志包括Uart串口日志、termlog及snapdump(故障瞬时)日志等。相较于其他两种日志,snapdump日志记录Controller相关事件且存于自身缓存上,由于通常controller自身缓存容量较小且事件刷新频繁,所以需要在测试失败时及时收集snapdump信息并下载到本地。
通常应用层日志中出现测试失败信息时,实际在底层硬件controller上相关问题早已出现,两边存在时间差,导致出现问题的snapdump日志已经被覆盖,收集到的snapdump已过时,导致收集到的snapdump日志不可用。
发明内容
本发明提供了一种收集认证测试中故障瞬时日志的方法及系统,用于解决现有收集到的故障瞬时日志snapdump超时不可用的问题。
为实现上述目的,本发明采用下述技术方案:
本发明第一方面提供了一种收集认证测试中故障瞬时日志的方法,所述方法包括以下步骤:
在认证测试过程中,采用事件关键词检索测试主机的内核日志;
筛选出所述内核日志中包含所述事件关键词的日志信息,形成第一文件;
经过设定时间段后,再次筛选出所述内核日志中包含所述事件关键词的日志信息,形成第二文件;
当所述第一文件和第二文件不同时,收集测试控制器内的故障瞬时日志。
进一步地,所述事件关键词为其出现会导致测试失败的词。
进一步地,所述事件关键词包括多个,对于每个所述事件关键词分别执行上述技术方案的步骤。
进一步地,筛选出的日志信息中,截取最新的一条或多条信息,形成第一文件;
所述第二文件的起始信息与所述第一文件的起始信息相同,第二文件的终止信息为日志信息中最新的一条信息。
进一步地,收集的所述故障瞬时日志在测试达到预设的测试次数后输出。
进一步地,所述测试次数根据当前测试项的执行时间及所述设定时间段确定,具体为:
对执行时间与设定时间段的比值向上取整数。
进一步地,所述方法还包括分析所述第一文件,若第一条日志信息的记录时刻在预设安全时间内,则在复现测试中缩短所述设定时间段。
进一步地,所述认证为vSAN认证,所述测试控制器为vSAN认证中的部件,所述故障瞬时日志存储在所述测试控制器的缓存中。
本发明第二方面提供了一种收集认证测试中故障瞬时日志的系统,所述系统包括:
检索单元,用于在认证测试过程中,采用事件关键词检索测试主机的内核日志;
第一文件生成单元,用于筛选出所述内核日志中包含所述事件关键词的日志信息,形成第一文件;
第二文件生成单元,在经过设定时间段后,再次筛选出所述内核日志中包含所述事件关键词的日志信息,形成第二文件;
故障瞬时日志收集单元,用于当所述第一文件和第二文件不同时,收集测试控制器内的故障瞬时日志。
本发买那个第三方面提供了一种计算机存储介质,所述计算机存储介质中存储有计算机指令所述计算机指令在所述系统上运行时,使所述系统执行所述方法的步骤。
本发明第二方面的所述收集认证测试中故障瞬时日志的系统能够实现第一方面及第一方面的各实现方式中的方法,并取得相同的效果。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
本发明通过对测试主机内核日志进行事件关键词的检索,在相隔设定时间段后,分别获取从内核日志中筛选的日志信息,形成第一文件和第二文件,对比着两个文件,当两者不同时,说明当前事件关键词对应的异常再次发生,则迅速收集故障瞬时日志,快速高效的解决vSAN认证测试中遇到的问题。便于进一步分析问题根本原因,加快认证测试执行进度,节省大量资源。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明所述方法的流程示意图;
图2是本发明所述系统的结构示意图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
vSAN认证测试项执行中,测试主机会有内核(vmkernel)日志输出,vmkernel中包括许多事件关键词event code信息。通常vSAN测试中特定event code(如0x71)出现将必然会导致测试最终测试失败,所以可以通过检测特定的event code来收集故障瞬间日志snapdump。由于异常事件通常会出现多次,为快速定位问题详细收集每次event code出现时的snapdump日志,所以需要实时检测是否出现有新的异常事件出现,以便快速准确收集snapdump日志。
实施例
如图1所示,本发明一种收集认证测试中故障瞬时日志的方法,所述方法包括以下步骤:
S1,在认证测试过程中,采用事件关键词检索测试主机的内核日志;
S2,筛选出所述内核日志中包含所述事件关键词的日志信息,形成第一文件;
S3,经过设定时间段后,再次筛选出所述内核日志中包含所述事件关键词的日志信息,形成第二文件;
S4,当所述第一文件和第二文件不同时,收集测试控制器内的故障瞬时日志。
步骤S1中,所述事件关键词为其出现会导致测试失败的词,如0x71。
所述事件关键词可以包括多个,对于每个所述事件关键词分别执行上述方法的步骤S1-步骤S4。
筛选出的日志信息中,截取最新的一条或多条信息,形成第一文件;
所述第二文件的起始信息与所述第一文件的起始信息相同,第二文件的终止信息为日志信息中最新的一条信息。当异常事件在第一文件和第二文件的形成过程中发生时,会产生关于当前事件关键词的新的日志记录,因此第二文件中的信息会多于第一文件中的信息。所以步骤S4在比较第一文件和第二文件不同时,证明异常发生,及时对控制器内的故障瞬时日志snapdump进行收集。
本发明的其一实施例中,在vSAN认证开始时,设置测试次数参数,步骤S4中收集的所述故障瞬时日志,在测试达到预设的测试次数后输出。
所述测试次数根据当前测试项的执行时间及所述设定时间段确定,具体为:对执行时间与设定时间段的比值向上取整数。
本发明的其一实施例中,在形成第一文件后,所述方法还包括分析所述第一文件,若第一条日志信息的记录时刻在预设安全时间内,则在复现测试中缩短所述设定时间段。本实施例考虑了测试开始时,设置安全时间,通常在该安全时间内内核日志中不会出现事件关键词相关的异常记录。若经过对第一文件的分析,发现在该预设安全时间内确实存在异常记录,则缩短设定时间段,尽快得到第二文件,进一步增强了对故障瞬时日志收集的及时性。
如图2所示,本发明一种收集认证测试中故障瞬时日志的系统,包括检索单元1、第一文件生成单元2、第二文件生成单元3和故障日志收集单元4。
检索单元1用于在认证测试过程中,采用事件关键词检索测试主机的内核日志;第一文件生成单元2用于筛选出所述内核日志中包含所述事件关键词的日志信息,形成第一文件;第二文件生成单元3在经过设定时间段后,再次筛选出所述内核日志中包含所述事件关键词的日志信息,形成第二文件;故障瞬时日志收集单元4用于当所述第一文件和第二文件不同时,收集测试控制器内的故障瞬时日志。
事件关键词为其出现会导致测试失败的词,如0x71。
第一文件生成单元2筛选出的日志信息中,截取最新的一条或多条信息,形成第一文件;
第二文件生成单元3形成的第二文件的起始信息与所述第一文件的起始信息相同,第二文件的终止信息为日志信息中最新的一条信息。当异常事件在第一文件和第二文件的形成过程中发生时,会产生关于当前事件关键词的新的日志记录,因此第二文件中的信息会多于第一文件中的信息。所以故障瞬时日志收集单元4在比较第一文件和第二文件不同时,证明异常发生,及时对控制器内的故障瞬时日志snapdump进行收集。
本发明还提供了一种计算机存储介质,所述计算机存储介质中存储有计算机指令,所述计算机指令在所述系统上运行时,使所述系统执行所述方法的步骤。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (7)

1.一种收集认证测试中故障瞬时日志的方法,其特征是,所述方法包括以下步骤:
S1,在认证测试过程中,采用事件关键词检索测试主机的内核日志;
S2,筛选出所述内核日志中包含所述事件关键词的日志信息,形成第一文件;
S3,经过设定时间段后,再次筛选出所述内核日志中包含所述事件关键词的日志信息,形成第二文件;
S4,当所述第一文件和第二文件不同时,收集测试控制器内的故障瞬时日志;
所述事件关键词为其出现会导致测试失败的词;
所述事件关键词包括多个,对于每个所述事件关键词分别执行步骤S1-S4;
筛选出的日志信息中,截取最新的一条或多条信息,形成第一文件;
所述第二文件的起始信息与所述第一文件的起始信息相同,第二文件的终止信息为日志信息中最新的一条信息。
2.根据权利要求1所述收集认证测试中故障瞬时日志的方法,其特征是,收集的所述故障瞬时日志在测试达到预设的测试次数后输出。
3.根据权利要求2所述收集认证测试中故障瞬时日志的方法,其特征是,所述测试次数根据当前测试项的执行时间及所述设定时间段确定,具体为:
对执行时间与设定时间段的比值向上取整数。
4.根据权利要求1所述收集认证测试中故障瞬时日志的方法,其特征是,所述方法还包括分析所述第一文件,若第一条日志信息的记录时刻在预设安全时间内,则在复现测试中缩短所述设定时间段。
5.根据权利要求1-4任一项所述收集认证测试中故障瞬时日志的方法,其特征是,所述认证为vSAN认证,所述测试控制器为vSAN认证中的部件,所述故障瞬时日志存储在所述测试控制器的缓存中。
6.一种收集认证测试中故障瞬时日志的系统,其特征是,所述系统包括:
检索单元,用于在认证测试过程中,采用事件关键词检索测试主机的内核日志;
第一文件生成单元,用于筛选出所述内核日志中包含所述事件关键词的日志信息,形成第一文件;
第二文件生成单元,在经过设定时间段后,再次筛选出所述内核日志中包含所述事件关键词的日志信息,形成第二文件;
故障瞬时日志收集单元,用于当所述第一文件和第二文件不同时,收集测试控制器内的故障瞬时日志;
所述事件关键词为其出现会导致测试失败的词;
所述事件关键词包括多个,对于每个所述事件关键词分别依次执行检索单元、第一文件生成单元、第二文件生成单元、故障瞬时日志收集单元的对应操作;
筛选出的日志信息中,截取最新的一条或多条信息,形成第一文件;
所述第二文件的起始信息与所述第一文件的起始信息相同,第二文件的终止信息为日志信息中最新的一条信息。
7.一种计算机存储介质,所述计算机存储介质中存储有计算机指令,其特征是,所述计算机指令在权利要求6所述系统上运行时,使所述系统执行如权利要求1-4任一项所述方法的步骤。
CN202110984869.4A 2021-08-25 2021-08-25 一种收集认证测试中故障瞬时日志的方法及系统 Active CN113867998B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110984869.4A CN113867998B (zh) 2021-08-25 2021-08-25 一种收集认证测试中故障瞬时日志的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110984869.4A CN113867998B (zh) 2021-08-25 2021-08-25 一种收集认证测试中故障瞬时日志的方法及系统

Publications (2)

Publication Number Publication Date
CN113867998A CN113867998A (zh) 2021-12-31
CN113867998B true CN113867998B (zh) 2023-08-15

Family

ID=78988369

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110984869.4A Active CN113867998B (zh) 2021-08-25 2021-08-25 一种收集认证测试中故障瞬时日志的方法及系统

Country Status (1)

Country Link
CN (1) CN113867998B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107479994A (zh) * 2016-06-07 2017-12-15 阿里巴巴集团控股有限公司 一种基于分布式软件系统的日志文件处理方法、装置
CN110704287A (zh) * 2019-08-31 2020-01-17 苏州浪潮智能科技有限公司 Linux系统下RAID卡异常日志收集方法、系统及存储介质
CN110750416A (zh) * 2019-09-21 2020-02-04 苏州浪潮智能科技有限公司 一种故障信息自动化处理的方法及装置
CN111309510A (zh) * 2020-02-23 2020-06-19 苏州浪潮智能科技有限公司 一种解析vsan认证测试失败信息的方法和设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107479994A (zh) * 2016-06-07 2017-12-15 阿里巴巴集团控股有限公司 一种基于分布式软件系统的日志文件处理方法、装置
CN110704287A (zh) * 2019-08-31 2020-01-17 苏州浪潮智能科技有限公司 Linux系统下RAID卡异常日志收集方法、系统及存储介质
CN110750416A (zh) * 2019-09-21 2020-02-04 苏州浪潮智能科技有限公司 一种故障信息自动化处理的方法及装置
CN111309510A (zh) * 2020-02-23 2020-06-19 苏州浪潮智能科技有限公司 一种解析vsan认证测试失败信息的方法和设备

Also Published As

Publication number Publication date
CN113867998A (zh) 2021-12-31

Similar Documents

Publication Publication Date Title
US7992040B2 (en) Root cause analysis by correlating symptoms with asynchronous changes
US10810074B2 (en) Unified error monitoring, alerting, and debugging of distributed systems
US10102113B2 (en) Software test automation systems and methods
US8140565B2 (en) Autonomic information management system (IMS) mainframe database pointer error diagnostic data extraction
CN107688531A (zh) 数据库集成测试方法、装置、计算机设备及存储介质
US20100131315A1 (en) Resolving incident reports
Zhang et al. Onion: identifying incident-indicating logs for cloud systems
Dong et al. Practical and accurate pinpointing of configuration errors using static analysis
CN112650688B (zh) 自动化回归测试方法、关联设备以及计算机程序产品
EP3200080A1 (en) Methods and systems for memory suspect detection
Syer et al. Identifying performance deviations in thread pools
CN108572895B (zh) 一种Linux下自动检查软硬件配置的稳定性测试方法
Wendland et al. Andror2: A dataset of manually-reproduced bug reports for android apps
Ali et al. [Retracted] Classification and Prediction of Software Incidents Using Machine Learning Techniques
CN110750416A (zh) 一种故障信息自动化处理的方法及装置
US20130318499A1 (en) Test script generation
CN113867998B (zh) 一种收集认证测试中故障瞬时日志的方法及系统
CN111435327B (zh) 一种日志记录的处理方法、装置及系统
Zhang et al. BuildSheriff: Change-aware test failure triage for continuous integration builds
CN113468029A (zh) 日志管理方法、装置、电子设备和可读存储介质
CN113849329A (zh) 一种操作系统的日志分析整合方法和系统
CN112988503A (zh) 分析方法、分析装置、电子装置和存储介质
Chiarini Provenance for system troubleshooting
Murtaza et al. F007: finding rediscovered faults from the field using function-level failed traces of software in the field
CN117439871B (zh) 抄表故障定位方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant