CN112380042A - 数据库软件的故障定位与分析方法、装置及存储介质 - Google Patents

数据库软件的故障定位与分析方法、装置及存储介质 Download PDF

Info

Publication number
CN112380042A
CN112380042A CN202011285047.9A CN202011285047A CN112380042A CN 112380042 A CN112380042 A CN 112380042A CN 202011285047 A CN202011285047 A CN 202011285047A CN 112380042 A CN112380042 A CN 112380042A
Authority
CN
China
Prior art keywords
fault
database software
error
target database
waiting event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011285047.9A
Other languages
English (en)
Other versions
CN112380042B (zh
Inventor
林浩南
黄远邦
刘鹏瑞
冯磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinaetek Service & Technology Co ltd
Original Assignee
Chinaetek Service & Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinaetek Service & Technology Co ltd filed Critical Chinaetek Service & Technology Co ltd
Priority to CN202011285047.9A priority Critical patent/CN112380042B/zh
Publication of CN112380042A publication Critical patent/CN112380042A/zh
Application granted granted Critical
Publication of CN112380042B publication Critical patent/CN112380042B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0718Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in an object-oriented system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis

Abstract

本发明提供一种数据库软件的故障定位与分析方法、装置及存储介质,所述方法包括:从性能和错误两个维度分别提取目标数据库软件在预设时间段内的故障特征,构建故障特征模型;遍历所述故障特征模型,确定验证结果;基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。本发明通过将数据库软件故障的特征模型化,用较少代价准确获得故障根因,可提高数据库运维人员的工作效率,降低业务因数据库故障而受到影响的时间窗口,提高业务系统的利用率。

Description

数据库软件的故障定位与分析方法、装置及存储介质
技术领域
本发明涉及数据库自动化运维技术领域,尤其涉及一种数据库软件的故障定位与分析方法、装置及存储介质。
背景技术
数据库是按照数据结构来组织、存储和管理数据的仓库。数据库软件指的是管理数据库的软件系统。数据库技术的发展,已经成为先进信息技术的重要组成部分,是现代计算机信息系统和计算机应用系统的基础和核心。当今世界上包括金融、制造、运输、行政管理等诸多行业的业务系统的正常运行都离不开数据库软件。数据库软件故障指的是数据库软件在业务生产期间遇到异常,导致业务执行缓慢或中断等现象,将对运行在该数据库基础上的业务系统造成严重影响,例如金融交易无法执行、航班运输受阻、工厂产品生产中断等。
修复数据库故障,恢复业务生产往往需要人工介入,对故障的定位和分析需要数据库运维人员对相应的数据库软件产品有足够全面的管理经验。管理经验丰富程度直接决定了数据库软件和业务系统恢复到正常功能所需要的时间长短。目前减少数据库故障对业务系统造成的影响,主要有下面几种手段:第一、聘请更资深的数据库运维人员,运维人员在对以往故障案例的处理过程中不断积累经验,提高对故障的分析定位效率和解决问题时效;第二、建立故障知识库,对既往发生过的故障不断记录积累,总结处理经验,加快故障处理的效率。
聘请更资深的数据库运维人员主要缺陷在于:人工成本高,如果仅用来应对偶发的数据库故障,人员利用率低。定位和分析故障特征需要耗费大量时间,随着时间的增长,数据库软件的功能也不断增加,运维人员仍需要不断学习和更新知识,成本较高。基于故障知识库主要缺陷在于:需要找到合适的厂商或者运维人员及时更新知识库,成本较高,故障发生时刻、定位和分析故障特征仍然需要耗费时间。
发明内容
本发明提供一种数据库软件的故障定位与分析方法、装置及存储介质,用以解决现有数据库软件故障定位和分析成本高、耗时长、效率低的缺陷,提高运维人员的分析定位效率,减少业务系统故障后运行缓慢和业务中断时间,提高业务系统的利用率。
本发明提供一种数据库软件的故障定位与分析方法,包括:
从性能和错误两个维度分别提取目标数据库软件在预设时间段内的故障特征,构建故障特征模型;
遍历所述故障特征模型,确定验证结果;
基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
根据本发明提供的一种数据库软件的故障定位与分析方法,所述从性能和错误两个维度分别提取目标数据库软件在预设时间段内的故障特征,构建故障特征模型,包括:
提取目标数据库软件在预设时间段内耗时最高的等待事件和所述等待事件对应的标记位;
提取所述目标数据库软件的错误日志信息,并获取所述预设时间段内出现的错误编号和错误标记位;
其中,所述等待事件用于描述每个有效工作会话正在执行的动作标记;
所述等待事件对应的标记位用于描述所述等待事件下的加锁级别或行为特征编码;
所述错误编号用于描述目标数据库软件抛出的错误信息;
所述错误标记位用于对所述目标数据库软件抛出错误信息后附加的特征进行区分。
根据本发明提供的一种数据库软件的故障定位与分析方法,所述遍历所述故障特征模型,确定验证结果,包括:
确定所述等待事件对应的标记位和所述错误标记位的共同验证方法;
对所述共同验证方法进行遍历确认,若符合场景则保留,获得验证结果。
根据本发明提供的一种数据库软件的故障定位与分析方法,所述基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头,包括:
基于故障根因列表,基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
本发明还提供一种数据库软件的故障定位与分析装置,包括:
构建单元,用于从性能和错误两个维度分别提取目标数据库软件在预设时间段内的故障特征,构建故障特征模型;
验证单元,用于遍历所述故障特征模型,确定验证结果;
故障定位单元,用于基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
根据本发明提供的一种数据库软件的故障定位与分析装置,所述构建单元具体用于:
提取目标数据库软件在预设时间段内耗时最高的等待事件和所述等待事件对应的标记位;
提取所述目标数据库软件的错误日志信息,并获取所述预设时间段内出现的错误编号和错误标记位;
其中,所述等待事件用于描述每个有效工作会话正在执行的动作标记;
所述等待事件对应的标记位用于描述所述等待事件下的加锁级别或行为特征编码;
所述错误编号用于描述目标数据库软件抛出的错误信息;
所述错误标记位用于对所述目标数据库软件抛出错误信息后附加的特征进行区分。
根据本发明提供的一种数据库软件的故障定位与分析装置,所述验证单元具体用于:
确定所述等待事件对应的标记位和所述错误标记位的共同验证方法;
对所述共同验证方法进行遍历确认,若符合场景则保留,获得验证结果。
根据本发明提供的一种数据库软件的故障定位与分析装置,其特征在于,所述故障定位单元具体用于:
基于故障根因列表,基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述数据库软件的故障定位与分析方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述数据库软件的故障定位与分析方法的步骤。
本发明提供的数据库软件的故障定位与分析方法、装置及存储介质,通过将数据库软件故障的特征模型化,用较少代价准确获得故障根因,可提高数据库运维人员的工作效率,降低业务因数据库故障而受到影响的时间窗口,提高业务系统的利用率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的数据库软件的故障定位与分析方法的流程示意图;
图2为本发明提供的数据库软件的故障定位与分析装置的结构示意图;
图3为本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图3描述本发明提供的数据库软件的故障定位与分析方法、装置及存储介质。
图1为本发明提供的数据库软件的故障定位与分析方法的流程示意图,包括:
步骤100、从性能和错误两个维度分别提取目标数据库软件在预设时间段内的故障特征,构建故障特征模型;
具体地,本发明首先从性能和错误两个维度提取目标数据库软件在预设时间段内的故障特征。
性能维度,即指考虑数据库软件的性能,可以提取目标数据库软件在最近一段时间内耗时最高的等待事件,耗时最高的等待事件可以反映数据库软件的性能。
错误维度,即考虑数据库软件运行过程中发生的错误信息,可以通过提取目标数据软件的错误日志信息,统计在最近一段时间内出现的错误。
在一个实施例中,所述从性能和错误两个维度分别提取目标数据库软件在预设时间段内的故障特征,构建故障特征模型,包括:
提取目标数据库软件在预设时间段内耗时最高的等待事件和所述等待事件对应的标记位;
提取所述目标数据库软件的错误日志信息,并获取所述预设时间段内出现的错误编号和错误标记位;
其中,所述等待事件用于描述每个有效工作会话正在执行的动作标记;
所述等待事件对应的标记位用于描述所述等待事件下的加锁级别或行为特征编码;
所述错误编号用于描述目标数据库软件抛出的错误信息;
所述错误标记位用于对所述目标数据库软件抛出错误信息后附加的特征进行区分。
具体地,提取目标数据库软件在预设时间段内耗时最高的等待事件和所述等待事件对应的标记位;
其中,所述等待事件用于描述每个有效工作会话正在执行的动作标记;所述等待事件对应的标记位用于描述所述等待事件下的加锁级别或行为特征编码。
例如,可以首先按照每会话每秒进行采样统计,计算每个等待事件的占用百分比,表1为等待事件的占用百分比示例。
表1为等待事件的占用百分比示例
Figure BDA0002782092900000061
Figure BDA0002782092900000071
当获取到占用比例超过预设阈值(如百分之十)的等待事件后,根据等待事件类型的不同,最终获得触发了哪些标记位,表2为等待事件对应的标记位示例。
表2为等待事件对应的标记位示例
EVENT MODE
A 05
B 03
提取所述目标数据库软件的错误日志信息,并获取所述预设时间段内出现的错误编号和错误标记位,其中,所述错误编号用于描述目标数据库软件抛出的错误信息;所述错误标记位用于对所述目标数据库软件抛出错误信息后附加的特征进行区分,表3为错误编号和错误标记位示例。
表3为错误编号和错误标记位示例
特征1 特征2 标记位
A>0 B is not null 01
A>0 B is null 02
A=0 B is not null 03
A=0 B is null 04
目标数据库软件在预设时间段内耗时最高的等待事件和所述等待事件对应的标记位,以及所述目标数据库软件在所述预设时间段内出现的错误编号和错误标记位,构成了故障特征模型。
步骤101、遍历所述故障特征模型,确定验证结果;
具体地,遍历所述故障特征模型是指综合分析从性能和错误两个维度提取出来的标记位,即等待事件对应的标记位和错误标记位,取其共同验证方法进行遍历确认,若符合场景则保留,最终获得验证结果。
在一个实施例中,所述遍历所述故障特征模型,确定验证结果,包括:
确定所述等待事件对应的标记位和所述错误标记位的共同验证方法;
对所述共同验证方法进行遍历确认,若符合所述目标数据库软件的相应故障场景则保留,获得验证结果。
例如,如表4所示,确定需要执行的验证方法为:FUNC-A,FUNC-C,FUNC-D,FUNC-F;
遍历执行上述验证方法(也可以称为特征判断函数),最终获得FUNC-C和FUNC-D两个“验证结果”。
表4标记位和验证方法对照表
类别+标记位 验证方法
EVENT-A+05 FUNC-A,FUNC-C
EVENT-B+03 FUNC-C
ERROR-1234+03 FUNC-F
ERROR-2345+04 FUNC-C,FUNC-D
步骤102、基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
具体地,此步骤验证结果收敛。当数据库软件出现故障时,往往可能出现根因故障点连带出现其他故障点,可以通过梳理根因包含列表,将步骤101得到的验证结果代入,最终给出系统的故障根因。
在一个实施例中,所述基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头,包括:
基于故障根因列表,基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
本发明提供的数据库软件的故障定位与分析方法,通过将数据库软件故障的特征模型化,用较少代价准确获得故障根因,可提高数据库运维人员的工作效率,降低业务因数据库故障而受到影响的时间窗口,提高业务系统的利用率。
下面对本发明提供的数据库软件的故障定位与分析装置进行描述,下文描述的数据库软件的故障定位与分析装置与上文描述的数据库软件的故障定位与分析方法可相互对应参照。
图2为本发明提供的数据库软件的故障定位与分析装置的结构示意图,包括:构建单元210、验证单元220和故障定位单元230,其中,
构建单元210,用于从性能和错误两个维度分别提取目标数据库软件在预设时间段内的故障特征,构建故障特征模型;
验证单元220,用于遍历所述故障特征模型,确定验证结果;
故障定位单元230,用于基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
本发明提供的数据库软件的故障定位与分析装置可以实现上述数据库软件的故障定位与分析方法实施例实现的各个过程,并达到相同的技术效果,为避免重复,这里不再赘述。
可选的,所述构建单元具体用于:
提取目标数据库软件在预设时间段内耗时最高的等待事件和所述等待事件对应的标记位;
提取所述目标数据库软件的错误日志信息,并获取所述预设时间段内出现的错误编号和错误标记位;
其中,所述等待事件用于描述每个有效工作会话正在执行的动作标记;
所述等待事件对应的标记位用于描述所述等待事件下的加锁级别或行为特征编码;
所述错误编号用于描述目标数据库软件抛出的错误信息;
所述错误标记位用于对所述目标数据库软件抛出错误信息后附加的特征进行区分。
可选的,所述验证单元具体用于:
确定所述等待事件对应的标记位和所述错误标记位的共同验证方法;
对所述共同验证方法进行遍历确认,若符合场景则保留,获得验证结果。
可选的,所述故障定位单元具体用于:
基于故障根因列表,基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行数据库软件的故障定位与分析方法,该方法包括:从性能和错误两个维度分别提取目标数据库软件在预设时间段内的故障特征,构建故障特征模型;遍历所述故障特征模型,确定验证结果;基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
可选的,所述从性能和错误两个维度分别提取目标数据库软件在预设时间段内的故障特征,构建故障特征模型,包括:
提取目标数据库软件在预设时间段内耗时最高的等待事件和所述等待事件对应的标记位;
提取所述目标数据库软件的错误日志信息,并获取所述预设时间段内出现的错误编号和错误标记位;
其中,所述等待事件用于描述每个有效工作会话正在执行的动作标记;
所述等待事件对应的标记位用于描述所述等待事件下的加锁级别或行为特征编码;
所述错误编号用于描述目标数据库软件抛出的错误信息;
所述错误标记位用于对所述目标数据库软件抛出错误信息后附加的特征进行区分。
可选的,所述遍历所述故障特征模型,确定验证结果,包括:
确定所述等待事件对应的标记位和所述错误标记位的共同验证方法;
对所述共同验证方法进行遍历确认,若符合场景则保留,获得验证结果。
可选的,所述基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头,包括:
基于故障根因列表,基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的数据库软件的故障定位与分析方法,该方法包括:从性能和错误两个维度分别提取目标数据库软件在预设时间段内的故障特征,构建故障特征模型;遍历所述故障特征模型,确定验证结果;基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
可选的,所述从性能和错误两个维度分别提取目标数据库软件在预设时间段内的故障特征,构建故障特征模型,包括:
提取目标数据库软件在预设时间段内耗时最高的等待事件和所述等待事件对应的标记位;
提取所述目标数据库软件的错误日志信息,并获取所述预设时间段内出现的错误编号和错误标记位;
其中,所述等待事件用于描述每个有效工作会话正在执行的动作标记;
所述等待事件对应的标记位用于描述所述等待事件下的加锁级别或行为特征编码;
所述错误编号用于描述目标数据库软件抛出的错误信息;
所述错误标记位用于对所述目标数据库软件抛出错误信息后附加的特征进行区分。
可选的,所述遍历所述故障特征模型,确定验证结果,包括:
确定所述等待事件对应的标记位和所述错误标记位的共同验证方法;
对所述共同验证方法进行遍历确认,若符合场景则保留,获得验证结果。
可选的,所述基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头,包括:
基于故障根因列表,基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的数据库软件的故障定位与分析方法,该方法包括:从性能和错误两个维度分别提取目标数据库软件在预设时间段内的故障特征,构建故障特征模型;遍历所述故障特征模型,确定验证结果;基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
可选的,所述从性能和错误两个维度分别提取目标数据库软件在预设时间段内的故障特征,构建故障特征模型,包括:
提取目标数据库软件在预设时间段内耗时最高的等待事件和所述等待事件对应的标记位;
提取所述目标数据库软件的错误日志信息,并获取所述预设时间段内出现的错误编号和错误标记位;
其中,所述等待事件用于描述每个有效工作会话正在执行的动作标记;
所述等待事件对应的标记位用于描述所述等待事件下的加锁级别或行为特征编码;
所述错误编号用于描述目标数据库软件抛出的错误信息;
所述错误标记位用于对所述目标数据库软件抛出错误信息后附加的特征进行区分。
可选的,所述遍历所述故障特征模型,确定验证结果,包括:
确定所述等待事件对应的标记位和所述错误标记位的共同验证方法;
对所述共同验证方法进行遍历确认,若符合场景则保留,获得验证结果。
可选的,所述基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头,包括:
基于故障根因列表,基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种数据库软件的故障定位与分析方法,其特征在于,包括:
从性能和错误两个维度分别提取目标数据库软件在预设时间段内的故障特征,构建故障特征模型;
遍历所述故障特征模型,确定验证结果;
基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
2.根据权利要求1所述的数据库软件的故障定位与分析方法,其特征在于,所述从性能和错误两个维度分别提取目标数据库软件在预设时间段内的故障特征,构建故障特征模型,包括:
提取目标数据库软件在预设时间段内耗时最高的等待事件和所述等待事件对应的标记位;
提取所述目标数据库软件的错误日志信息,并获取所述预设时间段内出现的错误编号和错误标记位;
其中,所述等待事件用于描述每个有效工作会话正在执行的动作标记;
所述等待事件对应的标记位用于描述所述等待事件下的加锁级别或行为特征编码;
所述错误编号用于描述目标数据库软件抛出的错误信息;
所述错误标记位用于对所述目标数据库软件抛出错误信息后附加的特征进行区分。
3.根据权利要求2所述的数据库软件的故障定位与分析方法,其特征在于,所述遍历所述故障特征模型,确定验证结果,包括:
确定所述等待事件对应的标记位和所述错误标记位的共同验证方法;
对所述共同验证方法进行遍历确认,若符合场景则保留,获得验证结果。
4.根据权利要求1所述的数据库软件的故障定位与分析方法,其特征在于,所述基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头,包括:
基于故障根因列表,基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
5.一种数据库软件的故障定位与分析装置,其特征在于,包括:
构建单元,用于从性能和错误两个维度分别提取目标数据库软件在预设时间段内的故障特征,构建故障特征模型;
验证单元,用于遍历所述故障特征模型,确定验证结果;
故障定位单元,用于基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
6.根据权利要求5所述的数据库软件的故障定位与分析装置,其特征在于,所述构建单元具体用于:
提取目标数据库软件在预设时间段内耗时最高的等待事件和所述等待事件对应的标记位;
提取所述目标数据库软件的错误日志信息,并获取所述预设时间段内出现的错误编号和错误标记位;
其中,所述等待事件用于描述每个有效工作会话正在执行的动作标记;
所述等待事件对应的标记位用于描述所述等待事件下的加锁级别或行为特征编码;
所述错误编号用于描述目标数据库软件抛出的错误信息;
所述错误标记位用于对所述目标数据库软件抛出错误信息后附加的特征进行区分。
7.根据权利要求6所述的数据库软件的故障定位与分析装置,其特征在于,所述验证单元具体用于:
确定所述等待事件对应的标记位和所述错误标记位的共同验证方法;
对所述共同验证方法进行遍历确认,若符合场景则保留,获得验证结果。
8.根据权利要求5所述的数据库软件的故障定位与分析装置,其特征在于,所述故障定位单元具体用于:
基于故障根因列表,基于所述验证结果进行故障根因,定位所述目标数据库软件的故障源头。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至4任一项所述数据库软件的故障定位与分析方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至4任一项所述数据库软件的故障定位与分析方法的步骤。
CN202011285047.9A 2020-11-17 2020-11-17 数据库软件的故障定位与分析方法、装置及存储介质 Active CN112380042B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011285047.9A CN112380042B (zh) 2020-11-17 2020-11-17 数据库软件的故障定位与分析方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011285047.9A CN112380042B (zh) 2020-11-17 2020-11-17 数据库软件的故障定位与分析方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN112380042A true CN112380042A (zh) 2021-02-19
CN112380042B CN112380042B (zh) 2024-04-12

Family

ID=74584960

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011285047.9A Active CN112380042B (zh) 2020-11-17 2020-11-17 数据库软件的故障定位与分析方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN112380042B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113673745A (zh) * 2021-07-19 2021-11-19 青岛海尔科技有限公司 一种产品优化方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017185945A1 (zh) * 2016-04-29 2017-11-02 中兴通讯股份有限公司 一种故障处理方法及装置
CN108388503A (zh) * 2018-02-13 2018-08-10 中体彩科技发展有限公司 数据库性能监控方法、系统、设备及计算机可读存储介质
CN110708204A (zh) * 2019-11-18 2020-01-17 上海维谛信息科技有限公司 一种基于运维知识库的异常处理方法、系统、终端及介质
CN111209131A (zh) * 2019-12-30 2020-05-29 航天信息股份有限公司广州航天软件分公司 一种基于机器学习确定异构系统的故障的方法和系统
CN111539493A (zh) * 2020-07-08 2020-08-14 北京必示科技有限公司 一种告警预测方法、装置、电子设备及存储介质
CN111581056A (zh) * 2020-05-06 2020-08-25 厦门理工学院 基于人工智能的软件工程数据库维护与预警系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017185945A1 (zh) * 2016-04-29 2017-11-02 中兴通讯股份有限公司 一种故障处理方法及装置
CN108388503A (zh) * 2018-02-13 2018-08-10 中体彩科技发展有限公司 数据库性能监控方法、系统、设备及计算机可读存储介质
CN110708204A (zh) * 2019-11-18 2020-01-17 上海维谛信息科技有限公司 一种基于运维知识库的异常处理方法、系统、终端及介质
CN111209131A (zh) * 2019-12-30 2020-05-29 航天信息股份有限公司广州航天软件分公司 一种基于机器学习确定异构系统的故障的方法和系统
CN111581056A (zh) * 2020-05-06 2020-08-25 厦门理工学院 基于人工智能的软件工程数据库维护与预警系统
CN111539493A (zh) * 2020-07-08 2020-08-14 北京必示科技有限公司 一种告警预测方法、装置、电子设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113673745A (zh) * 2021-07-19 2021-11-19 青岛海尔科技有限公司 一种产品优化方法及系统

Also Published As

Publication number Publication date
CN112380042B (zh) 2024-04-12

Similar Documents

Publication Publication Date Title
US10417072B2 (en) Scalable predictive early warning system for data backup event log
CN110704231A (zh) 一种故障处理方法及装置
CN113282461B (zh) 传输网的告警识别方法和装置
US20100082708A1 (en) System and Method for Management of Performance Fault Using Statistical Analysis
CN110149223B (zh) 故障定位方法和设备
CN113391943B (zh) 一种基于因果推断的微服务故障根因定位方法及装置
WO2023071761A1 (zh) 一种异常定位方法及装置
CN109669844A (zh) 设备故障处理方法、装置、设备和存储介质
CN109544014B (zh) 基于历史数据回放的反欺诈方法及装置
CN111913824B (zh) 确定数据链路故障原因的方法及相关设备
JP6419667B2 (ja) テストdbデータ生成方法及び装置
CN112380042B (zh) 数据库软件的故障定位与分析方法、装置及存储介质
CN103440460A (zh) 一种应用系统变更验证方法及验证系统
CN116074183B (zh) 一种基于规则引擎的c3超时分析方法、装置及设备
CN111522705A (zh) 一种工业大数据智能运维解决方法
CN112966056B (zh) 一种信息处理方法、装置、设备、系统及可读存储介质
CN110727538B (zh) 一种基于模型命中概率分布的故障定位系统及方法
CN111680974B (zh) 电子化承保流程的问题定位方法及装置
CN109685453B (zh) 智能识别工作流有效路径的方法
CN111352818A (zh) 应用程序性能分析方法、装置、存储介质及电子设备
CN114721861B (zh) 一种基于日志差异化比对的故障定位方法与系统
CN106934701B (zh) 一种企业税务风险值计算方法
CN114117077B (zh) 运维知识图谱构建及运维的方法、装置及计算机设备、存储介质
US11749070B2 (en) Identification of anomalies in an automatic teller machine (ATM) network
CN113780597B (zh) 影响传播关系模型构建和告警影响评估方法、计算机设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant