CN113505017B - 一种问题排查方法、装置、存储介质和设备 - Google Patents

一种问题排查方法、装置、存储介质和设备 Download PDF

Info

Publication number
CN113505017B
CN113505017B CN202110805845.8A CN202110805845A CN113505017B CN 113505017 B CN113505017 B CN 113505017B CN 202110805845 A CN202110805845 A CN 202110805845A CN 113505017 B CN113505017 B CN 113505017B
Authority
CN
China
Prior art keywords
value
time
database
waiting
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110805845.8A
Other languages
English (en)
Other versions
CN113505017A (zh
Inventor
申红芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202110805845.8A priority Critical patent/CN113505017B/zh
Publication of CN113505017A publication Critical patent/CN113505017A/zh
Application granted granted Critical
Publication of CN113505017B publication Critical patent/CN113505017B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0715Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a system implementing multitasking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种问题排查方法、装置、存储介质和设备,在检测到交易服务的响应时间大于第一预设时长的情况,获取响应时间中的各类等待时间,并计算每类等待时间与响应时间的占比,得到第一数值、第二数值和第三数值。对第一数值、第二数值和第三数值进行比较。在第一数值最大的情况下,提示数据库存在性能问题。在第二数值最大的情况下,提示交易中间件存在性能问题。在第三数值最大的情况下,提示交易服务存在性能问题。利用本申请所示方法,相较于现有技术,基于交易服务中各类等待时间和访问时间,进行针对性地问题排查,避免盲目地进行地毯式为题排查,减少问题排查所花费的时间,从而有效提高问题排查的效率。

Description

一种问题排查方法、装置、存储介质和设备
技术领域
本申请涉及数据处理领域,尤其涉及一种问题排查方法、装置、存储介质和设备。
背景技术
大型主机是IBM公司提供的一种具有高并发大数据处理能力的计算机平台,大型主机的集中部署和处理模式,在并发处理能力、交易数据一致性方面具有明显优势,这也是其广泛应用于全球众多大型银行、证券、保险等企业的重要原因。某些大型银行的核心系统采用了交易中间件(Customer Information Control System,CICS)和数据库(Information Management System,IMS)的架构,银行外部终端通过运行在主机平台上的交易中间件来访问存放在IMS里的核心数据,以完成银行联机交易和账务批处理。
在大型主机批量和联机集中部署架构下,在交易量突增或者集中处理某一类交易业务时,会对主机的资源造成一定的压力,易造成联机交易性能波动,进而可能影响用户体验。例如,在集中处理类似联机代收代付批处理时,可能某个对公商户账号集中入账发生数据库锁(LOCK)等待,进而影响到其他访问同一个数据库的交易服务。如果不能快速排查问题,可能会对银行业务造成较大影响。
目前,传统的问题排查方法为:针对主机操作系统、交易中间件、IMS三个组件,分头分析各个组件的相关资源是否发生故障或者性能问题,然后在对各个组件进行关联分析,得到问题所在。整个分析过程显得比较复杂,没有一个整体的流程来指导,排查效率较低,效果也不太令人满意。
为此,如何提高问题的排查效率,成为本领域亟需解决的问题。
发明内容
本申请提供了一种问题排查方法、装置、存储介质和设备,目的在于提高交易性能问题的排查效率。
为了实现上述目的,本申请提供了以下技术方案:
一种问题排查方法,包括:
在检测到交易服务的响应时间大于第一预设时长的情况,获取所述响应时间中的各类等待时间,并计算每类所述等待时间与所述响应时间的占比,得到第一数值、第二数值和第三数值;其中,所述各类等待时间包括等待数据库响应的时间、等待调度的时间、等待网络通信的时间;所述第一数值为所述等待数据库响应的时间与所述响应时间的占比,所述第二数值为所述等待调度的时间与所述响应时间的占比,所述第三数值为所述等待网络通信的时间与所述响应时间的占比;
对所述第一数值、所述第二数值和所述第三数值进行比较;
在所述第一数值最大的情况下,提示数据库存在性能问题;
在所述第二数值最大的情况下,提示交易中间件存在性能问题;
在所述第三数值最大的情况下,提示所述交易服务存在性能问题。
可选的,所述各类等待时间还包括数据同步的时间;
所述在所述第一数值最大的情况下,提示数据库存在性能问题,包括:
在第一数值最大的情况下,判断所述第一数值是否小于预设阈值;
在所述第一数值小于所述预设阈值的情况下,判断所述数据同步的时间是否大于第二预设时长;
在所述数据同步的时间不大于所述第二预设时长的情况下,提示所述数据库存在性能问题。
可选的,还包括:
在所述数据同步的时间大于所述第二预设时长的情况下,提示所述数据库内部发生资源争抢。
可选的,还包括:
在所述第一数值不小于所述预设阈值的情况下,获取数据库的日志;其中,所述日志用于指示所述交易服务在所述数据库中所经历的各类访问时间;所述访问时间包括第一访问时间、第二访问时间、第三访问时间、第四访问时间;
计算每类所述访问时间与所述等待数据库响应的时间的占比,得到第四数值、第五数值、第六数值和第七数值;所述第四数值为所述第一访问时间与所述等待数据库响应的时间的占比,所述第五数值为所述第二访问时间与所述等待数据库响应的时间的占比,所述第六数值为所述第三访问时间与所述等待数据库响应的时间的占比,所述第七数值为所述第四访问时间与所述等待数据库响应的时间的占比;
对所述第四数值、所述第五数值、所述第六数值和所述第七数值进行比较;
在所述第四数值最大的情况下,提示所述数据库的等待锁故障。
可选的,还包括:
在所述第五数值最大的情况下,提示所述数据库所属的磁盘存在性能问题。
可选的,还包括:
在所述第六数值或所述第七数值最大的情况下,提示主机访问所述数据库的频率过高。
一种问题排查装置,包括:
计算单元,用于在检测到交易服务的响应时间大于第一预设时长的情况,获取所述响应时间中的各类等待时间,并计算每类所述等待时间与所述响应时间的占比,得到第一数值、第二数值和第三数值;其中,所述各类等待时间包括等待数据库响应的时间、等待调度的时间、等待网络通信的时间;所述第一数值为所述等待数据库响应的时间与所述响应时间的占比,所述第二数值为所述等待调度的时间与所述响应时间的占比,所述第三数值为所述等待网络通信的时间与所述响应时间的占比;
比较单元,用于对所述第一数值、所述第二数值和所述第三数值进行比较;
第一提示单元,用于在所述第一数值最大的情况下,提示数据库存在性能问题;
第二提示单元,用于在所述第二数值最大的情况下,提示交易中间件存在性能问题;
第三提示单元,用于在所述第三数值最大的情况下,提示所述交易服务存在性能问题。
可选的,所述各类等待时间还包括数据同步的时间;
所述第一提示单元具体用于:
在第一数值最大的情况下,判断所述第一数值是否小于预设阈值;
在所述第一数值小于所述预设阈值的情况下,判断所述数据同步的时间是否大于第二预设时长;
在所述数据同步的时间不大于所述第二预设时长的情况下,提示所述数据库存在性能问题。
一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,所述程序执行所述的问题排查方法。
一种问题排查设备,包括:处理器、存储器和总线;所述处理器与所述存储器通过所述总线连接;
所述存储器用于存储程序,所述处理器用于运行程序,其中,所述程序运行时执行所述的问题排查方法。
本申请提供的技术方案,在检测到交易服务的响应时间大于第一预设时长的情况,获取响应时间中的各类等待时间,并计算每类等待时间与响应时间的占比,得到第一数值、第二数值和第三数值。其中,各类等待时间包括等待数据库响应的时间、等待调度的时间、等待网络通信的时间。第一数值为等待数据库响应的时间与响应时间的占比,第二数值为等待调度的时间与响应时间的占比,第三数值为等待网络通信的时间与响应时间的占比。对第一数值、第二数值和第三数值进行比较。在第一数值最大的情况下,提示数据库存在性能问题。在第二数值最大的情况下,提示交易中间件存在性能问题。在第三数值最大的情况下,提示交易服务存在性能问题。利用本申请所示方法,相较于现有技术,基于交易服务中各类等待时间和访问时间,进行针对性地问题排查,避免盲目地进行地毯式为题排查,减少问题排查所花费的时间,从而有效提高问题排查的效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a为本申请实施例提供的一种问题排查方法的示意图;
图1b为本申请实施例提供的一种问题排查方法的示意图;
图1c为本申请实施例提供的一种数据库数据运行记录图;
图1d为本申请实施例提供的另一种数据库数据运行记录图;
图1e为本申请实施例提供的另一种数据库数据运行记录图;
图1f为本申请实施例提供的另一种数据库数据运行记录图;
图2为本申请实施例提供的另一种问题排查方法的示意图;
图3为本申请实施例提供的一种问题排查装置的架构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1a和图1b所示,为本申请实施例提供的一种问题排查方法的示意图,包括如下步骤:
S101:在检测到交易服务的响应时间大于第一预设时长的情况,获取响应时间中的各类等待时间,并计算每类等待时间与响应时间的占比,得到第一数值、第二数值和第三数值。
其中,各类等待时间包括:等待数据库响应的时间,等待调度的时间,等待网络通信的时间,以及数据同步的时间。第一数值为等待数据库响应的时间与响应时间的占比,第二数值为等待调度的时间与响应时间的占比,第三数值为等待网络通信的时间与响应时间的占比。
一般来讲,第一数值、第二数值和第三数值的和值,等于交易服务的响应时间。具体的,交易服务的响应时间、等待数据库响应的时间、等待调度的时间、等待网络通信的时间,可以参见图1c,在图1c中,Response Time代表交易服务的响应时间,IMS Wait Time代表等待IMS响应的时间,LU62Wait Time代表等待网络通信的时间,Disp Wait Time代表等待调度的时间。
S102:对第一数值、第二数值和第三数值进行比较。
S103:在第一数值最大的情况下,判断第一数值是否小于预设阈值。
第一数值小于预设阈值,则执行S110,否则执行S104。
S104:获取数据库的日志。
其中,对于本申请实施例所示的IMS数据库,可以运行“DFSKDBC0”指令,获取得到数据库的日志。一般来讲,数据库的日志用于指示交易服务在数据库中所经历的各类访问时间。访问时间包括:第一访问时间,第二访问时间,第三访问时间,以及第四访问时间。
在本申请实施例中,第一访问时间为执行数据库中的LWT语句所花费的时间,第一访问时间为执行数据库中的IOT语句所花费的时间,第三访问时间为执行数据库中的DLI语句所花费的时间,第四访问时间为执行数据库中的DEC所花费的时间,具体的访问时间,可参见图1d所示。
需要说明的是,若第一数值最大,则代表交易服务所经历的时间,大部分花费在等待IMS响应的过程中,故认为数据库存在性能问题,需要进一步分析交易服务所访问的数据库的性能。
S105:计算每类访问时间与等待数据库响应的时间的占比,得到第四数值、第五数值、第六数值和第七数值。
其中,第四数值为第一访问时间与等待数据库响应的时间的占比,第五数值为第二访问时间与等待数据库响应的时间的占比,第六数值为第三访问时间与等待数据库响应的时间的占比,第七数值为第四访问时间与等待数据库响应的时间的占比。
一般来讲,第四数值、第五数值、第六数值和第七数值的和值,等于第一数值。
S106:对第四数值、第五数值、第六数值和第七数值进行比较。
S107:在第四数值最大的情况下,提示数据库的等待锁故障。
其中,若第四数值最大,则代表交易服务在数据库中所经历的时间,大部分花费在等待锁的过程中,故认为数据库的等待锁故障。
需要说明的是,若确定数据库的等待锁故障,则需要分析交易服务在访问哪个数据库时发生资源等待,具体的,可以运行“DFSKLT×0”指令,获取各个数据库的等待锁报告,解析各个等待锁报告,得到交易服务在各个数据库中的资源使用情况(可以参见图1e所示,图1e中所示内容均为本领域技术人员所熟悉的公知常识,这里不再赘述),并将存在交易服务资源使用记录的数据库,作为发生资源等待的数据库(即确定该数据库的等待锁故障)。
具体的,交易服务在数据库中的资源使用情况,如图1e所示。在图1e中,DB代表数据库的名称,RBA/HASH代表交易服务访问数据所在VSAM文件的RBA值,基于RBA值可以获取交易服务访问数据库的记录。
S108:在第五数值最大的情况下,提示数据库所属的磁盘存在性能问题。
其中,若第五数值最大,则代表交易服务在数据库中所经历的时间,大部分花费在磁盘数据的读取过程中,故认为数据库所属的磁盘存在性能问题。
S109:在第六数值或第七数值最大的情况下,提示主机访问数据库的频率过高。
其中,若第六数值或第七数值最大,则代表交易服务在数据库中所经历的时间,大部分花费在访问数据库的过程中,一般来讲,预设时间段内主机访问数据库的次数过多,会导致数据库的访问时间延长,从而影响交易服务的执行效率。
S110:判断数据同步的时间是否大于第二预设时长。
若数据同步的时间大于第二预设时长,则执行S111,否则执行S112。
S111:提示数据库内部发生资源争抢。
其中,若数据同步的时间大于第二预设时长,则代表数据库内部发生资源争抢,从而影响交易服务的执行效率。
S112:提示数据库存在性能问题。
其中,若确定数据存在性能问题,则可以通过查询交易服务的交易跟踪报告,得到交易服务在访问数据时执行每个访问语句(即DLI CALL)所消耗的时间,并对每个访问语句所消耗的时间进行比对,得到交易服务在数据库中的微观行为(如图1f所示),依据微观行为锁定单个数据库进行分析。
S113:在第二数值最大的情况下,提示交易中间件存在性能问题。
其中,若第二数值最大,则代表交易服务所经历的时间,大部分花费在等待调度的过程中,故认为交易中间件存在性能问题。
需要说明的是,若确定交易中间件存在性能问题,则可以通过分析交易中间件的CPU使用率和应用所属系统的CPU使用率,获悉等待调度的原因。
S114:在第三数值最大的情况下,提示交易服务存在性能问题。
其中,交易服务的性能问题包括但不限于为:网络故障、以及交易服务的数据源发生故障。
基于上述S101-S114所示流程,建立一套多维度问题排查的流程,从交易分析入手,一层一层拨开迷雾,从宏观交易到交易内部的微观表现,从整体到局部有逻辑地推理探究式地分析问题,以最终找到导致交易性能的根本原因。采用所示流程,可以避免传统分析方法的盲目性,不用大范围地所有组件进行地毯式搜索,而是根据分析方法进行,一条线精准定位问题。一方面可以提高分析效率,更早定位问题排除故障,以减少交易性能对主机的影响,另一方面可以节省人力成本和分析时间。基于S101-S114所示流程,不仅可以准确进行问题定位,而且还根据问题提出有针对性的优化措施(例如调整数据库日志的摆放、控制批量作业的并发度、调整数据库的buffer数量、优化作业调度关系、精简数据库访问等)。
综上所述,利用本实施例所示方法,相较于现有技术,基于交易服务中各类等待时间和访问时间,进行针对性地问题排查,避免盲目地进行地毯式为题排查,减少问题排查所花费的时间,从而有效提高问题排查的效率。
需要说明的是,上述实施例提及的S105,为本申请所述问题排查方法的一种可选的实现方式。此外,上述实施例提及的S108,也为本申请所述问题排查方法的一种可选的实现方式。为此,上述实施例提及的流程,可以概括为图2所示的方法。
如图2所示,为本申请实施例提供的另一种问题排查方法的示意图,包括如下步骤:
S201:在检测到交易服务的响应时间大于第一预设时长的情况,获取响应时间中的各类等待时间,并计算每类等待时间与响应时间的占比,得到第一数值、第二数值和第三数值。
其中,各类等待时间包括等待数据库响应的时间、等待调度的时间、等待网络通信的时间;第一数值为等待数据库响应的时间与响应时间的占比,第二数值为等待调度的时间与响应时间的占比,第三数值为等待网络通信的时间与响应时间的占比。
S202:对第一数值、第二数值和第三数值进行比较。
S203:在第一数值最大的情况下,提示数据库存在性能问题。
S204:在第二数值最大的情况下,提示交易中间件存在性能问题。
S205:在第三数值最大的情况下,提示交易服务存在性能问题。
综上所述,利用本实施例所示方法,相较于现有技术,基于交易服务中各类等待时间和访问时间,进行针对性地问题排查,避免盲目地进行地毯式为题排查,减少问题排查所花费的时间,从而有效提高问题排查的效率。
与上述本申请实施例提供的问题排查方法相对应,本申请实施例还提供了一种问题排查装置。
如图3所示,为本申请实施例提供的一种问题排查装置的架构示意图,包括:
计算单元100,用于在检测到交易服务的响应时间大于第一预设时长的情况,获取响应时间中的各类等待时间,并计算每类等待时间与响应时间的占比,得到第一数值、第二数值和第三数值;其中,各类等待时间包括等待数据库响应的时间、等待调度的时间、等待网络通信的时间;第一数值为等待数据库响应的时间与响应时间的占比,第二数值为等待调度的时间与响应时间的占比,第三数值为等待网络通信的时间与响应时间的占比。
其中,各类等待时间还包括数据同步的时间。
比较单元200,用于对第一数值、第二数值和第三数值进行比较。
第一提示单元300,用于在第一数值最大的情况下,提示数据库存在性能问题。
其中,第一提示单元300具体用于:在第一数值最大的情况下,判断第一数值是否小于预设阈值;在第一数值小于预设阈值的情况下,判断数据同步的时间是否大于第二预设时长;在数据同步的时间不大于第二预设时长的情况下,提示数据库存在性能问题。
第一提示单元300还用于:在数据同步的时间大于第二预设时长的情况下,提示数据库内部发生资源争抢。
第一提示单元300还用于:在第一数值不小于预设阈值的情况下,获取数据库的日志;其中,日志用于指示交易服务在数据库中所经历的各类访问时间;访问时间包括第一访问时间、第二访问时间、第三访问时间、第四访问时间;计算每类访问时间与等待数据库响应的时间的占比,得到第四数值、第五数值、第六数值和第七数值;第四数值为第一访问时间与等待数据库响应的时间的占比,第五数值为第二访问时间与等待数据库响应的时间的占比,第六数值为第三访问时间与等待数据库响应的时间的占比,第七数值为第四访问时间与等待数据库响应的时间的占比;对第四数值、第五数值、第六数值和第七数值进行比较;在第四数值最大的情况下,提示数据库的等待锁故障。
第一提示单元300还用于:在第五数值最大的情况下,提示数据库所属的磁盘存在性能问题。
第一提示单元300还用于:在第六数值或第七数值最大的情况下,提示主机访问数据库的频率过高。
第二提示单元400,用于在第二数值最大的情况下,提示交易中间件存在性能问题。
第三提示单元500,用于在第三数值最大的情况下,提示交易服务存在性能问题。
综上所述,利用本实施例所示方法,相较于现有技术,基于交易服务中各类等待时间和访问时间,进行针对性地问题排查,避免盲目地进行地毯式为题排查,减少问题排查所花费的时间,从而有效提高问题排查的效率。
本申请还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,程序执行上述本申请提供的问题排查方法。
本申请还提供了一种问题排查设备,包括:处理器、存储器和总线。处理器与存储器通过总线连接,存储器用于存储程序,处理器用于运行程序,其中,程序运行时执行上述本申请提供的问题排查方法,包括如下步骤:
在检测到交易服务的响应时间大于第一预设时长的情况,获取所述响应时间中的各类等待时间,并计算每类所述等待时间与所述响应时间的占比,得到第一数值、第二数值和第三数值;其中,所述各类等待时间包括等待数据库响应的时间、等待调度的时间、等待网络通信的时间;所述第一数值为所述等待数据库响应的时间与所述响应时间的占比,所述第二数值为所述等待调度的时间与所述响应时间的占比,所述第三数值为所述等待网络通信的时间与所述响应时间的占比;
对所述第一数值、所述第二数值和所述第三数值进行比较;
在所述第一数值最大的情况下,提示数据库存在性能问题;
在所述第二数值最大的情况下,提示交易中间件存在性能问题;
在所述第三数值最大的情况下,提示所述交易服务存在性能问题。
可选的,所述各类等待时间还包括数据同步的时间;
所述在所述第一数值最大的情况下,提示数据库存在性能问题,包括:
在第一数值最大的情况下,判断所述第一数值是否小于预设阈值;
在所述第一数值小于所述预设阈值的情况下,判断所述数据同步的时间是否大于第二预设时长;
在所述数据同步的时间不大于所述第二预设时长的情况下,提示所述数据库存在性能问题。
可选的,还包括:
在所述数据同步的时间大于所述第二预设时长的情况下,提示所述数据库内部发生资源争抢。
可选的,还包括:
在所述第一数值不小于所述预设阈值的情况下,获取数据库的日志;其中,所述日志用于指示所述交易服务在所述数据库中所经历的各类访问时间;所述访问时间包括第一访问时间、第二访问时间、第三访问时间、第四访问时间;
计算每类所述访问时间与所述等待数据库响应的时间的占比,得到第四数值、第五数值、第六数值和第七数值;所述第四数值为所述第一访问时间与所述等待数据库响应的时间的占比,所述第五数值为所述第二访问时间与所述等待数据库响应的时间的占比,所述第六数值为所述第三访问时间与所述等待数据库响应的时间的占比,所述第七数值为所述第四访问时间与所述等待数据库响应的时间的占比;
对所述第四数值、所述第五数值、所述第六数值和所述第七数值进行比较;
在所述第四数值最大的情况下,提示所述数据库的等待锁故障。
可选的,还包括:
在所述第五数值最大的情况下,提示所述数据库所属的磁盘存在性能问题。
可选的,还包括:
在所述第六数值或所述第七数值最大的情况下,提示主机访问所述数据库的频率过高。
本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (7)

1.一种问题排查方法,其特征在于,包括:
在检测到交易服务的响应时间大于第一预设时长的情况,获取所述响应时间中的各类等待时间,并计算每类所述等待时间与所述响应时间的占比,得到第一数值、第二数值和第三数值;其中,所述各类等待时间包括等待数据库响应的时间、等待调度的时间、等待网络通信的时间和数据同步的时间;所述第一数值为所述等待数据库响应的时间与所述响应时间的占比,所述第二数值为所述等待调度的时间与所述响应时间的占比,所述第三数值为所述等待网络通信的时间与所述响应时间的占比;
对所述第一数值、所述第二数值和所述第三数值进行比较;
在所述第一数值最大的情况下,提示数据库存在性能问题;
在所述第二数值最大的情况下,提示交易中间件存在性能问题;
在所述第三数值最大的情况下,提示所述交易服务存在性能问题;
所述在所述第一数值最大的情况下,提示数据库存在性能问题,包括:
在第一数值最大的情况下,判断所述第一数值是否小于预设阈值;
在所述第一数值小于所述预设阈值的情况下,判断所述数据同步的时间是否大于第二预设时长;
在所述数据同步的时间不大于所述第二预设时长的情况下,提示所述数据库存在性能问题;
在所述第一数值不小于所述预设阈值的情况下,获取数据库的日志;其中,所述日志用于指示所述交易服务在所述数据库中所经历的各类访问时间;所述访问时间包括第一访问时间、第二访问时间、第三访问时间、第四访问时间;
计算每类所述访问时间与所述等待数据库响应的时间的占比,得到第四数值、第五数值、第六数值和第七数值;所述第四数值为所述第一访问时间与所述等待数据库响应的时间的占比,所述第五数值为所述第二访问时间与所述等待数据库响应的时间的占比,所述第六数值为所述第三访问时间与所述等待数据库响应的时间的占比,所述第七数值为所述第四访问时间与所述等待数据库响应的时间的占比;
对所述第四数值、所述第五数值、所述第六数值和所述第七数值进行比较;
在所述第四数值最大的情况下,提示所述数据库的等待锁故障。
2.根据权利要求1所述的方法,其特征在于,还包括:
在所述数据同步的时间大于所述第二预设时长的情况下,提示所述数据库内部发生资源争抢。
3.根据权利要求1所述的方法,其特征在于,还包括:
在所述第五数值最大的情况下,提示所述数据库所属的磁盘存在性能问题。
4.根据权利要求1所述的方法,其特征在于,还包括:
在所述第六数值或所述第七数值最大的情况下,提示主机访问所述数据库的频率过高。
5.一种问题排查装置,其特征在于,包括:
计算单元,用于在检测到交易服务的响应时间大于第一预设时长的情况,获取所述响应时间中的各类等待时间,并计算每类所述等待时间与所述响应时间的占比,得到第一数值、第二数值和第三数值;其中,所述各类等待时间包括等待数据库响应的时间、等待调度的时间、等待网络通信的时间和数据同步的时间;所述第一数值为所述等待数据库响应的时间与所述响应时间的占比,所述第二数值为所述等待调度的时间与所述响应时间的占比,所述第三数值为所述等待网络通信的时间与所述响应时间的占比;
比较单元,用于对所述第一数值、所述第二数值和所述第三数值进行比较;
第一提示单元,用于在所述第一数值最大的情况下,提示数据库存在性能问题;
第二提示单元,用于在所述第二数值最大的情况下,提示交易中间件存在性能问题;
第三提示单元,用于在所述第三数值最大的情况下,提示所述交易服务存在性能问题;
其中,所述第一提示单元具体用于:
在第一数值最大的情况下,判断所述第一数值是否小于预设阈值;
在所述第一数值小于所述预设阈值的情况下,判断所述数据同步的时间是否大于第二预设时长;
在所述数据同步的时间不大于所述第二预设时长的情况下,提示所述数据库存在性能问题;
在所述第一数值不小于所述预设阈值的情况下,获取数据库的日志;其中,所述日志用于指示所述交易服务在所述数据库中所经历的各类访问时间;所述访问时间包括第一访问时间、第二访问时间、第三访问时间、第四访问时间;
计算每类所述访问时间与所述等待数据库响应的时间的占比,得到第四数值、第五数值、第六数值和第七数值;所述第四数值为所述第一访问时间与所述等待数据库响应的时间的占比,所述第五数值为所述第二访问时间与所述等待数据库响应的时间的占比,所述第六数值为所述第三访问时间与所述等待数据库响应的时间的占比,所述第七数值为所述第四访问时间与所述等待数据库响应的时间的占比;
对所述第四数值、所述第五数值、所述第六数值和所述第七数值进行比较;
在所述第四数值最大的情况下,提示所述数据库的等待锁故障。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,所述程序执行权利要求1-4任一所述的问题排查方法。
7.一种问题排查设备,其特征在于,包括:处理器、存储器和总线;所述处理器与所述存储器通过所述总线连接;
所述存储器用于存储程序,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1-4任一所述的问题排查方法。
CN202110805845.8A 2021-07-16 2021-07-16 一种问题排查方法、装置、存储介质和设备 Active CN113505017B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110805845.8A CN113505017B (zh) 2021-07-16 2021-07-16 一种问题排查方法、装置、存储介质和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110805845.8A CN113505017B (zh) 2021-07-16 2021-07-16 一种问题排查方法、装置、存储介质和设备

Publications (2)

Publication Number Publication Date
CN113505017A CN113505017A (zh) 2021-10-15
CN113505017B true CN113505017B (zh) 2024-07-19

Family

ID=78013580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110805845.8A Active CN113505017B (zh) 2021-07-16 2021-07-16 一种问题排查方法、装置、存储介质和设备

Country Status (1)

Country Link
CN (1) CN113505017B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117234786B (zh) * 2023-11-10 2024-02-20 江西师范大学 基于大数据的计算机性能控制分析系统及方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407085A (zh) * 2016-11-24 2017-02-15 中国银行股份有限公司 一种性能监控方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105955869A (zh) * 2016-05-12 2016-09-21 捷开通讯科技(上海)有限公司 电子装置异常应用程序监控及处理系统与方法
CN106339296A (zh) * 2016-08-31 2017-01-18 虎扑(上海)文化传播股份有限公司 服务状态监测方法和装置
CN111092811B (zh) * 2018-10-24 2021-11-26 北京金山云网络技术有限公司 一种请求处理方法、装置及api网关和可读存储介质
CN112131077B (zh) * 2020-09-21 2024-09-03 中国建设银行股份有限公司 故障节点的定位方法和定位装置、以及数据库集群系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407085A (zh) * 2016-11-24 2017-02-15 中国银行股份有限公司 一种性能监控方法及装置

Also Published As

Publication number Publication date
CN113505017A (zh) 2021-10-15

Similar Documents

Publication Publication Date Title
CN109284269B (zh) 异常日志分析方法、装置、存储介质及服务器
CN107451040B (zh) 故障原因的定位方法、装置及计算机可读存储介质
US8516499B2 (en) Assistance in performing action responsive to detected event
US9087102B2 (en) Adaptive query processing infrastructure
US20100094592A1 (en) Using Application Performance Signatures For Characterizing Application Updates
JP2006505062A5 (zh)
US20090307347A1 (en) Using Transaction Latency Profiles For Characterizing Application Updates
CN113157411B (zh) 一种基于Celery的可靠可配置任务系统及装置
CN112882911A (zh) 异常性能行为检测方法、系统、装置及存储介质
US20180189498A1 (en) Device monitoring policy
CN113505017B (zh) 一种问题排查方法、装置、存储介质和设备
CN111241059A (zh) 一种基于数据库的数据库优化方法及装置
CN111897696A (zh) 服务器集群硬盘状态检测方法、装置、电子设备及存储介质
CN112100070A (zh) 版本缺陷的检测方法、装置、服务器及存储介质
US20220027365A1 (en) Enterprise resource planning system, server and supervision method of sql queries in such a system or server
CN113886205A (zh) 数据库性能瓶颈定位分析方法、装置、系统及存储介质
CN110851347B (zh) 一种集群环境下的安全加固软件的自检系统及方法
CN116501468A (zh) 批量作业处理方法、装置及电子设备
CN114880157B (zh) 一种故障注入方法及装置
CN116302652A (zh) 系统报警信息的处理方法、装置及电子设备
CN112631771B (zh) 一种大数据系统的并行处理方法
CN108874325B (zh) 数据打印方法及系统
CN114817010A (zh) 一种基于Python的Redfish自动化测试方法及装置
CN110543349B (zh) 一种应用启动加速方法、装置及计算机可读存储介质
CN114064488A (zh) 交易测试方法、装置、存储介质和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant