CN113886205B - 数据库性能瓶颈定位分析方法、装置、系统及存储介质 - Google Patents
数据库性能瓶颈定位分析方法、装置、系统及存储介质 Download PDFInfo
- Publication number
- CN113886205B CN113886205B CN202111155840.1A CN202111155840A CN113886205B CN 113886205 B CN113886205 B CN 113886205B CN 202111155840 A CN202111155840 A CN 202111155840A CN 113886205 B CN113886205 B CN 113886205B
- Authority
- CN
- China
- Prior art keywords
- database
- resource consumption
- performance bottleneck
- layer
- monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 128
- 238000000034 method Methods 0.000 claims abstract description 139
- 238000012544 monitoring process Methods 0.000 claims abstract description 114
- 238000012360 testing method Methods 0.000 claims abstract description 88
- 230000008569 process Effects 0.000 claims abstract description 73
- 238000013461 design Methods 0.000 claims abstract description 23
- 238000003745 diagnosis Methods 0.000 claims description 23
- 230000002159 abnormal effect Effects 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 12
- 230000006835 compression Effects 0.000 claims description 10
- 238000007906 compression Methods 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 7
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 claims description 7
- 239000010931 gold Substances 0.000 claims description 7
- 229910052737 gold Inorganic materials 0.000 claims description 7
- 230000004807 localization Effects 0.000 claims description 2
- 230000003068 static effect Effects 0.000 abstract description 14
- 230000000750 progressive effect Effects 0.000 abstract description 8
- 238000011981 development test Methods 0.000 abstract description 4
- 238000011161 development Methods 0.000 description 14
- 238000009530 blood pressure measurement Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 8
- 238000005553 drilling Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 238000007726 management method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 238000012938 design process Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000009960 carding Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
- G06F11/3414—Workload generation, e.g. scripts, playback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明公开了一种数据库性能瓶颈定位分析方法、装置、系统及存储介质,该方法包括:在软件开发测试阶段,监控数据库服务器层的资源消耗指标;结合数据库的基准测试资源消耗指标和预设的正常压力下服务器资源消耗阈值范围,对服务器层的硬件资源性能瓶颈进行定位分析,简化操作过程和减少成本。可以从性能瓶颈可能出现的源头出发,从设计阶段的静态扫描到开发测试阶段的整体监控/逐层递进分析的诊断操作思路,实现由表及里,从整体到局部,逐层细节的数据库性能瓶颈定位分析方案,便于普通使用者快速精准的定位数据库性能瓶颈的节点、组件及根因,极大的提升数据库问题分析解决的效率。
Description
技术领域
本发明涉及数据库技术领域,尤其涉及一种数据库性能瓶颈定位分析方法、装置、系统及存储介质。
背景技术
Oracle数据库是目前使用最为广泛的数据库管理系统,作为一个通用的数据库系统,为应对核心数据和系统的超流量访问,Oracle数据库自身提供复杂多样的监控指标及工具,如enterprise manager、awr报告、sqltrace等,给Oracle数据库DBA专家带来便利的同时,却因为仅仅是各类监控指标展示,缺乏逻辑性的分析,更没有提供定位诊断类报告,过于依赖数据库人员的经验,给普通Oracle数据库使用者带来巨大困扰。对这些使用者来说,如何快速定位Oracle数据库的性能问题存在过高的使用和学习成本。
因此,现有Oracle数据库性能诊断的技术一般介绍某一种监控工具,或某一类监控指标,缺乏全局的、可操作性的、适合大多数人使用的、能够快速定位性能问题的性能诊断技术。
发明内容
本发明的主要目的在于提供一种数据库性能瓶颈定位分析方法、装置、系统及存储介质,旨在快速精准定位数据库的性能问题,提升数据库问题分析解决的效率,并简化操作过程和减少成本。
为实现上述目的,本发明提供一种数据库性能瓶颈定位分析方法,所述方法包括以下步骤:
在软件开发测试阶段的压测过程中,监控数据库所在的服务器层的资源消耗指标;
根据所述服务器层资源消耗指标,并结合所述数据库的基准测试资源消耗指标和预设的正常压力下服务器资源消耗阈值范围,对所述服务器层的硬件资源是否存在性能瓶颈进行定位分析。
可选地,根据所述服务器层资源消耗指标,并结合所述数据库的基准测试资源消耗指标和预设的正常压力下服务器资源消耗阈值范围,对所述服务器层的硬件资源是否存在性能瓶颈进行定位分析的步骤包括:
将所述服务器层资源消耗指标,与所述数据库的基准测试资源消耗指标进行比对,判断所述服务器层资源消耗指标是否超出对应指标预设的正常压力下服务器资源消耗阈值范围;
若所述服务器层资源消耗指标超出预设的正常压力下服务器资源消耗阈值范围,则确定所述服务器层资源消耗指标异常;
将异常的服务器层资源消耗指标,匹配预设的表象-根因对应关系,定位可能的性能瓶颈组件。
可选地,所述方法还包括:
在压测过程中,对所述数据库的全链路业务流程层进行监控,获得所述数据库的等待事件;
确定所述数据库的等待事件类型;
根据所述数据库的等待事件类型,结合所述服务器层的资源消耗指标,确定性能瓶颈点的方向。
可选地,所述方法还包括:
监控所述数据库的组件层,确定所述性能瓶颈点;
分析所述性能瓶颈点,定位产生性能问题的根因,生成诊断报告。
可选地,所述监控所述数据库的组件层,确定所述性能瓶颈点的步骤包括:
基于业务交易压力传导路径,从应用端开始,监控所述数据库的组件层,确定所述数据库执行进程情况,所述组件层的组件包括:所述数据库的应用连接、SQL分析执行、事务、锁、存储、日志和参数中的一种或多种;
根据所述数据库执行进程情况,确定所述性能瓶颈点。
可选地,所述监控所述数据库的组件层,确定所述数据库执行进程情况的步骤包括:
监控所述数据库的应用连接,查看所述数据库的应用连接情况,以根据所述数据库的应用连接情况确认造成性能瓶颈的根源是在应用端、应用与数据库之间的连接,或者数据库端,所述数据库的应用连接情况至少包括:所述数据库连接数的变化曲线;
监控所述数据库的SQL分析执行流程,获得所述数据库的SQL的解析和执行情况,以根据所述数据库的SQL的解析和执行情况,确定所述性能瓶颈点;
监控所述数据库的事务组件,查询是否出现影响数据库响应时间的预设的长/大事务数据处理操作,以根据长/大事务数据处理操作情况确定所述性能瓶颈点。
可选地,所述在软件开发测试阶段的压测过程中,监控数据库所在的服务器层的资源消耗指标的步骤之前还包括:
在软件系统架构设计阶段,定义所述数据库的架构规范和SQL语句规则;
基于所述数据库的架构规范和SQL语句规则,对数据库性能参数进行检测和SQL扫描,对比预设的所述数据库的基准测试性能黄金指标值和对应的参数建议值范围,确定存在问题的数据库参数值。
本发明还提出一种数据库性能瓶颈定位分析装置,所述装置包括:
监控模块,用于在软件开发测试阶段的压测过程中,监控数据库所在的服务器层的资源消耗指标;
定位分析模块,用于根据所述服务器层资源消耗指标,并结合所述数据库的基准测试资源消耗指标和预设的正常压力下服务器资源消耗阈值范围,对所述服务器层的硬件资源是否存在性能瓶颈进行定位分析。
本发明还提出一种数据库性能瓶颈定位分析系统,所述系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序程序,所述计算机程序被所述处理器执行时实现如上所述的数据库性能瓶颈定位分析方法的步骤。
本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的数据库性能瓶颈定位分析方法的步骤。
本发明实施例提出的数据库性能瓶颈定位分析方法、装置、系统及存储介质,在软件开发测试阶段的压测过程中,监控数据库所在的服务器层的资源消耗指标;根据所述服务器层资源消耗指标,并结合所述数据库的基准测试资源消耗指标和预设的正常压力下服务器资源消耗阈值范围,对所述服务器层的硬件资源是否存在性能瓶颈进行定位分析。本发明方案在软件开发测试阶段,通过自动监控数据库所在的服务器层的资源消耗指标,将服务器层资源消耗指标与服务器资源消耗阈值范围进行比对,获得性能瓶颈评估分析结果,便于普通使用者快速精准的定位数据库性能瓶颈的节点,极大的提升数据库问题分析解决的效率,而且简化操作过程和减少成本。此外,进一步还可以从性能瓶颈可能出现的源头出发,从设计阶段的静态扫描到开发测试阶段的整体监控/逐层递进分析的诊断操作思路,实现由表及里,从整体到局部,逐层细节的数据库性能瓶颈定位分析方案,便于普通使用者快速精准的定位数据库性能瓶颈的节点、组件及根因,极大的提升数据库问题分析解决的效率;从服务器资源监控、等待事件分析、数据库组件监控三方面逐层深入,以Oracle数据库为例,即从Oracle数据库应用级别、进程级别、SQL语句级别逐级下钻,分析性能瓶颈点,定位产生性能问题的根因,生成诊断报告,实现数据库性能瓶颈的有效快速精准定位分析。
附图说明
图1为本发明实施例数据库性能瓶颈定位分析装置所属终端设备的功能模块示意图;
图2为本发明数据库性能瓶颈定位分析方法一实施例的流程示意图;
图3为本发明实施例开发测试阶段的Oracle数据库性能瓶颈定位分析流程示意图;
图4为本发明实施例提供的一种常见Oracle性能问题与服务器层表象映射关系图;
图5为本发明数据库性能瓶颈定位分析方法另一实施例的流程示意图;
图6为本发明实施例提供的常见的Oracle等待事件类型图;
图7为本发明数据库性能瓶颈定位分析方法再一实施例的流程示意图;
图8为本发明数据库性能瓶颈定位分析方法再一实施例的流程示意图;
图9为本发明实施例提供的一种Oracle数据库SQL语句执行示意图;
图10为本发明实施例提供的一种Oracle数据库组件层分析思路图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:在软件开发测试阶段的压测过程中,监控数据库所在的服务器层的资源消耗指标;根据所述服务器层资源消耗指标,并结合所述数据库的基准测试资源消耗指标和预设的正常压力下服务器资源消耗阈值范围,对所述服务器层的硬件资源是否存在性能瓶颈进行定位分析。本发明方案在软件开发测试阶段,通过自动监控数据库所在的服务器层的资源消耗指标,将服务器层资源消耗指标与服务器资源消耗阈值范围进行比对,获得性能瓶颈评估分析结果,便于普通使用者快速精准的定位数据库性能瓶颈的节点,极大的提升数据库问题分析解决的效率,而且简化操作过程和减少成本。此外,进一步还可以从性能瓶颈可能出现的源头出发,从设计阶段的静态扫描到开发测试阶段的整体监控/逐层递进分析的诊断操作思路,实现由表及里,从整体到局部,逐层细节的数据库性能瓶颈定位分析方案,便于普通使用者快速精准的定位数据库性能瓶颈的节点、组件及根因,极大的提升数据库问题分析解决的效率;从服务器资源监控、等待事件分析、数据库组件监控三方面逐层深入,以Oracle数据库为例,即从Oracle数据库应用级别、进程级别、SQL语句级别逐级下钻,分析性能瓶颈点,定位产生性能问题的根因,生成诊断报告,实现数据库性能瓶颈的有效快速精准定位分析。
本发明实施例涉及的技术术语:
Oracle,Oracle数据库系统是美国ORACLE公司(甲骨文)提供的以分布式数据库为核心的一组软件产品,是目前最流行的客户/服务器(CLIENT/SERVER)或B/S体系结构的数据库之一,也是目前世界上使用最为广泛的数据库管理系统,作为一个通用的数据库系统,它具有完整的数据管理功能;作为一个关系数据库,它是一个完备关系的产品;作为分布式数据库它实现了分布式处理功能。
本发明实施例考虑到:现有Oracle数据库性能诊断的技术一般介绍某一种监控工具,或某一类监控指标,仅是各类监控指标展示,缺乏逻辑性的分析,更没有提供定位诊断类报告,过于依赖数据库人员的经验,给普通Oracle数据库使用者带来巨大困扰,缺乏全局的、可操作性的、适合大多数人使用的、能够快速定位性能问题的性能诊断技术。
基于此,本发明实施例提供一种解决方案,能够快速精准定位数据库的性能问题,提升数据库问题分析解决的效率,并简化操作过程和减少成本。
具体地,参照图1,图1为本发明数据库性能瓶颈定位分析装置所属终端设备的功能模块示意图。该数据库性能瓶颈定位分析装置可以为独立于终端设备的装置,其可以通过硬件或软件的形式承载于终端设备或系统上。该终端设备可以为手机、平板电脑等智能移动终端,还可以为服务器等网络设备。
在本实施例中,该数据库性能瓶颈定位分析装置所属终端设备至少包括输出模块110、处理器120、存储器130以及通信模块140。
存储器130中存储有操作系统以及数据库性能瓶颈定位分析程序;输出模块110可为显示屏、扬声器等。通信模块140可以包括WIFI模块、移动通信模块以及蓝牙模块等,通过通信模块140与外部设备或服务器进行通信。
其中,作为一种实施例方式,存储器130中的数据库性能瓶颈定位分析程序被处理器执行时实现以下步骤:
在软件开发测试阶段的压测过程中,监控数据库所在的服务器层的资源消耗指标;
根据所述服务器层资源消耗指标,并结合所述数据库的基准测试资源消耗指标和预设的正常压力下服务器资源消耗阈值范围,对所述服务器层的硬件资源是否存在性能瓶颈进行定位分析。
进一步地,存储器130中的数据库性能瓶颈定位分析程序被处理器执行时还实现以下步骤:
将所述服务器层资源消耗指标,与所述数据库的基准测试资源消耗指标进行比对,判断所述服务器层资源消耗指标是否超出对应指标预设的正常压力下服务器资源消耗阈值范围;
若所述服务器层资源消耗指标超出预设的正常压力下服务器资源消耗阈值范围,则确定所述服务器层资源消耗指标异常;
将异常的服务器层资源消耗指标,匹配预设的表象-根因对应关系,定位可能的性能瓶颈组件。
进一步地,存储器130中的数据库性能瓶颈定位分析程序被处理器执行时还实现以下步骤:
确定所述数据库的等待事件类型;
根据所述数据库的等待事件类型,结合所述服务器层的资源消耗指标,确定性能瓶颈点的方向。
进一步地,存储器130中的数据库性能瓶颈定位分析程序被处理器执行时还实现以下步骤:
监控所述数据库的组件层,确定所述性能瓶颈点;
分析所述性能瓶颈点,定位产生性能问题的根因,生成诊断报告。
进一步地,存储器130中的数据库性能瓶颈定位分析程序被处理器执行时还实现以下步骤:
基于业务交易压力传导路径,从应用端开始,监控所述数据库的组件层,确定所述数据库执行进程情况,所述组件层的组件包括:所述数据库的应用连接、SQL分析执行、事务、锁、存储、日志和参数中的一种或多种;
根据所述数据库执行进程情况,确定所述性能瓶颈点。
进一步地,存储器130中的数据库性能瓶颈定位分析程序被处理器执行时还实现以下步骤:
监控所述数据库的应用连接,查看所述数据库的应用连接情况,以根据所述数据库的应用连接情况确认造成性能瓶颈的根源是在应用端、应用与数据库之间的连接,或者数据库端,所述数据库的应用连接情况至少包括:所述数据库连接数的变化曲线;
监控所述数据库的SQL分析执行流程,获得所述数据库的SQL的解析和执行情况,以根据所述数据库的SQL的解析和执行情况,确定所述性能瓶颈点;
监控所述数据库的事务组件,查询是否出现影响数据库响应时间的预设的长/大事务数据处理操作,以根据长/大事务数据处理操作情况确定所述性能瓶颈点。
进一步地,存储器130中的数据库性能瓶颈定位分析程序被处理器执行时还实现以下步骤:
在软件系统架构设计阶段,定义所述数据库的架构规范和SQL语句规则;
基于所述数据库的架构规范和SQL语句规则,对数据库性能参数进行检测和SQL扫描,对比预设的所述数据库的基准测试性能黄金指标值和对应的参数建议值范围,确定存在问题的数据库参数值。
本实施例通过上述方案,在软件开发测试阶段的压测过程中,监控数据库所在的服务器层的资源消耗指标;根据所述服务器层资源消耗指标,并结合所述数据库的基准测试资源消耗指标和预设的正常压力下服务器资源消耗阈值范围,对所述服务器层的硬件资源是否存在性能瓶颈进行定位分析。本发明方案在软件开发测试阶段,通过自动监控数据库所在的服务器层的资源消耗指标,将服务器层资源消耗指标与服务器资源消耗阈值范围进行比对,获得性能瓶颈评估分析结果,便于普通使用者快速精准的定位数据库性能瓶颈的节点,极大的提升数据库问题分析解决的效率,而且简化操作过程和减少成本。此外,进一步还可以从性能瓶颈可能出现的源头出发,从设计阶段的静态扫描到开发测试阶段的整体监控/逐层递进分析的诊断操作思路,实现由表及里,从整体到局部,逐层细节的数据库性能瓶颈定位分析方案,便于普通使用者快速精准的定位数据库性能瓶颈的节点、组件及根因,极大的提升数据库问题分析解决的效率;从服务器资源监控、等待事件分析、数据库组件监控三方面逐层深入,以Oracle数据库为例,即从Oracle数据库应用级别、进程级别、SQL语句级别逐级下钻,分析性能瓶颈点,定位产生性能问题的根因,生成诊断报告,实现数据库性能瓶颈的有效快速精准定位分析。
基于上述终端设备架构但不限于上述架构,提出本发明方法实施例。
具体地,在本发明实施例中,从性能瓶颈可能出现的源头出发,从设计阶段的静态扫描到开发测试阶段的整体监控/逐层递进分析的诊断操作思路,提供一种由表及里,从整体到局部,逐层细节的数据库性能瓶颈定位的方法和监控诊断报告系统,便于普通使用者快速精准的定位数据库性能瓶颈的节点、组件及根因,极大的提升数据库问题分析解决的效率。
参照图2,图2为本发明数据库性能瓶颈定位分析方法第一实施例的流程示意图。
如图2所示,本发明一实施例提出的一种数据库性能瓶颈定位分析方法,所述方法包括以下步骤:
步骤S101,在软件开发测试阶段的压测过程中,监控数据库所在的服务器层的资源消耗指标;
本发明实施例方法的执行主体可以是一种数据库性能瓶颈定位分析装置,也可以是服务器或其他网络设备,本实施例对此不作具体限定。
本发明实施例涉及数据库性能瓶颈定位分析,其中,数据库可以具体是Oracle数据库等,本实施例以Oracle数据库举例说明。
本发明实施例主要分成两个阶段对Oracle数据库性能瓶颈进行定位分析,根据软件系统的研发周期,分别在软件系统架构设计阶段和开发测试阶段,对Oracle数据库进行静态扫描和动态监控诊断。
在本实施例方案中,主要是针对开发测试阶段,对数据库性能瓶颈逐层进行定位分析。
在开发和测试阶段,本发明分别以不同的实施例,分别从服务器资源监控、等待事件分析、Oracle组件监控三方面逐层深入,即从Oracle数据库应用级别、进程级别、SQL语句级别逐级下钻,分析性能瓶颈点,定位产生性能问题的根因,生成诊断报告。
如图3所示,本发明各实施例,从服务器层入手,逐层深入到Oracle数据库等待事件层、组件及参数层,来一步步的定位性能瓶颈。
首先,本实施例从服务器资源监控方面对Oracle数据库性能瓶颈进行定位分析。
具体地,在软件开发测试阶段的压测过程中,首先,监控数据库所在的服务器层的资源消耗指标,定位对应的流程或组件。
其中,服务器层指应用服务器层,应用服务器层监控的指标主要包括:CPU、内存、磁盘、负载曲线等,通过指标阈值设定,超过阈值范围则认定为资源指标存在异常。
步骤S102,根据所述服务器层资源消耗指标,并结合所述数据库的基准测试资源消耗指标和预设的正常压力下服务器资源消耗阈值范围,对所述服务器层的硬件资源是否存在性能瓶颈进行定位分析。
具体地,将所述服务器层资源消耗指标,与所述数据库的基准测试资源消耗指标进行比对,判断所述服务器层资源消耗指标是否超出对应指标预设的正常压力下服务器资源消耗阈值范围。
若所述服务器层资源消耗指标超出预设的正常压力下服务器资源消耗阈值范围,则确定所述服务器层资源消耗指标异常;将异常的服务器层资源消耗指标,匹配预设的表象-根因对应关系,定位可能的性能瓶颈组件。
更为具体地,具体实现如下:
监控服务器层资源消耗指标,定位对应的流程或组件。应用服务器层监控的指标主要包括:CPU、内存、磁盘、负载曲线等,如图4所示,通过指标阈值设定,超过阈值范围认定为资源指标存在异常,根据[表象,根因]对,定位可能的性能瓶颈组件。其中,高并发低负载场景特指在高并发压力情况下,并发用户逐渐增加,服务器的资源消耗均保持低位,但黄金指标曲线中的平均响应时间超过阈值范围。
本实施例通过分析服务器的资源消耗,对比Oracle数据库基准测试指标,分析服务器层可能的性能瓶颈根因,逐步排查Oracle数据库所在服务器硬件资源是否存在性能瓶颈。
更为具体地,结合图4所示,针对Oracle数据库所在服务器资源出现异常情况,均可对应到底层某个组件或环节出现问题,常见的对应关系可划分成的[表象,根因]对有如下几种:
CPU异常[CPU异常,SQL问题][CPU异常,存储问题];IO异常[IO异常,SQL问题][IO异常,存储问题][IO异常,日志问题];内存异常[内存异常,缓存问题][内存异常,参数问题];高并发低负载[高并发低负载,SQL问题][高并发低负载,锁问题]。
在实施压测过程中,监控Oracle数据库所在服务器资源消耗指标,结合基准测试资源消耗情况和正常压力下服务器资源消耗阈值区间,一方面,可判定Oracle数据库所在服务器的硬件资源是否存在性能瓶颈;另一方面,在服务器资源不存在性能瓶颈的情况下,根据[表象,根因]对的匹配,可初步诊断出具体性能问题所在组件或模块,为下一个步骤等待事件或Oracle组件的监控指明分析方向。
本实施例通过上述方案,在软件开发测试阶段的压测过程中,监控数据库所在的服务器层的资源消耗指标;根据所述服务器层资源消耗指标,并结合所述数据库的基准测试资源消耗指标和预设的正常压力下服务器资源消耗阈值范围,对所述服务器层的硬件资源是否存在性能瓶颈进行定位分析。本发明方案在软件开发测试阶段,通过自动监控数据库所在的服务器层的资源消耗指标,将服务器层资源消耗指标与服务器资源消耗阈值范围进行比对,获得性能瓶颈评估分析结果,便于普通使用者快速精准的定位数据库性能瓶颈的节点,极大的提升数据库问题分析解决的效率,而且简化操作过程和减少成本。
如图5所示,本发明另一实施例提出的一种数据库性能瓶颈定位分析方法,基于上述图2所示的实施例,所述方法还包括:
步骤S103,在压测过程中,对所述数据库的全链路业务流程层进行监控,获得所述数据库的等待事件;
步骤S104,确定所述数据库的等待事件类型;
步骤S105,根据所述数据库的等待事件类型,结合所述服务器层的资源消耗指标,确定性能瓶颈点的方向。
相比上述图2所示的实施例,本实施例进一步还包括从Oracle数据库等待事件层分析,来对Oracle数据库性能瓶颈进行定位分析的方案。
具体地,在压测过程中,进行数据库全链路业务流程层监控,监控数据库的等待事件类型,分析等待事件类型占比来确定具体数据库的哪个模块出现了性能瓶颈问题。
其中,每一个等待事件,在进程级别指明数据库的一种活动状态。在Oracle数据库系统内置等待事件视图,通过这些视图可以了解整体(系统级)、局部(会话级)的等待事件发生情况及各类别事件的分类统计。如图6所示,Oracle数据库常见的等待事件类型和常见的等待事件,可初步定位造成等待事件原因的分类所在,为下一步细化根因指明方向。
更为具体地,在压测过程中,通过监控等待事件,监控指标包括:等待类型,总等待次数,总等待时间,平均等待时间,总等待事件占DB time,前台总等待次数,前台总等待时间,前台平均等待时间,前台等待时间占比,前台等待占比,前台总等待事件占DB time,对照等待事件和等待事件类型分类,可以确定Oracle数据库主要的压力点和DB time耗时所在,再结合上述实施例中数据库服务器资源消耗情况,能进一步确定性能瓶颈点的方向,具体是哪个系统模块出了问题,如由数据库自身系统调度造成,或者用户I/O操作造成。
本实施例通过上述方案,在软件开发测试阶段的压测过程中,监控数据库所在的服务器层的资源消耗指标;根据所述服务器层资源消耗指标,并结合所述数据库的基准测试资源消耗指标和预设的正常压力下服务器资源消耗阈值范围,对所述服务器层的硬件资源是否存在性能瓶颈进行定位分析。本发明方案在软件开发测试阶段,通过自动监控数据库所在的服务器层的资源消耗指标,将服务器层资源消耗指标与服务器资源消耗阈值范围进行比对,获得性能瓶颈评估分析结果,便于普通使用者快速精准的定位数据库性能瓶颈的节点,极大的提升数据库问题分析解决的效率,而且简化操作过程和减少成本。进一步还可以在压测过程中,对所述数据库的全链路业务流程层进行监控,获得所述数据库的等待事件;确定所述数据库的等待事件类型;根据所述数据库的等待事件类型,结合所述服务器层的资源消耗指标,确定性能瓶颈点的方向,极大的提升数据库问题分析解决的效率。
如图7所示,本发明再一实施例提出的一种数据库性能瓶颈定位分析方法,基于上述图5所示的实施例,所述方法还包括:
步骤S106,监控所述数据库的组件层,确定所述性能瓶颈点;
步骤S107,分析所述性能瓶颈点,定位产生性能问题的根因,生成诊断报告。
相比上述图5所示的实施例,本实施例进一步还包括从Oracle数据库组件层分析,来对Oracle数据库性能瓶颈进行定位分析的方案。
具体地,监控所述数据库的组件层,确定所述性能瓶颈点,具体实现方案如下:
基于业务交易压力传导路径,从应用端开始,监控所述数据库的组件层,确定所述数据库执行进程情况,以便根据所述数据库执行进程情况,确定所述性能瓶颈点。
其中,所述组件层的组件包括:所述数据库的应用连接、SQL分析执行、事务、锁、存储、日志和参数中的一种或多种。
在监控所述数据库的组件层,确定所述数据库执行进程情况时,可以采用如下方案:
作为一种场景,可以监控所述数据库的应用连接,查看所述数据库的应用连接情况,以根据所述数据库的应用连接情况确认造成性能瓶颈的根源是在应用端、应用与数据库之间的连接,或者数据库端,所述数据库的应用连接情况至少包括:所述数据库连接数的变化曲线。
作为另一种场景,可以监控所述数据库的SQL分析执行流程,获得所述数据库的SQL的解析和执行情况,以根据所述数据库的SQL的解析和执行情况,确定所述性能瓶颈点。
作为再一种场景,可以监控所述数据库的事务组件,查询是否出现影响数据库响应时间的预设的长/大事务数据处理操作,以根据长/大事务数据处理操作情况确定所述性能瓶颈点。
本实施例通过上述方案,在软件开发测试阶段的压测过程中,监控数据库所在的服务器层的资源消耗指标;根据所述服务器层资源消耗指标,并结合所述数据库的基准测试资源消耗指标和预设的正常压力下服务器资源消耗阈值范围,对所述服务器层的硬件资源是否存在性能瓶颈进行定位分析。本发明方案在软件开发测试阶段,通过自动监控数据库所在的服务器层的资源消耗指标,将服务器层资源消耗指标与服务器资源消耗阈值范围进行比对,获得性能瓶颈评估分析结果,便于普通使用者快速精准的定位数据库性能瓶颈的节点,极大的提升数据库问题分析解决的效率,而且简化操作过程和减少成本。进一步可以从开发测试阶段的整体监控/逐层递进分析的诊断操作思路,实现由表及里,从整体到局部,逐层细节的数据库性能瓶颈定位分析方案,便于普通使用者快速精准的定位数据库性能瓶颈的节点、组件及根因,极大的提升数据库问题分析解决的效率;从服务器资源监控、等待事件分析、数据库组件监控三方面逐层深入,以Oracle数据库为例,即从Oracle数据库应用级别、进程级别、SQL语句级别逐级下钻,分析性能瓶颈点,定位产生性能问题的根因,生成诊断报告,实现数据库性能瓶颈的有效快速精准定位分析。
如图8所示,本发明再一实施例提出的一种数据库性能瓶颈定位分析方法,基于上述图7所示的实施例,在上述步骤S101,在软件开发测试阶段的压测过程中,监控数据库所在的服务器层的资源消耗指标之前,所述方法还包括:
步骤S1001,在软件系统架构设计阶段,定义所述数据库的架构规范和SQL语句规则;
步骤S1002,基于所述数据库的架构规范和SQL语句规则,对数据库性能参数进行检测和SQL扫描,对比预设的所述数据库的基准测试性能黄金指标值和对应的参数建议值范围,确定存在问题的数据库参数值。
相比上述图7所示的实施例,本实施例还包括在软件系统架构设计阶段对数据库性能瓶颈进行定位分析的方案。
具体地,在软件架构设计阶段,定义数据库架构规范和SQL语句规则,通过静态参数检测和SQL扫描,解决库、表空间、表、索引等在设计过程中可能引起性能问题的错误。
其中,常见的Oracle数据库性能参数包括:sga_target,shared_pool_size,db_catch_size,pga_aggregate_size,pga_aggregate_target,sessions,job_queue_processes,shares等,根据软件系统性能要求,对比Oracle数据库基准测试性能黄金指标值和对应的参数建议值范围,确定存在问题的Oracle数据库参数值。
SQL语句规范包括:库表连接数量限制,SQL语句长度,SQL对数据库资源消耗,索引配置,SQL语句判断条件,删除/插入/修改操作等等。
本实施例通过上述方案,在软件开发测试阶段的压测过程中,监控数据库所在的服务器层的资源消耗指标;根据所述服务器层资源消耗指标,并结合所述数据库的基准测试资源消耗指标和预设的正常压力下服务器资源消耗阈值范围,对所述服务器层的硬件资源是否存在性能瓶颈进行定位分析。本发明方案在软件开发测试阶段,通过自动监控数据库所在的服务器层的资源消耗指标,将服务器层资源消耗指标与服务器资源消耗阈值范围进行比对,获得性能瓶颈评估分析结果,便于普通使用者快速精准的定位数据库性能瓶颈的节点,极大的提升数据库问题分析解决的效率,而且简化操作过程和减少成本。此外,进一步还可以从性能瓶颈可能出现的源头出发,从设计阶段的静态扫描到开发测试阶段的整体监控/逐层递进分析的诊断操作思路,实现由表及里,从整体到局部,逐层细节的数据库性能瓶颈定位分析方案,便于普通使用者快速精准的定位数据库性能瓶颈的节点、组件及根因,极大的提升数据库问题分析解决的效率;从服务器资源监控、等待事件分析、数据库组件监控三方面逐层深入,以Oracle数据库为例,即从Oracle数据库应用级别、进程级别、SQL语句级别逐级下钻,分析性能瓶颈点,定位产生性能问题的根因,生成诊断报告,实现数据库性能瓶颈的有效快速精准定位分析。
下面以Oracle数据库为例,针对软件架构设计阶段和开发测试阶段,对Oracle数据库性能瓶颈进行定位分析的具体处理方案进行详细阐述。
本发明实施例提供的Oracle性能瓶颈定位方法,主要针对于Oracle数据库系统,对Oracle数据库系统的纷繁杂乱的监控和性能指标进行分析和梳理,设计出一套适合普通开发测试人员易于操作理解的Oracle数据库性能瓶颈定位方法。
如前所述,本发明实施例方案,主要分成两个阶段对Oracle数据库性能瓶颈进行定位分析,根据软件系统的研发周期,分别在软件系统架构设计阶段和开发测试阶段,对Oracle数据库进行静态扫描和动态监控诊断。
也就是说,本发明实施例提供的Oracle性能瓶颈定位方法主要包括两个阶段的定位操作:在软件设计阶段对Oracle数据库系统的静态扫描;在软件开发阶段对Oracle数据库系统逐层进行监控和定位分析。
其中,在软件架构设计阶段的静态扫描包括两个步骤:
步骤1:Oracle数据库基准测试和基准参数校验,一方面获取Oracle数据库官方提供的性能黄金指标基准值;另一方面,测试在当前特定CPU、内存、磁盘等硬件配置下Oracle数据库系统基础读写的性能指标,从而为软件开发过程中性能黄金指标值提供基准。基准测试还包括对比不同参数对比情况下,性能基准值的变化,主要的参数配置值,即常见的Oracle数据库性能参数有:sga_target,shared_pool_size,db_catch_size,pga_aggregate_size,pga_aggregate_target,sessions,job_queue_processes,shares等。其取值范围设定为如下表所示:
步骤2:在一般联机交易系统中,应用主要通过SQL语句与数据库进行交互,因此SQL语句的规范性对Oracle数据库的性能影响巨大。通过拟定SQL语句的规范要求,在设计阶段,对SQL语句进行静态扫描,可提前发现SQL语句的规范性问题,从而提升Oracle数据库的性能。
其中,SQL语句规范包括:库表连接数量限制,SQL语句长度,SQL对数据库资源消耗,索引配置,SQL语句判断条件,删除/插入/修改操作等等。具体的SQL语句常见的规范性要求有:
参与连接操作的表数量(禁止超过3张表复杂join,连接程序禁止使用jion,批处理禁止复杂join);连接操作为指定连接条件;不带条件的update/delete操作;查询语句缺少谓词;查询语句中or谓词超过10个;谓词包含非定位条件;SQL中存在union操作;SQL语句使用多层次嵌套;insert语句未指定字段列表;查询语句使用distinct;字段使用了函数等。
因此,在软件架构设计阶段,定义数据库架构规范和SQL语句规则,通过静态参数检测和SQL扫描,解决库、表空间、表、索引等在设计过程中可能引起性能问题的错误。根据软件系统性能要求,对比Oracle数据库基准测试性能黄金指标值和对应的参数建议值范围,确定存在问题的Oracle数据库参数值。
在开发和测试阶段,通过从应用端发起大并发压力,监控Oracle数据库的各项指标来进行性能定位和分析。如图3所示,从Oracle数据库服务器层入手,分别从服务器资源监控、等待事件分析、Oracle组件监控三方面逐层深入,即从Oracle数据库应用级别、进程级别、SQL语句级别逐级下钻,分析性能瓶颈点,定位产生性能问题的根因,生成诊断报告。
其中,应用与Oracle数据库的一般交互流程可如下:
应用获取数据库连接,发送SQL语句,数据库划分DB CPU时间片,DB CPU处理SQL语句,解析器解析SQL语句,执行器执行SQL,返回执行结果,应用释放数据库连接。
根据以往Oracle数据库项目实践,常见问题主要包括:应用数据库之间连接问题、SQL解析问题、SQL执行问题、数据库事务问题、锁问题、缓存问题、存储问题、数据库设计问题等。
如图3所示,本发明从服务器层入手,逐层深入到Oracle数据库等待事件层、组件及参数层,来一步步的定位性能瓶颈。主要包括如下3个步骤:
步骤1:服务器资源监控及服务器层瓶颈定位分析
监控服务器层资源消耗指标,定位对应的流程或组件。应用服务器层监控的指标主要包括:CPU、内存、磁盘、负载曲线等,如图4所示,通过指标阈值设定,超过阈值范围认定为资源指标存在异常,根据[表象,根因]对,定位可能的性能瓶颈组件。其中,高并发低负载场景特指在高并发压力情况下,并发用户逐渐增加,服务器的资源消耗均保持低位,但黄金指标曲线中的平均响应时间超过阈值范围。通过分析服务器的资源消耗,对比Oracle数据库基准测试指标,分析服务器层可能的性能瓶颈根因,逐步排查是否Oracle数据库所在服务器硬件资源存在性能瓶颈。
具体地,如图4所示,针对Oracle数据库所在服务器资源出现异常情况,均可对应到底层某个组件或环节出现问题,常见的对应关系可划分成的[表象,根因]对有如下:CPU异常[CPU异常,SQL问题][CPU异常,存储问题];IO异常[IO异常,SQL问题][IO异常,存储问题][IO异常,日志问题];内存异常[内存异常,缓存问题][内存异常,参数问题];高并发低负载[高并发低负载,SQL问题][高并发低负载,锁问题]。在实施压测过程中,监控Oracle数据库所在服务器资源消耗指标,结合基准测试资源消耗情况和正常压力下服务器资源消耗阈值区间,一方面,可判定Oracle数据库所在服务器的硬件资源是否存在性能瓶颈;另一方面,在服务器资源不存在性能瓶颈的情况下,根据[表象,根因]对的匹配,可初步诊断出具体性能问题所在组件或模块,为下一个步骤等待事件或Oracle组件的监控指明分析方向。
步骤2:等待事件分析及事件层瓶颈定位分析
通过数据库全链路业务流程层监控,监控数据库的等待事件类型,分析类型占比来确定具体数据库的哪个模块出现了性能瓶颈问题。每一个等待事件,在进程级别指明数据库的一种活动状态。在Oracle数据库系统内置等待事件视图,通过这些视图可以了解整体(系统级)、局部(会话级)的等待事件发生情况及各类别事件的分类统计。如图6所示,Oracle数据库常见的等待事件类型和常见的等待事件,可初步定位造成等待事件原因的分类所在,为下一步细化根因指明方向。
具体地,如图6所示,Oracle数据库的等待事件类型和常见的等待事件,在压测过程中,通过监控等待事件,监控指标包括:[等待类型,总等待次数,总等待时间,平均等待时间,总等待事件占DB time,前台总等待次数,前台总等待时间,前台平均等待时间,前台等待时间占比,前台等待占比,前台总等待事件占DB time],对照等待事件和等待事件类型分类,可以确定Oracle数据库主要的压力点和DB time耗时所在,再结合上述步骤1中数据库服务器资源消耗情况,能进一步确定性能瓶颈点的方向,具体是哪个系统模块出了问题,如由数据库自身系统调度造成,或者用户I/O操作造成。
步骤3:Oracle组件监控及组件层瓶颈定位分析
通过数据库组件层监控,监控数据库执行进程。在Oracle组件监控及组件层瓶颈定位分析过程中,基于压力传导路径分析,从应用端入手,如图10所示,分别监控数据库的连接、SQL分析执行、事务、锁、存储、日志等组件。各组件的监控指标阐述如下:
a.监控数据库的连接
组件监控从应用连接源头入手,查看数据库层面应用连接的情况,如每秒登录数/QPS/TPS/游标数等指标曲线。其中,数据库连接数的变化曲线能反应具体的性能瓶颈点,确认造成性能瓶颈的根源是在应用端,应用与数据库之间的连接,还是数据库端。常见的性能问题有连接参数配置错误、连接不释放、连接池管理失效等。
具体而言,数据库的连接监控指标包括:并发数,总连接数,每秒登陆数,TPS,QPS等,通过对比压测端黄金指标、并发用户数与数据库的连接指标,可判定压力是否传导到数据库端,或连接数参数配置导致出现高并发低负载的情况。
b.监控数据库的SQL分析执行
根据应用与数据库的交互流程,接下来监控分析数据库SQL的解析和执行情况。通过分析SQL语句的性能统计、SQL执行计划、SQL查询表统计信息、SQL使用索引统计信息等指标数据,查看SQL解析次数、占用时间,SQL平均响应时间、关键SQL的执行时间图等指标,确认是否在SQL解析和执行过程中存在问题。
从图9的SQL执行流程来看,涉及到的Oracle流程步骤包括:应用连接数据库,数据库服务器进程接收到一个SQL语句时,首先要将其转换成执行这个SQL语句的执行计划。检查共享池中是否有之前解析相同的SQL语句后所存储的SQL文本、解析树和执行计划。如果能命中共享池的缓存库,则SQL语句不需要再次解析,可直接由库缓存得到之前所产生的执行计划,从而直接跳到绑定或执行阶段,即软解析的过程;但是如果在共享池的库缓存中找不到对应的执行计划,则必须继续解析SQL、生成执行计划,即硬解析的过程。在硬解析的过程中,分析器对SQL语句进行语法分析和语义分析,分析是否符合规范,衡量语句中各表达式的意义,检查是否存在语义错误和权限;优化器会决定最佳执行计划,同时更新缓存区;最后执行器按照执行计划执行SQL,产生执行结果,当然不同类型的SQL语句,执行过程也不同。最后select查询语句会提取查询的记录行返回。
具体而言,如图9所示,数据库在接收到应用的SQL语句后,其整个操作过程中分析和执行至关重要,常用的监控指标分为总体SQL性能监控指标和单个监控指标。其中:
总体指标包括:buffer hit%,execute to prase%,soft parse%,sql executeelapsed time,parse time elapsed。通过缓存命中率、SQL解析等指标,分析是否存在大量硬解析,是否SQL解析时间占比SQL执行时间超过阈值范围,从而判定是否数据库的缓存参数配置或SQL优化器、执行器设置存在问题。
单个指标包括:执行次数,解析次数,总执行时间,平均执行时间,执行时间占比,总逻辑读,总物理读,平均物理读,平均逻辑读,排序次数,返回行数,平均返回行数。从单个SQL语句的监控指标可以看出SQL语句的编写是否存在问题,数据库表设计、索引设计是否符合业务需求,如存在过多的表联合查询,缺少索引或索引不规范等问题。
c.监控数据库的事务
事务组件层常见的问题在于:某个大并发请求时间段内,通过数据库的长/大事务指标判断是否出现长事务、事务回滚等影响数据库响应时间的操作。长事务进行大批量的数据处理,往往占据大量系统资源,而且运行时间长。在数据库大并发压力情况下,长事务会严重影响到其他事务的运行,甚至可能导致数据库系统不可用。大型事务的回滚产生非常大的代价,不仅锁定需要的资源,并且消耗大量的CPU和磁盘I/O,尤其是I/O操作将极为密集,极大的影响数据库的响应性能。
具体而言,事务监控指标主要是查看在压测过程中,是否存在长事务、大事务的情况,由于事务管理的机制都是经过使用日志文件来实现的,长事务和大事务的出现对数据库性能影响重大,因此,在监控中若出现长事务、大事务的情况,需要根据业务流程进一步分析是否可以拆分SQL语句或数据提交机制。
d.监控数据库的锁
数据库是一个多用户使用的共享资源,Oracle利用其锁机制来实现事务间的数据并发访问及数据一致性,Oracle的锁机制是一种轻量级的锁定机制,Oracle锁的信息是数据块的一个物理属性,而不是逻辑上属于某个表或某个行。因此,锁组件的监控在于从v$lock表和v$locked_object,找出持有锁的SQL、等待锁的SQL。确定谁持有锁,持有哪些类型的锁,当前被锁资源情况等。
具体而言,锁组件监控指标是从v$lock表和v$locked object中确认是否存在锁,找出持有锁的SQL语句以及等待锁的SQL语句。根据加锁的级别越大,数据库越省事,并发性越差的原则,结合SQL语句和业务逻辑,对SQL语句进行拆分,降低锁级别和持有时长,进一步减少锁的产生。
e.监控数据库的存储
在存储组件层面,主要分析存储介质磁盘的性能及存储磁盘的容量。一般可以通过Oracle基准测试来获取存储磁盘的IOPS基准值。而Oracle数据库的存储性能可以查看数据库实例层面的磁盘指标physical read*和physical write*来判断。可以分别分析应用的IO、系统IO、所有IO,单块读、单块写等。对比逻辑读和物理读的指标值,可以反映出数据库的缓存命中率及其变化趋势。
具体而言,存储组件监控指标分成数据库表空间、磁盘读写、数据文件I/O三个维度来查看,表空间指标包括:块大小,使用大小,分配大小,可扩展总大小;磁盘读写指标主要是磁盘的逻辑和物理读写情况,包括:physical read IO requests,physical readbytes,physical read total IO requests,physical read total bytes,physicalwrite IO requests,physical write bytes,physical write total IO requests,physical write total bytes;数据文件监控指标包括:数据库I/O,日志I/O响应时间,数据文件I/O响应时间。结合三个维度的存储指标,对比Oracle数据库基准测试I/O指标值,可以确认是否数据库存储存在性能瓶颈。
f.监控数据库的日志
数据库日志和参数的监控,结合数据库的日志文件,分析数据库执行过程中是否存在错误信息,通过trace、alert、log等日志文件,来进一步判断性能问题所在。
从上面三个步骤的监控和定位,从性能瓶颈可能出现的源头出发,从设计阶段的静态扫描到开发测试阶段的整体监控/逐层递进分析的诊断操作思路,实现由表及里,从整体到局部,逐层细节的数据库性能瓶颈定位分析方案,便于普通使用者快速精准的定位数据库性能瓶颈的节点、组件及根因,极大的提升数据库问题分析解决的效率;从服务器资源监控、等待事件分析、数据库组件监控三方面逐层深入,以Oracle数据库为例,即从Oracle数据库应用级别、进程级别、SQL语句级别逐级下钻,分析性能瓶颈点,定位产生性能问题的根因,生成诊断报告,实现数据库性能瓶颈的有效快速精准定位分析。
此外,本发明实施例还提出一种数据库性能瓶颈定位分析装置,所述装置包括:
监控模块,用于在软件开发测试阶段的压测过程中,监控数据库所在的服务器层的资源消耗指标;
定位分析模块,用于根据所述服务器层资源消耗指标,并结合所述数据库的基准测试资源消耗指标和预设的正常压力下服务器资源消耗阈值范围,对所述服务器层的硬件资源是否存在性能瓶颈进行定位分析。
本实施例数据库性能瓶颈定位分析的实现原理,可以参照上述各实施例,在此不再赘述。
此外,本发明实施例还提出一种数据库性能瓶颈定位分析系统,所述系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序程序,所述计算机程序被所述处理器执行时实现如上述实施例所述的数据库性能瓶颈定位分析方法的步骤。
本实施例数据库性能瓶颈定位分析的实现原理,可以参照上述各实施例,在此不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例所述的数据库性能瓶颈定位分析方法的步骤。
本实施例数据库性能瓶颈定位分析的实现原理,可以参照上述各实施例,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台推荐效果评价系统(可以是手机,计算机,服务器,被控终端,或者网络设备等)执行本发明每个实施例的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (7)
1.一种数据库性能瓶颈定位分析方法,其特征在于,应用于Oracle数据库系统,所述方法包括以下步骤:
在软件系统架构设计阶段,定义所述数据库的架构规范和SQL语句规则;
基于所述数据库的架构规范和SQL语句规则,对数据库性能参数进行检测和SQL扫描,对比预设的所述数据库的基准测试性能黄金指标值和对应的参数建议值范围,确定存在问题的数据库参数值;
在软件开发测试阶段的压测过程中,监控数据库所在的服务器层的资源消耗指标;
根据所述服务器层资源消耗指标,并结合所述数据库的基准测试资源消耗指标和预设的正常压力下服务器资源消耗阈值范围,对所述服务器层的硬件资源是否存在性能瓶颈进行定位分析;
对所述数据库的全链路业务流程层进行监控,获得所述数据库的等待事件;
确定所述数据库的等待事件类型;
根据所述数据库的等待事件类型,结合所述服务器层的资源消耗指标,确定性能瓶颈点的方向;
监控所述数据库的组件层,确定所述性能瓶颈点;
分析所述性能瓶颈点,定位产生性能问题的根因,生成诊断报告。
2.根据权利要求1所述的方法,其特征在于,根据所述服务器层资源消耗指标,并结合所述数据库的基准测试资源消耗指标和预设的正常压力下服务器资源消耗阈值范围,对所述服务器层的硬件资源是否存在性能瓶颈进行定位分析的步骤包括:
将所述服务器层资源消耗指标,与所述数据库的基准测试资源消耗指标进行比对,判断所述服务器层资源消耗指标是否超出对应指标预设的正常压力下服务器资源消耗阈值范围;
若所述服务器层资源消耗指标超出预设的正常压力下服务器资源消耗阈值范围,则确定所述服务器层资源消耗指标异常;
将异常的服务器层资源消耗指标,匹配预设的表象-根因对应关系,定位可能的性能瓶颈组件。
3.根据权利要求1所述的方法,其特征在于,所述监控所述数据库的组件层,确定所述性能瓶颈点的步骤包括:
基于业务交易压力传导路径,从应用端开始,监控所述数据库的组件层,确定所述数据库执行进程情况,所述组件层的组件包括:所述数据库的应用连接、SQL分析执行、事务、锁、存储、日志和参数中的一种或多种;
根据所述数据库执行进程情况,确定所述性能瓶颈点。
4.根据权利要求3所述的方法,其特征在于,所述监控所述数据库的组件层,确定所述数据库执行进程情况的步骤包括:
监控所述数据库的应用连接,查看所述数据库的应用连接情况,以根据所述数据库的应用连接情况确认造成性能瓶颈的根源是在应用端、应用与数据库之间的连接,或者数据库端,所述数据库的应用连接情况至少包括:所述数据库连接数的变化曲线;
监控所述数据库的SQL分析执行流程,获得所述数据库的SQL的解析和执行情况,以根据所述数据库的SQL的解析和执行情况,确定所述性能瓶颈点;
监控所述数据库的事务组件,查询是否出现影响数据库响应时间的预设的长/大事务数据处理操作,以根据长/大事务数据处理操作情况确定所述性能瓶颈点。
5.一种数据库性能瓶颈定位分析装置,其特征在于,应用于Oracle数据库系统,所述装置包括:
监控模块,用于在软件开发测试阶段的压测过程中,监控数据库所在的服务器层的资源消耗指标;
定位分析模块,用于根据所述服务器层资源消耗指标,并结合所述数据库的基准测试资源消耗指标和预设的正常压力下服务器资源消耗阈值范围,对所述服务器层的硬件资源是否存在性能瓶颈进行定位分析;
所述监控模块还用于,对所述数据库的全链路业务流程层进行监控,获得所述数据库的等待事件;以及,监控所述数据库的组件层,确定性能瓶颈点;
所述定位分析模块还用于,确定所述数据库的等待事件类型,根据所述数据库的等待事件类型,结合所述服务器层的资源消耗指标,确定性能瓶颈点的方向;以及,分析监控所述数据库的组件层得到的所述性能瓶颈点,定位产生性能问题的根因,生成诊断报告;
所述数据库性能瓶颈定位分析装置还用于,在软件系统架构设计阶段,定义所述数据库的架构规范和SQL语句规则;基于所述数据库的架构规范和SQL语句规则,对数据库性能参数进行检测和SQL扫描,对比预设的所述数据库的基准测试性能黄金指标值和对应的参数建议值范围,确定存在问题的数据库参数值。
6.一种数据库性能瓶颈定位分析系统,其特征在于,所述系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至4中任一项所述的数据库性能瓶颈定位分析方法的步骤。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述的数据库性能瓶颈定位分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111155840.1A CN113886205B (zh) | 2021-09-28 | 2021-09-28 | 数据库性能瓶颈定位分析方法、装置、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111155840.1A CN113886205B (zh) | 2021-09-28 | 2021-09-28 | 数据库性能瓶颈定位分析方法、装置、系统及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113886205A CN113886205A (zh) | 2022-01-04 |
CN113886205B true CN113886205B (zh) | 2024-06-25 |
Family
ID=79004419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111155840.1A Active CN113886205B (zh) | 2021-09-28 | 2021-09-28 | 数据库性能瓶颈定位分析方法、装置、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113886205B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024055663A1 (zh) * | 2022-09-14 | 2024-03-21 | 华为云计算技术有限公司 | 一种数据库的性能监控方法及相关系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106855844A (zh) * | 2015-12-09 | 2017-06-16 | 北京神州泰岳软件股份有限公司 | 一种性能测试方法和系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101316185B (zh) * | 2007-06-01 | 2011-05-18 | 阿里巴巴集团控股有限公司 | 一种基于日志文件的分析结果定位系统资源瓶颈的方法 |
CN107656858A (zh) * | 2016-07-26 | 2018-02-02 | 深圳联友科技有限公司 | 一种自动运维监控oracle数据库的方法及系统 |
CN106547860B (zh) * | 2016-10-21 | 2020-06-02 | 长安通信科技有限责任公司 | 一种分布式数据库性能故障的定位方法 |
CN111563014A (zh) * | 2019-02-13 | 2020-08-21 | 北京京东尚科信息技术有限公司 | 接口服务性能测试方法、装置、设备和存储介质 |
CN110162442B (zh) * | 2019-04-19 | 2022-09-27 | 平安科技(深圳)有限公司 | 一种系统性能瓶颈定位方法及系统 |
CN112131086A (zh) * | 2020-09-18 | 2020-12-25 | 浪潮电子信息产业股份有限公司 | 一种应用服务器的性能调优方法、装置及设备 |
CN112905431A (zh) * | 2021-03-05 | 2021-06-04 | 上海中通吉网络技术有限公司 | 系统性能问题自动定位方法、装置及设备 |
-
2021
- 2021-09-28 CN CN202111155840.1A patent/CN113886205B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106855844A (zh) * | 2015-12-09 | 2017-06-16 | 北京神州泰岳软件股份有限公司 | 一种性能测试方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113886205A (zh) | 2022-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7496799B2 (en) | System and method for monitoring the performance of a server | |
US7337167B2 (en) | Estimating a number of rows returned by a recursive query | |
US6910036B1 (en) | Database performance monitoring method and tool | |
US8788527B1 (en) | Object-level database performance management | |
US10642847B1 (en) | Differentially private budget tracking using Renyi divergence | |
US20080126393A1 (en) | Computer program product and system for annotating a problem sql statement for improved understanding | |
US7979440B2 (en) | System and article of manufacture for efficient evaluation of index screening predicates | |
US8108350B2 (en) | End-to-end tracing for database applications | |
US11803521B2 (en) | Implementation of data access metrics for automated physical database design | |
CN113886205B (zh) | 数据库性能瓶颈定位分析方法、装置、系统及存储介质 | |
US7325016B1 (en) | Monitoring database performance by obtaining SQL addresses for SQL statements | |
US20030167275A1 (en) | Computation of frequent data values | |
US6304871B1 (en) | Method and system for characterizing applications for use with databases having structured query language interfaces | |
CN106547860B (zh) | 一种分布式数据库性能故障的定位方法 | |
CN112527620A (zh) | 数据库性能分析方法及装置、电子设备、介质、产品 | |
US20090171921A1 (en) | Accelerating Queries Based on Exact Knowledge of Specific Rows Satisfying Local Conditions | |
US11797366B1 (en) | Identifying a root cause of an error | |
US10838947B2 (en) | Consistency check for foreign key definition | |
US7725461B2 (en) | Management of statistical views in a database system | |
US7685103B2 (en) | Method, system, and program for predicate processing by iterator functions | |
CN113641572B (zh) | 一种基于sql的海量大数据计算开发的调试方法 | |
US9715438B2 (en) | Static execution of statements in a program | |
Zhu et al. | An empirical study on quality issues of eBay's big data SQL analytics platform | |
Debes | Statspack | |
Persson | Databasanalys |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |