CN113190416A - 数据库执行计划的预警方法、装置、电子设备和存储介质 - Google Patents

数据库执行计划的预警方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN113190416A
CN113190416A CN202110587996.0A CN202110587996A CN113190416A CN 113190416 A CN113190416 A CN 113190416A CN 202110587996 A CN202110587996 A CN 202110587996A CN 113190416 A CN113190416 A CN 113190416A
Authority
CN
China
Prior art keywords
current
early warning
warning threshold
state parameter
current operation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110587996.0A
Other languages
English (en)
Inventor
姚积全
唐世昊
何雨伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110587996.0A priority Critical patent/CN113190416A/zh
Publication of CN113190416A publication Critical patent/CN113190416A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Computing Systems (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公开提供了一种数据库执行计划的预警方法,包括先获取数据库执行计划的当前运行信息,当前运行信息包含当前运行时间和当前运行状态参数。再根据当前运行时间,计算当前运行状态参数对应的当前预警阈值。最后根据计算所得的当前预警阈值,判断数据库执行计划的运行情况,具体判断当前运行状态参数与当前预警阈值之间是否符合预设关系,若当前运行状态参数与当前预警阈值之间符合预设关系,则发出预警信息,预警信息表示数据库执行计划运行异常。本公开还提供一种数据库执行计划的预警装置、电子设备以及计算机可读存储介质。

Description

数据库执行计划的预警方法、装置、电子设备和存储介质
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种数据库执行计划的预警方法、装置、电子设备和计算机可读存储介质。
背景技术
随着银行业务系统的高速发展,业务受众对象越来越多,商业银行的业务范畴已不再局限于柜面,各种基于互联网的业务渠道层出不穷,每天的业务数据量受外部因素影响,变化较大。因此,一旦任一项业务相关的数据库执行计划出现运行异常问题,将会直接影响业务处理时效。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:一般的数据库监控系统,往往通过历史经验设置预警指标,但预警指标固定,调整过程繁琐。由于无法自动化智能调整预警指标,使得运维人员无法及时定位并处理异常问题,同时由于预警指标的不智能性,也会增加运维人员的工作量。
发明内容
有鉴于此,本公开提供了一种数据库执行计划的预警方法和装置。
本公开的一个方面提供了一种数据库执行计划的预警方法,包括:获取数据库执行计划的当前运行信息,所述当前运行信息包含当前运行时间和当前运行状态参数;根据所述当前运行时间,计算所述当前运行状态参数对应的当前预警阈值;判断所述当前运行状态参数与所述当前预警阈值之间是否符合预设关系;若所述当前运行状态参数与所述当前预警阈值之间符合预设关系,则发出预警信息,所述预警信息表示所述数据库执行计划运行异常。
根据本公开的实施例,在所述根据所述当前运行时间,计算所述当前运行状态参数对应的当前预警阈值之前,所述方法还包括:判断所述当前运行时间是否属于预设时间范围;若所述当前运行时间属于预设时间范围内,则计算所述当前运行状态参数对应的当前预警阈值;若所述当前时间不属于预设时间范围内,则设置默认预警阈值作为当前预警阈值。
根据本公开的实施例,根据所述当前运行时间,计算所述当前运行状态参数对应的当前预警阈值,包括:获取所述运行信息包含的至少一种当前运行状态参数;根据所述当前运行时间,分别计算至少一种所述当前运行状态参数对应的当前预警阈值。
根据本公开的实施例,所述根据所述当前运行时间,计算所述当前运行状态参数对应的当前预警阈值,包括:获取默认预警阈值X和所述当前运行时间的预设偏离度Y;计算所述当前预警阈值为M,则:M=X(1+Y)。
根据本公开的实施例,所述判断所述当前运行状态参数与所述当前预警阈值之间是否符合预设关系,包括:分别判断每种所述当前运行状态参数的参数值是否大于或等于所述对应的当前预警阈值;若存在大于或等于所述对应的当前预警阈值的当前运行状态参数的参数值,则获取所述当前运行状态参数的预设权值;计算所有所述预设权值之和,得到当前预警率;判断所述当前预警率是否大于或等于预设预警率;所述若所述当前运行状态参数与所述当前预警阈值之间符合预设关系,则发出预警信息,包括:若所述当前预警率大于或等于预设预警率,则发出预警信息。
根据本公开的实施例,所述方法还包括:获取所述预警信息,所述预警信息包括所述数据库执行计划的服务器参数和SQL序列;根据所述服务器参数和所述SQL序列,定位异常发生地址。
根据本公开的实施例,所述方法还包括:获取数据库执行计划的多个历史周期的历史运行状态参数;计算所有所述历史运行状态参数的平均值,得到所述默认预警阈值。
本公开的另一个方面提供了一种数据库执行计划的预警装置,包括:第一获取模块,用于获取数据库执行计划的当前运行信息,所述当前运行信息包含当前运行时间和当前运行状态参数;第一计算模块,用于根据所述当前运行时间,计算所述当前运行状态参数对应的当前预警阈值;第一判断模块,用于判断所述当前运行状态参数与所述当前预警阈值之间是否符合预设关系;发出模块,用于若所述当前运行状态参数与所述当前预警阈值之间符合预设关系,则发出预警信息,所述预警信息表示所述数据库执行计划运行异常。
根据本公开的实施例,所述装置还包括:第二判断模块,用于判断所述当前运行时间是否属于预设时间范围;第二计算模块,用于若所述当前运行时间属于预设时间范围内,则计算所述当前运行状态参数对应的当前预警阈值;设置模块,用于若所述当前时间不属于预设时间范围内,则设置默认预警阈值作为当前预警阈值。
根据本公开的实施例,所述第一计算模块包括:第一获取单元,用于获取所述运行信息包含的至少一种当前运行状态参数;第一计算单元,用于根据所述当前运行时间,分别计算至少一种所述当前运行状态参数对应的当前预警阈值。
根据本公开的实施例,所述第一计算模块包括:第二获取单元,用于获取默认预警阈值X和所述当前运行时间的预设偏离度Y;第二计算单元,用于计算所述当前预警阈值为M,则:M=X(1+Y)。
根据本公开的实施例,所述第一判断模块,包括,包括:第一判断单元,用于分别判断每种所述当前运行状态参数的参数值是否大于或等于所述对应的当前预警阈值;第三获取单元,用于若存在大于或等于所述对应的当前预警阈值的当前运行状态参数的参数值,则获取所述当前运行状态参数的预设权值;第三计算单元,用于计算所有所述预设权值之和,得到当前预警率;第二判断单元,用于判断所述当前预警率是否大于或等于预设预警率;所述发出模块,具体用于若所述当前预警率大于或等于预设预警率,则发出预警信息。
根据本公开的实施例,所述装置还包括:第二获取模块,用于获取所述预警信息,所述预警信息包括所述数据库执行计划的服务器参数和SQL序列;定位模块,用于根据所述服务器参数和所述SQL序列,定位异常发生地址。
根据本公开的实施例,所述装置还包括:第三获取模块,用于获取数据库执行计划的多个历史周期的历史运行状态参数;第四计算模块,用于计算所有所述历史运行状态参数的平均值,得到所述默认预警阈值。
本公开的另一方面提供了一种电子设备,所述电子设备包括一个或多个处理器;以及存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求上述任一项所述的方法。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
根据本公开的实施例,因为采用了实时更新预警阈值的技术手段,所以至少部分地克服了现有技术中只能根据历史经验设置预警阈值的技术问题,进而达到了提高预警准确率的技术效果。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了可以应用本公开的数据库执行计划的预警方法和装置的示例性系统架构;
图2示意性示出了根据本公开实施例的数据库执行计划的预警方法的流程图;
图3示意性示出了根据本公开实施例的运行信息的示意图。
图4A示意性示出了根据本公开另一实施例的数据库执行计划的预警方法的流程图;
图4B示意性示出了根据本公开实施例的计算当前预警阈值的方法的流程图;
图4C示意性示出了根据本公开实施例的计算默认预警阈值的方法的流程图;
图4D示意性示出了根据本公开实施例的判断预设关系的方法的流程图;
图4E示意性示出了根据本公开实施例的定位异常的方法的流程图;
图4F示意性示出了根据本公开实施例的预警信息的示意图;
图5示意性示出了根据本公开实施例的数据库执行计划的预警装置的框图;
图6A示意性示出了根据本公开另一实施例的数据库执行计划的预警装置的框图;
图6B示意性示出了根据本公开实施例的第一计算模块的框图;
图6C示意性示出了根据本公开实施例的第一判断模块的框图;
图6D示意性示出了根据本公开另一实施例的数据库执行计划的预警装置的框图;
图6E示意性示出了根据本公开另一实施例的数据库执行计划的预警装置的框图;
图7示意性示出了根据本公开实施例的适于实现数据库执行计划的预警装置的电子设备的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
本公开的实施例提供了一种数据库执行计划的预警方法以及能够应用该方法的装置。该方法包括先获取数据库执行计划的当前运行信息,当前运行信息包含当前运行时间和当前运行状态参数。再根据当前运行时间,计算当前运行状态参数对应的当前预警阈值。最后根据计算所得的当前预警阈值,判断数据库执行计划的运行情况,具体判断当前运行状态参数与当前预警阈值之间是否符合预设关系,若当前运行状态参数与当前预警阈值之间符合预设关系,则发出预警信息,预警信息表示数据库执行计划运行异常。
图1示意性示出了根据本公开实施例的可以应用数据库执行计划的预警方法和装置的示例性系统架构100。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的数据库执行计划的预警方法一般可以由服务器105执行。相应地,本公开实施例所提供的数据库执行计划的预警装置一般可以设置于服务器105中。本公开实施例所提供的数据库执行计划的预警方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的数据库执行计划的预警装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。或者,本公开实施例所提供的数据库执行计划的预警装置也可以由终端设备101、102或103执行,或者也可以由不同于终端设备101、102或103的其他终端设备执行。相应地,本公开实施例所提供的数据库执行计划的预警装置也可以设置于终端设备101、102或103中,或设置于不同于终端设备101、102或103的其他终端设备中。
例如,数据库执行计划可以原本存储在终端设备101、102或103中的任意一个(例如,终端设备101,但不限于此)之中,或者存储在外部存储设备上并可以导入到终端设备101中。然后,终端设备101可以在本地执行本公开实施例所提供的数据库执行计划的预警方法,或者将数据库执行计划发送到其他终端设备、服务器或服务器集群,并由接收该数据库执行计划的其他终端设备、服务器或服务器集群来执行本公开实施例所提供的数据库执行计划的预警方法。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
数据库执行计划,也叫作SQL执行计划,可理解为一条查询语句在数据库中的执行过程或访问路径的描述。在使用数据库的过程中,在接受到查询SQL的指令之后,数据库会立即分配一个线程对该指令进行处理。查询处理器会对SQL查询任务进行优化,优化后会生成执行计划。然后交由计划执行器来执行。在执行每一条SQL指令时,都会生成相应的SQL执行计划。执行计划包括SQL查询的顺序、是否使用索引、以及使用索引信息的等等。
对于任何一项成熟的银行业务,除特定日期以外,每批次的交易量都是可预估的,且每批次的执行计划的运行时间之间差别不大。因此,若突然出现执行时间异常,例如,运行时间过长,依旧没有运行完成,则运维人员要花费时间去定位该异常问题。一个SQL执行计划的运行异常会造成后续其他执行计划的运行,从而影响业务处理的时效性。且在一个交易周期中,交易量会在正常的范围内浮动。若设置固定的预警指标对执行计划进行检测,则会生成很多不必要的预警信息,增加运维人员的工作量,降低预警准确率。因此,如何及时精准地预警SQL执行计划的异常变得极为重要。
图2示意性示出了根据本公开实施例的数据库执行计划方法的流程图。
如图2所示,该方法包括操作S201~S204。
在操作S201,获取数据库执行计划的当前运行信息,当前运行信息包含当前运行时间和当前运行状态参数。
在监控数据库执行计划时,从上游应用中实时获取数据库执行计划的当前运行信息,包括当前运行时间、当前运行时长、当前运行数据量以及当前服务器性能容量等等。其中,当前运行时长、当前运行数据量以及当前服务器性能容量为当前运行状态参数。运行状态参数之间是相互关联的。例如,当运行数据量增大时,运行时长会相应的增加。再例如,当服务器容量被高度占用时,运行时长也可能相应的增加。
运行信息的具体内容可见后文图3的相关描述。
在操作S202,根据当前运行时间,计算当前运行状态参数对应的当前预警阈值。
预警阈值并不是固定不变的,不同运行时刻下,运行状态参数具有不同的预警阈值。例如,在同一天内,高峰期的运行时长对应预警阈值应该大于非高峰期的运行时长对应的预警阈值。即针对不同的时刻,可以适当的调整预警阈值的大小,但调整的范围并不是可以无限增加的。
在操作S203,判断当前运行状态参数与当前预警阈值之间是否符合预设关系。
在操作S204,若当前运行状态参数与当前预警阈值之间符合预设关系,则发出预警信息,预警信息表示数据库执行计划运行异常。
当前运行状态参数与当前预警阈值之间的预设关系可以是当前运行状态参数与当前预警阈值之间的大小关系。即在判断当前运行状态参数与当前预警阈值之间是否符合预设关系时,可以直接比较当前运行状态参数的值与当前预警阈值之间的大小关系。若当前运行状态参数的值大于或等于当前预警阈值时,则发出预警信息,预警信息表示数据库执行计划运行异常。例如,若当前运行时长大于运行时长的预警阈值,则说明当前运行发生异常,系统发出预警信息告知运维人员数据库执行计划当前运行异常。
通过本公开实施例,结合运行时段和运行场景,自适应地调整预警阈值,实现了对数据库执行计划的动态预警,提高预警的准确性。
图3示意性示出了根据本公开实施例的运行信息的示意图。
如图3所示,运行信息为当前数据库执行计划的基本信息,包括时间戳、应用简称、服务器IP、SQL序列、服务器性能容量和数据量。其中,SQL序列包括应用简称和SQL内容。服务器IP包括CPU使用率、内存使用率、磁盘IO。
从运行信息中可以获取到当前数据库执行计划的具体执行内容,即SQL内容。还可以获取到当前的执行地址,即服务器IP,以及服务器的使用情况。根据运行信息,可以迅速得知数据库执行计划的当前运行状态。
下面参考图4A~图4F,结合具体实施例对图2所示的方法做进一步说明。
图4A示意性示出了根据本公开另一实施例的数据库执行计划的预警方法的流程图。
如图4A所示,在根据当前运行时间,计算当前运行状态参数对应的当前预警阈值之前,该方法还包括操作S401~S403。
在操作S401,判断当前运行时间是否属于预设时间范围。若当前运行时间属于预设时间范围内,则执行操作S402,若当前时间不属于预设时间范围内,则执行操作S403。
在操作S402,计算当前运行状态参数对应的当前预警阈值。
在操作S403,设置默认预警阈值作为当前预警阈值。
在本公开实施例中,通过对当前运行时间的判断,确定是否执行对预警阈值的自动调整。在不同的运行场景下,可选择是否对预警阈值进行自动调整。
例如,在非业务高峰期,信用卡还款的交易量不会出现大的浮动,即数据库执行计划的运行过程也会在正常范围内波动。因此,此时需要关闭阈值自动调整开关,使得预警阈值并不会更新,而采用默认预警阈值。默认预警阈值为符合日常交易量的预警阈值。
再例如,当出现金融舆情时,银行的交易量会出现异常的波动,数据库执行计划的运行过程也会出现运行时长增加的情况,但此时的运行时长增加是正常运行过程。因此,此时需要开启阈值自动调整开关,使得阈值根据时间段自动调整,从而降低需警率。
再例如,当预警阈值已经被更新至可接受的最大值时,需要关闭阈值自动调整开关,停止预警阈值的更新。避免由于预警阈值更新到过大后,造成漏检的问题。
图4B示意性示出了根据本公开实施例的计算当前预警阈值的方法的流程图。
如图4B所示,根据当前运行时间,计算当前运行状态参数对应的当前预警阈值,包括操作S404~S405。
在操作S404,获取运行信息包含的至少一种当前运行状态参数。
在操作S405,根据当前运行时间,分别计算至少一种当前运行状态参数对应的当前预警阈值。
在本公开实施例中,运行信息包括多种运行状态参数,选择至少一种当前运行状态参数与运行状态进行预警。若选择一种当前运行状态参数,则根据当前运行时间,计算该当前运行状态参数对应的当前预警阈值。若选择多种当前运行状态参数,则根据当前运行时间,分别计算每一种当前运行状态参数对应的当前预警阈值。
计算当前运行状态参数对应的当前预警阈值,包括:获取默认预警阈值X和当前运行时间的预设偏离度Y。计算当前预警阈值为M,则:
M=X(1+Y)。
例如,获取当前运行时长、当前运行数据量以及当前服务器性能容量。当前运行时长的默认预警阈值是1小时,当前运行数据量默认预警阈值是1000万,以及当前服务器性能容量默认预警阈值是CPU占用率30%。在上午10点时,当前运行时长、当前运行数据量以及当前服务器性能容量的预设偏离度分别是10%、20%和30%。则计算当前运行时长对应的当前预警阈值为60×(1+10%)=66分钟、当前运行数据量对应的当前预警阈值为1000×(1+20%)=1200万,以及当前服务器性能容量对应的当前预警阈值为30×(1+30%)=39%。
图4C示意性示出了根据本公开实施例的计算默认预警阈值的方法的流程图。
如图4C所示,该方法还包括操作S406~S407。
在操作S406,获取数据库执行计划的多个历史周期的历史运行状态参数。
在操作S407,计算所有历史运行状态参数的平均值,得到默认预警阈值。
在本公开实施例中,通过默认预警阈值根据历史数据决定。例如,某一数据库执行计划的执行周期为一天一次,则可以获取当前日期的前十天的执行计划的运行时长、运行数据量以及服务器性能容量,从而计算十天的平均运行时长作为当前运行时长的默认预警阈值,计算平均运行数据量作为当前运行数据量的默认预警阈值,以及计算十天的平均服务器性能容量作为当前运行服务器性能容量的默认预警阈值。
图4D示意性示出了根据本公开实施例的判断预设关系的方法的流程图。
如图4D所示,判断当前运行状态参数与当前预警阈值之间是否符合预设关系,若当前运行状态参数与当前预警阈值之间符合预设关系,则发出预警信息,包括操作S408~S412。
在操作S408,分别判断每种当前运行状态参数的参数值是否大于或等于对应的当前预警阈值。
在操作S409,若存在大于或等于对应的当前预警阈值的当前运行状态参数的参数值,则获取当前运行状态参数的预设权值。
在操作S410,计算所有预设权值之和,得到当前预警率。
在操作S411,判断当前预警率是否大于或等于预设预警率。
在操作S412,若当前预警率大于或等于预设预警率,则发出预警信息。
在本公开实施例中,获取多种当前运行状态参数,每一种当前运行状态参数对数据库执行计划的运行状态的影响程度是不一样的,因此需要通过每种当前运行状态参数的权重计算预警率,从而通过预警率确定是否生成预警信息。
例如,获取当前运行时长、当前运行数据量以及当前服务器性能容量三种当前运行状态参数,预设预警率为50%。其中,当前运行时长、当前运行数据量以及当前服务器性能容量所占权重分别为50%、30%和20%。在分别判断每种当前运行状态参数的参数值是否大于或等于对应的当前预警阈值的过程中,当前运行时长和当前运行数据量分别大于其对应的当前预警阈值,则当前预警率为50%+30%=80%。此时当前预警率80%大于预设预警率50%,则发出预警信息。
再例如,在分别判断每种当前运行状态参数的参数值是否大于或等于对应的当前预警阈值的过程中,当前运行数据量大于其对应的当前预警阈值,则当前预警率为30%。此时当前预警率30%小于预设预警率50%,则不发出预警信息。
由于部分当前运行状态参数对数据库执行计划整体的运行影响不大,因此,若当任一当前运行状态参数大于预警阈值时就发出预警信息,会增加不必要的预警信息,增加运维人员的工作量。
需要说明的是,本公开所指出的每个当前运行状态参数所占的权重、预设预警率、当前时间的预设偏移度以及默认预警阈值等具体数值均为示例性说明,本领域的技术人员可根据实际情况做出相应的调整。
图4E示意性示出了根据本公开实施例的定位异常的方法的流程图;
如图4E所示,该方法还包括操作S413~S414。
在操作S413,获取预警信息,预警信息包括数据库执行计划的服务器参数和SQL序列。
在操作S414,根据服务器参数和SQL序列,定位异常发生地址。
在本公开实施例中,在发出预警信息后,可根据预警信息包含的信息定位异常问题发生的地址。
图4F示意性示出了根据本公开实施例的预警信息的示意图。如图4F所示,预警信息可以包括时间戳、应用简称、服务器IP、SQL序列、SQL内容、执行开始时间、服务器性能容量指标序号和当前数据量。通过时间戳可以获得异常的发生时间。通过SQL内容、应用简称、执行开始时间和当前数据量可以得到异常发生的具体内容,通过服务器IP可以得到异常发生的地址,以及通过服务器性能容量指标序号和当前数据量可以获得异常发生的服务器的状态。
本公开提供的数据库执行计划的预警方法,通过后台多线程实时处理各上游应用上送的最新运行信息,并分别与对应的当前预警阈值进行比较,若满足预设条件,则发出预警信息,在前端页面进行展现。通过准实时的运行信息计算当前预警阈值,实现对预警阈值的实时自动更新,通过阈值调整开关增加预警阈值更新的合理性。根据各运行参数的权重及预警率,来综合判断是否发出预警信息,提高了预警的准确率。同时,在报警基础数据的指标计算和报警数据规则命中过程,均采用多线程,提高系统数据处理的时效性,通过此预警方法能够提高数据库运维人员的工作效率,也能及时降低对银行业务的影响。
图5示意性示出了根据本公开的实施例的数据库执行计划的预警装置的框图。
如图5所示,数据库执行计划的预警装置500包括第一获取模块501、第一计算模块502、第一判断模块503和发出模块504。
第一获取模块501,用于获取数据库执行计划的当前运行信息,当前运行信息包含当前运行时间和当前运行状态参数;
第一计算模块502,用于根据当前运行时间,计算当前运行状态参数对应的当前预警阈值;
第一判断模块503,用于判断当前运行状态参数与当前预警阈值之间是否符合预设关系;
发出模块504,用于若当前运行状态参数与当前预警阈值之间符合预设关系,则发出预警信息,预警信息表示数据库执行计划运行异常。
图6A示意性示出了根据本公开另一实施例的数据库执行计划的预警装置的框图。
如图6A所示,数据库执行计划的预警装置500还包括第二判断模块505,用于判断当前运行时间是否属于预设时间范围。以及第二计算模块506,用于若当前运行时间属于预设时间范围内,则计算当前运行状态参数对应的当前预警阈值。设置模块507,用于若当前时间不属于预设时间范围内,则设置默认预警阈值作为当前预警阈值。
图6B示意性示出了根据本公开实施例的第一计算模块的框图。
如图6B所示,第一计算模块502包括第一获取单元5201,用于获取运行信息包含的至少一种当前运行状态参数,以及第一计算单元5202,用于根据当前运行时间,分别计算至少一种当前运行状态参数对应的当前预警阈值。
图6C示意性示出了根据本公开实施例的第一判断模块的框图。
如图6C所示,第一判断模块503,包括第一判断单元5301,用于分别判断每种当前运行状态参数的参数值是否大于或等于对应的当前预警阈值;第三获取单元5302,用于若存在大于或等于对应的当前预警阈值的当前运行状态参数的参数值,则获取当前运行状态参数的预设权值;第三计算单元5303,用于计算所有预设权值之和,得到当前预警率;第二判断单元5404,用于判断当前预警率是否大于或等于预设预警率。
图6D示意性示出了根据本公开另一实施例的数据库执行计划的预警装置的框图。
如图6D所示,装置500还包括第二获取模块508,用于获取预警信息,预警信息包括数据库执行计划的服务器参数和SQL序列。以及定位模块509,用于根据服务器参数和SQL序列,定位异常发生地址。
图6E示意性示出了根据本公开另一实施例的数据库执行计划的预警装置的框图。
如图6E所示,装置500还包括第三获取模块510,用于获取数据库执行计划的多个历史周期的历史运行状态参数。以及第四计算模块511,用于计算所有历史运行状态参数的平均值,得到默认预警阈值。
本公开提供的数据库执行计划的预警装置,通过后台多线程实时处理各上游应用上送的最新运行信息,并分别与对应的当前预警阈值进行比较,若满足预设条件,则发出预警信息,在前端页面进行展现。通过准实时的运行信息计算当前预警阈值,实现对预警阈值的实时自动更新,通过阈值调整开关增加预警阈值更新的合理性。根据各运行参数的权重及预警率,来综合判断是否发出预警信息,提高了预警的准确率。同时,在报警基础数据的指标计算和报警数据规则命中过程,均采用多线程,提高系统数据处理的时效性,通过此预警方法能够提高数据库运维人员的工作效率,也能及时降低对银行业务的影响。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,第一获取模块501、第一计算模块502、第一判断模块503和发出模块504中的任意多个可以合并在一个模块/单元/子单元中实现,或者其中的任意一个模块/单元/子单元可以被拆分成多个模块/单元/子单元。或者,这些模块/单元/子单元中的一个或多个模块/单元/子单元的至少部分功能可以与其他模块/单元/子单元的至少部分功能相结合,并在一个模块/单元/子单元中实现。根据本公开的实施例,第一获取模块501、第一计算模块502、第一判断模块503和发出模块504中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一获取模块501、第一计算模块502、第一判断模块503和发出模块504中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
需要说明的是,本公开的实施例中数据库执行计划的预警装置部分与本公开的实施例中数据库执行计划的预警方法部分是相对应的,数据库执行计划的预警装置部分的描述具体参考数据库执行计划的预警方法部分,在此不再赘述。
图7示意性示出了根据本公开实施例的适于实现上文描述的方法的电子设备的框图。图7示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,根据本公开实施例的电子设备600包括处理器601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。处理器601例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器601还可以包括用于缓存用途的板载存储器。处理器601可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 603中,存储有系统600操作所需的各种程序和数据。处理器601、ROM 602以及RAM 603通过总线604彼此相连。处理器601通过执行ROM 602和/或RAM 603中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 602和RAM 603以外的一个或多个存储器中。处理器601也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,系统600还可以包括输入/输出(I/O)接口605,输入/输出(I/O)接口605也连接至总线604。系统600还可以包括连接至I/O接口605的以下部件中的一项或多项:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被处理器601执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质。例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件,或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 602和/或RAM 603和/或ROM 602和RAM 603以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,上述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框,以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (16)

1.一种数据库执行计划的预警方法,包括:
获取数据库执行计划的当前运行信息,所述当前运行信息包含当前运行时间和当前运行状态参数;
根据所述当前运行时间,计算所述当前运行状态参数对应的当前预警阈值;
判断所述当前运行状态参数与所述当前预警阈值之间是否符合预设关系;
若所述当前运行状态参数与所述当前预警阈值之间符合预设关系,则发出预警信息,所述预警信息表示所述数据库执行计划运行异常。
2.根据权利要求1所述的方法,其中,在所述根据所述当前运行时间,计算所述当前运行状态参数对应的当前预警阈值之前,所述方法还包括:
判断所述当前运行时间是否属于预设时间范围;
若所述当前运行时间属于预设时间范围内,则计算所述当前运行状态参数对应的当前预警阈值;
若所述当前时间不属于预设时间范围内,则设置默认预警阈值作为当前预警阈值。
3.根据权利要求1所述的方法,其中,所述根据所述当前运行时间,计算所述当前运行状态参数对应的当前预警阈值,包括:
获取所述运行信息包含的至少一种当前运行状态参数;
根据所述当前运行时间,分别计算至少一种所述当前运行状态参数对应的当前预警阈值。
4.根据权利要求1或3所述的方法,其中,根据所述当前运行时间,计算所述当前运行状态参数对应的当前预警阈值,包括:
获取默认预警阈值X和所述当前运行时间的预设偏离度Y;
计算所述当前预警阈值为M,则:
M=X(1+Y)。
5.根据权利要求3所述的方法,其中,所述判断所述当前运行状态参数与所述当前预警阈值之间是否符合预设关系,包括:
分别判断每种所述当前运行状态参数的参数值是否大于或等于所述对应的当前预警阈值;
若存在大于或等于所述对应的当前预警阈值的当前运行状态参数的参数值,则获取所述当前运行状态参数的预设权值;
计算所有所述预设权值之和,得到当前预警率;
判断所述当前预警率是否大于或等于预设预警率;
所述若所述当前运行状态参数与所述当前预警阈值之间符合预设关系,则发出预警信息,包括:
若所述当前预警率大于或等于预设预警率,则发出预警信息。
6.根据权利要求1所述的方法,其中,所述方法还包括:
获取所述预警信息,所述预警信息包括所述数据库执行计划的服务器参数和SQL序列;
根据所述服务器参数和所述SQL序列,定位异常发生地址。
7.根据权利要求2或3所述的方法,其中,所述方法还包括:
获取数据库执行计划的多个历史周期的历史运行状态参数;
计算所有所述历史运行状态参数的平均值,得到所述默认预警阈值。
8.一种数据库执行计划的预警装置,包括:
第一获取模块,用于获取数据库执行计划的当前运行信息,所述当前运行信息包含当前运行时间和当前运行状态参数;
第一计算模块,用于根据所述当前运行时间,计算所述当前运行状态参数对应的当前预警阈值;
第一判断模块,用于判断所述当前运行状态参数与所述当前预警阈值之间是否符合预设关系;
发出模块,用于若所述当前运行状态参数与所述当前预警阈值之间符合预设关系,则发出预警信息,所述预警信息表示所述数据库执行计划运行异常。
9.根据权利要求8所述的装置,其中,所述装置还包括:
第二判断模块,用于判断所述当前运行时间是否属于预设时间范围;
第二计算模块,用于若所述当前运行时间属于预设时间范围内,则计算所述当前运行状态参数对应的当前预警阈值;
设置模块,用于若所述当前时间不属于预设时间范围内,则设置默认预警阈值作为当前预警阈值。
10.根据权利要求8所述的装置,其中,所述第一计算模块包括:
第一获取单元,用于获取所述运行信息包含的至少一种当前运行状态参数;
第一计算单元,用于根据所述当前运行时间,分别计算至少一种所述当前运行状态参数对应的当前预警阈值。
11.根据权利要求8或10所述的装置,其中,所述第一计算模块包括:
第二获取单元,用于获取默认预警阈值X和所述当前运行时间的预设偏离度Y;
第二计算单元,用于计算所述当前预警阈值为M,则:
M=X(1+Y)。
12.根据权利要求10所述的装置,其中,所述第一判断模块,包括,包括:
第一判断单元,用于分别判断每种所述当前运行状态参数的参数值是否大于或等于所述对应的当前预警阈值;
第三获取单元,用于若存在大于或等于所述对应的当前预警阈值的当前运行状态参数的参数值,则获取所述当前运行状态参数的预设权值;
第三计算单元,用于计算所有所述预设权值之和,得到当前预警率;
第二判断单元,用于判断所述当前预警率是否大于或等于预设预警率;
所述发出模块,具体用于若所述当前预警率大于或等于预设预警率,则发出预警信息。
13.根据权利要求8所述的装置,其中,所述装置还包括:
第二获取模块,用于获取所述预警信息,所述预警信息包括所述数据库执行计划的服务器参数和SQL序列;
定位模块,用于根据所述服务器参数和所述SQL序列,定位异常发生地址。
14.根据权利要求9或10所述的装置,其中,所述装置还包括:
第三获取模块,用于获取数据库执行计划的多个历史周期的历史运行状态参数;
第四计算模块,用于计算所有所述历史运行状态参数的平均值,得到所述默认预警阈值。
15.一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任一项所述的方法。
16.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现权利要求1至7中任一项所述的方法。
CN202110587996.0A 2021-05-27 2021-05-27 数据库执行计划的预警方法、装置、电子设备和存储介质 Pending CN113190416A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110587996.0A CN113190416A (zh) 2021-05-27 2021-05-27 数据库执行计划的预警方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110587996.0A CN113190416A (zh) 2021-05-27 2021-05-27 数据库执行计划的预警方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN113190416A true CN113190416A (zh) 2021-07-30

Family

ID=76985477

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110587996.0A Pending CN113190416A (zh) 2021-05-27 2021-05-27 数据库执行计划的预警方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN113190416A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104410686A (zh) * 2014-11-25 2015-03-11 江苏省电力公司扬州供电公司 一种银电网络智能监控系统
WO2020048047A1 (zh) * 2018-09-03 2020-03-12 平安科技(深圳)有限公司 系统故障的预警方法、装置、设备及存储介质
CN111832827A (zh) * 2020-07-16 2020-10-27 国网北京市电力公司 一种配网故障预警方法、装置、可读介质及电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104410686A (zh) * 2014-11-25 2015-03-11 江苏省电力公司扬州供电公司 一种银电网络智能监控系统
WO2020048047A1 (zh) * 2018-09-03 2020-03-12 平安科技(深圳)有限公司 系统故障的预警方法、装置、设备及存储介质
CN111832827A (zh) * 2020-07-16 2020-10-27 国网北京市电力公司 一种配网故障预警方法、装置、可读介质及电子设备

Similar Documents

Publication Publication Date Title
US11487562B2 (en) Rolling resource credits for scheduling of virtual computer resources
US10970263B1 (en) Computer system and method of initiative analysis using outlier identification
US10783002B1 (en) Cost determination of a service call
US11294723B1 (en) Autonomous application management for distributed computing systems
US10489202B2 (en) System and methods for implementing control of use of shared resource in a multi-tenant system
US11449809B2 (en) Application capacity forecasting
CN108923996B (zh) 一种容量分析方法及装置
US20180352020A1 (en) Perfect application capacity analysis for elastic capacity management of cloud-based applications
CN111581055A (zh) 业务系统的控制方法及装置、电子设备和可读存储介质
CN110336884B (zh) 服务器集群更新方法和装置
US20200286163A1 (en) Intraday resource management system
CN113190416A (zh) 数据库执行计划的预警方法、装置、电子设备和存储介质
CN113722177B (zh) 时序指标异常检测方法、装置、系统、设备及存储介质
US11044167B2 (en) Intraday resource management system
CN114710406B (zh) 超时阈值的动态确定方法、装置、电子设备和介质
CN115312208B (zh) 接诊数据展示方法、装置、设备、介质
US20220263782A1 (en) Multi-channel messaging system
CN114841570B (zh) 用于客户关系管理系统的数据处理方法、装置、设备及介质
CN114996119B (zh) 故障诊断方法、装置、电子设备及存储介质
CN110601875B (zh) 信息输出方法、装置、管理设备及计算机可读存储介质
US20230012194A1 (en) System and method for real-time message display decisioning
CN116010952A (zh) 动态基线确定方法、交易数据检测方法、装置和电子设备
CN114240381A (zh) 应急管理方法、装置、设备、介质和程序产品
CN114328096A (zh) 指标监测方法、装置、设备、介质
CN113987032A (zh) 用于确定云服务实施策略的方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination