CN112052145A - 性能告警阈值的确定方法、装置、电子设备和介质 - Google Patents

性能告警阈值的确定方法、装置、电子设备和介质 Download PDF

Info

Publication number
CN112052145A
CN112052145A CN202010943893.9A CN202010943893A CN112052145A CN 112052145 A CN112052145 A CN 112052145A CN 202010943893 A CN202010943893 A CN 202010943893A CN 112052145 A CN112052145 A CN 112052145A
Authority
CN
China
Prior art keywords
performance
target system
alarm threshold
target
monitoring indexes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010943893.9A
Other languages
English (en)
Inventor
贾利娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202010943893.9A priority Critical patent/CN112052145A/zh
Publication of CN112052145A publication Critical patent/CN112052145A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3447Performance evaluation by modeling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公开提供了一种性能告警阈值的确定方法,包括:提取用于监控目标系统的M个性能监控指标,其中,M个性能监控指标用于作为对目标系统执行性能告警的性能告警阈值的确定依据,M为正整数。针对M个性能监控指标,获取目标系统的M个当前性能指标数据,其中,M个当前性能指标数据与M个性能监控指标一一对应,以及将M个当前性能指标数据输入至目标神经网络模型,以获得对目标系统进行性能告警的性能告警阈值,并基于性能告警阈值确定是否对目标系统执行性能告警。另外,本公开还提供了一种性能告警阈值的确定装置,电子设备以及计算机可读存储介质。本公开提供的方法和装置例如可以应用于金融领域或其他领域的系统性能告警中。

Description

性能告警阈值的确定方法、装置、电子设备和介质
技术领域
本公开涉及人工智能领域,特别是涉及一种性能告警阈值的确定方法、装置、电子设备和介质。
背景技术
伴随着科学技术的不断拓宽与发展,企业对应用主机、业务应用的需求呈逐步增加的趋势。同时伴随着业务活动的不断推陈出新,其频繁化和多样化使得各业务对IT(Intemet Technology,互联网技术)设备的响应要求级别不同。为了保证业务的顺利开展,需要监控IT设备的设备性能,以便运维人员能够对设备性能做到实时掌控,并且在IT设备出现异常的情况下,可以及时地、有针对性地采取相关的应对解决措施,以期调整IT设备性能,及时降低、甚至解除由于IT设备出现异常情况而给业务开展造成的负面影响。
相关技术也提供了一些监控IT设备的设备性能的解决方案。例如,可以根据业务对IT应用系统的响应要求,人工设置用于监控设备性能的监控指标,并人工设置与监控指标对应的告警阈值。
但是,相关技术提供的监控指标和告警阈值的配置方式,配置效率低,且准确率不高,无法适应技术潮流和业务发展的需要。
发明内容
有鉴于此,为了提高告警阈值的配置效率以及准确率,适应技术潮流和业务发展的需要,至少部分地克服相关技术的上述技术问题。本公开提供了一种性能告警阈值的确定方法、装置、电子设备和介质。
为实现上述目的,本公开的一个方面提供了一种性能告警阈值的确定方法,包括:提取用于监控目标系统的M个性能监控指标,其中,上述M个性能监控指标用于作为对上述目标系统执行性能告警的性能告警阈值的确定依据,M为正整数。针对上述M个性能监控指标,获取上述目标系统的M个当前性能指标数据,其中,上述M个当前性能指标数据与上述M个性能监控指标一一对应。以及将上述M个当前性能指标数据输入至目标神经网络模型,以获得对上述目标系统进行性能告警的性能告警阈值,并基于上述性能告警阈值确定是否对上述目标系统执行性能告警。
根据本公开的实施例,在将上述M个当前性能指标数据输入至目标神经网络模型之前,上述方法还包括:获取N组输入训练集数据,其中,上述N组输入训练集数据中的每组输入训练集数据与上述M个性能监控指标一一对应,N为正整数。以及对上述N组输入训练集数据进行训练,以得到上述目标神经网络模型。
根据本公开的实施例,上述目标神经网络模型的网络结构包括:网络输入层,其中,上述输入层包括M个输入层神经元,上述M个输入层神经元与上述M个性能监控指标一一对应。网络输出层,其中,上述输出层包括1个输出层神经元。以及网络隐含层,其中,上述隐含层包括P个隐含层神经元,且上述隐含层神经元的个数是基于输入层神经元的个数以及输出层神经元的个数确定的,P为正整数。
根据本公开的实施例,上述方法还包括:为上述网络隐含层设定第一激励函数。为上述网络输出层设定第二激励函数,其中,上述第二激励函数不同于上述第一激励函数。
根据本公开的实施例,上述获取N组输入训练集数据包括:针对上述M个性能监控指标,获取上述目标系统的M个历史性能指标数据,其中,上述M个历史性能指标数据与上述M个性能监控指标一一对应。以及对上述M个历史性能指标数据执行归一化处理,以得到上述N组输入训练集数据。
根据本公开的实施例,上述提取目标系统的M个性能监控指标包括:接收业务系统对上述目标系统的处理请求。基于上述处理请求,获取目标业务。以及基于上述目标业务和/或上述目标系统,提取目标系统的M个性能监控指标。
根据本公开的实施例,上述M个性能监控指标包括以下至少之一:上述目标业务的业务属性。上述目标业务的时间周期。处理上述目标业务时对上述目标系统的负载要求。对上述目标系统执行过性能告警的历史记录。
为实现上述目的,本公开的另一个方面提供了一种性能告警阈值的确定装置,包括:性能监控指标提取模块,用于提取用于监控目标系统的M个性能监控指标,其中,上述M个性能监控指标用于作为对上述目标系统执行性能告警的性能告警阈值的确定依据,M为正整数。性能指标数据获取模块,用于针对上述M个性能监控指标,获取上述目标系统的M个当前性能指标数据,其中,上述M个当前性能指标数据与上述M个性能监控指标一一对应。以及性能告警阈值确定模块,用于将上述M个当前性能指标数据输入至目标神经网络模型,以确定对上述目标系统进行性能告警的性能告警阈值,并基于上述性能告警阈值确定是否对上述目标系统执行性能告警。
根据本公开的实施例,在将上述M个当前性能指标数据输入至目标神经网络模型之前,上述装置还包括:输入训练集数据获取模块,用于获取N组输入训练集数据,其中,上述N组输入训练集数据中的每组输入训练集数据与上述M个性能监控指标一一对应,N为正整数。以及神经网络模型训练模块,用于对上述N组输入训练集数据进行训练,以得到上述目标神经网络模型。
根据本公开的实施例,上述目标神经网络模型的网络结构包括:网络输入层,其中,上述输入层包括M个输入层神经元,上述M个输入层神经元与上述M个性能监控指标一一对应。网络输出层,其中,上述输出层包括1个输出层神经元。以及网络隐含层,其中,上述隐含层包括P个隐含层神经元,且上述隐含层神经元的个数是基于输入层神经元的个数以及输出层神经元的个数确定的,P为正整数。
根据本公开的实施例,上述装置还包括:第一激励函数设定模块,用于为上述网络隐含层设定第一激励函数。第二激励函数设定模块,用于为上述网络输出层设定第二激励函数,其中,上述第二激励函数不同于上述第一激励函数。
根据本公开的实施例,上述输入训练集数据获取模块包括:历史性能指标数据获取子模块,用于针对上述M个性能监控指标,获取上述目标系统的M个历史性能指标数据,其中,上述M个历史性能指标数据与上述M个性能监控指标一一对应。以及输入训练集数据获取子模块,用于对上述M个历史性能指标数据执行归一化处理,以得到上述N组输入训练集数据。
根据本公开的实施例,上述性能监控指标提取模块包括:处理请求接收子模块,用于接收业务系统对上述目标系统的处理请求。目标业务获取子模块,用于基于上述处理请求,获取目标业务。以及性能监控指标提取子模块,基于上述目标业务和/或上述目标系统,提取目标系统的M个性能监控指标。
根据本公开的实施例,上述M个性能监控指标包括以下至少之一:上述目标业务的业务属性。上述目标业务的时间周期。处理上述目标业务时对上述目标系统的负载要求。对上述目标系统执行过性能告警的历史记录。
为实现上述目的,本公开的另一方面提供了一种电子设备,包括:一个或多个处理器,存储器,用于存储一个或多个程序,其中,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如上所述的方法。
为实现上述目的,本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,上述指令在被执行时用于实现如上所述的方法。
为实现上述目的,本公开的另一方面提供了一种计算机程序,上述计算机程序包括计算机可执行指令,上述指令在被执行时用于实现如上所述的方法。
与现有技术所提供的性能告警阈值的确定方法相比,本公开若干实施例提供的性能告警阈值的确定方法,在提取用于监控目标系统的多个性能监控指标的基础上,将获取到的与上述多个性能监控指标一一对应的多个当前性能指标数据输入事先训练好的神经网络模型,就可以得到对目标系统执行性能告警的性能告警阈值,使得基于该性能告警阈值可以确定是否对目标系统执行性能告警,摆脱了性能告警阈值的手动确定方式,实现了性能告警阈值确定方式的自动实现,至少部分克服了相关技术中利用手动方式确定性能告警阈值的效率低且准确率不高的技术的问题,提出了一种新的具备智能性的性能告警阈值的确定方法,实现性能告警阈值不需要手动频繁更新,效率高且准确率高的技术效果。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1示意性示出了适用于本公开实施例的可以应用性能告警阈值的确定方法和装置的系统架构;
图2示意性示出了根据本公开实施例的性能告警阈值的确定方法的流程图;
图3示意性示出了根据本公开实施例的神经网络结构的示意图;
图4示意性示出了根据本公开实施例的性能告警阈值的确定装置的框图;
图5示意性示出了根据本公开实施例的适于实现上文描述的性能告警阈值的确定方法的计算机可读存储介质产品的示意图;以及
图6示意性示出了根据本公开实施例的适于实现上文描述的性能告警阈值的确定方法的电子设备的框图。
在附图中,相同或对应的标号表示相同或对应的部分。
应该注意的是,附图并未按比例绘制,并且出于说明目的,在整个附图中类似结构或功能的元素通常用类似的附图标记来表示。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了上述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程性能告警阈值的确定装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。
相关技术所提供的性能告警阈值的确定方法大多是人工操作的方式,即通过人工操作的方式进行告警阈值的设定,不仅操作效率不高,而且对人为经验的依赖性较强,对于经验不足的相关人员来说,非常容易给监控指标设定出与业务处理要求不匹配的性能告警阈值,甚至设定出错误的性能告警阈值,从而给设备性能的监控造成一定的误导和干扰,更不要说根据每次处理业务对系统的要求,需要给监控指标更新与该业务处理匹配的性能告警阈值了。对于经验丰富的相关人员来说,虽然可以给监控指标设定出与业务处理要求相匹配的性能告警阈值,但是,在业务处理发生变化时,需要根据变化后的业务处理对系统的要求,给监控指标设定出与变化后的业务处理要求相匹配的性能告警阈值。进一步地,该告警阈值在每次设定后就维持固定不变,并不会动态变化,除非手动重新设定更新阈值。显然,传统的性能告警阈值的确定方法,显然已经不再适应当前业务大量日趋增长,系统规模日渐庞大,监控指标划分越来越细的实际状况,也没有考虑到业务趋势、周期性多样化的业务活动等影响因素,使得人工操作无法做到快速响应。
鉴于此,本公开为了克服现有技术中性能告警阈值的确定方法存在的上述不足,提供了一种新的性能告警阈值的确定方法,该方法可以实现性能告警阈值确定的智能化,达到性能告警阈值的可动态调整的技术效果。
本公开的实施例提供了一种性能告警阈值的确定方法、装置、电子设备和介质。其中,性能告警阈值的确定方法包括数据的获取阶段和性能告警阈值的确定阶段。在数据的获取阶段,一方面,提取用于监控目标系统的M个性能监控指标,该M个性能监控指标用于作为对目标系统执行性能告警的性能告警阈值的确定依据,M为正整数。另一方面,针对M个性能监控指标,获取目标系统的M个当前性能指标数据,其中,M个当前性能指标数据与M个性能监控指标一一对应。在性能告警阈值的确定阶段,将M个当前性能指标数据输入至目标神经网络模型,以获得对目标系统执行性能告警的性能告警阈值,并基于性能告警阈值确定是否对目标系统执行性能告警。
本公开提供的性能告警阈值的确定方法,在提取用于监控目标系统的多个性能监控指标的基础上,将获取到的与这多个性能监控指标一一对应的多个当前性能指标数据输入事先训练好的神经网络模型,即可得到对目标系统执行性能告警的性能告警阈值,使得基于该性能告警阈值可以确定是否对目标系统执行性能告警,摆脱了性能告警阈值的手动确定方式,实现了性能告警阈值的自动确定方式。解决了手动确定性能告警阈值的效率低且准确率不高的技术的问题,提出了一种新的具备智能性的性能告警阈值的确定方法,可以解决性能告警阈值需要手动频繁更新的问题。
需要说明的是,本公开提供的性能告警阈值的确定方法及其装置可用于金融领域的业务处理事务或系统性能监控运维事务中,也可用于除金融领域之外的任意领域的业务处理事务或系统性能监控运维事务中,本公开提供的性能告警阈值的确定方法及其装置的应用领域不做限定。
图1示意性示出了适用于本公开实施例的可以应用性能告警阈值的确定方法和装置的系统架构100。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如支付类应用、购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开的实施例所提供的性能告警阈值的确定方法一般可以由服务器105执行。相应地,本公开的实施例所提供的性能告警阈值的确定装置一般可以设置于服务器105中。本公开的实施例所提供的性能告警阈值的确定方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开的实施例所提供的性能告警阈值的确定装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考本公开的若干代表性实施方式,详细阐释本公开的原理和精神。此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
图2示意性示出了根据本公开实施例的性能告警阈值的确定方法的流程图。
如图2所示,该性能告警阈值的确定方法200可以包括操作S210~操作S230。
在操作S210,提取用于监控目标系统的M个性能监控指标。
根据本公开的实施例,目标系统可以是一个或多个IT应用系统,IT设备,伴随着业务活动的多样化,各业务促销周期内对IT应用系统响应要求级别不同,需要根据要求对监控指标进行更高频率的调整。
根据本公开的实施例,M个性能监控指标用于作为对目标系统执行性能告警的性能告警阈值的确定依据,M为正整数。在本公开中,性能监控指标用于表征目标系统在处于运行状态时需要对其执行性能监控的监控维度,通过在多个性能监控指标下对目标系统的监控,可以实时掌控目标系统的运行状态是否正常,是否满足当前业务处理的实际需求。考虑到目标系统是用于处理业务系统的业务进行处理的系统,所以用于监控目标系统的性能监控指标既可以包括目标系统在进行业务处理时表征自身系统性能的指标,也可以包括表征业务系统对目标系统的性能要求的指标,还可以包括表征具体业务的业务属性的指标。
在操作S220,针对M个性能监控指标,获取目标系统的M个当前性能指标数据。
根据本公开的实施例,M个当前性能指标数据与M个性能监控指标一一对应。在本公开中,若有M个性能监控指标,则相应地有M个当前性能指标数据,且每个当前性能指标数据是对应于一个性能监控指标的目标系统的当前性能指标数据。
在操作S230,将M个当前性能指标数据输入至目标神经网络模型,以获得对目标系统执行性能告警的性能告警阈值,并基于性能告警阈值确定是否对目标系统执行性能告警。
根据本公开的实施例,该目标神经网络模型由每组数据的各项指标作为输入,以性能告警阈值作为输出。在高于性能告警阈值的情况下,对目标系统执行性能告警,在不高于性能告警阈值的情况下,对目标系统不用执行性能告警,以便运维人员根据对应的告警内容及时作出相关应对措施。
通过本公开的实施例,在提取用于监控目标系统的多个性能监控指标的基础上,将获取到的与这多个性能监控指标一一对应的多个当前性能指标数据输入事先训练好的神经网络模型,即可得到对目标系统执行性能告警的性能告警阈值,使得基于该性能告警阈值可以确定是否对目标系统执行性能告警,摆脱了性能告警阈值的手动确定方式,实现了性能告警阈值的自动确定方式。解决了手动确定性能告警阈值的效率低且准确率不高的技术的问题,提出了一种新的具备智能性的性能告警阈值的确定方法,可以解决性能告警阈值需要手动频繁更新的问题。
作为一种可选的实施例,前述提取目标系统的M个性能监控指标包括:接收业务系统对前述目标系统的处理请求;基于前述处理请求,获取目标业务;以及基于前述目标业务和/或前述目标系统,提取目标系统的M个性能监控指标。
根据本公开的实施例,不同的业务系统在处理不同的业务活动时,对目标系统的处理请求是不同的,目标系统的性能也会相应发生变化,因此,在本公开中,基于目标系统和目标业务,提取性能监控指标,以实现对目标系统监控的自适应。
作为一种可选的实施例,前述M个性能监控指标包括以下至少之一:前述目标业务的业务属性;前述目标业务的时间周期;处理前述目标业务时对前述目标系统的负载要求;对前述目标系统执行过性能告警的历史记录。
根据本公开的实施例,M个性能监控指标可以包括但不限于业务趋势、周期活动数据、系统负载要求和历史告警处理的至少一个指标。
在本公开中,对业务趋势数据来说,针对不同业务系统,测定的阈值理当不同。企业网银和个人手机银行的业务系统告警阈值明显要区别对待。数据计量方式:每小段时间范围内,业务量的平均数据,可以以笔计,也可以以时间单位计,本公开对此不做限定。
在本公开中,对系统负载要求来说,针对不同的硬件、软件系统配置,系统使用年限因素等影响,系统的负载能力不同。高负载的系统和低负载的系统面对高峰业务的冲击时,抵抗能力不同,按照系统老旧、新置换配置等设定负载等级,高、较高、中、较低、低等不同程度,然后训练过程中再采用等级计量方式量化。
在本公开中,对周期性活动来说,以双十一为例,在这个周期性活动中,不同的时间段设置的告警阈值应当是有区别的,十二点到十二点半,前三十分钟的高峰期报警阈值明显要设定高一些,这样才会减少误报警次数。以活动不同时间段重要程度划分为强、较强、一般、较弱、弱等不同程度,后训练过程中再采用等级计量方式量化即可。
在本公开中,对历史告警处理来说,依据历史告警数据的处理情况,计算同一告警需要处理的次数占总告警的百分比。分数越大,证明该告警需要报警的意愿越强,否则反之。
优选地,性能告警阈值的确定方法以小段时间范围划分(时间范围越小,越精确)。
通过本公开的实施例,利用包含业务趋势、周期活动数据、系统负载要求和历史告警处理等指标的历史指标数据预测系统性能告警阈值。目的是不再依赖专家经验设定系统性能告警的阈值,且可以根据当前要求精准地定位到当前系统性能阈值。
作为一种可选的实施例,在将前述M个当前性能指标数据输入至目标神经网络模型之前,前述方法还可以包括:获取N组输入训练集数据,以及对前述N组输入训练集数据进行训练,以得到前述目标神经网络模型。
根据本公开的实施例,前述N组输入训练集数据中的每组输入训练集数据与前述M个性能监控指标一一对应,N为正整数。本公开对N和M的大小关系不做限定,即N可以大于M,N可以等于M,N可以小于M。可以理解的是,输入训练集数据的数量N越大,训练出的目标神经网络模型精度越高,但是对计算资源的消耗越大,所以在实际运用时,需要对输入训练集数据的数量做合理的选择。
BP网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最为广泛的神经网络模型。BP网络能学习和存储大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。前述目标神经网络可以是人工智能领域的BP(BackPropagation)网络。BP神经网络具备强大的自学习能力、记忆能力和数据的直接处理能力,并且可以通过对已有数据的学习训练,产生对新数据的准确划分,具备一定的智能性,可解决阈值手动频繁更新的问题。学习过程由信号的正向传播与误差的反向传播两个过程组成。
在信号的正向传播阶段:输入样本从输入层传入,经各隐含层逐层处理后,传向输出层。若输出层的实际输出与期望输出不符,则转入误差的反向传播阶段。
在误差的反向传播阶段:将输出结果以某种形式通过隐含层向输入层逐层反传,并将误差分摊给各层的所有神经元,从而获得各层神经元的误差信号,此误差信号即作为修正各神经元权值的依据。
训练一个BP神经网络实际上就是调整网络的权重和偏置这这个参数,BP神经网络的训练分前向传输(逐层波浪式的传递输出值)和逆向反馈(反向逐层调整权重和偏置)两部分。
需要说明的是,在训练BP神经网络之前,需要随机初始化权重和偏置,对每一个权重取[-1,1]的一个随机实数,每一个偏置取[0,1]的一个随机实数,之后就开始进行前向传输。
与现有的告警阈值测定方法相比,本公开采用BP神经网络算法综合考虑了系统负载要求、周期性多样化活动、业务趋势数据、历史告警处理等不同组合情况下的系统性能阈值,随运维实际情况动态调整系统性能阈值,降低提示性告警率,降低运维工作量和成本。
作为一种可选的实施例,本公开可以先用遗传算法对“BP网络”进行优化在解析空间找出较好的搜索空间,再用BP神经网络在较小的搜索空间内搜索最优解。这样可以避免单BP神经网络陷入局部极小和全局搜索能力差的问题。
作为一种可选的实施例,前述目标神经网络模型的网络结构可以包括:网络输入层,其中,前述输入层包括M个输入层神经元,前述M个输入层神经元与前述M个性能监控指标一一对应;网络输出层,其中,前述输出层包括1个输出层神经元;以及网络隐含层,其中,前述隐含层包括P个隐含层神经元,且前述隐含层神经元的个数是基于输入层神经元的个数以及输出层神经元的个数确定的,P为正整数。
根据本公开的实施例,前述目标神经网络模型可以是单隐含层前馈网络,也称为三层前馈网或三层感知器,即:输入层、中间层(也称隐含层)和输出层。其特点是:各层神经元仅与相邻层神经元之间相互全连接,同层内神经元之间无连接,各层神经元之间无反馈连接,构成具有层次结构的前馈型神经网络系统。单计算层前馈神经网络只能求解线性可分问题,能够求解非线性问题的网络必须是具有隐含层的多层神经网络。误差是各层权值的函数,因此调整权值可以改变误差。调整权值的原则是使误差不断减小,因此应使权值与误差的梯度下降成正比。
隐含层中的神经元个数:网络训练精度的提高,可以通过采用一个隐含层,而增加其神经元个数的方法来实现,这在结构实现上要比增加网络层数简单得多。神经元个数太少时,网络不能很好的学习,训练迭代次数也比较多,训练精度不高。神经元个数太多时,网络的功能强大,精度也更高,训练迭代的次数也大,可能会出现过拟合现象。由此,得到神经网络隐含层神经元个数的选取原则是:在能够解决问题的前提下,再加上一两个神经元,以加快误差下降速度即可。
隐含层的神经网络节点数足够多的的话,可以任意精度逼近一个非线性函数。本公开采用含有一个隐含层的三层多输入单输出的BP神经网络建立预测模型。在设计过程中,隐含层神经元个数的确定十分重要。隐含层神经元个数过多,会加大网络计算量并容易产生过拟合问题,神经元个数少,会影响神经网络性能,达不到预期效果。神经网络中神经元的数目与实际问题的复杂程度、输入输出层的神经元个数密切相关,而隐含层神经元个数确定多源于经验公式,其最终确定需要根据经验和多次试验来确定。本文参照以下经验公式:
Figure BDA0002673174130000141
该经验公式中,l为BP神经网络模型的隐含层的神经元的个数,n为BP神经网络模型的输入层的神经元的个数,m为BP神经网络模型的输出层的神经元的个数,a为1至10之间的常数,本领域技术人员可以理解地,a不一定为整数,但l为整数。例如,当n为4,m为5时,l可以取
Figure BDA0002673174130000151
Figure BDA0002673174130000152
之间的整数,即l可以取4、5、6、7、8、9、10、11、12中的任意整数。
在本公开中,BP神经网络模型采用M个性能监控指标,N组输入训练数据集,每组输入训练数据集都包含对应于M个性能监控指标的M个历史指标数据。通过样本数据的训练,可以不断修正神经网络模型的权值和阈值使得误差函数沿着负梯度的方向下降,逼近期望输出。
需要说明的是,BP网络由输入层、输出层和隐含层三层组成,隐含层可以有一层或者多层。BP神经网络的设计需要从网络的层数、每层中的神经元个数、激活函数、初始值以及学习速率这几个方面考虑。特别地。网络的层数,具有偏差和至少一个S型隐含层加上一个线性输出层的网络,使其能够逼近任何有理函数。
图3示意性示出了根据本公开实施例的神经网络的示意图。
在如图3所示的包含输入层、隐含层和输出层的BP网络模型300中,输入层的神经元个数M=4,隐含层的神经元个数l的神经元个数为1。该BP神经网络模型由每组数据的各项指标作为输入,以告警阈值作为输出。业务趋势数据、系统负载要求、周期性活动以及历史告警处理对应测定告警阈值的4个指标,所以输入层的节点数为4,告警阈值对应输出层的节点,所以输出层的节点数为1。
如图3所示,测定性能告警阈值的指标的个数为4个,分别为业务趋势数据、负载要求数据、周期性活动数据、历史告警处理数据,性能告警阈值的4个指标对应于BP神经网络模型输入层的4个神经元,分别为S1、S2、S3以及S4,且输入层的一个神经元用于接收对应的一种指标的历史指标数据。例如,神经元S1可以用于接收业务趋势的历史数据,神经元S2可以用于接收负载要求的历史数据,神经元S3可以用于接收周期性活动的历史数据,神经元S4可以用于接收历史告警处理的数据。
在信号的正向传播阶段:输入样本从输入层(S1、S2、S3以及S4)传入,经多个隐含层(S5、S6、S7、S8、S9以及S10)逐层处理后,传向输出层(S11)。若输出层的实际输出与期望输出不符,则转入误差的反向传播阶段。
误差的反向传播阶段:将输出结果以某种形式通过隐含层(S5、S6、S7、S8、S9以及S10)向输入层逐层(S1、S2、S3以及S4)反传,并将误差分摊给各层的所有神经元,从而获得各层神经元的误差信号,此误差信号即作为修正各神经元权值的依据。
需要说明的是,图3所示BP神经网络模型输入层的4个神经元与性能告警阈值的4个指标之间数据接收的对应关系仅是示意性的,并不是对数据接收的对应关系的限制,根据实现需要,可以有与图3不同的数据接收的对应关系,此处不再赘述。
需要说明的是,图3所示的BP神经网络模型包括的隐含层的数目,以及该隐含层包含的神经元的数目仅仅是示意性的。在本公开的其他实施例中,BP神经网络模型的隐含层的数目,以及隐含层所包含的神经元的个数也可以为其他数目量。例如,可以包括2个隐含层,每个隐含层可以包括4个神经元、5个神经元或者7个神经元,本公开对此不做限定。
作为一种可选的实施例,前述方法还包括:为前述网络隐含层设定第一激励函数;为前述网络输出层设定第二激励函数,其中,前述第二激励函数不同于前述第一激励函数。
根据本公开的实施例,BP神经网络采用S型函数(sigmoid)和线性函数作为激励函数,选择正切S型传递函数(tansig)作为隐含层神经元的激励函数,即第一激励函数。而由于网络输出的归一到[-1,1],因此选择对数S型传递函数(logsig)作为输出层神经元激励函数,即第二激励函数。
在具体实施时,可以使用Matlab进行神经网络训练。将样本数据归一化后输入网络,设定网络隐含层和输出层激励函数分别为tansig和logsig,网络训练函数为变学习速率算法函数(traingdx),网络性能函数为均方误差函数(mse),隐含层神经元的个数初设为6,通过不断迭代,达到期望误差。BP神经网络主要通过误差函数不断调节神经网络的权值和阈值使误差函数达到极小。
需要说明的是,traingdx函数、mse函数、tansig函数以及logsig函数等本身是本领域技术人员所习知的,在此不做赘述。其中,Matlab是一种数学软件,用于数据分析、无线通信、深度学习、图像处理与计算机视觉、信号处理、量化金融与风险管理、机器人,控制系统等领域,Matlab本身是本领域技术人员所习知的,在此不做赘述。
由于,神经网络中神经元的数目与实际问题的复杂程度、输入层以及输出层的神经元个数密切相关。通过上述对BP神经网络模型的隐含层的神经元的个数进行控制,既避免了BP神经网络模型的隐含层的神经元个数过多,从而加大网络计算量并容易产生过拟合问题,又避免了BP神经网络模型的隐含层的神经元个数少,从而影响神经网络性能,以致达不到预期效果的问题。
作为一种可选的实施例,前述获取N组输入训练集数据包括:针对前述M个性能监控指标,获取前述目标系统的M个历史性能指标数据,以及对前述M个历史性能指标数据执行归一化处理,以得到前述N组输入训练集数据。
根据本公开的实施例,机器学习通过历史告警数据处理等训练模型对应的指标的权重,对于新数据则可利用训练好的训练模型对应的指标的权重进行阈值测定。因此,在训练模型过程开始之前,需要对采集数据进行数据整理和处理,以去除异常数据对模型训练的影响。具体地,可以对整理好的数据做归一化处理。归一化处理即将每组训练集的每种指标的历史指标数据压缩于一定的数值范围内,通过归一化处理,加快了梯度下降求解最优值的过程,使得后续数据处理更加方便,从而加快神经网络模型的训练以及学习。具体地,在本公开的一些实施例中,在每组训练集的每种指标的历史指标数据进行归一化处理后,都位于集合[-1,1]之间等。归一化的具体方式可以通过公式来实现,由于归一化处理方式本身是本领域技术人员所习知的,在此不做赘述。
在本公开中,前述M个历史性能指标数据与前述M个性能监控指标一一对应,至少一种指标的历史指标数据包括IT设备的系统历史负载要求数据、历史周期性多样化活动数据、历史业务趋势数据、历史告警处理数据等中至少一种。利用指标的历史指标数据预测系统性能告警阈值。目的是不再依赖专家经验设定系统性能告警的阈值,且可以根据当前要求精准地定位到当前系统性能阈值。
通过本公开的实施例,可以综合考虑系统历史负载要求、历史周期性多样化活动、历史业务趋势数据、历史告警处理等不同组合情况下的系统性能阈值,可以随运维实际情况动态调整性能告警历史阈值,降低提示性告警率,降低运维工作量和成本。
本公开提供的性能告警阈值的确定方法,能准确地确定IT设备的性能告警阈值,确定IT设备的性能告警阈值的过程简单、方便、快速,提升了运维人员的使用体验。
图4示意性示出了根据本公开实施例的性能告警阈值的确定装置的框图。
如图4所示,该性能告警阈值的确定装置400可以包括性能监控指标提取模块410、性能指标数据获取模块420以及性能告警阈值确定模块430。
性能监控指标提取模块410,用于提取用于监控目标系统的M个性能监控指标。M个性能监控指标用于作为对目标系统执行性能告警的性能告警阈值的确定依据,M为正整数。可选地,性能监控指标提取模块410例如可以用于执行图2描述的操作S210,在此不再赘述。
性能指标数据获取模块420,用于针对M个性能监控指标,获取目标系统的M个当前性能指标数据。M个当前性能指标数据与M个性能监控指标一一对应。可选地,性能指标数据获取模块420例如可以用于执行图2描述的操作S220,在此不再赘述。
性能告警阈值确定模块430,用于将M个当前性能指标数据输入至目标神经网络模型,以确定对目标系统进行性能告警的性能告警阈值,并基于性能告警阈值确定是否对目标系统执行性能告警。可选地,性能告警阈值确定模块430例如可以用于执行图2描述的操作S230,在此不再赘述。
作为一种可选的实施例,在将前述M个当前性能指标数据输入至目标神经网络模型之前,前述性能告警阈值的确定装置400还可以包括:输入训练集数据获取模块,用于获取N组输入训练集数据,其中,前述N组输入训练集数据中的每组输入训练集数据与前述M个性能监控指标一一对应,N为正整数;以及神经网络模型训练模块,用于对前述N组输入训练集数据进行训练,以得到前述目标神经网络模型。
作为一种可选的实施例,前述目标神经网络模型的网络结构包括:网络输入层,其中,前述输入层包括M个输入层神经元,前述M个输入层神经元与前述M个性能监控指标一一对应;网络输出层,其中,前述输出层包括1个输出层神经元;以及网络隐含层,其中,前述隐含层包括P个隐含层神经元,且前述隐含层神经元的个数是基于输入层神经元的个数以及输出层神经元的个数确定的,P为正整数。
作为一种可选的实施例,前述性能告警阈值的确定装置400还可以包括:第一激励函数设定模块,用于为前述网络隐含层设定第一激励函数;第二激励函数设定模块,用于为前述网络输出层设定第二激励函数,其中,前述第二激励函数不同于前述第一激励函数。
作为一种可选的实施例,前述输入训练集数据获取模块包括:历史性能指标数据获取子模块,用于针对前述M个性能监控指标,获取前述目标系统的M个历史性能指标数据,其中,前述M个历史性能指标数据与前述M个性能监控指标一一对应;以及输入训练集数据获取子模块,用于对前述M个历史性能指标数据执行归一化处理,以得到前述N组输入训练集数据。
作为一种可选的实施例,前述性能监控指标提取模块包括:处理请求接收子模块,用于接收业务系统对前述目标系统的处理请求;目标业务获取子模块,用于基于前述处理请求,获取目标业务;以及性能监控指标提取子模块,基于前述目标业务和/或前述目标系统,提取目标系统的M个性能监控指标。
作为一种可选的实施例,前述M个性能监控指标包括以下至少之一:前述目标业务的业务属性;前述目标业务的时间周期;处理前述目标业务时对前述目标系统的负载要求;对前述目标系统执行过性能告警的历史记录。
需要说明的是,性能告警阈值的确定装置部分的实施例方式与上述性能告警阈值的确定方法部分的实施例方式对应类似,并且所达到的技术效果也对应类似,在此不再赘述。
根据本公开的实施例的模块、子模块中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,性能监控指标提取模块410、性能指标数据获取模块420、性能告警阈值确定模块430、输入训练集数据获取模块,神经网络模型训练模块,第一激励函数设定模块,第二激励函数设定模块,历史性能指标数据获取子模块,输入训练集数据获取子模块,处理请求接收子模块,目标业务获取子模块,性能监控指标提取子模块中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,性能监控指标提取模块410、性能指标数据获取模块420、性能告警阈值确定模块430、输入训练集数据获取模块,神经网络模型训练模块,第一激励函数设定模块,第二激励函数设定模块,历史性能指标数据获取子模块,输入训练集数据获取子模块,处理请求接收子模块,目标业务获取子模块,性能监控指标提取子模块中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,性能监控指标提取模块410、性能指标数据获取模块420、性能告警阈值确定模块430、输入训练集数据获取模块,神经网络模型训练模块,第一激励函数设定模块,第二激励函数设定模块,历史性能指标数据获取子模块,输入训练集数据获取子模块,处理请求接收子模块,目标业务获取子模块,性能监控指标提取子模块中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图5示意性示出了根据本公开实施例的适于实现上文描述的性能告警阈值的确定方法的计算机可读存储介质产品的示意图。
在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在设备上运行时,程序代码用于使设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的性能告警阈值的确定方法中的前述各项操作(或步骤),例如,电子设备可以执行如图2中所示的操作S210,提取用于监控目标系统的M个性能监控指标。M个性能监控指标用于作为对目标系统执行性能告警的性能告警阈值的确定依据,M为正整数。操作S220,针对M个性能监控指标,获取目标系统的M个当前性能指标数据。M个当前性能指标数据与M个性能监控指标一一对应。操作S230,将M个当前性能指标数据输入至目标神经网络模型,以获得对目标系统执行性能告警的性能告警阈值,并基于性能告警阈值确定是否对目标系统执行性能告警。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
如图5所示,描述了根据本公开的实施方式的性能告警阈值的确定的程序产品500,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、系统或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、系统或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆,RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言-诸如Java,C++等,还包括常规的过程式程序设计语言-诸如“C”,语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)一连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
图6示意性示出了根据本公开实施例的适于实现上文描述的告警阈值的确定方法的电子设备的框图。图6示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,根据本公开实施例的电子设备600包括处理器601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。处理器601例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器601还可以包括用于缓存用途的板载存储器。处理器601可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 603中,存储有电子设备600操作所需的各种程序和数据。处理器601、ROM602以及RAM 603通过总线604彼此相连。处理器601通过执行ROM 602和/或RAM 603中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,程序也可以存储在除ROM602和RAM 603以外的一个或多个存储器中。处理器601也可以通过执行存储在一个或多个存储器中的程序来执行根据本公开实施例的方法流程的如图2中所示的操作S210,提取用于监控目标系统的M个性能监控指标。M个性能监控指标用于作为对目标系统执行性能告警的性能告警阈值的确定依据,M为正整数。操作S220,针对M个性能监控指标,获取目标系统的M个当前性能指标数据。M个当前性能指标数据与M个性能监控指标一一对应。操作S230,将M个当前性能指标数据输入至目标神经网络模型,以获得对目标系统执行性能告警的性能告警阈值,并基于性能告警阈值确定是否对目标系统执行性能告警。
根据本公开的实施例,电子设备600还可以包括输入/输出(I/O)接口605,输入/输出(I/O)接口605也连接至总线604。电子设备600还可以包括连接至I/O接口605的以下部件中的一项或多项:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被处理器601执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的告警阈值的确定方法,包括如图2中所示的操作S210,提取用于监控目标系统的M个性能监控指标。M个性能监控指标用于作为对目标系统执行性能告警的性能告警阈值的确定依据,M为正整数。操作S220,针对M个性能监控指标,获取目标系统的M个当前性能指标数据。M个当前性能指标数据与M个性能监控指标一一对应。操作S230,将M个当前性能指标数据输入至目标神经网络模型,以获得对目标系统执行性能告警的性能告警阈值,并基于性能告警阈值确定是否对目标系统执行性能告警。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 602和/或RAM 603和/或ROM 602和RAM 603以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时电可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (10)

1.一种性能告警阈值的确定方法,包括:
提取用于监控目标系统的M个性能监控指标,其中,M个性能监控指标用于作为对目标系统执行性能告警的性能告警阈值的确定依据,M为正整数;
针对M个性能监控指标,获取目标系统的M个当前性能指标数据,其中,M个当前性能指标数据与M个性能监控指标一一对应;
将M个当前性能指标数据输入至目标神经网络模型,以获得对目标系统进行性能告警的性能告警阈值,并基于性能告警阈值确定是否对目标系统执行性能告警。
2.根据权利要求1的方法,其中,在将M个当前性能指标数据输入至目标神经网络模型之前,方法还包括:
获取N组输入训练集数据,其中,N组输入训练集数据中的每组输入训练集数据与M个性能监控指标一一对应,N为正整数;
对N组输入训练集数据进行训练,以得到目标神经网络模型。
3.根据权利要求2的方法,其中,目标神经网络模型的网络结构包括:
网络输入层,其中,输入层包括M个输入层神经元,M个输入层神经元与M个性能监控指标一一对应;
网络输出层,其中,输出层包括1个输出层神经元;
网络隐含层,其中,隐含层包括P个隐含层神经元,且隐含层神经元的个数是基于输入层神经元的个数以及输出层神经元的个数确定的,P为正整数。
4.根据权利要求3的方法,其中,方法还包括:
为网络隐含层设定第一激励函数;
为网络输出层设定第二激励函数,其中,第二激励函数不同于第一激励函数。
5.根据权利要求2的方法,其中,获取N组输入训练集数据包括:
针对M个性能监控指标,获取目标系统的M个历史性能指标数据,其中,M个历史性能指标数据与M个性能监控指标一一对应;
对M个历史性能指标数据执行归一化处理,以得到N组输入训练集数据。
6.根据权利要求1的方法,其中,提取目标系统的M个性能监控指标包括:
接收业务系统对目标系统的处理请求;
基于处理请求,获取目标业务;
基于目标业务和/或目标系统,提取目标系统的M个性能监控指标。
7.根据权利要求6的方法,其中,M个性能监控指标包括以下至少之一:
目标业务的业务属性;
目标业务的时间周期;
处理目标业务时对目标系统的负载要求;
对目标系统执行过性能告警的历史记录。
8.一种性能告警阈值的确定装置,包括:
性能监控指标提取模块,用于提取用于监控目标系统的M个性能监控指标,其中,M个性能监控指标用于作为对目标系统执行性能告警的性能告警阈值的确定依据,M为正整数;
性能指标数据获取模块,用于针对M个性能监控指标,获取目标系统的M个当前性能指标数据,其中,M个当前性能指标数据与M个性能监控指标一一对应;
性能告警阈值确定模块,用于将M个当前性能指标数据输入至目标神经网络模型,以确定对目标系统进行性能告警的性能告警阈值,并基于性能告警阈值确定是否对目标系统执行性能告警。
9.一种电子设备,包括:
一个或多个处理器;以及
存储器,用于存储一个或多个程序,
其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现权利要求1至7中任一项的方法。
10.一种计算机可读存储介质,存储有计算机可执行指令,指令在被执行时用于实现权利要求1至7中任一项的方法。
CN202010943893.9A 2020-09-09 2020-09-09 性能告警阈值的确定方法、装置、电子设备和介质 Pending CN112052145A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010943893.9A CN112052145A (zh) 2020-09-09 2020-09-09 性能告警阈值的确定方法、装置、电子设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010943893.9A CN112052145A (zh) 2020-09-09 2020-09-09 性能告警阈值的确定方法、装置、电子设备和介质

Publications (1)

Publication Number Publication Date
CN112052145A true CN112052145A (zh) 2020-12-08

Family

ID=73609913

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010943893.9A Pending CN112052145A (zh) 2020-09-09 2020-09-09 性能告警阈值的确定方法、装置、电子设备和介质

Country Status (1)

Country Link
CN (1) CN112052145A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112527598A (zh) * 2020-12-10 2021-03-19 北京百度网讯科技有限公司 监控数据的方法、装置、设备、存储介质和程序产品
CN113313591A (zh) * 2021-05-26 2021-08-27 中国银行股份有限公司 一种数据异常的告警方法及装置
CN113342623A (zh) * 2021-05-28 2021-09-03 福建福诺移动通信技术有限公司 基于动态阈值方法的可视化预警系统及方法
CN113552855A (zh) * 2021-07-23 2021-10-26 重庆英科铸数网络科技有限公司 工业设备动态阈值设定方法、装置、电子设备及存储介质
CN113608960A (zh) * 2021-07-09 2021-11-05 五八有限公司 一种服务监控方法、装置、电子设备及存储介质
CN115001942A (zh) * 2022-05-26 2022-09-02 腾云悦智科技(深圳)有限责任公司 一种运维监控阈值推荐的方法及系统
CN117395198A (zh) * 2023-12-11 2024-01-12 国网浙江省电力有限公司 一种电力通信网络拥塞报警方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108572905A (zh) * 2018-04-23 2018-09-25 中国农业银行股份有限公司 一种基于分布式计算的监控方法及系统
CN109446017A (zh) * 2018-09-03 2019-03-08 平安科技(深圳)有限公司 一种告警算法生成方法、监控系统及终端设备
CN109639450A (zh) * 2018-10-23 2019-04-16 平安壹钱包电子商务有限公司 基于神经网络的故障告警方法、计算机设备及存储介质
CN110135689A (zh) * 2019-04-12 2019-08-16 深圳壹账通智能科技有限公司 企业经营风险预警方法、装置及计算机可读存储介质
CN110490321A (zh) * 2019-08-02 2019-11-22 浙江中铁科工程咨询有限公司 轨道交通工程安全监理预警方法及监控系统
CN110782045A (zh) * 2019-10-17 2020-02-11 成都四方伟业软件股份有限公司 一种运维告警系统动态阈值的生成方法及装置
CN111581690A (zh) * 2020-03-31 2020-08-25 西南交通大学 一种地下大空间关键指标阈值确定方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108572905A (zh) * 2018-04-23 2018-09-25 中国农业银行股份有限公司 一种基于分布式计算的监控方法及系统
CN109446017A (zh) * 2018-09-03 2019-03-08 平安科技(深圳)有限公司 一种告警算法生成方法、监控系统及终端设备
CN109639450A (zh) * 2018-10-23 2019-04-16 平安壹钱包电子商务有限公司 基于神经网络的故障告警方法、计算机设备及存储介质
CN110135689A (zh) * 2019-04-12 2019-08-16 深圳壹账通智能科技有限公司 企业经营风险预警方法、装置及计算机可读存储介质
CN110490321A (zh) * 2019-08-02 2019-11-22 浙江中铁科工程咨询有限公司 轨道交通工程安全监理预警方法及监控系统
CN110782045A (zh) * 2019-10-17 2020-02-11 成都四方伟业软件股份有限公司 一种运维告警系统动态阈值的生成方法及装置
CN111581690A (zh) * 2020-03-31 2020-08-25 西南交通大学 一种地下大空间关键指标阈值确定方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
石全等: "《系统决策与建模》", pages: 196 - 198 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112527598A (zh) * 2020-12-10 2021-03-19 北京百度网讯科技有限公司 监控数据的方法、装置、设备、存储介质和程序产品
CN112527598B (zh) * 2020-12-10 2023-08-18 北京百度网讯科技有限公司 监控数据的方法、装置、设备、存储介质和程序产品
CN113313591A (zh) * 2021-05-26 2021-08-27 中国银行股份有限公司 一种数据异常的告警方法及装置
CN113342623A (zh) * 2021-05-28 2021-09-03 福建福诺移动通信技术有限公司 基于动态阈值方法的可视化预警系统及方法
CN113342623B (zh) * 2021-05-28 2022-05-17 福建福诺移动通信技术有限公司 基于动态阈值方法的可视化预警系统及方法
CN113608960A (zh) * 2021-07-09 2021-11-05 五八有限公司 一种服务监控方法、装置、电子设备及存储介质
CN113552855A (zh) * 2021-07-23 2021-10-26 重庆英科铸数网络科技有限公司 工业设备动态阈值设定方法、装置、电子设备及存储介质
CN115001942A (zh) * 2022-05-26 2022-09-02 腾云悦智科技(深圳)有限责任公司 一种运维监控阈值推荐的方法及系统
CN117395198A (zh) * 2023-12-11 2024-01-12 国网浙江省电力有限公司 一种电力通信网络拥塞报警方法及系统
CN117395198B (zh) * 2023-12-11 2024-02-20 国网浙江省电力有限公司 一种电力通信网络拥塞报警方法及系统

Similar Documents

Publication Publication Date Title
CN112052145A (zh) 性能告警阈值的确定方法、装置、电子设备和介质
AU2021232839B2 (en) Updating Attribute Data Structures to Indicate Trends in Attribute Data Provided to Automated Modelling Systems
US11138376B2 (en) Techniques for information ranking and retrieval
US11763312B2 (en) Automated rules execution testing and release system
WO2023055426A1 (en) Techniques for input classification and responses using generative neural networks
CN115983900A (zh) 用户营销策略的构建方法、装置、设备、介质和程序产品
CN113988458A (zh) 反洗钱风险监控方法和模型训练方法、装置、设备及介质
CN116684330A (zh) 基于人工智能的流量预测方法、装置、设备及存储介质
GB2600817A (en) Systems and methods for generating dynamic interface options using machine learning models
JP2024507602A (ja) データ処理方法及び予測モデルをトレーニングするための方法
CN109361539A (zh) 一种基于发育网络的性能告警方法和装置
CN110413482B (zh) 检测方法和装置
CN109408531B (zh) 缓慢下跌型数据的检测方法及装置、电子设备、存储介质
CN113762972A (zh) 数据存储控制方法及装置、电子设备、存储介质
CN112131468A (zh) 推荐系统中的数据处理方法、装置
CN113254761A (zh) 特定行为信息智能预警系统及方法
Mehmood et al. LSTMDD: an optimized LSTM-based drift detector for concept drift in dynamic cloud computing
Prajapati et al. Study of big data analytics tool: Apache spark
CN111435463B (zh) 数据处理方法及相关设备、系统
CN111709786B (zh) 用于生成用户留存时间的方法、装置、设备和介质
CN117557106A (zh) 企业经营健康度检测方法、装置、设备及介质
US20200380352A1 (en) Linear modeling of quality assurance variables
CN117745336A (zh) 客户流失预测方法、装置、设备、存储介质及程序产品
Babu et al. Resource-Based Prediction in Cloud Computing Using LSTM with Autoencoders
Jiao Financial management early warning model of enterprise circular economy based on chaotic particle swarm optimization algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination