CN110515793B - 系统性能监控方法、装置、设备及存储介质 - Google Patents

系统性能监控方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110515793B
CN110515793B CN201910669511.5A CN201910669511A CN110515793B CN 110515793 B CN110515793 B CN 110515793B CN 201910669511 A CN201910669511 A CN 201910669511A CN 110515793 B CN110515793 B CN 110515793B
Authority
CN
China
Prior art keywords
monitoring
optimized
monitored object
information
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910669511.5A
Other languages
English (en)
Other versions
CN110515793A (zh
Inventor
朱洲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910669511.5A priority Critical patent/CN110515793B/zh
Priority to PCT/CN2019/116483 priority patent/WO2021012481A1/zh
Publication of CN110515793A publication Critical patent/CN110515793A/zh
Application granted granted Critical
Publication of CN110515793B publication Critical patent/CN110515793B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Mathematical Physics (AREA)
  • Human Resources & Organizations (AREA)
  • Technology Law (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及系统性能优化技术领域,提供一种系统性能监控方法、装置、设备及存储介质,所述方法包括以下步骤:当接收到启动监控服务的指令时,通过监控服务对应的代理agent确定agent对应的监控对象;采集监控对象对应的监控信息,并基于监控信息,判断监控对象是否处于正常状态;若判定监控对象处于异常状态,则确定监控信息对应的待优化问题;将待优化问题输入优化模型中,通过优化模型,确定监控对象对应的优化策略;判断待优化问题是否为调外部关联方问题;若否,则输出异常状态对应的异常信息和优化策略;若是,则获取调外部关联方对应的终端地址;将异常信息发送至终端地址对应的终端。本发明实现系统异常现象的快速定位以及展示。

Description

系统性能监控方法、装置、设备及存储介质
技术领域
本发明涉及系统性能优化技术领域,尤其涉及一种系统性能监控方法、装置、设备及计算机可读存储介质。
背景技术
随着互联网技术的发展,传统银行受到冲击,为此传统银行运作模式做出调整,其中,直销银行是互联网时代应运而生的一种新型银行运作模式,然而目前的直销银行使用直销银行系统进行运作时,直销银行系统无法将自身的性能负载告知给运维人员,也无法展示直销银行的整体架构性能,如系统负载情况,网络走向情况,调度关系等,使得运维人员对直销银行系统的性能负载并不了解,现有的直销银行系统往往是等运行出现故障后,通过告警的方式通知运维人员,此时运维人员才知道直销银行系统有问题,但是具体故障是什么,直销银行系统自身也无法快速准确定位并展示给运维人员,使得运维人员需要花费较多的时间查找故障的原因,造成运维人员无法及时解决直销银行系统的故障问题。
发明内容
本发明的主要目的在于提供一种系统性能监控方法、装置、设备及计算机可读存储介质,旨在解决现有的直销银行系统故障无法快速准确定位并且无法展示的技术问题。
为实现上述目的,本发明提供一种系统性能监控方法,所述系统性能监控方法包括以下步骤:
当接收到启动监控服务的指令时,通过所述监控服务对应的代理agent确定所述agent对应的监控对象;
采集所述监控对象对应的监控信息,并基于所述监控信息,判断所述监控对象是否处于正常状态;
若判定所述监控对象处于异常状态,则确定所述监控信息对应的待优化问题;
将所述待优化问题输入优化模型中,通过所述优化模型,确定所述监控对象对应的优化策略;
判断所述待优化问题是否为调外部关联方问题;
若否,则输出所述异常状态对应的异常信息和所述优化策略;
若是,则获取调外部关联方对应的终端地址;
将所述异常信息发送至所述终端地址对应的终端。
可选地,所述当接收到启动监控服务的指令时,通过所述监控服务对应的agent确定所述agent对应的监控对象的步骤之前,所述方法还包括:
接收已解决的待优化问题和所述已解决的待优化问题对应的优化策略;
以所述已解决的待优化问题作为初始模型的输入,以所述已解决的待优化问题对应的优化策略作为所述初始模型的输出,将所述初始模型训练成所述优化模型;
接收导入的学习网址,基于爬虫技术,监测所述学习网址是否存在更新的待优化问题和所述更新的待优化问题对应的优化策略;
若存在,则获取所述更新的待优化问题和所述更新的待优化问题对应的优化策略;
以所述更新的待优化问题作为所述优化模型的输入,以所述更新的待优化问题对应的优化策略作为所述优化模型的输出,训练得到新的优化模型,并将所述新的优化模型作为所述优化模型。
可选地,所述采集所述监控对象对应的监控信息,并基于所述监控信息,判断所述监控对象是否处于正常状态的步骤包括:
采集所述监控对象对应的监控信息,并确定所述监控对象对应的图形样式;
将所述监控信息生成动态监控图表,所述动态监控图表以所述监控对象对应的图形样式显示;
基于所述动态监控图表,实时确定所述监控对象是否处于正常状态。
可选地,所述根据所述监控信息生成动态监控图表的步骤之后,所述方法还包括:
获取所述监控对象的安全值;
将所述监控信息与所述安全值进行比较;
将超过安全值的监控信息在所述动态监控图表中,以亮色标注。
可选地,所述通过所述监控服务对应的代理agent确定所述agent对应的监控对象包括:
根据预置的配置信息确定所述监控对象,所述配置信息为预先设置用于指示所述监控对象种类的信息。
可选地,所述通过所述监控服务对应的代理agent确定所述agent对应的监控对象包括:
接收用户添加指令,所述用户添加指令包括添加的监控对象种类;
根据所述用户添加指令确定对应的所述监控对象。
可选地,所述待优化问题包括内部主机层面问题、内部代码层面问题和所述调外部关联方问题。
此外,为实现上述目的,本发明还提供一种系统性能监控装置,所述系统性能监控装置包括:
监控模块,用于当接收到启动监控服务的指令时,通过所述监控服务对应的agent确定所述agent对应的监控对象;
采集模块,用于采集所述监控对象对应的监控信息,并基于所述监控信息,判断所述监控对象是否处于正常状态;
判断模块,用于若判定所述监控对象处于异常状态,则确定所述监控信息对应的待优化问题;
确定模块,用于将所述待优化问题输入优化模型中,通过所述优化模型,确定所述监控对象对应的优化策略;
所述判断模块,还用于判断所述待优化问题是否为调外部关联方问题;
输出模块,用于若否,则输出所述异常状态对应的异常信息和所述优化策略;
所述输出模块,还用于若是,则获取调外部关联方对应的终端地址;
发送模块,用于将所述异常信息发送至所述终端地址对应的终端。
此外,为实现上述目的,本发明还提供一种监控设备,所述监控设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的系统性能监控程序,其中所述系统性能监控程序被所述处理器执行时,实现如上述的系统性能监控方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有系统性能监控程序,其中所述系统性能监控程序被处理器执行时,实现如上述的系统性能监控方法的步骤。
本发明提供一种系统性能监控方法,当接收到启动监控服务的指令时,通过所述监控服务对应的代理agent确定所述agent对应的监控对象;采集所述监控对象对应的监控信息,并基于所述监控信息,判断所述监控对象是否处于正常状态;若判定所述监控对象处于异常状态,则确定所述监控信息对应的待优化问题;将所述待优化问题输入优化模型中,通过所述优化模型,确定所述监控对象对应的优化策略;判断所述待优化问题是否为调外部关联方问题;若否,则输出所述异常状态对应的异常信息和所述优化策略;若是,则获取调外部关联方对应的终端地址;将所述异常信息发送至所述终端地址对应的终端。本发明通过部署agent,从而确定监控对象,并对监控对象进行监控,以采集监控对象的监控信息,通过分析监控信息判断监控对象是否正常,若监控对象处于异常状态,则进一步判断是否为调外部关联方问题,若否,则输出异常信息和对应的优化策略,以供运维人员及时定位系统瓶颈,并根据优化策略进行优化,实现系统异常现象的快速定位以及展示;若是,则将异常信息发送至调外部关联方对应的终端。
附图说明
图1为本发明实施例方案中涉及的监控设备的硬件结构示意图;
图2为本发明系统性能监控方法第一实施例的流程示意图;
图3为本发明系统性能监控装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例涉及的系统性能监控方法主要应用于监控设备,该监控设备可以是PC、便携计算机、移动终端等具有显示和处理功能的设备。
参照图1,图1为本发明实施例方案中涉及的监控设备的硬件结构示意图。本发明实施例中,监控设备可以包括处理器1001(例如CPU),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口);存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的硬件结构并不构成对监控设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种计算机可读存储介质的存储器1005可以包括操作系统、网络通信模块以及系统性能监控程序。
在图1中,网络通信模块主要用于连接服务器,与服务器进行数据通信;而处理器1001可以调用存储器1005中存储的系统性能监控程序,并执行本发明实施例提供的系统性能监控方法。
本发明实施例提供了一种系统性能监控方法,该方法可运用在直销银行系统中,在与直销银行系统类似的系统体系中同样适用,以下将以直销银行系统为例进行说明。
参照图2,图2为本发明系统性能监控方法第一实施例的流程示意图。
本实施例中,所述系统性能监控方法包括以下步骤:
步骤S10,当接收到启动监控服务的指令时,通过所述监控服务对应的agent确定所述agent对应的监控对象;
步骤S20,采集所述监控对象对应的监控信息,并基于所述监控信息,判断所述监控对象是否处于正常状态;
步骤S30,若判定所述监控对象处于异常状态,则确定所述监控信息对应的待优化问题;
步骤S40,将所述待优化问题输入优化模型中,通过所述优化模型,确定所述监控对象对应的优化策略;
步骤S50,判断所述待优化问题是否为调外部关联方问题;
步骤S60,若否,则输出所述异常状态对应的异常信息和所述优化策略;
步骤S70,若是,则获取调外部关联方对应的终端地址;
步骤S80,将所述异常信息发送至所述终端地址对应的终端。
本实施例通过agent确定监控对象,并采集监控对象的监控信息,基于监控信息确定监控对象是否处于正常状态,在确定监控对象处于异常状态时,进一步判断是否为调外部关联方问题,若否,则输出对应的异常信息和对应的优化策略,以供运维人员及时定位待优化问题,并根据优化策略对直销银行系统进行优化;若是,则将异常信息发送至调外部关联方对应的终端,对运维人员的专业能力没有要求。
以下将对各个步骤进行详细的说明:
步骤S10,当接收到启动监控服务的指令时,通过所述监控服务对应的agent确定所述agent对应的监控对象。
本实施例中,在对直销银行系统进行系统性能监控之前,需要在直销银行系统中部署监控设备,具体的,在需要被监控的主机上面推送对应的agent(指能自主活动的软件或者硬件实体),并启动监控服务,该agent以进程的形式运行在主机上面。当接收到启动监控服务的指令时,启动该agent,并通过agent确定需要监控的监控对象,其中,监控对象包括主机内存、CPU(Central Processing Unit,中央处理器)、jvm(Java Virtual MachineJava虚拟机)、进程、线程、磁盘io、网络流量等底层物理性能的信息,以及程序接口、类、库、jar包等的调用响应时长等,监控对象可在将agent部署到主机上后,在监控设备中进行添加。
具体的,添加监控对象有两种方式;
第一种方式包括:agent中预置有相关监控对象的配置信息,在将agent部署到需要被监控的主机上后,启动agent,agent根据预置的配置信息,确定对应的监控对象。如agent中预置的监控对象为主机内存、CPU、jvm和进程信息四项,则在将agent推送到相应的主机上后,启动该agent时,可确定监控对象为主机内存、CPU、jvm和进程信息。
第二种方式包括:在将agent部署到需要被监控的主机上后,启动agent,在对应的添加界面中,手动添加需要监控的监控对象。如在启动agent后,用户在对应的添加界面中,手动添加主机内存、CPU、jvm、进程、线程和磁盘io对应的相关配置信息,则在启动服务时,确定监控对象为主机内存、CPU、jvm、进程、线程、head和磁盘io。
步骤S20,采集所述监控对象对应的监控信息,并基于所述监控信息,判断所述监控对象是否处于正常状态。
本实施例中,在启动agent后,通过agent实时采集监控对象对应的监控信息,如监控对象为主机内存,则采集主机内存占用率,如监控对象为CPU,则采集CPU使用率等。
在采集到监控对象对应的监控信息后,基于监控采集到的监控信息,判断监控对象是否处于正常状态,具体的,为每一个监控对象对应的监控信息预设一个安全值,在采集到监控信息后,将监控信息与安全值进行比较,判断当前监控对象对应的监控信息是否超过安全值,若是,则确定当前监控对象处于异常状态;若否,则确定当前监控对象处于正常状态。如主机内存的安全值为70%,当监测到当前主机内存占用率为85%时,确定当前主机处于异常状态。
需要说明的是,由于监控对象不同,因而每一个监控对象预设的安全值也是不同的,可预设一个经验值,并根据实际经验来设置安全值,具体的,如主机内存超过80%后,运行会出现卡顿的状态,此时可根据经验值,将主机内存的安全值设置为70%,留有操作余地,而不是单纯的设为80%。
具体的,步骤S20包括:
步骤S21,采集所述监控对象对应的监控信息,并确定所述监控对象对应的图形样式。
采集监控对象的监控信息,并确定监控对象对应的图形样式,在本实施例中,由于监控对象的不同,图形样式也是有多种多样的,即监控设备中预置有多种图形样式,每一种监控信息都有对应的图像样式,如CPU使用率采用线形图的图像样式,主机内存的占用情况以扇形图的图像样式等,具体的图形样式的种类在此不做限定。
步骤S22,将所述监控信息生成动态监控图表,所述动态监控图表以所述监控对象对应的图形样式显示。
将采集到的监控信息生成动态监控图表,其中,动态监控图标以确定的图形样式进行显示,即实时采集监控信息,并将监控信息生成监控图表,且该监控图表处于实时更新的状态。
步骤S23,基于所述动态监控图表,实时确定所述监控对象是否处于正常状态。
根据生成的动态监控图表,实时确定监控对象是否处于正常状态,即在动态监控图表中,可展现监控对象处于什么状态。
具体的,步骤S23包括:
步骤a,获取所述监控对象的安全值。
在本实施例中,每一监控对象都对应有一个安全值,该安全值可事先根据经验进行设置,每一监控对象的安全值都不同。
步骤b,将所述监控信息与所述安全值进行比较。
将采集到的监控信息与安全值进行比较,具体的,将采集到的监控信息进行数值转换,得到监控数据值,并将该监控数据值与安全值进行比较。
可以理解的,监控信息如主机内存,监控设备采集到的监控信息为主机内存的占用情况,根据采集到的主机内存的占用情况,以及主机内存的最大值,可将主机内存的占用情况转换为主机内存占用率,并将该主机内存占用率与主机内存对应的安全值进行比较,若超过安全值,则说明主机内存占用高,容易引起卡顿,确定主机内存处于异常状态;若未超过安全值,则说明主机内存占用率不高,运行正常,确定主机内存助于正常状态。
步骤c,将超过安全值的监控信息在所述动态监控图表中,以亮色标注。
接着,将监控信息生成动态监控图表,并在该动态监控图表中,将超过安全值的监控信息以亮色标注,如告警红色标注,将未超过安全值的监控信息以正常绿色标注,或者,在该动态监控图标中,只将超过安全值的监控信息进行显示,并以亮色标注,而未超过安全值的监控信息无需显示,达到减轻运行负载,和节省存储的效果。
步骤S30,若判定所述监控对象处于异常状态,则确定所述监控信息对应的待优化问题。
本实施例中,若判定监控对象处于异常状态,则根据监控信息确定对应的待优化问题,可理解的,每一监控对象发生异常,其对应的待优化问题是不同的,那么其对应的优化策略也是不同的,故在判定监控对象处于异常状态时,需要进一步判断具体是什么待优化问题。
步骤S40,将所述待优化问题输入优化模型中,通过所述优化模型,确定所述监控对象对应的优化策略。
在确定监控信息对应的待优化问题后,将待优化问题输入事先训练好的优化模型中,通过优化模型,确定监控对象对应的优化策略。
本实施例中,若判定监控对象处于异常状态,即监控信息超过安全值,说明需要对该监控对象进行优化,则确定监控对象对应的优化策略,其中,由于监控对象只有异常和正常两种状态,因此,可事先针对每一监控对象的异常状态设置对应的优化策略,当判定当前的监控对象处于异常状态时,即可获取对应的优化策略,如cpu使用率过高,负载压力大,导致cpu异常告警,则确定cpu的优化策略为扩容cpu和加大核数等,以便运维人员根据优化策略对cpu进行优化。
步骤S50,判断所述待优化问题是否为调外部关联方问题;
监控设备在确定采集到的监控信息对应的待优化问题之后,判断待优化问题是否为调外部关联方问题,其中,在本实施例中,将待优化问题分为包括内部主机层面问题、内部代码层面问题和调外部关联方问题三种类型。
具体的,内部主机层面问题包括主机内存、CPU、jvm、进程、线程、磁盘io和网络流量等。其对应的待优化问题和优化策略分别为:
cpu使用率过高,负载压力大:扩容cpu,加大核数;
内存使用率过高:扩容内存大小;
Jvm配置异常(堆栈大小过小,持久代过小,新生代、老年代配置问题):修改对应java容器的配置文件,修改jvm的参数;
进程或线程配置过大或不够:根据实际情况调整系统层和应用层的进程数、线程数;
磁盘io过大,读写性能低:优化对应物理主机的磁盘性能;
网络流量过大,影响系统性能:优化主机网卡性能或加大网络带宽。
内部代码层面问题包括程序接口、类、库、jar包等的调用响应时长等。其对应的待优化问题和优化策略分别为:
某个接口响应缓慢:将监控设备检测到的问题转给对应开发,优化代码,优化算法,加快接口响应速度;
调用模块库抛异常:将监控设备检测到的问题转给对应开发,优化代码,解决抛异常的情况;
程序调用某个微服务异常:通过错误日志快速定位,代码问题优化代码,其他问题根据实际情况处理。
调外部关联方问题包括调关联方接口响应时间,关联方网络的丢包率等,其对应的待优化问题和优化策略分别为:
调关联方接口响应时间长:联系相应的关联方处理;
监控到关联方网络丢包严重:联系相应关联方及网络人员处理。
监控设备基于采集到的监控信息,确定监控对象对应的待优化问题,并进一步判断待优化问题是否为调外部关联方问题。
步骤S60,若否,则输出所述异常状态对应的异常信息和所述优化策略。
可以理解的,若监控设备判定当前待优化问题不是调外部关联方问题,说明待优化问题属于内部主机层面问题或者内部代码层面问题,可由运维人员进行解决,则输出对应的异常信息和优化策略,以供运维人员对监控对象进行优化。
需要说明的是,监控设备只负责将异常信息和对应的优化策略显示给运维人员观看,并不具备自我修复能力,这是由于不管内部主机层面问题还是内部代码层面问题,都需要人工干预才能解决。
步骤S70,若是,则获取调外部关联方对应的终端地址。
若监控设备判定当前待优化问题是调外部关联方问题,说明待优化问题需要调外部关联方相关人员进行处理,不需要内部的运维人员处理,且有可能内部的运维人员没有权限进行优化,则获取调外部关联方对应的终端地址。
步骤S80,将所述异常信息发送至所述终端地址对应的终端。
此时,监控设备显示对应的异常信息,并将该异常信息发送至终端地址对应的终端,以供调外部关联方接收到异常信息,并对异常信息对应的待优化问题进行处理。
本实施例通过部署agent,从而确定监控对象,并对监控对象进行监控,以采集监控对象的监控信息,通过分析监控信息判断监控对象是否正常,若监控对象处于异常状态,则进一步判断是否为调外部关联方问题,若否,则输出异常信息和对应的优化策略,以供运维人员及时定位系统瓶颈,并根据优化策略进行优化,实现系统异常现象的快速定位以及展示;若是,则将异常信息发送至调外部关联方对应的终端。
进一步地,基于第一实施例提出本发明系统性能监控方法的第二实施例。系统性能监控方法的第二实施例与系统性能监控方法的第一实施例的区别在于,优化模型的训练步骤包括:
步骤d,接收已解决的待优化问题和所述已解决的待优化问题对应的优化策略;
在本实施例中,监控设备还包括机器学习模块,运维人员可将已解决的待优化问题和对应的优化策略输入监控设备中,监控设备通过机器学习模块进行学习,其中,已解决的待优化问题可为运维人员实际解决的待优化问题,也可以是他人解决的公众能获取到的待优化问题。运维人员在输入已解决的待优化问题时,关联输入对应的优化策略,以使监控设备在接收到已解决的待优化问题时,接收到对应的优化策略,而不会将某一待优化问题与其他不相关的优化策略关联。
步骤e,以所述已解决的待优化问题作为初始模型的输入,以所述已解决的待优化问题对应的优化策略作为所述初始模型的输出,将所述初始模型训练成所述优化模型;
监控设备以接收到的已解决的待优化问题作为初始模型的输入,以对应的优化策略作为初始模型的输出,将初始模型训练成优化模型。
步骤f,接收导入的学习网址,基于爬虫技术,监测所述学习网址是否存在更新的待优化问题和所述更新的待优化问题对应的优化策略;
可以理解的,由于互联网技术更新迭代的速度较快,当前训练得到的优化模型并不能满足日常需求,监控对象很可能出现运维人员没遇到过的异常状态,为了使优化模型更具适应性和成长性,监控设备还可接收运维人员导入的学习网址,通过爬虫技术,监测该学习网址上是否存在他人上传的,不同于优化模型已有的,更新的待优化问题和更新的待优化问题对应的优化策略。
步骤g,若存在,则获取所述更新的待优化问题和所述更新的待优化问题对应的优化策略;
若存在,则获取更新的待优化问题和对应的优化策略,即只要有他人在学习网址上传了新的待优化问题和对应的优化策略,机器学习模块即可获取到更新的待优化问题和对应的优化策略。
步骤h,以所述更新的待优化问题作为所述优化模型的输入,以所述更新的待优化问题对应的优化策略作为所述优化模型的输出,训练得到新的优化模型,并将所述新的优化模型作为所述优化模型。
监控设备以更新的待优化问题作为优化模型的输入,以对应的优化策略作为优化模型的输出,持续更新该优化模型。使优化模型具备成长学习能力。
在实际应用中,机器学习模块的学习方式包括:
1、通过导入hadoop、spring boot、dubbo等计算文档,提供给机器学习模块进行学习;
2、通过将科技论坛、社区、博客的网址录入机器学习模块,机器学习模块进行爬虫获取信息,进行学习;
3、日常工作中,用户遇到监控对象待优化问题时,将处理方法及处理结果录入机器学习模块,机器学习模块模仿学习。
本实施例将监控对象异常分为多种待优化问题,当监控对象处于异常状态时,在确定优化策略的过程中,需先确定监控对象对应的待优化问题,再通过训练得到的优化模型根据待优化问题,进一步确定对应的优化策略,提高监控设备的成长学习能力,以应对互联网领域的迅速迭代。
此外,本发明实施例还提供一种系统性能监控装置。
参照图3,图3为本发明系统性能监控装置第一实施例的功能模块示意图。
本实施例中,所述系统性能监控装置包括:
采集模块10,用于采集所述监控对象对应的监控信息,并基于所述监控信息,判断所述监控对象是否处于正常状态;
判断模块20,用于若判定所述监控对象处于异常状态,则确定所述监控信息对应的待优化问题;
确定模块30,用于将所述待优化问题输入优化模型中,通过所述优化模型,确定所述监控对象对应的优化策略;
所述判断模块20,还用于判断所述待优化问题是否为调外部关联方问题;
输出模块40,用于若否,则输出所述异常状态对应的异常信息和所述优化策略;
所述输出模块40,还用于若是,则获取调外部关联方对应的终端地址;
发送模块50,用于将所述异常信息发送至所述终端地址对应的终端。
进一步地,所述系统性能监控装置还包括机器学习模块,所述机器学习模块用于:
接收已解决的待优化问题和所述已解决的待优化问题对应的优化策略;
以所述已解决的待优化问题作为初始模型的输入,以所述已解决的待优化问题对应的优化策略作为所述初始模型的输出,将所述初始模型训练成所述优化模型;
接收导入的学习网址,基于爬虫技术,监测所述学习网址是否存在更新的待优化问题和所述更新的待优化问题对应的优化策略;
若存在,则获取所述更新的待优化问题和所述更新的待优化问题对应的优化策略;
以所述更新的待优化问题作为所述优化模型的输入,以所述更新的待优化问题对应的优化策略作为所述优化模型的输出,训练得到新的优化模型,并将所述新的优化模型作为所述优化模型。
进一步地,所述采集模块20还用于:
采集所述监控对象对应的监控信息,并确定所述监控对象对应的图形样式;
将所述监控信息生成动态监控图表,所述动态监控图表以所述监控对象对应的图形样式显示;
基于所述动态监控图表,实时确定所述监控对象是否处于正常状态。
进一步地,所述采集模块20还用于:
获取所述监控对象的安全值;
将所述监控信息与所述安全值进行比较;
将超过安全值的监控信息在所述动态监控图表中,以亮色标注。
其中,上述系统性能监控装置中各个模块和单元与上述系统性能监控方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
此外,本发明实施例还提供一种计算机可读存储介质。
本发明计算机可读存储介质上存储有系统性能监控程序,其中所述系统性能监控程序被处理器执行时,实现如上述的系统性能监控方法的步骤。
其中,系统性能监控程序被执行时所实现的方法可参照本发明系统性能监控方法的各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种系统性能监控方法,其特征在于,所述系统性能监控方法包括以下步骤:
当接收到启动监控服务的指令时,通过所述监控服务对应的代理agent确定所述代理agent对应的监控对象;
采集所述监控对象对应的监控信息,并基于所述监控信息,判断所述监控对象是否处于正常状态;
若判定所述监控对象处于异常状态,则确定所述监控信息对应的待优化问题;
将所述待优化问题输入优化模型中,通过所述优化模型,确定所述监控对象对应的优化策略;
判断所述待优化问题是否为调外部关联方问题,其中,调外部关联方问题为需要调用外部关联方相关人员进行处理的问题;
若否,则输出所述异常状态对应的异常信息和所述优化策略;
若是,则获取调外部关联方对应的终端地址;
将所述异常信息发送至所述终端地址对应的终端。
2.如权利要求1所述的系统性能监控方法,其特征在于,所述当接收到启动监控服务的指令时,通过所述监控服务对应的代理agent确定所述代理agent对应的监控对象的步骤之前,所述方法还包括:
接收已解决的待优化问题和所述已解决的待优化问题对应的优化策略;
以所述已解决的待优化问题作为初始模型的输入,以所述已解决的待优化问题对应的优化策略作为所述初始模型的输出,将所述初始模型训练成所述优化模型;
接收导入的学习网址,基于爬虫技术,监测所述学习网址是否存在更新的待优化问题和所述更新的待优化问题对应的优化策略;
若存在,则获取所述更新的待优化问题和所述更新的待优化问题对应的优化策略;
以所述更新的待优化问题作为所述优化模型的输入,以所述更新的待优化问题对应的优化策略作为所述优化模型的输出,训练得到新的优化模型,并将所述新的优化模型作为所述优化模型。
3.如权利要求1-2任意一项所述的系统性能监控方法,其特征在于,所述采集所述监控对象对应的监控信息,并基于所述监控信息,判断所述监控对象是否处于正常状态的步骤包括:
采集所述监控对象对应的监控信息,并确定所述监控对象对应的图形样式;
根据所述监控信息生成动态监控图表,所述动态监控图表以所述监控对象对应的图形样式显示;
基于所述动态监控图表,实时确定所述监控对象是否处于正常状态。
4.如权利要求3所述的系统性能监控方法,其特征在于,所述根据所述监控信息生成动态监控图表的步骤之后,所述方法还包括:
获取所述监控对象的安全值;
将所述监控信息与所述安全值进行比较;
将超过安全值的监控信息在所述动态监控图表中,以亮色标注。
5.如权利要求4所述的系统性能监控方法,其特征在于,所述通过所述监控服务对应的代理agent确定所述代理agent对应的监控对象包括:
根据预置的配置信息确定所述监控对象,所述配置信息为预先设置用于指示所述监控对象种类的信息。
6.如权利要求4所述的系统性能监控方法,其特征在于,所述通过所述监控服务对应的代理agent确定所述代理agent对应的监控对象包括:
接收用户添加指令,所述用户添加指令包括添加的监控对象种类;
根据所述用户添加指令确定对应所述监控对象。
7.如权利要求1所述的系统性能监控方法,其特征在于,所述待优化问题包括内部主机层面问题、内部代码层面问题和所述调外部关联方问题。
8.一种系统性能监控装置,其特征在于,所述系统性能监控装置包括:
监控模块,用于当接收到启动监控服务的指令时,通过所述监控服务对应的代理agent确定所述代理agent对应的监控对象;
采集模块,用于采集所述监控对象对应的监控信息,并基于所述监控信息,判断所述监控对象是否处于正常状态;
判断模块,用于若判定所述监控对象处于异常状态,则确定所述监控信息对应的待优化问题;
确定模块,用于将所述待优化问题输入优化模型中,通过所述优化模型,确定所述监控对象对应的优化策略;
所述判断模块,还用于判断所述待优化问题是否为调外部关联方问题,其中,调外部关联方问题为需要调用外部关联方相关人员进行处理的问题;
输出模块,用于若否,则输出所述异常状态对应的异常信息和所述优化策略;
所述输出模块,还用于若是,则获取调外部关联方对应的终端地址;
发送模块,用于将所述异常信息发送至所述终端地址对应的终端。
9.一种监控设备,其特征在于,所述监控设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的系统性能监控程序,其中所述系统性能监控程序被所述处理器执行时,实现如权利要求1至7中任一项所述的系统性能监控方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有系统性能监控程序,其中所述系统性能监控程序被处理器执行时,实现如权利要求1至7中任一项所述的系统性能监控方法的步骤。
CN201910669511.5A 2019-07-23 2019-07-23 系统性能监控方法、装置、设备及存储介质 Active CN110515793B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910669511.5A CN110515793B (zh) 2019-07-23 2019-07-23 系统性能监控方法、装置、设备及存储介质
PCT/CN2019/116483 WO2021012481A1 (zh) 2019-07-23 2019-11-08 系统性能监控方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910669511.5A CN110515793B (zh) 2019-07-23 2019-07-23 系统性能监控方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110515793A CN110515793A (zh) 2019-11-29
CN110515793B true CN110515793B (zh) 2022-02-18

Family

ID=68622932

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910669511.5A Active CN110515793B (zh) 2019-07-23 2019-07-23 系统性能监控方法、装置、设备及存储介质

Country Status (2)

Country Link
CN (1) CN110515793B (zh)
WO (1) WO2021012481A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110995539A (zh) * 2019-12-12 2020-04-10 深圳前海环融联易信息科技服务有限公司 业务系统监控方法、装置及计算机设备
CN111651323A (zh) * 2020-05-29 2020-09-11 山东中创软件商用中间件股份有限公司 一种应用软件的监控方法、装置及设备
CN112492632B (zh) * 2020-11-09 2023-02-17 厦门亿联网络技术股份有限公司 一种基于漫游系统的异常监控方法、系统
CN114509716A (zh) * 2021-08-30 2022-05-17 正泰集团研发中心(上海)有限公司 电能表性能检测方法、装置、设备及计算机可读存储介质
CN113918409A (zh) * 2021-09-09 2022-01-11 西安震有信通科技有限公司 一种服务性能监控方法、系统及终端
WO2024023646A1 (en) 2022-07-29 2024-02-01 3M Innovative Properties Company Stabilized hot melt pressure-sensitive adhesives
CN116823233B (zh) * 2023-08-30 2023-11-07 青岛巨商汇网络科技有限公司 一种基于全周期运维的用户数据处理方法及系统
CN117520097A (zh) * 2023-11-29 2024-02-06 一汽解放汽车有限公司 操作系统的数据处理方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102014407A (zh) * 2010-12-10 2011-04-13 北京交通大学 一种基于snmp的无线传感器网络域委托代理管理机制
CN108063753A (zh) * 2017-11-10 2018-05-22 全球能源互联网研究院有限公司 一种信息安全监测方法及系统
CN109948000A (zh) * 2019-01-09 2019-06-28 南方科技大学 异质网络的异常目标检测方法、装置、设备及存储介质
CN110009371A (zh) * 2018-12-27 2019-07-12 阿里巴巴集团控股有限公司 异常行为确定方法、装置、设备及计算机可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101483545B (zh) * 2008-12-31 2011-06-29 中国建设银行股份有限公司 一种金融业务监控方法及系统
US10091131B2 (en) * 2014-07-10 2018-10-02 International Business Machines Corporation Increased network resources in exchange for sharing of device resources
CN107239339B (zh) * 2016-03-29 2021-03-02 斑马智行网络(香港)有限公司 系统性能优化参数确定方法、系统性能优化方法及装置
CN106027328B (zh) * 2016-05-13 2020-02-07 深圳市中润四方信息技术有限公司 一种基于应用容器部署的集群监控的方法及系统
CN107992398B (zh) * 2017-12-22 2021-04-27 宜人恒业科技发展(北京)有限公司 一种业务系统的监控方法和监控系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102014407A (zh) * 2010-12-10 2011-04-13 北京交通大学 一种基于snmp的无线传感器网络域委托代理管理机制
CN108063753A (zh) * 2017-11-10 2018-05-22 全球能源互联网研究院有限公司 一种信息安全监测方法及系统
CN110009371A (zh) * 2018-12-27 2019-07-12 阿里巴巴集团控股有限公司 异常行为确定方法、装置、设备及计算机可读存储介质
CN109948000A (zh) * 2019-01-09 2019-06-28 南方科技大学 异质网络的异常目标检测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
WO2021012481A1 (zh) 2021-01-28
CN110515793A (zh) 2019-11-29

Similar Documents

Publication Publication Date Title
CN110515793B (zh) 系统性能监控方法、装置、设备及存储介质
CN107566358B (zh) 一种风险预警提示方法、装置、介质及设备
US11221743B2 (en) Information processing method, terminal, server, and computer storage medium
CN112052111B (zh) 服务器异常预警的处理方法、装置、设备及存储介质
CN110377481B (zh) 日志管理方法、装置、设备及存储介质
CN109802881A (zh) 一种群聊消息的定向提醒处理方法及装置
CN109194689B (zh) 异常行为识别方法、装置、服务器及存储介质
CN109669795A (zh) 崩溃信息处理方法及装置
US9736031B2 (en) Information system construction assistance device, information system construction assistance method, and information system construction assistance program
CN112487210A (zh) 异常设备识别方法、电子设备和介质
US20230205516A1 (en) Software change analysis and automated remediation
CN116418653A (zh) 基于多指标根因定位算法的故障定位方法及装置
CN105162931B (zh) 一种通信号码的分类方法及装置
WO2020073661A1 (zh) 动态码同步进程扩容方法、动态码生成器及存储介质
US20220222350A1 (en) Vulnerability dashboard and automated remediation
JP2011118686A (ja) 業務支援装置
US20180254944A1 (en) Method of providing log information, server for providing log information, and storage medium
CN117435999A (zh) 一种风险评估方法、装置、设备以及介质
CN110209558B (zh) 基于软件定义存储的智能运维方法和装置
CN105243315B (zh) 用于单一型图片验证码输入的方法、装置及系统
CN112907360B (zh) 风险评估方法、设备、存储介质及程序产品
CN112230815B (zh) 智能求助方法、装置、设备及存储介质
CN114398994A (zh) 基于图像识别的业务异常检测方法、装置、设备及介质
US12001551B2 (en) Warning apparatus, control method, and program
FI129933B (en) Management of communication network prediction models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant