CN115629933A - 业务系统监控方法、装置、设备及存储介质 - Google Patents

业务系统监控方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115629933A
CN115629933A CN202211134907.8A CN202211134907A CN115629933A CN 115629933 A CN115629933 A CN 115629933A CN 202211134907 A CN202211134907 A CN 202211134907A CN 115629933 A CN115629933 A CN 115629933A
Authority
CN
China
Prior art keywords
monitoring
service
sdk
service system
monitoring data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211134907.8A
Other languages
English (en)
Inventor
徐盛松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Irobotbox Technology Co ltd
Original Assignee
Shenzhen Irobotbox Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Irobotbox Technology Co ltd filed Critical Shenzhen Irobotbox Technology Co ltd
Priority to CN202211134907.8A priority Critical patent/CN115629933A/zh
Publication of CN115629933A publication Critical patent/CN115629933A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种业务系统监控方法,包括:定时同步各个业务系统对应的各个云资源的使用情况信息;基于各个所述业务系统中预配置的各个事务监控SDK分别从所述使用情况信息中获取监控数据并缓存;若第一事务监控SDK缓存的第一监控数据达到预设阈值,则对所述第一监控数据进行建模分析,获得所述第一监控数据对应的可视化报表并发送至预设用户端。本发明还公开了一种业务系统监控装置、设备及存储介质。本发明通过异步处理的方式获取业务系统各项事务的监控数据,在不占用系统资源的情况下,实现了对各个业务系统的线上服务资源的全局监控,可以快速发现线上服务资源存在的异常,并且快速定位具体的系统问题,提高了业务系统监控的效率。

Description

业务系统监控方法、装置、设备及存储介质
技术领域
本发明涉及监控技术领域,尤其涉及一种业务系统监控方法、装置、设备及存储介质。
背景技术
近年来,由于科技的进步,互联网步入了云计算时代。在云计算时代,服务供应商可以为其他企业提供云资源,其中,云资源包括可以快速提供的网络、服务器、存储、应用软件、服务等线上资源。
随着服务供应商的业务增加,业务系统的线上服务资源也越来越多,而由于线上服务资源的同时增加,导致业务系统对线上服务资源进行管理十分地困难,其难点主要体现在:未能及时发现生产环境产生的问题并及时处理;未能发现服务假死;定位很多系统问题的具体原因需要大量的时间成本;解决由线上服务资源导致的问题的人力成本过高。
因此,需要提出一种可以通过不同指标的监控与报警,对业务系统进行监控,并快速发现并定位系统问题的技术方案。
发明内容
本发明的主要目的在于提供一种业务系统监控方法,旨在解决线上服务资源管理困难,不能及时发现并定位系统出现的问题的技术问题。
为实现上述目的,本发明提供一种业务系统监控方法,所述业务系统监控方法包括以下步骤:
定时同步各个业务系统对应的各个云资源的使用情况信息;
基于各个所述业务系统中预配置的各个事务监控SDK分别从所述使用情况信息中获取监控数据并缓存;
若第一事务监控SDK缓存的第一监控数据达到预设阈值,则对所述第一监控数据进行建模分析,获得所述第一监控数据对应的可视化报表并发送至预设用户端。
优选地,所述基于各个所述业务系统中预配置的各个事务监控SDK分别从所述使用情况信息中获取监控数据并缓存的步骤之前,还包括:
在各个所述业务系统中配置监控SDK,其中,所述监控SDK至少包括各个所述事务监控SDK。
优选地,所述监控SDK还包括逻辑监控SDK,所述在各个所述业务系统中配置监控SDK的步骤之后,还包括:
基于各个所述业务系统中的所述逻辑监控SDK实时对关键业务处理流程中的数据进行分析,确定是否存在关键业务对应的系统异常;
若存在所述系统异常,则对所述关键业务进行建模分析,基于所述系统异常确定异常数据源;
基于所述异常数据源生成警报信息并发送至预设用户端。
优选地,所述监控SDK还包括服务监控SDK,所述在各个所述业务系统中配置监控SDK的步骤之后,还包括:
基于各个所述业务系统中的所述服务监控SDK确定服务状态执行过程中的异常情况;
基于所述异常情况进行系统预报,并生成系统服务执行日志。
优选地,所述基于所述异常情况进行系统预报,并生成系统服务执行日志的步骤之后,还包括:
获取所述异常情况对应的异常处理策略;
基于所述异常处理策略对所述异常情况进行自动化容错处理。
优选地,所述业务系统监控方法还包括:
实时获取各个业务系统对应的API调用量情况;
基于所述API调用量情况确定是否存在超过安全阈值,和/或,周期性调用量异常的调用情况;
若存在,则基于所述调用情况生成系统通知并发送至预设用户端。
优选地,所述获得所述第一监控数据对应的可视化报表并发送至预设用户端的步骤之后,还包括:
基于所述可视化报表对所述第一监控数据的各项监控指标进行时段分析、同比分析以及环比分析,每隔预设时间生成分析报告并发送至所述预设用户端。
此外,为实现上述目的,本发明还提供一种业务系统监控装置,所述业务系统监控装置包括:
同步模块,用于定时同步各个业务系统对应的各个云资源的使用情况信息;
监控模块,用于基于各个所述业务系统中预配置的各个事务监控SDK分别从所述使用情况信息中获取监控数据并缓存;
分析模块,用于若第一事务监控SDK缓存的第一监控数据达到预设阈值,则对所述第一监控数据进行建模分析,获得所述第一监控数据对应的可视化报表并发送至预设用户端。
此外,为实现上述目的,本发明还提供一种业务系统监控设备,所述业务系统监控设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的业务系统监控程序,所述业务系统监控程序被所述处理器执行时实现如上所述的业务系统监控方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,其特征在于,所述可读存储介质上存储有业务系统监控程序,所述业务系统监控程序被处理器执行时实现如上所述的业务系统监控方法的步骤。
本发明提出的业务系统监控方法,通过定时同步各个业务系统对应的各个云资源的使用情况信息;基于各个所述业务系统中预配置的各个事务监控SDK分别从所述使用情况信息中获取监控数据并缓存;若第一事务监控SDK缓存的第一监控数据达到预设阈值,则对所述第一监控数据进行建模分析,获得所述第一监控数据对应的可视化报表并发送至预设用户端所能实现的有益效果。通过异步处理的方式获取业务系统各项事务的监控数据,在不占用系统资源的情况下,实现了对各个业务系统的线上服务资源的全局监控,使得根据可视化报表可以快速发现线上服务资源存在的异常,并且快速定位具体的系统问题,有利于后续快速解决发现的系统问题,提高了业务系统监控的效率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境中业务系统监控设备的结构示意图;
图2为本发明业务系统监控方法第一实施例的流程示意图;
图3是本发明实施例方案涉及的业务系统监控装置的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境中业务系统监控设备的结构示意图。
本发明实施例终端可以是PC,也可以是智能手机、平板电脑、便携计算机等具有显示功能的可移动式终端设备。
如图1所示,该业务系统监控设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,业务系统监控设备还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对业务系统监控设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及业务系统监控程序。
在图1所示的业务系统监控设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的业务系统监控程序。
在本实施例中,业务系统监控设备包括:存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的业务系统监控程序,其中,处理器1001调用存储器1005中存储的业务系统监控程序时,执行以下各个实施例中业务系统监控方法的步骤。
本发明还提供一种业务系统监控方法,参照图2,图2为本发明业务系统监控方法第一实施例的流程示意图。
本实施例中,该方法包括以下步骤:
步骤S101,定时同步各个业务系统对应的各个云资源的使用情况信息;
本实施例中,为了将各个业务系统对应的各个云资源的资源情况纳入监控,首先需要进行资源同步,定时同步各个业务系统对应的各个云资源的使用情况信息,后续即可从各个云资源的使用情况信息中获得监控数据。
具体地,云平台,即云计算平台,可以根据用户的需求,为用户提供相应的计算能力、存储空间或者各类软件服务,云平台集合了各个云资源,例如ECS、RDS、K8S、GuassDB、Redis、RabbitMQ、PostgreSQL、Polardb等,通过任务调度系统,可以定时调用云平台接口,从而对各个云资源的使用情况信息进行同步,该定时调用的时刻可以作为超参数提前进行设定,此外,将同步后的各个云资源的使用情况信息存储至数据库中。
步骤S102,基于各个所述业务系统中预配置的各个事务监控SDK分别从所述使用情况信息中获取监控数据并缓存;
需要说明的是,SDK(Software Development Kit,软件开发工具包),一般都是一些软件工程师为特定的软件包、软件框架、硬件平台、操作系统等建立应用软件时的开发工具的集合。其应用于监控数据方面,可以将数据通过监听或劫持的方式采集起来,统一发送至后台。
本实施例中,为了获得监控数据,需要用到各个业务系统中预配置的各个事务监控SDK,由于各个业务系统不同,因此各个业务系统对应的云资源可能相同也可能不同,不同业务系统中预配置的各个事务监控SDK可能相同也可能不同,其中,事务监控SDK可以由业务系统中的各项事务进行触发,包括单点和多点事务触发,例如心跳监控事务触发、业务逻辑事务触发、定时服务事务触发、定时任务事务触发、事务阈值触发、事务异常触发等。
具体地,在每次同步了云资源的使用情况信息后,各个事务监控SDK可以根据事务触发在使用情况信息中采集相关的监控数据,而后将采集到的监控数据进行缓存,以使得后续可以根据缓存的监控数据进行分析,达到对各个业务系统对应的各个云资源的资源情况进行监控的效果。
步骤S103,若第一事务监控SDK缓存的第一监控数据达到预设阈值,则对所述第一监控数据进行建模分析,获得所述第一监控数据对应的可视化报表并发送至预设用户端。
本实施例中,各个事务监控SDK对于监控数据的缓存存在预设阈值,若任一事务监控SDK缓存的监控数据达到了预设阈值,则将该事务监控SDK作为第一事务监控SDK,将其缓存的监控数据作为第一监控数据,而后,对第一监控数据进行建模分析,根据建模分析的结果构建出第一监控数据对应的可视化报表,最终,将可视化报表发送至预设用户端,该预设用户端可以为相关人员使用的远程终端,例如运营、产品、开发以及维护人员,根据可视化报表,相关人员可以对业务系统对应的各个云资源的资源情况进行监控,并做出相应地处理。
可选地,除了对监控数据进行缓存的方式外,各个事务监控SDK还可以存在独立数据库,用于独立地存储监控数据,每个事务监控SDK对应的独立数据库存在预设阈值,当任一事务监控SDK的独立数据库中存储的监控数据达到预设阈值时,即可以对其存储的监控数据进行建模分析,以获得可视化报表。
在本实施例中,通过定时同步各个业务系统对应的各个云资源的使用情况信息;基于各个所述业务系统中预配置的各个事务监控SDK分别从所述使用情况信息中获取监控数据并缓存;若第一事务监控SDK缓存的第一监控数据达到预设阈值,则对所述第一监控数据进行建模分析,获得所述第一监控数据对应的可视化报表并发送至预设用户端。通过异步处理的方式获取业务系统各项事务的监控数据,在不占用系统资源的情况下,实现了对各个业务系统的线上服务资源的全局监控,使得根据可视化报表可以快速发现线上服务资源存在的异常,并且快速定位具体的系统问题,有利于后续快速解决发现的系统问题,提高了业务系统监控的效率。
基于第一实施例,提出本发明业务系统监控方法的第二实施例,在本实施例中,步骤S102之前,还包括:
步骤S201,在各个所述业务系统中配置监控SDK,其中,所述监控SDK至少包括各个所述事务监控SDK。
本实施例中,为了对各个业务系统进行监控,需要预先在各个业务系统中配置监控SDK,其中,监控SDK至少包括各个事务监控SDK,用于从各个云资源的使用情况信息中获取监控数据。
可选地,监控SDK还可以包括用于监控业务系统核心业务逻辑的逻辑监控SDK,以及,用于监控业务系统服务状态的服务监控SDK,使得后续可以及时发现业务系统在核心逻辑和/或服务状态方面的异常问题。
在本实施例中,通过在各个所述业务系统中配置监控SDK,其中,所述监控SDK至少包括各个所述事务监控SDK。使得后续可以对业务系统进行不同指标的监控与报警,实现对各个业务系统的线上服务资源的全局监控,快速定位具体的系统问题,有利于后续快速解决发现的系统问题,提高了业务系统监控的效率。
基于第二实施例,提出本发明业务系统监控方法的第三实施例,在本实施例中,所述监控SDK还包括逻辑监控SDK,步骤S201之后,还包括:
步骤S301,基于各个所述业务系统中的所述逻辑监控SDK实时对关键业务处理流程中的数据进行分析,确定是否存在关键业务对应的系统异常;
步骤S302,若存在所述系统异常,则对所述关键业务进行建模分析,基于所述系统异常确定异常数据源;
步骤S303,基于所述异常数据源生成警报信息并发送至预设用户端。
本实施例中,各个业务系统中预配置的监控SDK还包括逻辑监控SDK,用于对监控业务系统的核心业务逻辑进行监控,通过逻辑监控SDK可以实时对业务系统的关键业务处理流程中的数据进行分析,确定是否存在关键业务对应的系统异常,若存在系统异常,则根据系统异常确定异常数据源,从而根据异常数据源生成警报信息并发送至预设用户端,例如,逻辑监控SDK集成在业务系统的关键业务处理流程中,对大规模的数据(亿级)进行实时的数据分析,捕获核心业务和关键业务中的系统异常,而后对关键业务进行建模分析,根据捕获到的系统异常确定异常数据源,并根据异常数据源生成警报信息,将警报信息通过系统通知和/或第三方通信发送至预设用户端,即相关人员的远程终端,以使得相关人员后续可以做出相应地处理。
在本实施例中,通过基于各个所述业务系统中的所述逻辑监控SDK实时对关键业务处理流程中的数据进行分析,确定是否存在关键业务对应的系统异常;若存在所述系统异常,则对所述关键业务进行建模分析,基于所述系统异常确定异常数据源;基于所述异常数据源生成警报信息并发送至预设用户端。实现了对业务系统核心业务逻辑的监控,可以及时发现系统异常并定位异常数据源,而后通知相关人员快速地进行响应,以达到快速定位并解决系统异常的目的,提高了业务系统监控的效率。
基于第二实施例,提出本发明业务系统监控方法的第四实施例,在本实施例中,所述监控SDK还包括服务监控SDK,步骤S201之后,还包括:
步骤S401,基于各个所述业务系统中的所述服务监控SDK确定服务状态执行过程中的异常情况;
步骤S402,基于所述异常情况进行系统预报,并生成系统服务执行日志。
其中,步骤S402之后,还包括:
步骤S501,获取所述异常情况对应的异常处理策略;
步骤S502,基于所述异常处理策略对所述异常情况进行自动化容错处理。
本实施例中,各个业务系统中预配置的监控SDK还包括服务监控SDK,用于对业务系统的服务状态进行监控,通过服务监控SDK,可以确定业务系统服务状态执行过程中的异常情况,根据异常情况进行系统预报,并生成系统服务执行日志,而后,根据异常情况获取对应的异常处理策略,从而根据异常处理策略对异常情况进行自动化容错处理,例如,在系统服务、定时任务以及消息队列执行中集成服务监控SDK,通过服务监控SDK确定服务状态执行超时、报错、在规定结束时间未执行完成等异常情况,从而对异常情况进行系统预报,并生成系统服务执行日志,而后,在预先设定的异常处理策略中,可以根据异常情况确定对应的异常处理策略,并根据该策略进行自动化容错处理,包括:将在规定结束时间未执行完成的服务和任务自动添加至下一个执行循环;自动截断未执行完的服务、任务、队列,终止报错并重新执行等,使得可以智能化的解决业务系统服务状态出现的异常情况。
在本实施例中,通过基于各个所述业务系统中的所述服务监控SDK确定服务状态执行过程中的异常情况;基于所述异常情况进行系统预报,并生成系统服务执行日志;而后获取所述异常情况对应的异常处理策略;基于所述异常处理策略对所述异常情况进行自动化容错处理。实现了对业务系统服务状态的监控,可以及时发现业务系统服务状态的异常情况,后续根据对应的异常处理策略对异常情况进行自动化容错处理,达到对服务状态的异常情况进行快速定位并自动解决的目的,提高了服务状态监控的智能性,提高了业务系统监控的效率。
基于第一实施例,提出本发明业务系统监控方法的第五实施例,在本实施例中,所述业务系统监控方法还包括:
步骤S601,实时获取各个业务系统对应的API调用量情况;
步骤S602,基于所述API调用量情况确定是否存在超过安全阈值,和/或,周期性调用量异常的调用情况;
步骤S603,若存在,则基于所述调用情况生成系统通知并发送至预设用户端。
需要说明的是,API(Application Program Interface,应用程序界面)的定义为应用程序可用以与计算机操作系统交换信息和命令的标准集。其本质是预先定义的函数,常作为不同程序或者不同系统之间的接口或者通道,通过调用API接口,即可进行数据的传输。
本实施例中,为了对业务系统的API调用情况进行监控,首先需要实时获取各个业务系统对应的API调用量情况,而后根据获取的API调用量情况确定是否存在超过安全阈值,和/或,周期性调用量异常的调用情况,若存在,则根据调用情况生成系统通知并发送至预设用户端,例如,对业务系统内部各子系统的API调用量、外部系统调用内部系统的API调用量、调用外部系统的API调用量进行实时监控,对超过安全阀值的调用情况,和/或,周期性调用量异常的调用情况,生成系统通知并发送至相关人员的远程终端,或者通过第三方通信工具告知相关人员进行处理。
可选地,对各个业务系统对应的API调用量进行实时监控时,还可以根据实时的API调用量情况动态地对调用阈值和安全阈值进行调整,也可以根据时间段对API调用量进行智能分配。
在本实施例中,通过实时获取各个业务系统对应的API调用量情况;基于所述API调用量情况确定是否存在超过安全阈值,和/或,周期性调用量异常的调用情况;若存在,则基于所述调用情况生成系统通知并发送至预设用户端。实现了对业务系统API调用量的实时监控,可以快速地发现并定位API调用量产生的异常情况,并通知相关人员进行处理,提高了业务系统监控的效率。
基于第一实施例,提出本发明业务系统监控方法的第六实施例,在本实施例中,步骤S103之后,还包括:
步骤S701,基于所述可视化报表对所述第一监控数据的各项监控指标进行时段分析、同比分析以及环比分析,每隔预设时间生成分析报告并发送至所述预设用户端。
本实施例中,获得第一监控数据对应的可视化报表后,还可以根据可视化报表对第一监控数据的各项监控指标进行时段分析、同比分析以及环比分析,每隔预设时间,生成上述分析的分析报告并发送至预设用户端,例如,设置时间段,按时间段定时将分析报告发送至相关人员的远程终端。
可选地,也可以设置每生成一次可视化报表,则进行一次上述分析,并将分析报告发送至预设用户端,避免生成重复的分析报告。
可选地,在对业务系统不同的监控对象进行监控时,也可以生成可视化报表,例如核心业务逻辑监控、服务状态监控以及API调用量监控等,而后执行上述根据可视化报表获得分析报告并发送至预设用户端的操作,从而更直观的体现监控结果。
在本实施例中,通过基于所述可视化报表对所述第一监控数据的各项监控指标进行时段分析、同比分析以及环比分析,每隔预设时间生成分析报告并发送至所述预设用户端。从而更直观的获得监控数据的变化情况,以使得后续可以对监控数据的变化进行预测,提前做出相应地处理,提高了业务系统监控的效率。
此外,本发明实施例还提出一种业务系统监控装置,参照图3,所述业务系统监控装置包括:
同步模块10,用于定时同步各个业务系统对应的各个云资源的使用情况信息;
监控模块20,用于基于各个所述业务系统中预配置的各个事务监控SDK分别从所述使用情况信息中获取监控数据并缓存;
分析模块30,用于若第一事务监控SDK缓存的第一监控数据达到预设阈值,则对所述第一监控数据进行建模分析,获得所述第一监控数据对应的可视化报表并发送至预设用户端。
此外,本发明实施例还提出一种业务系统监控设备,该业务系统监控设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的业务系统监控程序,所述业务系统监控程序被所述处理器执行时实现如上所述的业务系统监控方法的步骤。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有业务系统监控程序,所述业务系统监控程序被处理器执行时实现如上所述的业务系统监控方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种业务系统监控方法,其特征在于,所述业务系统监控方法包括以下步骤:
定时同步各个业务系统对应的各个云资源的使用情况信息;
基于各个所述业务系统中预配置的各个事务监控SDK分别从所述使用情况信息中获取监控数据并缓存;
若第一事务监控SDK缓存的第一监控数据达到预设阈值,则对所述第一监控数据进行建模分析,获得所述第一监控数据对应的可视化报表并发送至预设用户端。
2.如权利要求1所述的业务系统监控方法,其特征在于,所述基于各个所述业务系统中预配置的各个事务监控SDK分别从所述使用情况信息中获取监控数据并缓存的步骤之前,还包括:
在各个所述业务系统中配置监控SDK,其中,所述监控SDK至少包括各个所述事务监控SDK。
3.如权利要求2所述的业务系统监控方法,其特征在于,所述监控SDK还包括逻辑监控SDK,所述在各个所述业务系统中配置监控SDK的步骤之后,还包括:
基于各个所述业务系统中的所述逻辑监控SDK实时对关键业务处理流程中的数据进行分析,确定是否存在关键业务对应的系统异常;
若存在所述系统异常,则对所述关键业务进行建模分析,基于所述系统异常确定异常数据源;
基于所述异常数据源生成警报信息并发送至预设用户端。
4.如权利要求2所述的业务系统监控方法,其特征在于,所述监控SDK还包括服务监控SDK,所述在各个所述业务系统中配置监控SDK的步骤之后,还包括:
基于各个所述业务系统中的所述服务监控SDK确定服务状态执行过程中的异常情况;
基于所述异常情况进行系统预报,并生成系统服务执行日志。
5.如权利要求4所述的业务系统监控方法,其特征在于,所述基于所述异常情况进行系统预报,并生成系统服务执行日志的步骤之后,还包括:
获取所述异常情况对应的异常处理策略;
基于所述异常处理策略对所述异常情况进行自动化容错处理。
6.如权利要求1所述的业务系统监控方法,其特征在于,所述业务系统监控方法还包括:
实时获取各个业务系统对应的API调用量情况;
基于所述API调用量情况确定是否存在超过安全阈值,和/或,周期性调用量异常的调用情况;
若存在,则基于所述调用情况生成系统通知并发送至预设用户端。
7.如权利要求1至6任一项所述的业务系统监控方法,其特征在于,所述获得所述第一监控数据对应的可视化报表并发送至预设用户端的步骤之后,还包括:
基于所述可视化报表对所述第一监控数据的各项监控指标进行时段分析、同比分析以及环比分析,每隔预设时间生成分析报告并发送至所述预设用户端。
8.一种业务系统监控装置,其特征在于,所述业务系统监控装置包括:
同步模块,用于定时同步各个业务系统对应的各个云资源的使用情况信息;
监控模块,用于基于各个所述业务系统中预配置的各个事务监控SDK分别从所述使用情况信息中获取监控数据并缓存;
分析模块,用于若第一事务监控SDK缓存的第一监控数据达到预设阈值,则对所述第一监控数据进行建模分析,获得所述第一监控数据对应的可视化报表并发送至预设用户端。
9.一种业务系统监控设备,其特征在于,所述业务系统监控设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的业务系统监控程序,所述业务系统监控程序被所述处理器执行时实现如权利要求1至7中任一项所述的业务系统监控方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述可读存储介质上存储有业务系统监控程序,所述业务系统监控程序被处理器执行时实现如权利要求1至7中任一项所述的业务系统监控方法的步骤。
CN202211134907.8A 2022-09-16 2022-09-16 业务系统监控方法、装置、设备及存储介质 Pending CN115629933A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211134907.8A CN115629933A (zh) 2022-09-16 2022-09-16 业务系统监控方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211134907.8A CN115629933A (zh) 2022-09-16 2022-09-16 业务系统监控方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115629933A true CN115629933A (zh) 2023-01-20

Family

ID=84902913

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211134907.8A Pending CN115629933A (zh) 2022-09-16 2022-09-16 业务系统监控方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115629933A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115801545A (zh) * 2023-02-06 2023-03-14 天翼云科技有限公司 一种混合云管的异常实时上报方法、系统、设备和介质
CN116662122A (zh) * 2023-06-06 2023-08-29 长春师范大学 一种基于业务监控的监控方法、系统、设备及介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115801545A (zh) * 2023-02-06 2023-03-14 天翼云科技有限公司 一种混合云管的异常实时上报方法、系统、设备和介质
CN115801545B (zh) * 2023-02-06 2023-06-23 天翼云科技有限公司 一种混合云管的异常实时上报方法、系统、设备和介质
CN116662122A (zh) * 2023-06-06 2023-08-29 长春师范大学 一种基于业务监控的监控方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
US10210036B2 (en) Time series metric data modeling and prediction
KR101826368B1 (ko) 클라우드 컴퓨팅 모니터링 및 관리 시스템
CN115629933A (zh) 业务系统监控方法、装置、设备及存储介质
CN105573824B (zh) 分布式计算系统的监控方法及系统
CN111950988B (zh) 分布式工作流调度方法、装置、存储介质及电子设备
CN113704065A (zh) 监控方法、装置、设备及计算机存储介质
US20160323160A1 (en) Detection of node.js memory leaks
US10007562B2 (en) Business transaction context for call graph
CN113377626B (zh) 基于服务树的可视化统一报警方法、装置、设备和介质
US10372572B1 (en) Prediction model testing framework
CN114090366A (zh) 一种监控数据的方法、装置和系统
US10331484B2 (en) Distributed data platform resource allocator
CN113570476A (zh) 基于自定义告警规则的电网监控系统容器服务监控方法
CN113760634A (zh) 一种数据处理方法和装置
CN112307046A (zh) 数据采集方法和装置、计算机可读存储介质、电子设备
CN115514618A (zh) 告警事件的处理方法、装置、电子设备和介质
CN114090268B (zh) 容器管理方法及容器管理系统
CN114564249B (zh) 推荐调度引擎、推荐调度方法及计算机可读存储介质
CN115202973A (zh) 应用运行状态的确定方法、装置、电子设备和介质
CN114816477A (zh) 服务器升级方法、装置、设备、介质和程序产品
CN114861909A (zh) 模型质量监控方法、装置、电子设备以及存储介质
CN114625763A (zh) 用于数据库的信息分析方法、装置、电子设备和可读介质
CN114090397A (zh) 一种告警信息处理方法和装置
CN114372826A (zh) 一种运价数据的处理方法、系统、设备及存储介质
CN113282455A (zh) 一种监控处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination