CN109428779A - 一种分布式业务的监控告警方法及装置 - Google Patents

一种分布式业务的监控告警方法及装置 Download PDF

Info

Publication number
CN109428779A
CN109428779A CN201710757200.5A CN201710757200A CN109428779A CN 109428779 A CN109428779 A CN 109428779A CN 201710757200 A CN201710757200 A CN 201710757200A CN 109428779 A CN109428779 A CN 109428779A
Authority
CN
China
Prior art keywords
monitoring
message
code
abnormal
business
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710757200.5A
Other languages
English (en)
Inventor
沈鹏
刘家鑫
马志远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Antian Information Technology Co Ltd
Original Assignee
Wuhan Antian Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Antian Information Technology Co Ltd filed Critical Wuhan Antian Information Technology Co Ltd
Priority to CN201710757200.5A priority Critical patent/CN109428779A/zh
Publication of CN109428779A publication Critical patent/CN109428779A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3688Test management for test execution, e.g. scheduling of test suites
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/14Arrangements for monitoring or testing data switching networks using software, i.e. software packages

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Alarm Systems (AREA)

Abstract

本发明实施例的目的在于提供了一种分布式业务的监控告警方法,包括在应用程序的预定义代码片段部署业务监控节点,以监控代码运行;当代码运行发生异常时捕获异常消息;根据捕获的异常消息产生相应告警。在实际业务代码段进行监控,不仅能了解业务进程的存活情况,也能体现内部逻辑的运行情况,能达到完善的监控目的。并且,开发人员可以根据预设规则合理的布置监控节点,提高了监控的准确性和灵活性。另外,本发明也不需要单独编写监控接口,大大降低了监控的部署及开发成本。本发明还公开了一种分布式业务的监控告警装置。

Description

一种分布式业务的监控告警方法及装置
技术领域
本发明属于计算机技术领域,尤其涉及一种分布式业务的监控告警方法及装置。
背景技术
随着大数据技术的发展,单一的计算能力已经无法满足日渐增加的数据需求,分布式计算能力显得尤为重要,如何保障分布式计算能力的正常、可靠运行,以及非正常运行后的告警恢复机制,是目前监控系统技术领域关注的重点。
现有的分布式业务的监控告警技术包括:(1)在每台业务终端机器部署监控脚本,仅对业务进程是否存活进行监控,当发现监控的业务进程没有存活,会向监控中心上报此次失败信息,监控中心接受到此消息后,会读取预定义的告警配置并发送告警。(2)在每台业务终端机器提供单独的监控接口,监控中心需单独编写代码来调用各个业务终端机所提供的监控接口,以检查业务的可用性,如果调用接口过程中发现返回预先定义的失败状态协议,则读取告警配置并发送告警。
上述方案的缺陷在于:(1)仅对业务进程进行存活监控,不能体现内部逻辑是否正常运行,不能达到完善的监控目的;而在各个机器部署监控脚本,可能会被中断,且部署耗时,不方便于集中调度管理。(2)对每台业务终端机器,开发人员都需要单独编写监控接口,增加了开发量;并且监控的完善性完全依赖于监控接口,不能体现实际业务是否运行正常,难以达到实际的监控目的。
发明内容
本发明实施例的目的在于提供了一种分布式业务的监控告警方法及系统,能够深入到业务内部,完善监控业务运行情况,且不需要在每台业务终端机部署监控脚本,也不需要单独编写监控接口,减轻了部署成本和开发成本。
本发明公开了一种分布式业务的监控告警方法,包括以下步骤:
S01,在应用程序的预定义代码片段部署业务监控节点,以监控代码运行;
S02,当代码运行发生异常时捕获异常消息;
S03,根据捕获的异常消息产生相应告警。
进一步的,所述预定义代码片段包括:网络通信、数据库访问、第三方接口调用、文件读写、缓存服务访问、消息队列服务访问或各种服务中间件调用中的至少一种。
进一步的,所述代码运行发生异常为导致应用程序不能正常运行的状态,代码运行发生异常包括:网络请求断开、数据库不能访问、第三方接口调用超时、文件读写失败、连接缓存系统失败、消息队列或各种中间件服务通信失败。
进一步的,异常消息至少包括业务标识。
进一步的,捕获的异常消息以消息队列形式传递。
本发明还公开了一种分布式业务的监控告警装置,包括业务监控节点部署模块、异常消息捕获模块、告警模块,其中:
业务监控节点部署模块,用于在应用程序的预定义代码片段部署业务监控节点,以监控代码运行;
异常消息捕获模块,用于当代码运行发生异常时捕获异常消息;
告警模块,用于根据捕获的异常消息产生相应告警。
进一步的,所述预定义代码片段包括:网络通信、数据库访问、第三方接口调用、文件读写、缓存服务访问、消息队列服务访问或各种服务中间件调用中的至少一种。
进一步的,所述代码运行发生异常为导致应用程序不能正常运行的状态,代码运行发生异常包括:网络请求断开、数据库不能访问、第三方接口调用超时、文件读写失败、连接缓存系统失败、消息队列或各种中间件服务通信失败。
进一步的,异常消息至少包括业务标识。
进一步的,所述监控告警装置还包括消息队列模块,用于接收异常消息捕获模块捕获的异常消息,并将其发送给告警模块。
本发明相比于现有技术的有益效果在于,本发明在应用程序的预定义代码片段部署业务监控节点以监控代码运行,当代码运行发生异常时捕获异常消息,并产生告警。在实际业务代码段进行监控,不仅能了解业务进程的存活情况,也能体现内部逻辑的运行情况,能达到完善的监控目的。并且,开发人员可以根据预设规则合理的布置监控节点,提高了监控的准确性和灵活性。另外,本发明也不需要单独编写监控接口,大大降低了监控的部署及开发成本。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一示例性实施例示出的一种分布式业务的监控告警方法的流程图。
图2为本发明一示例性实施例示出的一种分布式业务的监控告警装置的结构示意图。
图3为本发明另一示例性实施例示出的一种分布式业务的监控告警装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优节点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,一种分布式业务的监控告警方法,包括以下步骤:
S101,在应用程序的预定义代码片段部署业务监控节点,以监控代码运行。
在应用程序中,主动的对可能发生异常且有监控意义的代码片段里代码片段部署业务监控节点,监控代码运行。如在网络通信、数据库访问、第三方接口调用、文件读写、缓存服务访问、消息队列服务访问、各种服务中间件调用等代码片段处部署业务监控节点。
比如在一个学生信息系统里,有一个业务是从数据库读取某个学生的用户信息,则在数据库访问这一代码片段进行监控。可以理解的,数据库访问这段代码片段用于操作数据库这种服务组件,而如果数据库不能正常服务或访问数据库时不能正常通信,必然会造成相应代码片段异常,导致业务进程奔溃,因此需要在此处部署监控节点。
又比如,对于一些需要获取授权用户信息的业务,如微博、微信等,是调用第三方接口通过网络来获取信息。而如果网络或第三方服务的不可用,必然会造成相应代码片段异常,导致业务进程奔溃,因此需要在此处部署监控节点。
S102,当代码运行发生异常时捕获异常消息。
代码运行发生异常主要指导致应用程序不能正常运行的状态。比如网络请求断开、数据库不能访问、第三方接口调用超时、文件读写失败、连接缓存系统失败、消息队列或各种中间件服务通信失败等等。
以学生信息系统为例说明,当发现数据库访问这一代码片段发生异常,即数据不能访问,则捕获异常消息。捕获的异常消息至少包括业务名称,当然,还可以包括异常时间、事件标识、异常堆栈等。业务名称,为具有一定意义的能够描述此业务场景的标识,用于标识被告警人;异常时间可以为当前系统时间;事件标识,可以为用于区分一个业务中的多个监控点的标识;堆栈信息可以为发生异常的堆栈上下文调用信息,用于排查异常原因。
基本的各种编程语言都有自己的捕获异常实现方式,比如在python语言中,捕获异常的方式为try,except;在php,java语言中捕获异常的方式为try,catch。为了方便对异常消息进行处理,优选将异常消息组成消息体,比如拼装成json消息体,形式如:
{“业务名称”:“读取学生信息”,“异常时间:“xxxx-xx-xx xx:xx:xx”,“事件标识”:“数据库读取”,”异常堆栈”:”xx“}
S103,根据捕获的异常消息产生相应告警。
比如对S102过来的消息体进行decode操作,然后根据业务名称和预定义在配置文件中的业务名称和告警人信息的对应关系来读取配置中的告警人信息,产生相应告警。比如业务名称:{被告警人名称,被告警人通知方式,告警人地址},告警人名称为被告警人真实名称;被告警人通知方式可以为短信或邮件;被告警人地址可以为被告警人的邮件地址或电话号码。若捕获的异常消息的业务名称能匹配预定义配置文件的告警信息,则按配置被告警方式通知被告警人已产生告警。
另外,在步骤S102、S103之间可以利用消息队列来传递捕获的异常消息,相比传统的通过http来通信,减少了一些无用的头部信息,数据包比http更小,节省了传输带宽,并且可以灵活的部署多个监听消息队列模块来适应异常消息堆积的情况。
本实施例根据预设的规则为应用程序部署业务监控节点以监控代码运行,当代码运行发生异常时捕获异常消息,并产生告警。在实际业务代码段进行监控,不仅能了解业务进程的存活情况,也能体现内部逻辑的运行情况,能达到完善的监控目的。并且,开发人员可以根据预设规则合理的布置监控节点,提高了监控的准确性和灵活性。另外,本发明也不需要单独编写监控接口,大大降低了监控的部署及开发成本。
本发明还公开了一种分布式业务的监控告警装置,如图2所示,包括业务监控节点部署模块11、异常消息捕获模块12、告警模块13,其中:
业务监控节点部署模块11,用于在应用程序的预定义代码片段部署业务监控节点,以监控代码运行。
在应用程序中,主动的对可能发生异常且有监控意义的代码片段里代码片段部署业务监控节点,监控代码运行。如在网络通信、数据库访问、第三方接口调用、文件读写、缓存服务访问、消息队列服务访问、各种服务中间件调用等代码片段处部署业务监控节点。
比如在一个学生信息系统里,有一个业务是从数据库读取某个学生的用户信息,则在数据库访问这一代码片段进行监控。可以理解的,数据库访问这段代码片段用于操作数据库这种服务组件,而如果数据库不能正常服务或访问数据库时不能正常通信,必然会造成相应代码片段异常,导致业务进程奔溃,因此需要在此处部署监控节点。
又比如,对于一些需要获取授权用户信息的业务,如微博、微信等,是调用第三方接口通过网络来获取信息。而如果网络或第三方服务的不可用,必然会造成相应代码片段异常,导致业务进程奔溃,因此需要在此处部署监控节点。
异常消息捕获模块12,用于当代码运行发生异常时捕获异常消息。
代码运行发生异常主要指导致应用程序不能正常运行的状态。比如网络请求断开、数据库不能访问、第三方接口调用超时、文件读写失败、连接缓存系统失败、消息队列或各种中间件服务通信失败等等。
以学生信息系统为例说明,当发现数据库访问这一代码片段发生异常,即数据不能访问,则捕获异常消息。捕获的异常消息至少包括业务名称,当然,还可以包括异常时间、事件标识、异常堆栈等。业务名称,为具有一定意义的能够描述此业务场景的标识,用于标识被告警人;异常时间可以为当前系统时间;事件标识,可以为用于区分一个业务中的多个监控点的标识;堆栈信息可以为发生异常的堆栈上下文调用信息,用于排查异常原因。
基本的各种编程语言都有自己的捕获异常实现方式,比如在python语言中,捕获异常的方式为try,except;在php,java语言中捕获异常的方式为try,catch。为了方便对异常消息进行处理,优选将异常消息组成消息体,比如拼装成json消息体,形式如:
{“业务名称”:“读取学生信息”,“异常时间:“xxxx-xx-xx xx:xx:xx”,“事件标识”:“数据库读取”,”异常堆栈”:”xx“}
告警模块13,用于根据捕获的异常消息产生相应告警。
比如对异常消息捕获模块12发送过来的消息体进行decode操作,然后根据业务名称和预定义在配置文件中的业务名称和告警人信息的对应关系来读取配置中的告警人信息,产生相应告警。比如业务名称:{被告警人名称,被告警人通知方式,告警人地址},告警人名称为被告警人真实名称;被告警人通知方式可以为短信或邮件;被告警人地址可以为被告警人的邮件地址或电话号码。若捕获的异常消息的业务名称能匹配预定义配置文件的告警信息,则按配置被告警方式通知被告警人已产生告警。
另外,监控告警装置还包括消息队列模块14,用于接收异常消息捕获模块12捕获的异常消息,并将其发送给告警模块13。相比传统的通过http来通信,减少了一些无用的头部信息,数据包比http更小,节省了传输带宽,并且可以灵活的部署多个监听消息队列模块来适应异常消息堆积的情况。
在具体产品中,如图3所示,业务监控节点部署模块11、异常消息捕获模块12可以部署于业务终端机器,即业务代码片段所在的机器,实际场景中可能有多台。告警模块13及消息队列模块14可部署于监控终端机器。
本实施例根据预设的规则为应用程序部署业务监控节点以监控代码运行,当代码运行发生异常时捕获异常消息,并产生告警。在实际业务代码段进行监控,不仅能了解业务进程的存活情况,也能体现内部逻辑的运行情况,能达到完善的监控目的。并且,开发人员可以根据预设规则合理的布置监控节点,提高了监控的准确性和灵活性。另外,本发明也不需要单独编写监控接口,大大降低了监控的部署及开发成本。
本领域普通技术人员可以理解为上述实施例所包括的各个模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
本领域普通技术人员还可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以在存储于一计算机可读取存储介质中,所述的存储介质,包括ROM/RAM、磁盘、光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种分布式业务的监控告警方法,其特征在于,包括以下步骤:
在应用程序的预定义代码片段部署业务监控节点,以监控代码运行;
当代码运行发生异常时捕获异常消息;
根据捕获的异常消息产生相应告警。
2.如权利要求1所述的监控告警方法,其特征在于,所述预定义代码片段包括:网络通信、数据库访问、第三方接口调用、文件读写、缓存服务访问、消息队列服务访问或各种服务中间件调用中的至少一种。
3.如权利要求1所述的监控告警方法,其特征在于,所述代码运行发生异常为导致应用程序不能正常运行的状态,代码运行发生异常包括:网络请求断开、数据库不能访问、第三方接口调用超时、文件读写失败、连接缓存系统失败、消息队列或各种中间件服务通信失败。
4.如权利要求1所述的监控告警方法,其特征在于,所述异常消息至少包括业务标识。
5.如权利要求1所述的监控告警方法,其特征在于,所述捕获的异常消息以消息队列形式传递。
6.一种分布式业务的监控告警装置,其特征在于,包括业务监控节点部署模块、异常消息捕获模块、告警模块,其中:
所述业务监控节点部署模块,用于在应用程序的预定义代码片段部署业务监控节点,以监控代码运行;
所述异常消息捕获模块,用于当代码运行发生异常时捕获异常消息;
所述告警模块,用于根据捕获的异常消息产生相应告警。
7.如权利要求6所述的监控告警装置,其特征在于,所述预定义代码片段包括:网络通信、数据库访问、第三方接口调用、文件读写、缓存服务访问、消息队列服务访问或各种服务中间件调用中的至少一种。
8.如权利要求6所述的监控告警装置,其特征在于,所述代码运行发生异常为导致应用程序不能正常运行的状态,代码运行发生异常包括:网络请求断开、数据库不能访问、第三方接口调用超时、文件读写失败、连接缓存系统失败、消息队列或各种中间件服务通信失败。
9.如权利要求6所述的监控告警装置,其特征在于,异常消息至少包括业务标识。
10.如权利要求6所述的监控告警装置,其特征在于,所述监控告警装置还包括消息队列模块,用于接收异常消息捕获模块捕获的异常消息,并将其发送给告警模块。
CN201710757200.5A 2017-08-29 2017-08-29 一种分布式业务的监控告警方法及装置 Pending CN109428779A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710757200.5A CN109428779A (zh) 2017-08-29 2017-08-29 一种分布式业务的监控告警方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710757200.5A CN109428779A (zh) 2017-08-29 2017-08-29 一种分布式业务的监控告警方法及装置

Publications (1)

Publication Number Publication Date
CN109428779A true CN109428779A (zh) 2019-03-05

Family

ID=65503480

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710757200.5A Pending CN109428779A (zh) 2017-08-29 2017-08-29 一种分布式业务的监控告警方法及装置

Country Status (1)

Country Link
CN (1) CN109428779A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111274094A (zh) * 2020-02-04 2020-06-12 上海携程商务有限公司 接口预警方法、系统、设备及存储介质
CN111475386A (zh) * 2020-06-05 2020-07-31 中国银行股份有限公司 一种故障预警方法及相关装置
CN111475520A (zh) * 2020-04-10 2020-07-31 厦门慢雾科技有限公司 一种对区块数据进行自动化监控和告警的方法及系统
CN112181763A (zh) * 2020-09-22 2021-01-05 中国建设银行股份有限公司 一种智能调度中的智能检测告警方法及装置
CN112685256A (zh) * 2020-12-30 2021-04-20 上海掌门科技有限公司 服务端监控方法、设备和介质
CN112860522A (zh) * 2021-03-02 2021-05-28 北京梧桐车联科技有限责任公司 程序的运行监控方法、装置及设备
CN112988443A (zh) * 2021-03-16 2021-06-18 上海哔哩哔哩科技有限公司 业务异常的处理方法及装置
CN113342607A (zh) * 2021-06-08 2021-09-03 北京科东电力控制系统有限责任公司 一种面向api的全场景多维度监控机制的实现方法
CN113992348A (zh) * 2021-09-22 2022-01-28 北京东方通软件有限公司 一种一体机的监控方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020099818A1 (en) * 2000-11-16 2002-07-25 Russell Ethan George Method and system for monitoring the performance of a distributed application
US7546609B2 (en) * 2004-03-12 2009-06-09 Emc Corporation Method and apparatus for determining monitoring locations in distributed systems
CN101553769A (zh) * 2005-10-11 2009-10-07 努雅公司 用于跟踪并监控计算机应用的系统和方法
CN101562540B (zh) * 2009-05-08 2011-11-02 华为技术有限公司 业务监控方法及设备
CN102354298A (zh) * 2011-07-27 2012-02-15 哈尔滨工业大学 基于staf的高端容错机故障注入自动化测试平台及方法
CN102981943A (zh) * 2012-10-29 2013-03-20 新浪技术(中国)有限公司 监控应用日志的方法及系统
CN103605592A (zh) * 2013-11-29 2014-02-26 中国航空工业集团公司第六三一研究所 一种分布式计算机系统故障检测机制
CN107086937A (zh) * 2016-02-14 2017-08-22 华为技术有限公司 一种监控方法及设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020099818A1 (en) * 2000-11-16 2002-07-25 Russell Ethan George Method and system for monitoring the performance of a distributed application
US7546609B2 (en) * 2004-03-12 2009-06-09 Emc Corporation Method and apparatus for determining monitoring locations in distributed systems
CN101553769A (zh) * 2005-10-11 2009-10-07 努雅公司 用于跟踪并监控计算机应用的系统和方法
CN101562540B (zh) * 2009-05-08 2011-11-02 华为技术有限公司 业务监控方法及设备
CN102354298A (zh) * 2011-07-27 2012-02-15 哈尔滨工业大学 基于staf的高端容错机故障注入自动化测试平台及方法
CN102981943A (zh) * 2012-10-29 2013-03-20 新浪技术(中国)有限公司 监控应用日志的方法及系统
CN103605592A (zh) * 2013-11-29 2014-02-26 中国航空工业集团公司第六三一研究所 一种分布式计算机系统故障检测机制
CN107086937A (zh) * 2016-02-14 2017-08-22 华为技术有限公司 一种监控方法及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZHAO3456: ""我工作这几年(五)-- 在代码中加入一些关键统计信息来实时监控程序的运行状态"", 《HTTP://BLOG.CSDN.NET/ZHAO_3546/ARTICLE/DETAILS/18941649》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111274094A (zh) * 2020-02-04 2020-06-12 上海携程商务有限公司 接口预警方法、系统、设备及存储介质
CN111274094B (zh) * 2020-02-04 2023-09-26 上海携程商务有限公司 接口预警方法、系统、设备及存储介质
CN111475520B (zh) * 2020-04-10 2022-05-13 厦门慢雾科技有限公司 一种对区块数据进行自动化监控和告警的方法及系统
CN111475520A (zh) * 2020-04-10 2020-07-31 厦门慢雾科技有限公司 一种对区块数据进行自动化监控和告警的方法及系统
CN111475386A (zh) * 2020-06-05 2020-07-31 中国银行股份有限公司 一种故障预警方法及相关装置
CN111475386B (zh) * 2020-06-05 2024-01-23 中国银行股份有限公司 一种故障预警方法及相关装置
CN112181763A (zh) * 2020-09-22 2021-01-05 中国建设银行股份有限公司 一种智能调度中的智能检测告警方法及装置
CN112685256A (zh) * 2020-12-30 2021-04-20 上海掌门科技有限公司 服务端监控方法、设备和介质
CN112860522A (zh) * 2021-03-02 2021-05-28 北京梧桐车联科技有限责任公司 程序的运行监控方法、装置及设备
CN112988443A (zh) * 2021-03-16 2021-06-18 上海哔哩哔哩科技有限公司 业务异常的处理方法及装置
CN113342607A (zh) * 2021-06-08 2021-09-03 北京科东电力控制系统有限责任公司 一种面向api的全场景多维度监控机制的实现方法
CN113992348A (zh) * 2021-09-22 2022-01-28 北京东方通软件有限公司 一种一体机的监控方法及系统
CN113992348B (zh) * 2021-09-22 2022-08-30 北京东方通软件有限公司 一种一体机的监控方法及系统

Similar Documents

Publication Publication Date Title
CN109428779A (zh) 一种分布式业务的监控告警方法及装置
CN110535902A (zh) 基于微服务实现监控智能化的处理方法及电子装置
US8149725B2 (en) Methods, systems, and computer program products for a hierarchical, redundant OAM&P architecture for use in an IP multimedia subsystem (IMS) network
US7213068B1 (en) Policy management system
CN104168333B (zh) Proxzone服务平台的工作方法
US20060230309A1 (en) System for remote fault management in a wireless network
CN110830283B (zh) 故障检测方法、装置、设备和系统
CN106993043B (zh) 基于代理的数据通信系统和方法
CN104065526B (zh) 一种服务器故障报警的方法和装置
CN109800098A (zh) 业务异常节点定位方法、装置、计算机设备及存储介质
CN112423331B (zh) 一种故障诊断方法及装置
CN103812838A (zh) 一种服务调用方法和设备及系统
CN109960634A (zh) 一种应用程序监控方法、装置及系统
CN103259684A (zh) 互联网业务监控方法和系统
US8099489B2 (en) Network monitoring method and system
CN113452607A (zh) 分布式链路采集的方法、装置、计算设备和存储介质
CN108363653A (zh) 监控系统的部署方法、装置、计算机设备及存储介质
CN108418860A (zh) 一种基于ceph集群的osd心跳通讯方法
CN110018677A (zh) 一种物联网设备管理系统及方法
CN103986709A (zh) 一种RESTful架构下的中间件注册方法
US10277484B2 (en) Self organizing network event reporting
CN109510730A (zh) 分布式系统及其监控方法、装置、电子设备及存储介质
CN106713014B (zh) 一种监控系统中的被监控主机、监控系统以及监控方法
CN108880913A (zh) 一种流量特征的管理方法、装置及中心节点服务器
CN114090293A (zh) 一种服务提供方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190305

WD01 Invention patent application deemed withdrawn after publication