CN112100034A - 一种业务监控方法和装置 - Google Patents

一种业务监控方法和装置 Download PDF

Info

Publication number
CN112100034A
CN112100034A CN202011050531.3A CN202011050531A CN112100034A CN 112100034 A CN112100034 A CN 112100034A CN 202011050531 A CN202011050531 A CN 202011050531A CN 112100034 A CN112100034 A CN 112100034A
Authority
CN
China
Prior art keywords
monitoring
service
thread
module
counter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011050531.3A
Other languages
English (en)
Inventor
刘琳琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Taikang Pension Insurance Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Taikang Pension Insurance Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd, Taikang Pension Insurance Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN202011050531.3A priority Critical patent/CN112100034A/zh
Publication of CN112100034A publication Critical patent/CN112100034A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种业务监控方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:根据业务系统之间的调用关系获取标准业务系统运行所依赖的模块服务,并统计模块服务的个数;将模块服务的个数赋值给计数器以作为计数器初值;开启线程池中的不少于一个线程以对模块服务进行监控,其中,每个线程对一个模块服务进行监控,并响应于每获得一个线程的监控数据,将计数器的值减1;响应于达到设定的超时时间,根据不少于一个线程的监控数据得到对标准业务系统的监控结果。该实施方式能够通过对标准业务系统运行所依赖的模块服务进行监控来实现对标准业务系统的监控,从而可以高效、灵活、快速、精准、低成本地监控标准业务系统的健康状态。

Description

一种业务监控方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种业务监控方法和装置。
背景技术
由于业务系统功能实现的需求,很多互联网业务系统需要保证24小时运行,这对业务系统的稳定性提出了要求,需要实时监控业务系统是否健康稳定运行,如若出现问题可及时发现并解决问题。目前,常用的监控方法是在该业务系统内部编写一个监控度检查的不带有任何业务逻辑的监控接口,通过实时调度访问此监控接口来对该业务系统进行监控,具体地,若在规定的响应时间内可以拿到响应值,则表示该业务系统正常稳定运行;否则,说明该业务系统运行异常,给业务系统监控报警接收人发送监控告警信息。
然而,对于复杂的应用来说,其不止包括一个业务系统,且这些业务系统之间也会存在一定的依赖关系,例如:一个业务系统依赖于数据库服务、缓存服务等各种独立运行的其他服务,且若该业务系统依赖的服务不稳定或者出现异常宕机等情况,则同样会导致该业务系统无法正常运行。因此,需要对该业务系统及其运行依赖的模块服务都进行监控。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
现有的监控技术只能监控业务系统本身应用的健康状态,无法监控业务系统运行所依赖的相关服务的健康状态。
发明内容
有鉴于此,本发明实施例提供一种业务监控方法和装置,能够通过对目标业务系统运行所依赖的模块服务进行监控来实现对目标业务系统的监控,从而可以高效、灵活、快速、精准、低成本地监控业务系统的健康状态。
为实现上述目的,根据本发明实施例的一个方面,提供了一种业务监控方法。
一种业务监控方法,包括:根据业务系统之间的调用关系获取标准业务系统运行所依赖的模块服务,并统计所述模块服务的个数;将目标所述模块业务系统的依赖服务的个数赋值给计数器以作为计数器初值;开启线程池中的不少于一个线程以对所述模块服务进行监控,其中,以使每个线程对一个依赖模块服务进行监控,并响应于每获得一个线程的监控数据,将所述计数器的值减1;响应于达到设定的超时时间,根据所述不少于一个线程的监控数据得到对所述标准业务系统的监控结果。
可选地,通过倒计数锁存器来对所述不少于一个线程进行管理,响应于每获得一个线程的监控数据,调用所述倒计数锁存器来将所述计数器的值减1。
可选地,所述超时时间是通过倒计数锁存器来进行设定的,所述业务监控方法还包括:响应于达到设定的超时时间,若所述计数器的值不为0,则通过所述倒计数锁存器关闭所述线程池,然后收集所述不少于一个线程的监控数据。
可选地,在得到对所述标准业务系统的监控结果之后,还包括:将此次业务监控的监控时间和监控结果保存到监控系统中。
可选地,在将所述模块服务的个数赋值给计数器以作为计数器初值之前,还包括:确定当前时间与上次业务监控的监控时间的时间间隔大于设定阈值;若所述时间间隔不大于所述阈值,则将上次业务监控的监控结果返回。
可选地,还包括:对于每个线程,根据所述线程的监控数据是否为空来判断所述线程监控的模块服务的状态是否异常;若所述线程的监控数据为空,则所述线程监控的模块服务异常。
可选地,还包括:将监控结果及每个模块服务的状态写入监控页面,并通过抓取状态关键词的方式获取异常的模块服务,进行报警提醒。
根据本发明实施例的另一方面,提供了一种业务监控装置。
一种业务监控装置,包括:依赖服务统计模块,用于根据业务系统之间的调用关系获取标准业务系统运行所依赖的模块服务,并统计所述模块服务的个数;计数器赋值模块,用于将目标业务系统的所述依赖服务模块服务的个数赋值给计数器以作为计数器初值;服务监控处理模块,用于开启线程池中的不少于一个线程以对所述模块服务进行监控,其中,以使每个线程对一个依赖服务模块服务进行监控,并响应于每获得一个线程的监控数据,将所述计数器的值减1;监控数据处理模块,用于响应于达到设定的超时时间,根据所述不少于一个线程的监控数据得到对所述标准业务系统的监控结果。
根据本发明实施例的又一方面,提供了一种业务监控电子设备。
一种业务监控的电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例所提供的业务监控方法。
根据本发明实施例的再一方面,提供了一种计算机可读介质。
一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例所提供的业务监控方法。
上述发明中的一个实施例具有如下优点或有益效果:通过根据业务系统之间的调用关系获取标准业务系统运行所依赖的模块服务,并统计模块服务的个数;将模块服务的个数赋值给计数器以作为计数器初值;开启线程池中的不少于一个线程以对模块服务进行监控,每个线程对一个模块服务进行监控,并响应于每获得一个线程的监控数据,将计数器的值减1;响应于达到设定的超时时间,根据不少于一个线程的监控数据得到对标准业务系统的监控结果,实现了通过对标准业务系统的模块服务进行监控来实现对标准业务系统的监控,从而可以高效、灵活、快速、精准、低成本地监控业务系统的健康状态;且不侵入业务系统的业务逻辑代码,监控接口的方法和业务逻辑的代码保持相对的独立;并且监控功能本身尽可能少的占用系统资源的开销以及服务运行的资源;相关监控接口不需要单独部署,不需要占用新的服务器资源。另外,本发明的实施例还提供了一种实时监控系统的页面,可一目了然地获取监控结果,以便系统负责人进行业务系统监控。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是本发明实施例可以应用于其中的示例性系统架构图;
图2是本发明实施例的业务监控的实现原理示意图;
图3是根据本发明实施例的业务监控方法的主要步骤示意图;
图4是根据本发明实施例的业务监控装置的主要模块示意图;
图5是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1示出了可以应用本发明实施例的业务监控方法或业务监控装置的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种应用,例如报警类应用、定时器应用、信息提醒类应用等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的业务系统的监控结果提供支持的后台管理服务器。后台管理服务器可以对接收到的业务系统监控请求等数据进行分析等处理,并将处理结果(例如监控结果)反馈给终端设备。
需要说明的是,本发明实施例所提供的业务监控方法一般由服务器105执行,相应地,业务监控装置一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2是本发明实施例的业务监控的实现原理示意图。在一个复杂的应用系统中,一般会涉及到多项业务,这些业务之间可能会存在依赖关系。在本发明的一个实施例中,以标准业务接口平台为例,其不光包括标准业务系统,实际上标准业务系统的投保服务正常运行依赖很多其他的功能模块服务,如数据库oracle服务、redis缓存服务、获取流水号服务等各种独立运行的模块服务,如若标准业务系统依赖的服务不稳定或者出现异常宕机等情况,标准业务接口平台亦不能正常的提供承保相关的服务,故需要实时监测本标准业务系统及相关依赖服务的健康状态,出现问题第一时间发现以及快速响应处理,才能保证养老标准接口平台的正常稳定高效的运行,更好的支持互联网保险承保业务。
为了保证每项业务健康稳定的运行,需要实时、准确、精准、快速的监控业务系统的健康状态,并且监控功能尽可能少的占用系统资源的开销,以及尽可能少的占用系统服务运行资源。如图2所示,本发明实施例中,根据图2中的系统框架来实现业务监控。主要包括统一监控平台、标准业务监控系统、标准业务系统运行所的模块服务(简称“依赖服务”)几个部分,其中,统一监控平台用于接收用户的监控请求,并获取监控请求中包括的标准业务系统信息,然后通过调用标准业务系统的监控接口来进行业务监控,并在获得标准业务系统的监控接口返回的监控结果之后将其进行显示,以及对有异常的业务系统进行报警提醒;标准业务系统提供监控接口以供统一监控平台进行调用,标准业务系统的监控接口里面的监控逻辑不仅仅监控本业务系统,而且监控本业务系统运行所依赖的服务。
为了实时、准确、精准、快速的监控业务系统的健康状态,并且使监控功能尽可能少的占用系统资源的开销,尽可能少的占用系统服务运行资源,本发明的标准业务监控系统主要结合java的线程池管理工具ExecutorService和倒计数锁存器CountDownLatch两者的功能来实现新的监控接口并返回监控结果页面,供统一监控平台轮询调度及监控该业务系统的运行状态。
标准业务系统正常运行依赖的服务有N个,具体为服务1、服务2、服务3、……、服务N,其中,N为正整数。基于这N个依赖服务提供一个监控接口。
在该监控接口对应的监控服务类内部,定义一个时间变量,用于记录对标准业务系统最近一次的监控时间;定义一个监控结果对象集合,用于记录对标准业务系统最近一次的监控时间对应的监控结果;定义N个监控方法,分别用于对标准业务系统的N个依赖服务进行监控并返回监控数据;定义一个监控结果收集器,用于对这N个监控方法返回的监控数据进行收集、处理以得到监控结果,并将监控结果保存到监控结果对象集合中。
当用户通过统一监控平台发送标准业务系统的监控请求时,统一监控平台将调用标准业务系统的监控接口以执行对标准业务系统的监控。
图3是根据本发明实施例的业务监控方法的主要步骤示意图。根据本发明的技术方案,标准业务系统具有不少于一个依赖服务。如图3所示,本发明实施例的业务监控方法主要包括如下的步骤S301至步骤S304。
步骤S301:根据业务系统之间的调用关系获取标准业务系统运行所依赖的模块服务,并统计模块服务的个数;
步骤S302:将模块服务的个数赋值给计数器以作为计数器初值;
步骤S303:开启线程池中的不少于一个线程以对模块服务进行监控,其中,每个线程对一个模块服务进行监控,并响应于每获得一个线程的监控数据,将计数器的值减1;
步骤S304:响应于达到设定的超时时间,根据不少于一个线程的监控数据得到对标准业务系统的监控结果。
对于包括多个业务系统的应用来说,当需要对其中的某个业务系统进行运行状态监控时,可以基于系统业务分层的理念,对业务系统之间的调用关系进行分析,进而得到业务系统运行所依赖的模块服务,即:业务系统的依赖服务。在本发明的实施例中,当要对标准业务系统进行监控时,即可根据业务系统之间的调用关系获取标准业务系统运行所依赖的模块服务,并对这些模块服务进行监控分析以得到标准业务系统的监控结果。在对这些模块服务进行监控时,为了更好、更全面地分析标准业务系统的监控结果,则需要尽量全面地获取这些模块服务的监控数据。故而,在本发明的实施例中,通过获取标准业务系统运行所依赖的模块服务的个数,并结合计数器来实现对这些模块服务的全面监控。
根据本发明的实施例,统一监控平台调用标准业务系统的监控接口进行业务监控。标准业务系统的业务监控系统将首先获取标准业务系统运行所依赖的模块服务个数,并赋值给建立的计数器以作为计数器的初值。其中,标准业务系统依赖的模块服务个数可以是之前已统计完成并保存在数据库中的,计数器可以是在接收到业务监控请求后创建的,也可以是之前已创建好的,只是进行一个初始值的赋值操作。
针对标准业务系统依赖的N个服务,利用java的多线程并发线程池ExecutorService创建N个线程的线程池,使得N个线程可同时执行,即触发标准业务系统的业务监控系统的主流程时,这N个线程可同时分别进行这N个服务的监控,在监控接口内通过并发执行线程池中的N个线程可节约N倍左右的接口响应时间,每个线程内部执行具体的依赖服务的监控逻辑,并且返回每个依赖服务的监控数据。
标准业务系统的业务监控系统在每获得一个线程返回的依赖服务的监控数据后,即可将计数器的值递减1,如此,即可根据计数器的值判断是否每个线程都返回了监控数据。
在本发明的实施例中,通过倒计数锁存器来对该不少于一个线程进行管理,响应于每获得一个线程的监控数据,调用倒计数锁存器来将计数器的值减1。在业务监控系统的主方法流程中,利用java的倒计数锁存器CountDownLatch管理N个线程,即计数器的初始化值设为N个服务相对应的数量N。CountDownLatch是一个非常实用的多线程控制工具类,管理线程池剩余线程的个数。针对每个线程执行的依赖服务的监控逻辑,即每个线程执行完后,主动调用CountDownLatch.countDown()方法对计数器的值执行减1的操作,直到所有的线程执行完成后计数器值为0。该处理的目的是在监控接口的主方法内部检测所有的线程是否执行完毕,若执行完毕进行下步返回监控结果相关的流程。
然而,在进行标准业务系统的依赖服务的监控时,也并非是可以不限制监控时长的。因此,本发明设置了超时时间,当有依赖服务在超时时间到达时还未获得监控数据,则说明该依赖服务存在异常。响应于达到设定的超时时间,若计数器的值不为0,则通过倒计数锁存器关闭线程池,然后收集每个线程的监控数据。根据本发明的实施例,超时时间是通过倒计数锁存器来进行设定的。在监控接口的主方法内执行倒计数锁存器CountDownLatch.await(long timeout,TimeUnit unit)有参方法,设置超时时间timeout的具体值,以便在等待一段时间后进行线程阻塞。若方法的返回值为false,表示计数器不为0,即此时仍有线程未执行完成,则可利用方法ExecutorService.shutdownNow()把线程池关闭,从而释放线程池占用的资源。此监控场景主要是为了监控依赖服务是否正常稳定运行,到达一定的超时时间timeout后,计数器没有进行减1的依赖服务的监控结果应当是不健康的状态,不再等待该依赖服务的监控数据,以免导致死锁状态。
在达到超时时间后,标准业务系统的业务监控系统收集每个线程返回的监控数据,并将此次业务监控的监控时间保存到定义的时间变量中,将监控结果保存到定义的监控结果对象集合中。对于每个线程,根据该线程的监控数据是否为空来判断该线程监控的依赖服务的状态是否异常;若该线程的监控数据为空,则该线程监控的依赖服务异常。如果某线程的监控数据为空,则赋值其监控的依赖服务为不健康的状态值即可。业务监控系统收集到每个线程返回的监控数据后,即可汇总得到此次业务监控的结果,并将业务监控系统收集的监控结果以列表的形式保存在之前定义的监控结果对象集合private List<MonitorInfo>lastCheckResult中,以记录标准业务系统最近一次的监控结果;将当前监控系统请求的监控时间保存在定义的系统最近的监控调度时间的时间变量privateLocalDateTime lastCheckDateTime中。
根据本发明的实施例,每次在进行标准业务系统的监控之前,都需要确定当前时间与上次业务监控的监控时间的时间间隔是否大于设定阈值,若大于,则开始执行监控流程,否则,将上次业务监控的监控结果返回。具体地,可在接收到标准业务系统的监控请求后,判断监控请求的当前时间LocalDateTime.now()与上次业务监控的监控时间lastCheckDateTime相隔是否在设定阈值(例如:一分钟,可根据业务实现需要灵活配置)之内,若是,可直接返回lastCheckResult结果,不再具体执行监控依赖服务的方法,从而节省系统资源的开销,避免短时间内频繁地进行业务系统监控造成业务系统资源浪费,影响业务执行。若当前时间与上次业务监控的监控时间的时间间隔超过系统定义的间隔范围,则执行监控逻辑并返回最新的监控结果。
根据本发明的一个实施例,在获得监控结果及每个依赖服务的状态之后,还可以将监控结果lastCheckResult及每个依赖服务的状态写入业务监控系统的监控页面monitor.html中。监控接口返回的是自定义的monitor.html页面,页面信息布局例如可以是表格形式,行目录为依赖的服务名称,服务名称描述,服务健康状态,服务健康状态描述等,使得监控页面简单清晰一目了然。
统一监控平台可通过抓取与监控页面monitor.html约定的状态关键词来获取异常的依赖服务,例如,假设异常的依赖服务的状态为FAIL,若监控页面中有FAIL,则表示有不可用的异常服务,发送监控报警信息给相关的监控报警接收人。监控报警接收人收到监控报警信息后,可以及时进行相关处理。另外,用户还可随时访问标准业务系统的监控接口,获取监控页面monitor.html,该页面可以一目了然的看清楚当前系统的运行状态,方便系统负责人实时监控标准业务系统依赖的服务的健康状态。
根据本发明的一个实施例,假设标准业务系统A的依赖服务有服务1、服务2、……、服务5。通过本发明的业务监控系统进行标准业务系统及其依赖服务的监控后,得到的依赖服务的监控结果及每个依赖服务的状态数据如下表1所示。
表1
依赖服务的名称 描述信息 状态 监控状况描述
服务1 数据库服务 OK OK
服务2 缓存服务 OK OK
服务3 获取流水号服务 OK OK
服务4 保单列表服务 OK OK
服务5 保单详情服务 FAIL FAIL
其中,描述信息是标准业务系统依赖的服务的具体描述;状态是依赖服务的状态,其中,OK为正常状态,FAIL为异常状态;监控状况描述指的是每个依赖服务的监控状况是否正常,其中,OK为监控正常,FAIL为监控异常。
图4是根据本发明实施例的业务监控装置的主要模块示意图。如图4所示,本发明实施例的业务监控装置400主要包括依赖服务统计模块401、计数器赋值模块402、服务监控处理模块403和监控数据处理模块404。
依赖服务统计模块401,用于根据业务系统之间的调用关系获取标准业务系统运行所依赖的模块服务,并统计所述模块服务的个数;
计数器赋值模块402,用于将所述模块服务的个数赋值给计数器以作为计数器初值;
服务监控处理模块403,用于开启线程池中的不少于一个线程以对所述模块服务进行监控,其中,使每个线程对一个依赖服务进行监控,并响应于每获得一个线程的监控数据,将所述计数器的值减1;
监控数据处理模块404,用于响应于达到设定的超时时间,根据所述不少于一个线程的监控数据得到对所述标准业务系统的监控结果。
根据本发明的一个实施例,通过倒计数锁存器来对所述不少于一个线程进行管理,响应于每获得一个线程的监控数据,调用所述倒计数锁存器来将所述计数器的值减1。
根据本发明的另一个实施例,所述超时时间是通过倒计数锁存器来进行设定的,本发明实施例的业务监控装置400还可以包括数据收集模块(图中未示出),用于响应于达到设定的超时时间,若所述计数器的值不为0,则通过所述倒计数锁存器关闭所述线程池,然后收集所述不少于一个线程的监控数据。
根据本发明的另一个实施例,业务监控装置400还可以包括数据保存模块(图中未示出),用于在得到对所述标准业务系统的监控结果之后,将此次业务监控的监控时间和监控结果保存到监控系统中。
根据本发明的又一个实施例,业务监控装置400还可以包括第一判定模块(图中未示出),用于在将所述模块服务的个数赋值给计数器以作为计数器初值之前,确定当前时间与上次业务监控的监控时间的时间间隔大于设定阈值;若所述时间间隔不大于所述阈值,则将上次业务监控的监控结果返回。
根据本发明的又一个实施例,业务监控装置400还可以包括第二判定模块(图中未示出),用于对于每个线程,根据所述线程的监控数据是否为空来判断所述线程监控的模块服务的状态是否异常;若所述线程的监控数据为空,则所述线程监控的模块服务异常。
根据本发明的再一个实施例,业务监控装置400还可以包括监控报警模块(图中未示出),用于将监控结果及每个模块服务的状态写入监控页面,并通过抓取状态关键词的方式获取异常的模块服务,进行报警提醒。
根据本发明实施例的技术方案,通过根据业务系统之间的调用关系获取标准业务系统运行所依赖的模块服务,并统计模块服务的个数;将模块服务的个数赋值给计数器以作为计数器初值;开启线程池中的不少于一个线程以对模块服务进行监控,每个线程对一个模块服务进行监控,并响应于每获得一个线程的监控数据,将计数器的值减1;响应于达到设定的超时时间,根据不少于一个线程的监控数据得到对标准业务系统的监控结果,实现了通过对标准业务系统的模块服务进行监控来实现对标准业务系统的监控,从而可以高效、灵活、快速、精准、低成本地监控业务系统的健康状态;且不侵入业务系统的业务逻辑代码,监控接口的方法和业务逻辑的代码保持相对的独立;并且监控功能本身尽可能少的占用系统资源的开销以及服务运行的资源;相关监控接口不需要单独部署,不需要占用新的服务器资源。另外,本发明的实施例还提供了一种实时监控系统的页面,可一目了然地获取监控结果,以便系统负责人进行业务系统监控。
下面参考图5,其示出了适于用来实现本发明实施例的终端设备或服务器的计算机系统500的结构示意图。图5示出的终端设备或服务器仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括依赖服务统计模块、计数器赋值模块、服务监控处理模块和监控数据处理模块。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定,例如,计数器赋值模块还可以被描述为“用于将所述模块服务的个数赋值给计数器以作为计数器初值的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者不少于一个程序,当上述一个或者不少于一个程序被一个该设备执行时,使得该设备包括:根据业务系统之间的调用关系获取标准业务系统运行所依赖的模块服务,并统计所述模块服务的个数;将所述模块服务的个数赋值给计数器以作为计数器初值;开启线程池中的不少于一个线程以对所述模块服务进行监控,其中,每个线程对一个模块服务进行监控,并响应于每获得一个线程的监控数据,将所述计数器的值减1;响应于达到设定的超时时间,根据所述不少于一个线程的监控数据得到对所述标准业务系统的监控结果。
根据本发明实施例的技术方案,通过根据业务系统之间的调用关系获取标准业务系统运行所依赖的模块服务,并统计模块服务的个数;将模块服务的个数赋值给计数器以作为计数器初值;开启线程池中的不少于一个线程以对模块服务进行监控,每个线程对一个模块服务进行监控,并响应于每获得一个线程的监控数据,将计数器的值减1;响应于达到设定的超时时间,根据不少于一个线程的监控数据得到对标准业务系统的监控结果,实现了通过对标准业务系统的模块服务进行监控来实现对标准业务系统的监控,从而可以高效、灵活、快速、精准、低成本地监控业务系统的健康状态;且不侵入业务系统的业务逻辑代码,监控接口的方法和业务逻辑的代码保持相对的独立;并且监控功能本身尽可能少的占用系统资源的开销以及服务运行的资源;相关监控接口不需要单独部署,不需要占用新的服务器资源。另外,本发明的实施例还提供了一种实时监控系统的页面,可一目了然地获取监控结果,以便系统负责人进行业务系统监控。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种业务监控方法,其特征在于,包括:
根据业务系统之间的调用关系获取标准业务系统运行所依赖的模块服务,并统计所述模块服务的个数;
将所述模块服务的个数赋值给计数器以作为计数器初值;
开启线程池中的不少于一个线程以对所述模块服务进行监控,其中,每个线程对一个模块服务进行监控,并响应于每获得一个线程的监控数据,将所述计数器的值减1;
响应于达到设定的超时时间,根据所述不少于一个线程的监控数据得到对所述标准业务系统的监控结果。
2.根据权利要求1所述的业务监控方法,其特征在于,通过倒计数锁存器来对所述不少于一个线程进行管理,响应于每获得一个线程的监控数据,调用所述倒计数锁存器来将所述计数器的值减1。
3.根据权利要求1或2所述的业务监控方法,其特征在于,所述超时时间是通过倒计数锁存器来进行设定的,所述业务监控方法还包括:
响应于达到设定的超时时间,若所述计数器的值不为0,则通过所述倒计数锁存器关闭所述线程池,然后收集所述不少于一个线程的监控数据。
4.根据权利要求1所述的业务监控方法,其特征在于,在得到对所述标准业务系统的监控结果之后,还包括:
将此次业务监控的监控时间和监控结果保存到监控系统中。
5.根据权利要求4所述的业务监控方法,其特征在于,在将所述模块服务的个数赋值给计数器以作为计数器初值之前,还包括:
确定当前时间与上次业务监控的监控时间的时间间隔大于设定阈值;
若所述时间间隔不大于所述阈值,则将上次业务监控的监控结果返回。
6.根据权利要求1所述的业务监控方法,其特征在于,还包括:
对于每个线程,根据所述线程的监控数据是否为空来判断所述线程监控的模块服务的状态是否异常;
若所述线程的监控数据为空,则所述线程监控的模块服务异常。
7.根据权利要求1所述的业务监控方法,其特征在于,还包括:
将监控结果及每个模块服务的状态写入监控页面,并通过抓取状态关键词的方式获取异常的模块服务,进行报警提醒。
8.一种业务监控装置,其特征在于,包括:
依赖服务统计模块,用于根据业务系统之间的调用关系获取标准业务系统运行所依赖的模块服务,并统计所述模块服务的个数;
计数器赋值模块,用于将所述模块服务的个数赋值给计数器以作为计数器初值;
服务监控处理模块,用于开启线程池中的不少于一个线程以对所述模块服务进行监控,其中,每个线程对一个模块服务进行监控,并响应于每获得一个线程的监控数据,将所述计数器的值减1;
监控数据处理模块,用于响应于达到设定的超时时间,根据所述不少于一个线程的监控数据得到对所述标准业务系统的监控结果。
9.一种业务监控的电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN202011050531.3A 2020-09-29 2020-09-29 一种业务监控方法和装置 Pending CN112100034A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011050531.3A CN112100034A (zh) 2020-09-29 2020-09-29 一种业务监控方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011050531.3A CN112100034A (zh) 2020-09-29 2020-09-29 一种业务监控方法和装置

Publications (1)

Publication Number Publication Date
CN112100034A true CN112100034A (zh) 2020-12-18

Family

ID=73784230

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011050531.3A Pending CN112100034A (zh) 2020-09-29 2020-09-29 一种业务监控方法和装置

Country Status (1)

Country Link
CN (1) CN112100034A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112764992A (zh) * 2021-01-20 2021-05-07 网银在线(北京)科技有限公司 线程池的监控方法、装置及设备
CN113885956A (zh) * 2021-09-29 2022-01-04 北京百度网讯科技有限公司 服务部署方法及装置、电子设备和存储介质
CN114155093A (zh) * 2022-02-08 2022-03-08 一方函互联网有限公司 基于区块链的电子保函全流程管理及风险管控系统
CN115934480A (zh) * 2023-03-15 2023-04-07 浪潮电子信息产业股份有限公司 一种任务监控方法、系统、装置及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170206477A1 (en) * 2016-01-20 2017-07-20 American Express Travel Related Services Company, Inc. System and method for health monitoring of business processes and systems
CN108038145A (zh) * 2017-11-23 2018-05-15 携程旅游网络技术(上海)有限公司 分布式服务跟踪方法、系统、存储介质和电子设备
CN110795264A (zh) * 2019-10-14 2020-02-14 杭州海兴电力科技股份有限公司 监控管理方法及系统、智能管理终端
CN110795315A (zh) * 2018-08-01 2020-02-14 北京京东尚科信息技术有限公司 监控业务的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170206477A1 (en) * 2016-01-20 2017-07-20 American Express Travel Related Services Company, Inc. System and method for health monitoring of business processes and systems
CN108038145A (zh) * 2017-11-23 2018-05-15 携程旅游网络技术(上海)有限公司 分布式服务跟踪方法、系统、存储介质和电子设备
CN110795315A (zh) * 2018-08-01 2020-02-14 北京京东尚科信息技术有限公司 监控业务的方法和装置
CN110795264A (zh) * 2019-10-14 2020-02-14 杭州海兴电力科技股份有限公司 监控管理方法及系统、智能管理终端

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112764992A (zh) * 2021-01-20 2021-05-07 网银在线(北京)科技有限公司 线程池的监控方法、装置及设备
CN112764992B (zh) * 2021-01-20 2024-04-12 网银在线(北京)科技有限公司 线程池的监控方法、装置及设备
CN113885956A (zh) * 2021-09-29 2022-01-04 北京百度网讯科技有限公司 服务部署方法及装置、电子设备和存储介质
CN113885956B (zh) * 2021-09-29 2023-08-29 北京百度网讯科技有限公司 服务部署方法及装置、电子设备和存储介质
CN114155093A (zh) * 2022-02-08 2022-03-08 一方函互联网有限公司 基于区块链的电子保函全流程管理及风险管控系统
CN115934480A (zh) * 2023-03-15 2023-04-07 浪潮电子信息产业股份有限公司 一种任务监控方法、系统、装置及计算机可读存储介质
CN115934480B (zh) * 2023-03-15 2023-06-16 浪潮电子信息产业股份有限公司 一种任务监控方法、系统、装置及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN112100034A (zh) 一种业务监控方法和装置
US10523580B2 (en) Automatic cloud provisioning based on related internet news and social network trends
US20070168915A1 (en) Methods and systems to detect business disruptions, determine potential causes of those business disruptions, or both
CN106452818B (zh) 一种资源调度的方法和系统
CN111209110B (zh) 一种实现负载均衡的任务调度管理方法、系统和存储介质
JP2015191523A (ja) 構成管理装置、構成管理システム、および構成管理プログラム
CN109840141B (zh) 基于云监控的线程控制方法、装置、电子设备及存储介质
CN112965879A (zh) 数据处理方法、装置、电子设备及可读存储介质
CN112230847B (zh) 一种监控K8s存储卷的方法、系统、终端及存储介质
CN112052133A (zh) 一种基于Kubernetes的业务系统监控方法和装置
CN112181948A (zh) 数据库操作语句的处理方法、装置、电子设备和介质
US9032014B2 (en) Diagnostics agents for managed computing solutions hosted in adaptive environments
CN111538585A (zh) 一种基于node.js的服务器进程调度方法、系统和装置
CN114153609A (zh) 资源控制方法及装置、电子设备、计算机可读存储介质
CN110347546B (zh) 监控任务动态调整方法、装置、介质及电子设备
US10893015B2 (en) Priority topic messaging
CN112817687A (zh) 一种数据同步方法和装置
CN116521639A (zh) 一种日志数据的处理方法、电子设备和计算机可读介质
CN107276853B (zh) 流量处理方法及电子设备、计算机系统
CN113360182B (zh) 系统性能诊断的方法和装置
CN115202973A (zh) 应用运行状态的确定方法、装置、电子设备和介质
US8904002B2 (en) Reducing overhead in component interactions
CN113282455A (zh) 一种监控处理方法和装置
CN113127187A (zh) 用于集群扩缩容的方法和装置
CN106484536B (zh) 一种io调度方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination