CN113360342A - 业务功能运行环境的监控方法及设备 - Google Patents

业务功能运行环境的监控方法及设备 Download PDF

Info

Publication number
CN113360342A
CN113360342A CN202110626849.XA CN202110626849A CN113360342A CN 113360342 A CN113360342 A CN 113360342A CN 202110626849 A CN202110626849 A CN 202110626849A CN 113360342 A CN113360342 A CN 113360342A
Authority
CN
China
Prior art keywords
monitoring
environment
operating environment
operating
environments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110626849.XA
Other languages
English (en)
Inventor
郭朝兴
杨杰荣
郭丽
赵世航
李文静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Bank of China
Original Assignee
Agricultural Bank of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Bank of China filed Critical Agricultural Bank of China
Priority to CN202110626849.XA priority Critical patent/CN113360342A/zh
Publication of CN113360342A publication Critical patent/CN113360342A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例提供一种业务功能运行环境的监控方法及设备,在确定待监控的业务功能对应的各个运行环境以及各个运行环境之间的调用关系后,为各个运行环境分别配置监控案例,并根据各个运行环境之间的调用关系,确定各个运行环境对应的监控案例之间的调用关系,然后每隔预设时间间隔,分别执行各个运行环境对应的监控案例,并根据各个运行环境对应的监控案例的执行结果以及监控案例之间的调用关系,确定各个运行环境的运行状态。本申请可以区分出存在故障的运行环境是自身系统故障,还是因其调用的运行环境存在故障而导致的关联系统故障,从而能够准确、快速的定位到存在故障的运行环境。

Description

业务功能运行环境的监控方法及设备
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种业务功能运行环境的监控方法及设备。
背景技术
对业务功能的运行环境进行监控,可以及时的发现业务功能的运行环境是否出现故障,对于软件应用系统具有重要的作用。
现有的运行环境监控方式主要包括:1)机器运维监控:利用特定的工具、插件等建立机器的硬件性能监控,例如采集中央处理器(central processing unit,简称CPU)、内存、应用程序的占用情况数据,主要对业务运行环境的基础信息进行监控,并在监控指标超过阈值时进行告警;2)根据业务功能采用的协议(如超文本传输协议(Hyper textTransfer Protocol,简称HTTP),socket协议等)配置自身的监控方式,例如HTTP状态码监控、接口交易响应字段监控等。
然而,当前业务系统之间的关联关系越来越复杂,尤其是前台类业务系统,后台关联系统更为庞大。现有的监控方式仅对业务的单个运行环境建立了监控,在业务系统的关联关系越来越复杂的情况下,无法准确、快速的定位到存在故障的运行环境。
发明内容
本申请实施例提供一种业务功能运行环境的监控方法及设备,可以解决现有技术中无法准确、快速的定位到存在故障的运行环境的技术问题。
第一方面,本申请实施例提供一种业务功能运行环境的监控方法,该方法包括:
确定待监控的业务功能对应的各个运行环境以及所述各个运行环境之间的调用关系;
为所述各个运行环境分别配置监控案例,并根据所述各个运行环境之间的调用关系,确定所述各个运行环境对应的监控案例之间的调用关系,其中,所述各个运行环境之间的调用关系与所述各个运行环境对应的监控案例之间的调用关系相同;
每隔预设时间间隔,执行所述各个运行环境对应的监控案例,并根据所述各个运行环境对应的监控案例的执行结果以及所述各个运行环境对应的监控案例之间的调用关系,确定所述各个运行环境的运行状态。
在一种可行的实施方式中,所述根据所述各个运行环境对应的监控案例的执行结果以及所述各个运行环境对应的监控案例之间的调用关系,确定所述各个运行环境的运行状态,包括:
在当前运行环境对应的第一监控案例执行成功时,确定所述当前运行环境的运行状态为可用状态;
在当前运行环境对应的第一监控案例执行失败,且所述第一监控案例调用的第二监控案例执行成功时,确定所述当前运行环境的运行状态为自身系统故障状态;
在当前运行环境对应的第一监控案例与所述第一监控案例调用的第二监控案例均执行失败时,确定所述当前运行环境的运行状态为关联系统故障状态。
在一种可行的实施方式中,确定所述各个运行环境的运行状态之后,还包括:
根据所述各个运行环境的运行状态,以及各种运行状态与监控预警信号之间的对应关系,输出所述各个运行环境对应的监控预警信号。
在一种可行的实施方式中,确定所述各个运行环境的运行状态之后,还包括:
分别计算并输出所述各个运行环境在预设时长内的可用率、所述各个运行环境在所述预设时长内的自身系统故障率,以及所述各个运行环境在所述预设时长内的关联系统故障率。
在一种可行的实施方式中,采用以下方式计算第i个运行环境在预设时长内的可用率Li
Li=sum1/sum
采用以下方式计算第i个运行环境在所述预设时长内的自身系统故障率Mi
Mi=sum2/sum
采用以下方式计算第i个运行环境在所述预设时长内的关联系统故障率Ni
Ni=sum3/sum
其中,sum=sum1+sum2+sum3,sum1表示所述第i个运行环境在预设时长内处于可用状态的次数,sum2表示所述第i个运行环境在所述预设时长内处于自身系统故障状态的次数,sum3表示所述第i个运行环境在所述预设时长内处于关联系统故障状态的次数。
第二方面,本申请实施例提供一种业务功能运行环境的监控装置,该装置包括:
确定模块,用于确定待监控的业务功能对应的各个运行环境以及所述各个运行环境之间的调用关系;
配置模块,用于为所述各个运行环境分别配置监控案例,并根据所述各个运行环境之间的调用关系,确定所述各个运行环境对应的监控案例之间的调用关系,其中,所述各个运行环境之间的调用关系与所述各个运行环境对应的监控案例之间的调用关系相同;
处理模块,用于每隔预设时间间隔,执行所述各个运行环境对应的监控案例,并根据所述各个运行环境对应的监控案例的执行结果以及所述各个运行环境对应的监控案例之间的调用关系,确定所述各个运行环境的运行状态。
在一种可行的实施方式中,所述处理模块具体用于:
在当前运行环境对应的第一监控案例执行成功时,确定所述当前运行环境的运行状态为可用状态;
在当前运行环境对应的第一监控案例执行失败,且所述第一监控案例调用的第二监控案例执行成功时,确定所述当前运行环境的运行状态为自身系统故障状态;
在当前运行环境对应的第一监控案例与所述第一监控案例调用的第二监控案例均执行失败时,确定所述当前运行环境的运行状态为关联系统故障状态。
在一种可行的实施方式中,还包括预警模块,用于:
在确定所述各个运行环境的运行状态之后,根据所述各个运行环境的运行状态,以及各种运行状态与监控预警信号之间的对应关系,输出所述各个运行环境对应的监控预警信号。
在一种可行的实施方式中,所述处理模块还用于:
在确定所述各个运行环境的运行状态之后,分别计算并输出所述各个运行环境在预设时长内的可用率、所述各个运行环境在所述预设时长内的自身系统故障率,以及所述各个运行环境在所述预设时长内的关联系统故障率。
在一种可行的实施方式中,所述处理模块具体用于:
采用以下方式计算第i个运行环境在预设时长内的可用率Li
Li=sum1/sum
采用以下方式计算第i个运行环境在所述预设时长内的自身系统故障率Mi
Mi=sum2/sum
采用以下方式计算第i个运行环境在所述预设时长内的关联系统故障率Ni
Ni=sum3/sum
其中,sum=sum1+sum2+sum3,sum1表示所述第i个运行环境在预设时长内处于可用状态的次数,sum2表示所述第i个运行环境在所述预设时长内处于自身系统故障状态的次数,sum3表示所述第i个运行环境在所述预设时长内处于关联系统故障状态的次数。
第三方面,本申请实施例提供一种电子设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面提供的业务功能运行环境的监控方法。
第四方面,本申请实施例提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面提供的业务功能运行环境的监控方法。
第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时,实现如第一方面提供的业务功能运行环境的监控方法。
本申请实施例所提供的业务功能运行环境的监控方法,在确定待监控的业务功能对应的各个运行环境以及各个运行环境之间的调用关系后,为各个运行环境分别配置监控案例,并根据各个运行环境之间的调用关系,确定各个运行环境对应的监控案例之间的调用关系,然后每隔预设时间间隔,分别执行各个运行环境对应的监控案例,并根据各个运行环境对应的监控案例的执行结果以及监控案例之间的调用关系,确定各个运行环境的运行状态。本申请实施例中,由于各个运行环境之间的调用关系与各个运行环境对应的监控案例之间的调用关系一致,因此可以根据各个运行环境对应的监控案例的执行结果以及监控案例之间的调用关系,区分出存在故障的运行环境是自身系统故障,还是因其关联的运行环境存在故障而导致的关联系统故障,进而能够准确、快速的定位到存在故障的运行环境。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对本申请实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例中提供的一种业务功能运行环境的监控方法的流程示意图一;
图2为本申请实施例中提供的各个运行环境之间的调用关系示意图;
图3为本申请实施例中提供的一种业务功能运行环境的监控方法的流程示意图二;
图4为本申请实施例中提供的一种业务功能运行环境的监控装置的程序模块示意图;
图5为本申请实施例中提供的一种电子设备的硬件结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。此外,虽然本申请中公开内容按照示范性一个或几个实例来介绍,但应理解,可以就这些公开内容的各个方面也可以单独构成一个完整实施方式。
需要说明的是,本申请中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本申请的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。
本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明。应该理解这样使用的用语在适当情况下可以互换,例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。
此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的那些组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
本申请中使用的术语“模块”,是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。
以下对本申请实施例中涉及的相关术语进行解释:
监控案例:通过模拟测试人员执行真实业务交易,并对执行结果进行相关自动化判断来验证运行环境和交易的可用性的自动化脚本。
运行环境:指具有一定的操作系统、软件,部署了数据库、应用软件的用于项目、产品开发测试的软硬件环境。
交易:是指应用系统配置的用于实现系统指定功能的功能编码号。
业务场景-产品-业务功能:特定应用领域内相关产品内的特定功能,例如:掌上银行-信贷-查询功能。
可用性:运行环境能够正常使用的能力,满足本系统开发、测试的能力,以及满足关联系统正常调用并完成相关业务的能力。
当前金融业务系统之间的关联关系越来越复杂,尤其是前台类应用系统,后台关联系统更为庞大,任何中、后台运行环境出现故障都会直接影响前台渠道类应用的联调与测试。面对运行环境越来越多,关联关系越来越复杂的实际情况,现有的监控方式仅能对单个系统建立运维类监控或者交易监控,由于运行环境存在各种不确定情况,交易或者运维监控运行失败也存在各种可能情况,误报率非常高。在目前运行环境关联关系越来越复杂的情况下,无法准确、快速定位到出现故障的具体运行环境。
为了解决上述技术问题,本申请实施例中提供了一种业务功能运行环境的监控方法,通过为各个运行环境配置监控案例,各个运行环境对应的监控案例之间的调用关系与各个运行环境之间的调用关系一致,可以根据各个运行环境对应的监控案例的执行结果以及监控案例之间的调用关系,区分出存在故障的运行环境是自身系统故障,还是因关联的运行环境存在故障而导致的关联系统故障,进而能够准确、快速的定位到存在故障的运行环境。下面采用详细的实施例进行详细说明。
参照图1,图1为本申请实施例中提供的一种业务功能运行环境的监控方法的流程示意图一,在一种可行的实施方式中,该方法包括:
S101、确定待监控的业务功能对应的各个运行环境以及各个运行环境之间的调用关系。
本申请实施例中,可以先选择需要监控的业务场景(比如渠道-信贷),然后选择需要监控的业务场景内具体的产品(比如信贷的某种贷款产品),最后选择产品的具体业务功能(比如查询功能)。
按照上述选择方式,本申请实施例中可以选择一个或多个业务功能作为待监控的业务功能。
在确定待监控的业务功能后,分析确定待监控的业务功能涉及的关联环境,不同的业务功能涉及的环境数量、关联关系通常会存在差异,整体上为从前台到中台再到后台的一个关系,形状一般为多叉树结构。
为了更好的理解本申请实施例,参照图2,图2为本申请实施例中提供的各个运行环境之间的调用关系示意图。
在图2中,业务场景1中包括两个产品,分别为产品1和产品2,产品1包括两个业务功能,分别为业务功能1和业务功能2。其中,业务功能1涉及A、B、C、D、E五个运行环境,A运行环境调用B运行环境,B运行环境分别调用C运行环境、D运行环境,C运行环境调用E运行环境。
S102、为各个运行环境分别配置监控案例,并根据各个运行环境之间的调用关系,确定各个运行环境对应的监控案例之间的调用关系。
其中,各个运行环境之间的调用关系与各个运行环境对应的监控案例之间的调用关系相同。
本申请实施例中,在确定待监控的业务功能对应的各个运行环境以及各个运行环境之间的调用关系后,为各个运行环境分别配置该业务功能的业务交易监控案例,各个运行环境配置的监控案例执行地址与运行环境之间的实际链接关系一致,该一致性可以通过接口管理平台运行环境调用关系配置与监控案例执行的具体地址进行校验实现。
其中,各个运行环境配置的监控案例是对同样的业务功能进行监控。
为了更好的理解本申请实施例,参照图2,在图2中,由于A运行环境调用B运行环境,B运行环境分别调用C运行环境、D运行环境,C运行环境调用E运行环境,因此A运行环境对应的监控案例的执行结果受到B运行环境、C运行环境、D运行环境、E运行环境对应的监控案例的执行结果的影响,B运行环境对应的监控案例的执行结果受到C运行环境、D运行环境、E运行环境对应的监控案例的执行结果的影响,C运行环境对应的监控案例的执行结果受到E运行环境对应的监控案例的执行结果的影响,这样就形成了功能点1各个运行环境对应的监控案例之间的调用关系。
在一种可行的实施方式中,监控案例之间的调用关系可以使用JSON数据结构存储绑定的关联关系树,每个监控节点存储该节点绑定的下游子节点。如果下JSON结构所示,当前节点存储节点ID、名称、下游节点数组,下游各个节点按照该方式逐层级存储。
Figure BDA0003101656620000081
Figure BDA0003101656620000091
S103、每隔预设时间间隔,执行各个运行环境对应的监控案例。
本申请实施例中,各个运行环境对应的监控案例可以按照crontab时间表达式,每隔一定的时间间隔,执行各个运行环境对应的监控案例。
或者,也可以按照一定的执行频率,执行各个运行环境对应的监控案例。
可以理解的是,各个运行环境对应的监控案例按照统一设定的执行频率进行监控的调度和执行,能够有助于后续对时间相近的执行结果进行聚合分析,保证监控结果的有效性。
S104、并根据各个运行环境对应的监控案例的执行结果以及各个运行环境对应的监控案例之间的调用关系,确定各个运行环境的运行状态。
可以理解的是,系统测试环境中业务功能的调用关系是一个长链条,尤其对于前台系统来说,链条中的任意一个中后台系统出现故障都会导致前台系统的关联系统故障,为了准确度量系统的可用性,就要区分出当前存在故障的运行环境是自身系统故障,还是因其关联的运行环境存在故障而导致的关联系统故障,本实施例对运行环境的可用性状态做出如下定义:
可用状态:表示本运行环境对应的监控案例执行成功。
自身系统故障状态:表示本运行环境对应的监控案例执行不成功,关联运行环境对应的监控案例执行成功。
关联系统故障状态:表示本运行环境对应的监控案例执行不成功,关联运行环境对应的监控案例执行成功。
在本申请一种可行的实施方式中,在当前运行环境对应的第一监控案例执行成功时,确定当前运行环境的运行状态为可用状态;在当前运行环境对应的第一监控案例执行失败,且第一监控案例调用的第二监控案例执行成功时,确定当前运行环境的运行状态为自身系统故障状态;在当前运行环境对应的第一监控案例与所述第一监控案例调用的第二监控案例均执行失败时,确定当前运行环境的运行状态为关联系统故障状态。
示例性的,假设a、b、c、d为具有链路调用关系的四个运行环境A、B、C、D对应的监控案例,调用关系为a→b→c→d。参照表1,表1为a、b、c、d四个监控案例的执行结果与各个运行环境的运行状态之间的对照表。
表1:监控案例a、b、c、d的执行结果与各运行环境的运行状态对照表
Figure BDA0003101656620000101
本申请实施例中,由于各个运行环境之间的调用关系与各个运行环境对应的监控案例之间的调用关系一致,因此可以根据各个运行环境对应的监控案例的执行结果以及监控案例之间的调用关系,区分出存在故障的运行环境是自身系统故障,还是因其关联的运行环境存在故障而导致的关联系统故障,进而能够准确、快速的定位到存在故障的运行环境。
基于上述实施例中所描述的内容,参照图3,图3为本申请实施例中提供的一种业务功能运行环境的监控方法的流程示意图二,在一种可行的实施方式中,该方法包括:
S301、确定待监控的业务功能对应的各个运行环境以及各个运行环境之间的调用关系。
S302、为各个运行环境分别配置监控案例,并根据各个运行环境之间的调用关系,确定各个运行环境对应的监控案例之间的调用关系。
其中,各个运行环境之间的调用关系与各个运行环境对应的监控案例之间的调用关系相同。
S303、每隔预设时间间隔,执行各个运行环境对应的监控案例。
S304、并根据各个运行环境对应的监控案例的执行结果以及各个运行环境对应的监控案例之间的调用关系,确定各个运行环境的运行状态。
其中,所述步骤S301至步骤S304描述的内容与上述实施例中步骤S101至步骤S104描述的内容一致,具体可以参照上述实施例中的描述,在此不再赘述。
S305、根据各个运行环境的运行状态,以及各种运行状态与监控预警信号之间的对应关系,输出各个运行环境对应的监控预警信号。
本申请实施例中,可以预先建立各种运行状态与监控预警信号之间的对应关系,例如使用红色信号灯代表自身系统故障状态,黄色信号灯代表关联系统故障状态,绿色信号灯代表可用状态。
在确定各个运行环境的运行状态后,即可根据各个运行环境的运行状态,输出各个运行环境对应的监控预警信号。
示例性的,假设a、b、c、d为具有链路调用关系的四个运行环境A、B、C、D对应的监控案例,调用关系为a→b→c→d。参照表2,表2为A、B、C、D四个运行环境的运行状态与监控预警信号之间的对照表。
表2:A、B、C、D四个运行环境的运行状态与监控预警信号之间的对照表
环运行境 运行状态 监控预警信号
A 关联系统故障 黄灯
B 关联系统故障 黄灯
C 自身系统故障 红灯
D 可用 绿灯
本申请实施例中所提供的业务功能运行环境的监控方法,能够快速、准确到存在故障的运行环境,并以不同的监控预警信号反馈给相关人员进行处理,能够有效提升故障定位、故障修复的效率。
基于上述实施例中所描述的内容,在一种可行的实施方式中,在确定各个运行环境的运行状态之后,还包括:
分别计算并输出各个运行环境在预设时长内的可用率、各个运行环境在预设时长内的自身系统故障率,以及各个运行环境在预设时长内的关联系统故障率。
本申请实施例中,通过统计各个运行环境在预设时长内处于可用状态的次数、处于自身系统故障状态的次数、以及处于关联系统故障状态的次数,即可计算出各个运行环境在预设时长内的可用率、各个运行环境在预设时长内的自身系统故障率,以及各个运行环境在预设时长内的关联系统故障率。
示例性的,假设a、b、c、d为具有链路调用关系的四个运行环境A、B、C、D对应的监控案例,调用关系为a→b→c→d。在预设时长内的时间点1、2、3、4,分别执行各个运行环境对应的监控案例后,执行结果如表3所示:
表3为各个运行环境对应的监控案例在预设时长内的执行结果示意表
Figure BDA0003101656620000121
在一种可行的实施方式中,采用以下方式计算第i个运行环境在预设时长内的可用率Li
Li=sum1/sum
采用以下方式计算第i个运行环境在所述预设时长内的自身系统故障率Mi
Mi=sum2/sum
采用以下方式计算第i个运行环境在所述预设时长内的关联系统故障率Ni
Ni=sum3/sum
其中,sum=sum1+sum2+sum3,sum1表示第i个运行环境在预设时长内处于可用状态的次数,sum2表示第i个运行环境在预设时长内处于自身系统故障状态的次数,sum3表示第i个运行环境在预设时长内处于关联系统故障状态的次数。
本申请实施例提供的业务功能运行环境的监控方法,相较于现有技术至少具备以下优势:
1)可以针对同一个金融交易业务,从前台到中台再到后台建立调用关系与运行环境一致的多叉树监控体系,不仅能够对单个系统进行监控,还能够基于监控案例之间的调用关系,对整个环境体系进行整体监控。
2)通过将运行环境的状态定义为可用、关联系统故障、自身系统故障,根据各个运行环境对应的运行状态以及各个运行环境对应的监控案例之间的调用关系,可以准确度量整个系统环境的可用性。
3)可以准确区分出存在故障的运行环境是自身系统故障,还是因调用的运行环境存在故障而导致的关联系统故障,并采用不同的监控预警信号,直观、明确的展示各个运行环境的运行状态,可以大幅度减低环境故障的定位时间,提升效率。
4)通过计算各个运行环境在预设时长内的可用率、自身系统故障率,以及关联系统故障率,可以对整个系统环境的可靠性进行准确评价。
例如:假设有A、B、C、D四个运行环境:
传统的监控方式,通常由各个运行环境的维护人员分别根据自身运行环境监控的需要,配置相应功能的监控案例,自身运行环境对应的监控案例执行失败的时候,对应的开发人员从前往后分析具体哪个运行环境出现问题,需要各个运行环境的开发人员共同参与分析,问题定位时间长,且对运行环境的可用性计算仅能针对当前运行环境的监控结果进行统计计算,无法涉及关联运行环境的影响(非本运行环境自身问题造成的失败)。
在本申请实施提供的监控方法中,对4个运行环境同时配置监控案例,具体调用关系的业务监控建立绑定关系,进行全局性环境监控。当运行环境对应的监控案例执行失败时,体现出监控失败功能项各个运行环境的当前状态,例如:当运行环境A(关联系统故障)→运行环境B(关联系统故障)→运行环境C(自身系统故障)→运行环境D(可用)时,由此可以快速定位故障节点为运行环境C的某个具体功能,并将链路环境的可用性发送给各个运行环境的干系人(各个运行环境的红、黄、绿状态),从而有效提升了故障问题的定位效率(尤其是复杂系统环境下)。
另外,在计算各个运行环境的可用性的时候,考虑到了整个运行环境体系的执行情况,而不仅仅是单个运行环境的执行情况,可以更加客观、准确的评估链路长、复杂程度高的运行环境的可用性。
基于上述实施例中所描述的内容,本申请实施例中还提供一种业务功能运行环境的监控装置,参照图4,图4为本申请实施例中提供的一种业务功能运行环境的监控装置的程序模块示意图,该业务功能运行环境的监控装置包括:
确定模块401,用于确定待监控的业务功能对应的各个运行环境以及各个运行环境之间的调用关系。
配置模块402,用于为各个运行环境分别配置监控案例,并根据各个运行环境之间的调用关系,确定各个运行环境对应的监控案例之间的调用关系,其中,各个运行环境之间的调用关系与各个运行环境对应的监控案例之间的调用关系相同。
处理模块403,用于每隔预设时间间隔,执行各个运行环境对应的监控案例,并根据各个运行环境对应的监控案例的执行结果以及各个运行环境对应的监控案例之间的调用关系,确定各个运行环境的运行状态。
本申请实施例所提供的业务功能运行环境的监控装置,由于各个运行环境之间的调用关系与各个运行环境对应的监控案例之间的调用关系一致,因此可以根据各个运行环境对应的监控案例的执行结果以及监控案例之间的调用关系,区分出存在故障的运行环境是自身系统故障,还是因其关联的运行环境存在故障而导致的关联系统故障,进而能够准确、快速的定位到存在故障的运行环境。
在一种可行的实施方式中,处理模块403具体用于:
在当前运行环境对应的第一监控案例执行成功时,确定当前运行环境的运行状态为可用状态;在当前运行环境对应的第一监控案例执行失败,且第一监控案例调用的第二监控案例执行成功时,确定当前运行环境的运行状态为自身系统故障状态;在当前运行环境对应的第一监控案例与第一监控案例调用的第二监控案例均执行失败时,确定当前运行环境的运行状态为关联系统故障状态。
在一种可行的实施方式中,上述业务功能运行环境的监控装置还包括预警模块,用于:
在确定各个运行环境的运行状态之后,根据各个运行环境的运行状态,以及各种运行状态与监控预警信号之间的对应关系,输出各个运行环境对应的监控预警信号。
在一种可行的实施方式中,处理模块403还用于:
在确定所述各个运行环境的运行状态之后,分别计算并输出各个运行环境在预设时长内的可用率、各个运行环境在所述预设时长内的自身系统故障率,以及各个运行环境在所述预设时长内的关联系统故障率。
在一种可行的实施方式中,处理模块403具体用于:
采用以下方式计算第i个运行环境在预设时长内的可用率Li
Li=sum1/sum
采用以下方式计算第i个运行环境在预设时长内的自身系统故障率Mi
Mi=sum2/sum
采用以下方式计算第i个运行环境在预设时长内的关联系统故障率Ni
Ni=sum3/sum
其中,sum=sum1+sum2+sum3,sum1表示第i个运行环境在预设时长内处于可用状态的次数,sum2表示第i个运行环境在预设时长内处于自身系统故障状态的次数,sum3表示第i个运行环境在预设时长内处于关联系统故障状态的次数。
需要说明的是,本申请实施例中确定模块401、配置模块402、处理模块403具体执行的内容可以参阅图1或图3所示实施例中描述的业务功能运行环境的监控方法的各个步骤,具体可以参照上述实施例,此处不做赘述。
进一步的,基于上述实施例中所描述的内容,本申请实施例中还提供了一种电子设备,该电子设备包括至少一个处理器和存储器;其中,存储器存储计算机执行指令;上述至少一个处理器执行存储器存储的计算机执行指令,以实现如上述实施例中描述的业务功能运行环境的监控方法的各个步骤,具体可以参照上述实施例,此处不做赘述。
为了更好的理解本申请实施例,参照图5,图5为本申请实施例提供的一种电子设备的硬件结构示意图。
如图5所示,本实施例的电子设备50包括:处理器501以及存储器502;其中:
存储器502,用于存储计算机执行指令;
处理器501,用于执行存储器存储的计算机执行指令,以实现上述实施例中描述的业务功能运行环境的监控方法的各个步骤,具体可以参照上述实施例,此处不做赘述。
可选地,存储器502既可以是独立的,也可以跟处理器501集成在一起。
当存储器502独立设置时,该设备还包括总线503,用于连接所述存储器502和处理器501。
进一步的,基于上述实施例中所描述的内容,本申请实施例中还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,以实现上述实施例中描述的业务功能运行环境的监控方法的各个步骤,具体可以参照上述实施例,此处不做赘述。
进一步的,基于上述实施例中所描述的内容,本申请实施例中还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时,可以实现上述实施例中描述的业务功能运行环境的监控方法的各个步骤,具体可以参照上述实施例,此处不做赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本申请各个实施例所述方法的部分步骤。
应理解,上述处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合申请所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称:ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (13)

1.一种业务功能运行环境的监控方法,其特征在于,所述方法包括:
确定待监控的业务功能对应的各个运行环境以及所述各个运行环境之间的调用关系;
为所述各个运行环境分别配置监控案例,并根据所述各个运行环境之间的调用关系,确定所述各个运行环境对应的监控案例之间的调用关系,其中,所述各个运行环境之间的调用关系与所述各个运行环境对应的监控案例之间的调用关系相同;
每隔预设时间间隔,执行所述各个运行环境对应的监控案例,并根据所述各个运行环境对应的监控案例的执行结果以及所述各个运行环境对应的监控案例之间的调用关系,确定所述各个运行环境的运行状态。
2.根据权利要求1所述的方法,其特征在于,所述根据所述各个运行环境对应的监控案例的执行结果以及所述各个运行环境对应的监控案例之间的调用关系,确定所述各个运行环境的运行状态,包括:
在当前运行环境对应的第一监控案例执行成功时,确定所述当前运行环境的运行状态为可用状态;
在当前运行环境对应的第一监控案例执行失败,且所述第一监控案例调用的第二监控案例执行成功时,确定所述当前运行环境的运行状态为自身系统故障状态;
在当前运行环境对应的第一监控案例与所述第一监控案例调用的第二监控案例均执行失败时,确定所述当前运行环境的运行状态为关联系统故障状态。
3.根据权利要求2所述的方法,其特征在于,确定所述各个运行环境的运行状态之后,还包括:
根据所述各个运行环境的运行状态,以及各种运行状态与监控预警信号之间的对应关系,输出所述各个运行环境对应的监控预警信号。
4.根据权利要求2所述的方法,其特征在于,确定所述各个运行环境的运行状态之后,还包括:
分别计算并输出所述各个运行环境在预设时长内的可用率、所述各个运行环境在所述预设时长内的自身系统故障率,以及所述各个运行环境在所述预设时长内的关联系统故障率。
5.根据权利要求4所述的方法,其特征在于,采用以下方式计算第i个运行环境在预设时长内的可用率Li
Li=sum1/sum
采用以下方式计算第i个运行环境在所述预设时长内的自身系统故障率Mi
Mi=sum2/sum
采用以下方式计算第i个运行环境在所述预设时长内的关联系统故障率Ni
Ni=sum3/sum
其中,sum=sum1+sum2+sum3,sum1表示所述第i个运行环境在预设时长内处于可用状态的次数,sum2表示所述第i个运行环境在所述预设时长内处于自身系统故障状态的次数,sum3表示所述第i个运行环境在所述预设时长内处于关联系统故障状态的次数。
6.一种业务功能运行环境的监控装置,其特征在于,所述装置包括:
确定模块,用于确定待监控的业务功能对应的各个运行环境以及所述各个运行环境之间的调用关系;
配置模块,用于为所述各个运行环境分别配置监控案例,并根据所述各个运行环境之间的调用关系,确定所述各个运行环境对应的监控案例之间的调用关系,其中,所述各个运行环境之间的调用关系与所述各个运行环境对应的监控案例之间的调用关系相同;
处理模块,用于每隔预设时间间隔,执行所述各个运行环境对应的监控案例,并根据所述各个运行环境对应的监控案例的执行结果以及所述各个运行环境对应的监控案例之间的调用关系,确定所述各个运行环境的运行状态。
7.根据权利要求6所述的装置,其特征在于,所述处理模块具体用于:
在当前运行环境对应的第一监控案例执行成功时,确定所述当前运行环境的运行状态为可用状态;
在当前运行环境对应的第一监控案例执行失败,且所述第一监控案例调用的第二监控案例执行成功时,确定所述当前运行环境的运行状态为自身系统故障状态;
在当前运行环境对应的第一监控案例与所述第一监控案例调用的第二监控案例均执行失败时,确定所述当前运行环境的运行状态为关联系统故障状态。
8.根据权利要求7所述的装置,其特征在于,还包括预警模块,用于:
在确定所述各个运行环境的运行状态之后,根据所述各个运行环境的运行状态,以及各种运行状态与监控预警信号之间的对应关系,输出所述各个运行环境对应的监控预警信号。
9.根据权利要求7所述的装置,其特征在于,所述处理模块还用于:
在确定所述各个运行环境的运行状态之后,分别计算并输出所述各个运行环境在预设时长内的可用率、所述各个运行环境在所述预设时长内的自身系统故障率,以及所述各个运行环境在所述预设时长内的关联系统故障率。
10.根据权利要求9所述的装置,其特征在于,所述处理模块具体用于:
采用以下方式计算第i个运行环境在预设时长内的可用率Li
Li=sum1/sum
采用以下方式计算第i个运行环境在所述预设时长内的自身系统故障率Mi
Mi=sum2/sum
采用以下方式计算第i个运行环境在所述预设时长内的关联系统故障率Ni
Ni=sum3/sum
其中,sum=sum1+sum2+sum3,sum1表示所述第i个运行环境在预设时长内处于可用状态的次数,sum2表示所述第i个运行环境在所述预设时长内处于自身系统故障状态的次数,sum3表示所述第i个运行环境在所述预设时长内处于关联系统故障状态的次数。
11.一种电子设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至5任一项所述的业务功能运行环境的监控方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至5任一项所述的业务功能运行环境的监控方法。
13.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1至5任一项所述的业务功能运行环境的监控方法。
CN202110626849.XA 2021-06-04 2021-06-04 业务功能运行环境的监控方法及设备 Pending CN113360342A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110626849.XA CN113360342A (zh) 2021-06-04 2021-06-04 业务功能运行环境的监控方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110626849.XA CN113360342A (zh) 2021-06-04 2021-06-04 业务功能运行环境的监控方法及设备

Publications (1)

Publication Number Publication Date
CN113360342A true CN113360342A (zh) 2021-09-07

Family

ID=77532464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110626849.XA Pending CN113360342A (zh) 2021-06-04 2021-06-04 业务功能运行环境的监控方法及设备

Country Status (1)

Country Link
CN (1) CN113360342A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114422323A (zh) * 2021-12-28 2022-04-29 中国电信股份有限公司 一种针对物联网设备的联合监控方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103178974A (zh) * 2011-12-21 2013-06-26 中国银联股份有限公司 故障处理系统及方法
CN108833184A (zh) * 2018-06-29 2018-11-16 腾讯科技(深圳)有限公司 服务故障定位方法、装置、计算机设备及存储介质
WO2020147419A1 (zh) * 2019-01-18 2020-07-23 深圳壹账通智能科技有限公司 监控方法、装置、计算机设备及存储介质
CN112084055A (zh) * 2020-08-19 2020-12-15 广州小鹏汽车科技有限公司 应用系统的故障定位方法、装置、电子设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103178974A (zh) * 2011-12-21 2013-06-26 中国银联股份有限公司 故障处理系统及方法
CN108833184A (zh) * 2018-06-29 2018-11-16 腾讯科技(深圳)有限公司 服务故障定位方法、装置、计算机设备及存储介质
WO2020147419A1 (zh) * 2019-01-18 2020-07-23 深圳壹账通智能科技有限公司 监控方法、装置、计算机设备及存储介质
CN112084055A (zh) * 2020-08-19 2020-12-15 广州小鹏汽车科技有限公司 应用系统的故障定位方法、装置、电子设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114422323A (zh) * 2021-12-28 2022-04-29 中国电信股份有限公司 一种针对物联网设备的联合监控方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN111881014B (zh) 一种系统测试方法、装置、存储介质及电子设备
CN111475355B (zh) 高速链路信号完整性评估方法、系统、终端及存储介质
CN110557299A (zh) 一种网络传输功能批量测试方法、系统、终端及存储介质
CN114844768A (zh) 信息分析方法、装置及电子设备
CN114116496A (zh) 自动化测试方法、装置、设备及介质
CN113672456A (zh) 应用平台的模块化自监听方法、系统、终端及存储介质
CN113590454A (zh) 测试方法、装置、计算机设备和存储介质
CN113360342A (zh) 业务功能运行环境的监控方法及设备
CN107679423A (zh) 分区完整性检查方法及装置
CN113609011A (zh) 一种保险产品工厂的测试方法、装置、介质和设备
CN116194894A (zh) 原生云应用程序的故障定位
CN111639022A (zh) 交易测试方法及装置、存储介质、电子装置
CN111381995A (zh) 用于还原用户操作的方法及装置、计算机
CN115587041A (zh) 移动应用交付任务处理方法和装置、电子设备和存储介质
CN109902001A (zh) 对未初始化变量的检测方法及终端设备
CN115757169A (zh) 基于接口自动化测试的判断方法、装置以及存储介质
CN112291302B (zh) 物联网设备行为数据分析方法与处理系统
CN114385498A (zh) 性能测试方法、系统、计算机设备及可读存储介质
CN114037539A (zh) 一种保险出单链路异常检测方法及装置
CN112463486A (zh) 一种磁盘质检方法、系统、终端及存储介质
CN113282506A (zh) 测试数据获取方法、装置、设备及计算机可读存储介质
CN113254332A (zh) 一种存储系统多场景测试方法、系统、终端及存储介质
CN111797406A (zh) 一种医疗基金数据分析处理方法、装置及可读存储介质
CN110457188A (zh) 可保持事务类型比例的tpc-e测试方法及测试系统
CN111984512B (zh) 存储系统资源竞态模拟测试方法、系统、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination