CN114500343B - 业务链条运行监控方法及其装置、设备、介质、产品 - Google Patents

业务链条运行监控方法及其装置、设备、介质、产品 Download PDF

Info

Publication number
CN114500343B
CN114500343B CN202210350323.8A CN202210350323A CN114500343B CN 114500343 B CN114500343 B CN 114500343B CN 202210350323 A CN202210350323 A CN 202210350323A CN 114500343 B CN114500343 B CN 114500343B
Authority
CN
China
Prior art keywords
monitoring
service chain
service
server
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210350323.8A
Other languages
English (en)
Other versions
CN114500343A (zh
Inventor
钱宇航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huaduo Network Technology Co Ltd
Original Assignee
Guangzhou Huaduo Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huaduo Network Technology Co Ltd filed Critical Guangzhou Huaduo Network Technology Co Ltd
Priority to CN202210350323.8A priority Critical patent/CN114500343B/zh
Publication of CN114500343A publication Critical patent/CN114500343A/zh
Application granted granted Critical
Publication of CN114500343B publication Critical patent/CN114500343B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/12Network monitoring probes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • H04L43/106Active monitoring, e.g. heartbeat, ping or trace-route using time related information in packets, e.g. by adding timestamps

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开一种业务链条运行监控方法及其装置、设备、介质、产品,所述方法包括:获取监控配置信息,其包括业务链条执行时调用的源数据所在的第一服务器提供的第一访问接口、所述业务链条调用源数据后获得的结果数据所在的第二服务器的第二访问接口,以及指示对所述业务链条的执行实施监控的间隔的探测周期;根据探测周期定期调用第一访问接口发送监控指令以驱动执行所述业务链条,所述监控指令携带监控时间戳;监听通过第二访问接口返回的报告信息;根据所述报告信息中的存储时间戳及所述监控时间戳确定所述业务链条的连通性及传输时延。本申请能够实现对电商平台的业务链条的运行状况进行标准化的故障诊断分析。

Description

业务链条运行监控方法及其装置、设备、介质、产品
技术领域
本申请涉及电商系统安全技术领域,尤其涉及一种业务链条运行监控方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。
背景技术
电商平台中,针对各家线上店铺,常会衍生出大量的服务,一种典型的服务是为线上店铺提供从其上线的海量的商品对象中确定出一个商品推荐列表的搜索推荐服务,不同的线上店铺调用一种搜索推荐服务,后台便通过一条对应的业务链条的执行来实施,以该线上店铺的商品数据库为原始数据,经该业务链条的各个业务执行环节执行后,获得最终的结果数据,即完成商品推荐列表的构造。通常,根据不同的搜索推荐算法或业务逻辑,电商平台中会存在大量的此类搜索推荐服务,均可被线上店铺调用。
后台对应提供的搜索推荐服务,在电商平台的服务集群中,其业务链条所经过的各个业务执行环节相对应的服务器节点、服务中间件等,通常是基于微服务架构进行分布式部署的,对于大量的业务链条来说,各种服务器节点和服务中间件在总体上呈现出错综复杂的分布,一旦某个服务中间件或服务器节点故障,对于电商平台的故障排查来说,是非常困难的。
业务链条所涉的各个中间服务器节点,一般不开放给线上店铺的终端用户直接使用,其主要负责维护源数据即所述商品数据一侧到结果数据一侧之间的业务逻辑,因此也可被为离线同步系统,对于这种系统而言,由于不开放给终端用户直接使用,因而,其维护完全依靠后台技术,如何在不影响各个业务链条的稳健运行的情况下实现对离线同步系统的运行的监控,是电商平台可以不断优化的问题。
发明内容
本申请的首要目的在于解决上述问题至少之一而提供一种业务链条运行监控方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品。
为满足本申请的各个目的,本申请采用如下技术方案:
适应本申请的目的之一而提供的一种业务链条运行监控方法,包括如下步骤:
获取为业务链条预设的监控配置信息,所述监控配置信息包括该业务链条执行时调用的源数据所在的第一服务器提供的第一访问接口、所述业务链条调用所述源数据执行对应业务后获得的结果数据所在的第二服务器提供的第二访问接口,以及指示对所述业务链条的执行实施监控的间隔的探测周期;
根据该业务链条的监控配置信息中的探测周期定期调用所述第一访问接口向第一服务器发送监控指令以驱动执行所述业务链条,所述监控指令携带当前时刻相对应的监控时间戳,以使所述监控时间戳沿所述的业务链条传递;
监听第二服务器通过第二访问接口返回的与该监控指令相对应的报告信息,该报告信息包含由该业务链条产生的结果数据的存储时间戳及经该业务链条送达的所述监控时间戳;
根据所述报告信息中的存储时间戳及所述监控时间戳确定所述业务链条的连通性及传输时延,获得第一校验结果。
扩展的实施例中,获得第一校验结果的步骤之后,包括如下步骤:
响应于所述报告信息相对应的送达事件,调用所述监控配置信息所预配置的校验规则,经所述第二访问接口读取该报告信息相对应的结果数据,根据该校验规则对所述结果数据实施校验,获得第二校验结果。
较佳的实施例中,所述业务链条包含多个业务执行环节,经该业务链条产生的结果数据中包含其中至少部分业务执行环节相对应的标识及表示该业务执行环节成功或失败的状态信息,所述第二校验结果包含所述业务执行环节相对应的标识及其状态信息。
进一步的实施例中,获得第二校验结果的步骤之后,包括如下步骤:
将所述第一校验结果及第二校验结果构造为告警信息,调用预设的告警接口提交该告警信息。
进一步的实施例中,将所述第一校验结果及第二校验结果构造为告警信息,调用预设的告警接口提交该告警信息的步骤之后,包括如下步骤:
响应告警信息查看指令,推送监控报告页面,在该监控报告页面中可视化显示根据所述告警信息生成的相应的业务链条的各个业务环节的标识及其状态信息,以及所述的传输时延的可读信息。
较佳的实施例中,所述业务链条所执行的业务为电商平台中对商品对象进行搜索排序相对应的业务,其中,所述第一服务器用于存储商品对象的商品信息,所述第二服务器用于存储完成所述业务链条之后生成的商品推荐列表。
适应本申请的目的之一而提供的一种业务链条运行监控装置,包括:配置获取模块、探测触发模块、报告接收模块,以及诊断分析模块,其中,所述配置获取模块,用于获取为业务链条预设的监控配置信息,所述监控配置信息包括该业务链条执行时调用的源数据所在的第一服务器提供的第一访问接口、所述业务链条调用所述源数据执行对应业务后获得的结果数据所在的第二服务器提供的第二访问接口,以及指示对所述业务链条的执行实施监控的间隔的探测周期;所述探测触发模块,用于根据该业务链条的监控配置信息中的探测周期定期调用所述第一访问接口向第一服务器发送监控指令以驱动执行所述业务链条,所述监控指令携带当前时刻相对应的监控时间戳,以使所述监控时间戳沿所述的业务链条传递;所述报告接收模块,用于监听第二服务器通过第二访问接口返回的与该监控指令相对应的报告信息,该报告信息包含由该业务链条产生的结果数据的存储时间戳及经该业务链条送达的所述监控时间戳;所述诊断分析模块,用于根据所述报告信息中的存储时间戳及所述监控时间戳确定所述业务链条的连通性及传输时延,获得第一校验结果。
扩展的实施例中,本申请的业务链条运行监控装置还包括:深度诊断模块,用于响应于所述报告信息相对应的送达事件,调用所述监控配置信息所预配置的校验规则,经所述第二访问接口读取该报告信息相对应的结果数据,根据该校验规则对所述结果数据实施校验,获得第二校验结果。
较佳的实施例中,所述业务链条包含多个业务执行环节,经该业务链条产生的结果数据中包含其中至少部分业务执行环节相对应的标识及表示该业务执行环节成功或失败的状态信息,所述第二校验结果包含所述业务执行环节相对应的标识及其状态信息。
进一步的实施例中,本申请的业务链条运行监控装置还包括:告警提交模块,用于将所述第一校验结果及第二校验结果构造为告警信息,调用预设的告警接口提交该告警信息。
进一步的实施例中,本申请的业务链条运行监控装置还包括:告警查看模块,用于响应告警信息查看指令,推送监控报告页面,在该监控报告页面中可视化显示根据所述告警信息生成的相应的业务链条的各个业务环节的标识及其状态信息,以及所述的传输时延的可读信息。
较佳的实施例中,所述业务链条所执行的业务为电商平台中对商品对象进行搜索排序相对应的业务,其中,所述第一服务器用于存储商品对象的商品信息,所述第二服务器用于存储完成所述业务链条之后生成的商品推荐列表。
适应本申请的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本申请所述的业务链条运行监控方法的步骤。
适应本申请的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的业务链条运行监控方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
适应本申请的另一目的而提供的一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本申请任意一种实施例中所述方法的步骤。
相对于现有技术,本申请的优势如下:本申请独立于业务链条的运行而对其运行实施监控,根据对业务链条预配置的监控配置信息中的探测周期,周期性触发向业务链条的源头即第一服务器发送监控指令,并随同该监控指令提供监控时间戳,使该监控时间戳随业务链条的各个业务执行环节的运行而流转,与此同时,对于业务链条的末端,即存储该业务链条所生成的结果数据的第二服务器,监听对应的报告信息,该报告信息包含第二服务器接收该监控指令驱动业务链条运行后相对应产生的结果数据的存储时间戳及随业务链条送达的所述监控时间戳,据此,可以对业务链条的连通性和传输时延进行诊断,实现对电商平台的离线同步系统中错综复杂的业务链条的运行稳定性的标准化的故障诊断分析,且不干扰离线同步系统的既有业务逻辑。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请的业务链条运行监控方法的典型实施例的流程示意图;
图2为本申请的业务链条运行监控方法所实施的网络环境的示意图;
图3为本申请的业务链条运行监控装置的原理框图;
图4为本申请所采用的一种计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global PositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本申请所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
需要指出的是,本申请所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本申请的网络部署方式的实施方式。
本申请的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来实施访问。
本申请中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
本申请所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本申请的技术方案所调用即可。
本领域技术人员对此应当知晓:本申请的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本申请所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
本申请即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本申请的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
本申请的一种业务链条运行监控方法,可被编程为计算机程序产品,部署于服务器中运行而实现,藉此可以通过访问该计算机程序产品运行后开放的接口,通过图形用户界面与该计算机程序产品的进程进行人机交互而执行该方法。
请参阅图1,本申请的业务链条运行监控方法在其典型实施例中,包括如下步骤:
步骤S1100、获取为业务链条预设的监控配置信息,所述监控配置信息包括该业务链条执行时调用的源数据所在的第一服务器提供的第一访问接口、所述业务链条调用所述源数据执行对应业务后获得的结果数据所在的第二服务器提供的第二访问接口,以及指示对所述业务链条的执行实施监控的间隔的探测周期:
请参阅图2,图2示例出本申请的业务链条运行监控方法的部署环境,其中示出第一服务器、中间服务集群、第二服务器,以及用于部署依据本申请的业务链条运行监控方法所实现的计算机服务的监控服务器。其中,第一服务器与第二服务器均可以是服务集群。而所述的中间服务集群,可以包含实现业务链条执行所需的多个服务器。
以电商平台为例,所述第一服务器用于部署一个或多个数据库引擎,为电商平台提供数据库服务,用于存储电商平台各线上店铺所上线的商品对象的商品信息,以作为所述业务链条的始发节点,为业务链条的运行提供源数据。
所述中间服务集群用于支持电商平台中的业务链条的中间业务执行环节的运行,每个业务执行环节可以通过一个或多个服务中间件的协作而实现,在业务链条的一个或多个业务执行环节的配合下,首先从所述的第一服务器获取源数据,依据业务链条所实现的业务逻辑对源数据进行相应的处理,最终获得结果数据,再输出至第二服务器。可见,中间服务集群实际上是一个离线同步系统,该离线同步系统用于支持电商平台中的多个业务链条的运行。
所述第二服务器用于部署一个或多个数据库引擎,同理为电商平台提供数据库服务,用于存储各个所述的业务链条完成运行后所产生的结果数据,例如由提供搜索推荐服务的业务链条根据第一服务器的数据库中的商品对象进行搜索和排序后对应产生的商品推荐列表。
据此可见,所述的业务链条,以第一服务器的源数据为输入,根据业务链条所对应的业务逻辑,通过串接的不同业务执行环节对源数据进行处理,最终获得相应的结果数据,并将结果数据存储至第二服务器。离线同步系统中允许存在大量的业务链条,为了便于识别,每个业务链条可对应设置一个标识,在本方法的各个需要作用于业务链条的技术特征中,可以根据标识识别对应的业务链条。
为了实现对海量的业务链条的监控,如图2所示,接入本申请的监控服务器,该监控服务器可以通过第一服务器提供的第一访问接口与第一服务器进行交互,同时也可以通过第二服务器提供的第二访问接口与第二服务器进行交互,但与所述离线同步系统的服务集群之间无需进行直接的接口访问。所述的第一访问接口和第二访问接口既可以是统一接口,也可以是对应每条业务链条独立设备相应的接口,具体可在编程时灵活实施。
如前所述,监控服务器运行依据本申请的业务链条运行监控方法所实现的计算机服务,故而构造出一个离线监控系统,该离线监控系统可以开放给负责业务链条维护的管理用户访问,从而允许管理用户通过访问该离线监控系统提供的维护页面编辑配置各个业务链条相对应的监控配置信息,用于指示离线监控系统对相应的业务链条实施相应的监控。
所述的监控配置信息,一个实施例中,主要包括对所述第一访问接口、第二访问接口的指定,同时还要求管理用户设置一个探测周期,用于指示监控服务器触发对业务链条的监控的时间间隔。必要时,还可以要求该监控配置信息中指明需要实施监控的业务链条的标识,以便监控服务器在与以统一接口方式实现的所述的第一访问接口和第二访问接口交互时,通过该标识对应具体的业务链条。
对于监控配置信息而言,其中所指定的第一访问接口,是指该标识相对应的业务链条获取源数据所在的第一服务器能够获取所述探测周期的接口;其中所指定的第二访问接口,是指该标识相对应的业务链条存储其结果数据的第二服务器所提供的接口,通过该接口可以获取业务链条运行后生成的报告信息;其中的探测周期,是用于指示监控服务器定期触发针对该标识所指定的业务链条的监控指令的循环时隙。据此,一条监控配置信息可以用于表示针对一个业务链条,以所述探测周期所指定的循环时隙,定期地向第一访问接口发送监控指令,并且可从第二访问接口接收该业务链条运行后提交的报告信息。
所述监控配置信息由管理用户预先配置并存储至本申请的监控服务器中,监控服务器可以自动或被手动地开始启动对业务链条的监控,因而调用获取相应的业务链条的监控配置信息,以便开始对该业务链条实施监控。
步骤S1200、根据该业务链条的监控配置信息中的探测周期定期调用所述第一访问接口向第一服务器发送监控指令以驱动执行所述业务链条,所述监控指令携带当前时刻相对应的监控时间戳,以使所述监控时间戳沿所述的业务链条传递:
当监控服务器开始实施监控时,其根据所述的监控配置信息,获取其中的探测周期,以该探测周期为循环时隙,持续定期触发与该监控配置信息相对应的业务链条的监控指令。为了便于后续的校验,在触发所述监控指令时,以触发监控指令相对应的当前时刻生成该监控指令相对应的监控时间戳,交由该监控指令携带。必要时,该监控指令还携带所述业务链条的标识以便识别。然后,监控服务器调用第一服务器的第一访问接口,将该监控指令传递给第一服务器,以便驱动第一服务器启动相应的业务链条的运行,而向该业务链条提供源数据。
所述第一服务器接收所述监控指令后,响应于该监控指令,开始驱动执行该监控指令相对应的业务链条。所述业务链条根据其预设的业务逻辑,先从第一服务器中调用相应的源数据,例如所述的商品对象的商品信息,然后,在所述离线同步系统的支持下,由其多个业务执行环节对所述源数据先后进行预设规则的处理,最终生成相应的结果数据,例如所述的商品推荐列表。其中,为了方便后续的校验,所述监控指令所携带的监控时间戳,在整个业务链条的各个不同业务执行环节中均被传递,因此,各个业务执行环节可以将其自身标识及自身是否成功执行相对应的状态信息,以及包括自身执行时长之类的运行信息等,一并包含于结果数据中逐级向下传递。
不难理解,如果一条业务链条中的某个业务执行环节无法触及,便导致断路,由此,所述的监控时间戳未必能顺利传递,这一现象可被监控服务器通过判断经过预设监听时长后是否能成功收到包含该监控时间戳的报告信息来识别,当经过所述监听时长仍未能接收到某一监控时间戳相对应的报告信息时,监控服务器即可判断接收该监控时间戳的业务链条存在断路现象。
所述的探测周期,可由本领域技术人员根据经验数据或实验数据进行灵活设置,所述监听时长则一般可设置为略大于所述的探测周期,两者相配合可界定业务链条执行所需的一个合理的延迟范围,使得离线监控系统的监控过程更具鲁棒性。
步骤S1300、监听第二服务器通过第二访问接口返回的与该监控指令相对应的报告信息,该报告信息包含由该业务链条产生的结果数据的存储时间戳及经该业务链条送达的所述监控时间戳:
在通过所述的监控指令驱动业务链条运行之后,本申请的离线监控服务器可通过第二服务器提供的第二访问接口对该业务链条运行后生成的报告信息进行监听。
所述报告信息,由作为所述业务链条的末端节点的第二服务器,在其接收该业务链条所生成的结果数据并完成存储后,便可对应生成。所述报告信息的构造可由本领域技术人员灵活设置,作为要件,其需包含所述结果数据的存储时间戳,以供与所述的监控时间戳进行比较。改进的实施例中,由于获得业务链条的结果数据意味着该业务链条不存在断路故障,因此业务链条赖以启动执行的监控指令所携带的监控时间戳也会顺利到达第二服务器,据此,将该监控时间戳与所述存储时间戳一并封装于所述的报告信息中,可方便监控服务器直接根据其中的监控时间戳和存储时间戳确定整个业务链条的传输时延。当然,理想的不存在断路故障的情况下,如果第二服务器未在报告信息中包含该监控时间戳,监控服务器理论上也可通过监控指令的顺序触发来确定每条报告信息的对应关系。
所述的报告信息,进一步还可以包含相应的业务链条所产生的结果数据,甚至包含该业务链条的各个业务执行环节对应产生的各种标识和状态信息等。
监控服务器在对第二服务器的第二访问接口实施监听时,可以设置所述的监听时长,该监听时长以监控指令所携带的监控时间戳为起计时刻,在经过该监听时长后,如果仍未收到该监控指令相对应的报告信息,则可判定相应的业务链条存在断路故障。
监控服务器在所述的监听时长范围内接收到其已发送的监控指令相对应的报告信息后,可以对其进行解析以获得其中所封装的各种信息,例如所述的存储时间戳和监控时间戳。
步骤S1400、根据所述报告信息中的存储时间戳及所述监控时间戳确定所述业务链条的连通性及传输时延,获得第一校验结果:
为了实现对被执行的业务链路的诊断分析,监控服务器在获得所述的报告信息后,一个实施例中,将所述报告信息中的存储时间戳与所述监控时间戳的差值作为所述业务链路的传输时延,并且根据其成功接收到该报告信息而确定该业务链条处于连通状态,将传输时延和该连通状态封装为是次诊断分析相对应的第一校验结果。
反之,如果经过所述监听时长未能接收到监控指令相对应的报告信息,则可判定相应的业务链条无法连通,其对应的传输时延无限大,从而也可封装出所述的第一校验结果。
不难理解,由于针对一条业务链条的监控探测时根据探测周期持续触发的,因此,监控服务器可以源源不断地获得所述的第一校验结果,这些在不同时序产生的数据,可以被用于进行更为深入的诊断分析。
通过以上本申请的典型实施例的揭示可以看出,本申请独立于业务链条的运行而对其运行实施监控,根据对业务链条预配置的监控配置信息中的探测周期,周期性触发向业务链条的源头即第一服务器发送监控指令,并随同该监控指令提供监控时间戳,使该监控时间戳随业务链条的各个业务执行环节的运行而流转,与此同时,对于业务链条的末端,即存储该业务链条所生成的结果数据的第二服务器,监听对应的报告信息,该报告信息包含第二服务器接收该监控指令驱动业务链条运行后相对应产生的结果数据的存储时间戳及随业务链条送达的所述监控时间戳,据此,可以对业务链条的连通性和传输时延进行诊断,实现对电商平台的离线同步系统中错综复杂的业务链条的运行稳定性的标准化的故障诊断分析,且不干扰离线同步系统的既有业务逻辑。
扩展的实施例中,所述步骤S1400中,获得第一校验结果的步骤之后,包括如下步骤:
步骤S1500、响应于所述报告信息相对应的送达事件,调用所述监控配置信息所预配置的校验规则,经所述第二访问接口读取该报告信息相对应的结果数据,根据该校验规则对所述结果数据实施校验,获得第二校验结果:
监控服务器可以根据监控配置信息是否关联预配置的校验规则,在存在所述的校验规则时,根据该检验规则进一步获取第二校验结果。具体而言,监控服务器响应于所述报告信息相对应的送达事件,检测所述监控配置信息是否预配置了所述的校验规则,所述校验规则可预先实现对报告信息进行校验的校验逻辑,当存在所述的校验规则时,直接通过所述第二访问接口读取第二服务器所存储的与该报告信息相对应的结果数据,然后根据该校验规则对所述的结果数据进行数据层面校验,最终获得相应的第二校验结果。
示例而言,所述的校验规则可以用于校验所述的结果数据是否符合预期,为此而设置与预期相匹配的相关判断规则,例如,如果预期产生大于100条搜索结果,则在所述的校验规则中可预配置规则“>100”,后续由监控服务器解析该规则进行校验即可。
较佳的实施例中,所述业务链条包含多个业务执行环节,经该业务链条产生的结果数据中包含其中至少部分业务执行环节相对应的标识及表示该业务执行环节成功或失败的状态信息,所述第二校验结果包含所述业务执行环节相对应的标识及其状态信息。由此,方便通过各个业务执行环节相对应的标识及其状态信息,对业务链条的运行过程实施精细化的诊断分析。
本实施例开放校验规则的自定义功能,使得管理用户可以通过所述的监控服务器自行配置相关校验规则,实现对业务链条所产生的结果数据的深度监测,丰富了本申请的离线监控系统的功能,实现对业务链条的深度诊断分析。
进一步的实施例中,所述步骤S1500中,获得第二校验结果的步骤之后,包括如下步骤:
步骤S1600、将所述第一校验结果及第二校验结果构造为告警信息,调用预设的告警接口提交该告警信息:
为了实现对离线监控系统所获得的校验结果的深度诊断,可将前述各实施例中的第一校验结果和第二校验结果进行统一格式的数据封装,将其封装为可供标准化解析的告警信息,然后调用预设的告警接口,提交该告警信息。所述的告警信息可以存储于数据库中,例如可以通过调用所述第一访问接口或第二访问接口而相应存储至第一服务器或第二服务器开放的数据库中,后续可在其中相应调用,以节省本申请的监控服务器自身的系统存储资源的开销。
本实施例可实现将第一校验结果和第二校验结果标准化而获得告警信息,使得后续据此实现的深度诊断分析更为高效。
进一步的实施例中,所述步骤S1600、将所述第一校验结果及第二校验结果构造为告警信息,调用预设的告警接口提交该告警信息的步骤之后,包括如下步骤:
步骤S1700、响应告警信息查看指令,推送监控报告页面,在该监控报告页面中可视化显示根据所述告警信息生成的相应的业务链条的各个业务环节的标识及其状态信息,以及所述的传输时延的可读信息:
本申请的离线监控系统可以对其相应的管理用户所触发的告警信息查看指令做出响应,而为其生成并推送监控报告页面,该监控报告页面用于显示对一条或多条所述的业务链条的告警信息进行可视化解析所获得的结果。
例如,响应于该查看指令,该查看指令指定一个业务链条相对应的标识,据此,离线监控系统从数据库中调用该标识相对应的业务链条的告警信息对其进行相应的解析,将其中所述业务链条的各个业务执行环节相对应的标识及其状态信息分门别类封装于所述报告页面的一个显示区域,以其中涉及整个业务链条相对应的持续产生的多个第一校验结果相对应的传输时延进行线性拟合并生成相对应的趋势图表封装于所述报告页面的另一显示区域,完成该报告页面的排版代码的配置之后,便可将该监控报告页面推送至相应的管理用户的终端设备的浏览器进行解析显示。当浏览器解析显示之后,管理用户便可从页面中获得相应的可读信息,以此使管理用户更快速高效地了解业务链条的诊断分析结果。
较佳的实施例中,所述业务链条所执行的业务为电商平台中对商品对象进行搜索排序相对应的业务,其中,所述第一服务器用于存储商品对象的商品信息,所述第二服务器用于存储完成所述业务链条之后生成的商品推荐列表。据此,电商平台的维护人员可以快速地了解各个业务链条的健康状态,而无需进行任何人工的单点测试。
本实施例通过将告警信息进行可视化展现,使告警信息更可读,更便于管理用户对业务链条的运行状况进行深入的分析,对于业务链条繁多且具有错综复杂分布特点的电商平台的后台维护工作而言,可以大大提升业务链条的维护效率,从而节省后台维护成本。
请参阅图3,适应本申请的目的之一而提供的一种业务链条运行监控装置,是对本申请的业务链条运行监控方法的功能化体现,该装置包括:配置获取模块1100、探测触发模块1200、报告接收模块1300,以及诊断分析模块1400,其中,所述配置获取模块1100,用于获取为业务链条预设的监控配置信息,所述监控配置信息包括该业务链条执行时调用的源数据所在的第一服务器提供的第一访问接口、所述业务链条调用所述源数据执行对应业务后获得的结果数据所在的第二服务器提供的第二访问接口,以及指示对所述业务链条的执行实施监控的间隔的探测周期;所述探测触发模块1200,用于根据该业务链条的监控配置信息中的探测周期定期调用所述第一访问接口向第一服务器发送监控指令以驱动执行所述业务链条,所述监控指令携带当前时刻相对应的监控时间戳,以使所述监控时间戳沿所述的业务链条传递;所述报告接收模块1300,用于监听第二服务器通过第二访问接口返回的与该监控指令相对应的报告信息,该报告信息包含由该业务链条产生的结果数据的存储时间戳及经该业务链条送达的所述监控时间戳;所述诊断分析模块1400,用于根据所述报告信息中的存储时间戳及所述监控时间戳确定所述业务链条的连通性及传输时延,获得第一校验结果。
扩展的实施例中,本申请的业务链条运行监控装置还包括:深度诊断模块,用于响应于所述报告信息相对应的送达事件,调用所述监控配置信息所预配置的校验规则,经所述第二访问接口读取该报告信息相对应的结果数据,根据该校验规则对所述结果数据实施校验,获得第二校验结果。
较佳的实施例中,所述业务链条包含多个业务执行环节,经该业务链条产生的结果数据中包含其中至少部分业务执行环节相对应的标识及表示该业务执行环节成功或失败的状态信息,所述第二校验结果包含所述业务执行环节相对应的标识及其状态信息。
进一步的实施例中,本申请的业务链条运行监控装置还包括:告警提交模块,用于将所述第一校验结果及第二校验结果构造为告警信息,调用预设的告警接口提交该告警信息。
进一步的实施例中,本申请的业务链条运行监控装置还包括:告警查看模块,用于响应告警信息查看指令,推送监控报告页面,在该监控报告页面中可视化显示根据所述告警信息生成的相应的业务链条的各个业务环节的标识及其状态信息,以及所述的传输时延的可读信息。
较佳的实施例中,所述业务链条所执行的业务为电商平台中对商品对象进行搜索排序相对应的业务,其中,所述第一服务器用于存储商品对象的商品信息,所述第二服务器用于存储完成所述业务链条之后生成的商品推荐列表。
为解决上述技术问题,本申请实施例还提供计算机设备。如图4所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中,该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种业务链条运行监控方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行本申请的业务链条运行监控方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图3中的各个模块及其子模块的具体功能,存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本申请的业务链条运行监控装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本申请还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本申请任一实施例的业务链条运行监控方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被一个或多个处理器执行时实现本申请任一实施例所述方法的步骤。
本领域普通技术人员可以理解实现本申请上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等计算机可读存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
综上所述,本申请能够实现对电商平台的离线同步系统中业务链条的运行状况进行标准化的故障诊断分析,实现系统运行状态的安全监测,通过实现基于业务链条的故障诊断逻辑,使故障分析更为具体可靠;通过独立于离线同步系统进行诊断分析,确保离线同步系统不受干扰地运行。
本技术领域技术人员可以理解,本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (9)

1.一种业务链条运行监控方法,其特征在于,包括如下步骤:
获取为业务链条预设的监控配置信息,所述监控配置信息包括该业务链条执行时调用的源数据所在的第一服务器提供的第一访问接口、所述业务链条调用所述源数据执行对应业务后获得的结果数据所在的第二服务器提供的第二访问接口,以及指示对所述业务链条的执行实施监控的间隔的探测周期;
根据该业务链条的监控配置信息中的探测周期定期调用所述第一访问接口向第一服务器发送监控指令以驱动执行所述业务链条,所述监控指令携带当前时刻相对应的监控时间戳,以使所述监控时间戳沿所述的业务链条传递;
监听第二服务器通过第二访问接口返回的与该监控指令相对应的报告信息,该报告信息包含由该业务链条产生的结果数据的存储时间戳及经该业务链条送达的所述监控时间戳;
根据所述报告信息中的存储时间戳及所述监控时间戳确定所述业务链条的连通性及传输时延,获得第一校验结果。
2.根据权利要求1所述的业务链条运行监控方法,其特征在于,获得第一校验结果的步骤之后,包括如下步骤:
响应于所述报告信息相对应的送达事件,调用所述监控配置信息所预配置的校验规则,经所述第二访问接口读取该报告信息相对应的结果数据,根据该校验规则对所述结果数据实施校验,获得第二校验结果。
3.根据权利要求2所述的业务链条运行监控方法,其特征在于,所述业务链条包含多个业务执行环节,经该业务链条产生的结果数据中包含其中至少部分业务执行环节相对应的标识及表示该业务执行环节成功或失败的状态信息,所述第二校验结果包含所述业务执行环节相对应的标识及其状态信息。
4.根据权利要求3所述的业务链条运行监控方法,其特征在于,获得第二校验结果的步骤之后,包括如下步骤:
将所述第一校验结果及第二校验结果构造为告警信息,调用预设的告警接口提交该告警信息。
5.根据权利要求4所述的业务链条运行监控方法,其特征在于,将所述第一校验结果及第二校验结果构造为告警信息,调用预设的告警接口提交该告警信息的步骤之后,包括如下步骤:
响应告警信息查看指令,推送监控报告页面,在该监控报告页面中可视化显示根据所述告警信息生成的相应的业务链条的各个业务环节的标识及其状态信息,以及所述的传输时延的可读信息。
6.根据权利要求1至5中任意一项所述的业务链条运行监控方法,其特征在于,所述业务链条所执行的业务为电商平台中对商品对象进行搜索排序相对应的业务,其中,所述第一服务器用于存储商品对象的商品信息,所述第二服务器用于存储完成所述业务链条之后生成的商品推荐列表。
7.一种业务链条运行监控装置,其特征在于,包括:
配置获取模块,用于获取为业务链条预设的监控配置信息,所述监控配置信息包括该业务链条执行时调用的源数据所在的第一服务器提供的第一访问接口、所述业务链条调用所述源数据执行对应业务后获得的结果数据所在的第二服务器提供的第二访问接口,以及指示对所述业务链条的执行实施监控的间隔的探测周期;
探测触发模块,用于根据该业务链条的监控配置信息中的探测周期定期调用所述第一访问接口向第一服务器发送监控指令以驱动执行所述业务链条,所述监控指令携带当前时刻相对应的监控时间戳,以使所述监控时间戳沿所述的业务链条传递;
报告接收模块,用于监听第二服务器通过第二访问接口返回的与该监控指令相对应的报告信息,该报告信息包含由该业务链条产生的结果数据的存储时间戳及经该业务链条送达的所述监控时间戳;
诊断分析模块,用于根据所述报告信息中的存储时间戳及所述监控时间戳确定所述业务链条的连通性及传输时延,获得第一校验结果。
8.一种计算机设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至6中任意一项所述的方法的步骤。
9.一种计算机可读存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至6中任意一项所述的方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行相应的方法所包括的步骤。
CN202210350323.8A 2022-04-02 2022-04-02 业务链条运行监控方法及其装置、设备、介质、产品 Active CN114500343B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210350323.8A CN114500343B (zh) 2022-04-02 2022-04-02 业务链条运行监控方法及其装置、设备、介质、产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210350323.8A CN114500343B (zh) 2022-04-02 2022-04-02 业务链条运行监控方法及其装置、设备、介质、产品

Publications (2)

Publication Number Publication Date
CN114500343A CN114500343A (zh) 2022-05-13
CN114500343B true CN114500343B (zh) 2023-04-18

Family

ID=81488049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210350323.8A Active CN114500343B (zh) 2022-04-02 2022-04-02 业务链条运行监控方法及其装置、设备、介质、产品

Country Status (1)

Country Link
CN (1) CN114500343B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115037653B (zh) * 2022-06-28 2023-10-13 北京奇艺世纪科技有限公司 业务流量监控方法、装置、电子设备和存储介质
CN116055353B (zh) * 2023-01-28 2023-06-30 中国信息通信研究院 通信网元技术接口性能的测试装置、测试方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7568019B1 (en) * 2002-02-15 2009-07-28 Entrust, Inc. Enterprise management system for normalization, integration and correlation of business measurements with application and infrastructure measurements
CN108415811A (zh) * 2018-03-23 2018-08-17 广发证券股份有限公司 一种监测业务逻辑的方法及装置
CN111884878A (zh) * 2020-07-24 2020-11-03 樊馨 基于区块链的数据监控方法
WO2022062735A1 (zh) * 2020-09-22 2022-03-31 中兴通讯股份有限公司 时延测量方法及其装置、网络通信设备、存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7568019B1 (en) * 2002-02-15 2009-07-28 Entrust, Inc. Enterprise management system for normalization, integration and correlation of business measurements with application and infrastructure measurements
CN108415811A (zh) * 2018-03-23 2018-08-17 广发证券股份有限公司 一种监测业务逻辑的方法及装置
CN111884878A (zh) * 2020-07-24 2020-11-03 樊馨 基于区块链的数据监控方法
WO2022062735A1 (zh) * 2020-09-22 2022-03-31 中兴通讯股份有限公司 时延测量方法及其装置、网络通信设备、存储介质

Also Published As

Publication number Publication date
CN114500343A (zh) 2022-05-13

Similar Documents

Publication Publication Date Title
CN114500343B (zh) 业务链条运行监控方法及其装置、设备、介质、产品
CN107562635B (zh) 嵌入式软件测试辅助系统
US9703624B2 (en) Event correlation and calculation engine
US20160132538A1 (en) Crawler for discovering control system data in an industrial automation environment
US8832658B2 (en) Verification framework for business objects
CN111385123A (zh) Web服务分布式智能监控方法、装置、计算机设备及存储介质
CN109638318B (zh) 燃料电池远程监控系统和方法
US10289522B2 (en) Autonomous information technology diagnostic checks
CN115437338A (zh) 远程诊断方法及装置、电子设备和存储介质
CN107193714A (zh) 一种告警展示方法及装置
CN112313627B (zh) 事件到无服务器函数工作流实例的映射机制
CA3142771A1 (en) Method of and device for monitoring business data, method of and device for generating rule data, and system
CN117608825A (zh) 基于多云管理平台的资源管理方法和相关设备
CN110968479B (zh) 一种针对应用程序的业务级全链路监控方法及服务器
CN116594847A (zh) 服务器巡检方法、系统、装置、服务器、介质和程序产品
US20200257698A1 (en) Data array of objects indexing
CN107315576A (zh) 一种动态扩展软件流程的方法和系统
CN110198230A (zh) 应用的监控方法、装置、存储介质和电子装置
CN112564980A (zh) 一种基于微服务架构的服务监控方法及系统
CN116755994A (zh) 云平台性能测试方法和系统、电子设备及存储介质
CN110333964A (zh) 异常日志处理方法及装置、电子设备、存储介质
CN115942064A (zh) 直播引导信息显示方法及其装置、设备、介质
CN112882892B (zh) 数据处理方法和装置、电子设备及存储介质
US11032170B1 (en) Remotely-deployed automated computer network diagnostic tool
CN109033291A (zh) 一种作业调度方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant