CN111124819A - 全链路监控的方法和装置 - Google Patents

全链路监控的方法和装置 Download PDF

Info

Publication number
CN111124819A
CN111124819A CN201911259633.3A CN201911259633A CN111124819A CN 111124819 A CN111124819 A CN 111124819A CN 201911259633 A CN201911259633 A CN 201911259633A CN 111124819 A CN111124819 A CN 111124819A
Authority
CN
China
Prior art keywords
characteristic parameter
service node
access request
link
user access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911259633.3A
Other languages
English (en)
Other versions
CN111124819B (zh
Inventor
唐啸
黄坤
董亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Priority to CN201911259633.3A priority Critical patent/CN111124819B/zh
Publication of CN111124819A publication Critical patent/CN111124819A/zh
Application granted granted Critical
Publication of CN111124819B publication Critical patent/CN111124819B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes

Abstract

本发明公开了全链路监控的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:确定用户访问请求对应的调用链路的前端服务节点;根据所述前端服务节点的特征参数,判断所述用户访问请求是否需要被监控;若是,则在所述调用链路的各个服务节点中执行监控逻辑,对所述用户访问请求进行全链路监控。该实施方式能够根据服务节点的实时特征参数对当前用户访问请求是否需要被监控采样进行动态的判决,动态自适应调整分布式全链路监控的采样率,实现单节点、实时的、差异化、精细化设置采样率。

Description

全链路监控的方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种全链路监控的方法和装置。
背景技术
现有的分布式全链路监控系统大都聚焦于如何构建高并发、高可靠、应用级透明、可视化、可延展性的监控系统。在监控过程中,一般通过配置文件设置静态监控采样率来减少采样对服务节点性能的影响。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
仅能针对全局服务节点进行设置,无法做到单节点、实时的、差异化、精细化设置。
发明内容
有鉴于此,本发明实施例提供一种全链路监控的方法和装置,能够根据服务节点的实时特征参数对当前用户访问请求是否需要被监控采样进行动态的判决,动态自适应调整分布式全链路监控的采样率,实现单节点、实时的、差异化、精细化设置采样率。
为实现上述目的,根据本发明实施例的一个方面,提供了一种全链路监控的方法,包括:
确定用户访问请求对应的调用链路的前端服务节点;
根据所述前端服务节点的特征参数,判断所述用户访问请求是否需要被监控;
若是,则在所述调用链路的各个服务节点中执行监控逻辑,对所述用户访问请求进行全链路监控。
可选地,根据所述前端服务节点的特征参数,判断所述用户访问请求是否需要被监控,包括:
根据所述前端服务节点的特征参数的取值,确定各个所述特征参数在当前时刻对判断结果产生影响的影响概率;
对各个所述特征参数的影响概率进行加权求和,根据加权求和的结果确定所述用户访问请求的抽样概率;
当所述抽样概率大于等于预设概率阈值时,判定所述用户访问请求需要被监控。
可选地,根据所述前端服务节点的特征参数的取值,确定各个所述特征参数在当前时刻对判断结果产生影响的影响概率,包括;
对于任意一个特征参数,获取所述当前时刻所述任意一个特征参数的取值;根据所述当前时刻所述任意一个特征参数的取值以及所述任意一个特征参数的取值上限,确定所述任意一个特征参数在当前时刻对判断结果产生影响的影响概率。
可选地,对于任意一个特征参数,所述任意一个特征参数的取值上限是按照如下步骤确定的:
根据预设时间窗内各个用户访问请求对应的所述任意一个特征参数的取值,确定所述预设时间窗内所述任意一个特征参数的最大取值;以所述最大取值与所述任意一个特征参数的预设比例系数的乘积作为所述任意一个特征参数的取值上限。
可选地,确定所述预设时间窗内所述任意一个特征参数的最大取值之前,还包括:
将所述预设时间窗内各个用户访问请求对应的所述任意一个特征参数的取值中的异常值剔除。
可选地,在所述调用链路的各个服务节点中执行监控逻辑,包括:
在所述前端服务节点生成所述调用链路的跟踪标识;对于所述调用链路中的每个服务节点,在调用过程中透传所述跟踪标识和所述每个服务节点的层级标识,采集链路数据。
可选地,采集链路数据之后,还包括:将所述链路数据发送至消息队列,消费所述消息队列中的消息以持久化存储所述链路数据。
根据本发明实施例的第二方面,提供一种全链路监控的装置,包括:核心服务模块,自适应采样模块和数据采集模块;其中,
所述核心服务模块确定用户访问请求对应的调用链路的前端服务节点;
所述自适应采样模块根据所述前端服务节点的特征参数,判断所述用户访问请求是否需要被监控;
若是,则所述数据采集模块在所述调用链路的各个服务节点中执行监控逻辑,对所述用户访问请求进行全链路监控。
可选地,所述自适应采样模块根据所述前端服务节点的特征参数,判断所述用户访问请求是否需要被监控,包括:
根据所述前端服务节点的特征参数的取值,确定各个所述特征参数在当前时刻对判断结果产生影响的影响概率;
对各个所述特征参数的影响概率进行加权求和,根据加权求和的结果确定所述用户访问请求的抽样概率;
当所述抽样概率大于等于预设概率阈值时,判定所述用户访问请求需要被监控。
可选地,所述自适应采样模块根据所述前端服务节点的特征参数的取值,确定各个所述特征参数在当前时刻对判断结果产生影响的影响概率,包括;
对于任意一个特征参数,获取所述当前时刻所述任意一个特征参数的取值;根据所述当前时刻所述任意一个特征参数的取值以及所述任意一个特征参数的取值上限,确定所述任意一个特征参数在当前时刻对判断结果产生影响的影响概率。
可选地,本发明实施例的装置还包括参数配置模块,用于:对于任意一个特征参数,按照如下步骤确定所述任意一个特征参数的取值上限:
根据预设时间窗内各个用户访问请求对应的所述任意一个特征参数的取值,确定所述预设时间窗内所述任意一个特征参数的最大取值;以所述最大取值与所述任意一个特征参数的预设比例系数的乘积作为所述任意一个特征参数的取值上限。
可选地,所述参数配置模块还用于:确定所述预设时间窗内所述任意一个特征参数的最大取值之前,将所述预设时间窗内各个用户访问请求对应的所述任意一个特征参数的取值中的异常值剔除。
可选地,所述数据采集模块在所述调用链路的各个服务节点中执行监控逻辑,包括:
在所述前端服务节点生成所述调用链路的跟踪标识;对于所述调用链路中的每个服务节点,在调用过程中透传所述跟踪标识和所述每个服务节点的层级标识,采集链路数据。
可选地,本发明实施例的装置还包括:消息队列模块和数据存储模块;所述数据采集模块采集链路数据之后,将所述链路数据发送至所述消息队列模块中的消息队列,所述消息队列模块调用数据存储模块消费所述消息队列中的消息以持久化存储所述链路数据。
根据本发明实施例的第三方面,提供一种全链路监控的电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例第一方面提供的方法。
根据本发明实施例的第四方面,提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例第一方面提供的方法。
上述发明中的一个实施例具有如下优点或有益效果:本发明根据服务节点的实时特征参数对当前用户访问请求是否需要被监控采样进行动态的判决,能够动态自适应调整分布式全链路监控的采样率,实现单节点、实时的、差异化、精细化设置采样率。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是本发明实施例的全链路监控的方法的主要流程的示意图;
图2是本发明可选实施例中的全链路监控的方法的流程示意图;
图3是本发明实施例的全链路监控的装置的主要模块的示意图;
图4是本发明实施例可以应用于其中的示例性系统架构图;
图5是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本发明实施例的全链路监控的方法和装置主要用于微服务架构的分布式系统。微服务架构是一个分布式架构,按业务划分服务节点,一个分布式系统往往有很多个服务节点。在微服务系统中,一个来自用户的访问请求先到达一个服务节点(前端服务节点),然后通过通过链路调用,到达其他服务节点,经过一系列的业务逻辑计算最后将数据返回给用户。在复杂的微服务架构中,几乎每一个访问请求都会形成一个复杂的分布式服务调用链路。通过对调用链路进行全链路监控,能够采集用户访问请求处理过程中的链路数据(即请求调用过程中的跟踪信息),以便发生故障的时候,能够快速定位和解决问题。
理论上来说,收集的跟踪信息越多越能更好的反映出系统的实际运行情况,并给出更精准的预警和分析。但是在高并发的分布式系统运行时,大量的请求调用会产生海量的日志信息,如果收集过多的跟踪信息将会对整个分布式系统的性能造成一定的影响,同时保存大量的日志信息也需要较大的存储开销。另外在实际的生产过程中并非所有数据都是值得关注的。现有技术在对调用链路进行全链路监控时,一般通过配置文件设置静态监控采样率来减少采样对服务节点性能的影响,例如zipkin(一款开源的分布式实时数据追踪系统)开源软件原生提供的采样率设置。
但是通过配置文件设置静态监控采样率时,仅能针对全局进行设置,无法做到单节点、实时的、差异化、精细化设置。比如:有些接口比较重要,需要使采样率高一点;有些接口很简单,希望不采集或者采集率设置低一点,此时zipkin原生提供的采样率设置是没办法做到的。
有鉴于此,本发明针对监控过程中监控软件和监控方案对于服务节点本身影响和性能消耗等实时特征,动态自适应调整监控采样率。
根据本发明实施例的一个方面,提供了一种全链路监控的方法。
图1是本发明实施例的全链路监控的方法的主要流程的示意图,如图1所示,全链路监控的方法,包括:
步骤S101、确定用户访问请求对应的调用链路的前端服务节点;
步骤S102、根据所述前端服务节点的特征参数,判断所述用户访问请求是否需要被监控;若是,则跳转至步骤S103;否则,跳转至步骤104;
步骤S103、在所述调用链路的各个服务节点中执行监控逻辑,对所述用户访问请求进行全链路监控;
步骤S104、不作处理。不作处理是指不对当前的用户访问请求进行监控,但是该用户访问请求的正常业务逻辑仍然执行。
前端服务节点是指与用户交互的服务节点。示例性地,用户将访问请求发送到服务节点A,服务节点A通过调用服务节点B和C对用户访问请求进行处理,处理结果汇总到服务节点A之后,有服务节点A返回给用户。此过程中,服务节点A视为前端服务节点。
特征参数是指服务节点的性能消耗等方面的特征,例如节点流量特征、CPU(Central Processing Unit/Processor,中央处理器)、内存、磁盘IO(Input/Output,输入/输出)性能等。本领域技术人员也可以根据实际情况选择其他特征作为本发明中的特征参数。特征参数能够反映服务节点的实时状态。与现有技术中设置静态监控采样率的方式相比,本发明根据服务节点的实时特征参数对当前用户访问请求是否需要被监控采样进行动态的判决,能够动态自适应调整分布式全链路监控的采样率,实现单节点、实时的、差异化、精细化设置采样率。
可选地,根据所述前端服务节点的特征参数,判断所述用户访问请求是否需要被监控,包括:根据所述前端服务节点的特征参数的取值,确定各个所述特征参数在当前时刻对判断结果产生影响的影响概率;对各个所述特征参数的影响概率进行加权求和,根据加权求和的结果确定所述用户访问请求的抽样概率;当所述抽样概率大于等于预设概率阈值时,判定所述用户访问请求需要被监控。
特征参数的取值反映前端服务节点的实时状态,例如负载情况。影响概率反映一个特征参数对采样行为产生的概率贡献,即反映一个特征参数对抽样采样率的影响程度。影响概率的计算方式可以根据实际情况进行选择性设定。抽样概率即用户访问请求被采样监控或者需要采样监控的概率,抽样概率越大,表明对应用户访问请求被采样或者需要采样的概率越大。本实施例有效挖掘了涉及当前访问请求的服务节点的计算机性能特征,通过加权的方式,对各个特征参数的影响作用进行加权处理和多特征融合,达到智能采样的目的,对机器负载和性能达到了非侵入式无感知的智能监控,大大降低了高流量高并发请求状态下,实时密集监控对服务器性能的影响,亦减少了静态配置导致在较低的采样率和较低的传输负载下可能会导致错过重要紧急事件的缺陷,为构建智能、动态和大规模商业部署的、实用的链路跟踪系统的收集组件提供了强有力的保障和技术指引。
可选地,根据所述前端服务节点的特征参数的取值,确定各个所述特征参数在当前时刻对判断结果产生影响的影响概率,包括;对于任意一个特征参数,获取所述当前时刻所述任意一个特征参数的取值;根据所述当前时刻所述任意一个特征参数的取值以及所述任意一个特征参数的取值上限,确定所述任意一个特征参数在当前时刻对判断结果产生影响的影响概率。此处提及的当前时刻,是指接收到用户访问请求的时刻。
示例性地,按照如下公式确定特征参数的影响概率:
Figure BDA0002311272140000081
式中,Porigin(i,j,t)表示在用户访问请求i对应的当前时刻t时特征参数j的影响概率;scoreOrigin(j,t)表示特征参数j在当前时刻t的取值,取值越高,表明其对抽样概率的影响越大;scoreLimit(j)表示特征参数j的取值上限。
本实施例根据当前时刻特征参数的取值以及特征参数的取值上限,确定特征参数在当前时刻对判断结果产生影响的影响概率,使得确定出的影响概率能够反映服务节点的真实状态,例如负载情况。
在确定特征参数的取值上限时,可以人为设置一个取值上限数值,也可以根据最近一段时间特征参数的取值情况来确定。可选地,对于任意一个特征参数,所述任意一个特征参数的取值上限是按照如下步骤确定的:根据预设时间窗内各个用户访问请求对应的所述任意一个特征参数的取值,确定所述预设时间窗内所述任意一个特征参数的最大取值;以所述最大取值与所述任意一个特征参数的预设比例系数的乘积作为所述任意一个特征参数的取值上限。预设时间窗可以根据实际情况进行选择性设定,例如预设时间窗为截止至当前时刻的预设时长范围内。本实施例中,每次用户访问请求都会携带一个时间戳,以预设时间窗内各个时间戳对应的特征参数的取值的最大值作为该特征参数的取值上限。预设比例系数可以根据实际情况进行选择性设定,例如设置为0.7、0.8等。
实际应用过程中,在确定所述预设时间窗内所述任意一个特征参数的最大取值之前,还可以包括:将所述预设时间窗内各个用户访问请求对应的所述任意一个特征参数的取值中的异常值剔除。异常值的定义可以根据实际情况进行设定。示例性地,将预设时间窗内各个用户访问请求对应的特征参数的取值中的最大值剔除。由于历史数据的某些异常峰值不具有典型性,会使得其他正常数据分布在零点分拣无法增长。本实施例将其剔除,能够避免上述情况的发生。
实际应用过程中,可以预先进行配置参数信息,例如各个特征参数的取值上限、加权因子、预设概率阈值、预设时间窗等。
可选地,在所述调用链路的各个服务节点中执行监控逻辑,包括:在所述前端服务节点生成所述调用链路的跟踪标识;对于所述调用链路中的每个服务节点,在调用过程中透传所述跟踪标识和所述每个服务节点的层级标识,采集链路数据。需要采集的链路数据可以根据实际情况进行选择性设定,例如包括响应报文参数(比如响应状态、响应大小和响应时间等)。
跟踪标识TraceID为链路请求的唯一标识,在用户访问请求入口(即前端服务节点)生成,并跟随下游请求附加到报文头中进行透传。链路层级标识SpanID代表上下游关系的层级标识ID,表示子系统在链路中所处的层级。pSpanID表示调用链路中上游关系的层级。对于任意服务节点及其子节点重复上述步骤,直至事务的各调用请求完成。各调用请求完成后或单次调用请求完成后,将链路数据上报,例如服务节点的追踪标记和子节点的追踪标记。
以连用链路为服务节点serverA->服务节点serverB->服务节点serverC为例。远程调用开始,用字符串server_transaction_trace_id标识此次调用任务,三个服务节点的跟踪标识分别为server_transaction_trace_id,即:TraceID(A)=TraceID(B)=TraceID(c)=server_transaction_trace_id,为全局标识。在同一次链路追踪中的服务节点共享相同的跟踪标识。对于serverA,其SpanID(A)=serverA_SpanID;pSpanID(A)=-1;-1表示远程请求调用发起节点;对于serverB,其SpanID(B)=serverB_SpanID;pSpanID(B)=serverA_SpanID;对于serverC,其SpanID(C)=serverC_SpanID;pSpanID(C)=serverB_SpanID;至此,serverC是最终叶子节点完成全部的监控调用链请求。
执行链路数据采集的模块(以下简称数据采集模块)是一个独立的、与应用层业务代码分离的组件,在系统底层进行增加链路监控相关的额外的请求参数和链路监控相关的额外的响应报文参数记录。例如在开源的springcloud(一套微服务解决方案)微服务中,通过sleuth(springcloud中的一个组件)组件在配置文件增加引用,示例如下:
Figure BDA0002311272140000101
Figure BDA0002311272140000111
可选地,采集链路数据之后,还包括:将所述链路数据发送至消息队列,消费所述消息队列中的消息以持久化存储所述链路数据。
本实施例中,可以采用一个独立的、与应用层业务代码分离的组件(以下简称消息队列模块)维护消息队列,如kafka(一个开源流处理平台)、RabbitMQ(一种开源消息代理软件)等;以在开源的springcloud微服务中依赖kafka组件为例,搭建开源kafka服务中间件以后,在springcloud配置文件增加引用以及制定kafka消息服务的地址和端口,即可使用对应的消息中间件。增加引用示例如下:
Figure BDA0002311272140000112
本实施例中,可以采用一个独立的、与应用层业务代码分离的组件(以下简称数据存储模块)执行持久化存储链路数据的操作。示例性地,在数据存储和检索框架开源实现,如elasticsearch,mysql等。以开源的elasticsearch为例,部署好elasticsearch服务和对应的配置文件,启动即可。
可选地,本发明实施例可以可视化展示所示链路数据。本实施例中,可以采用一个独立的、与应用层业务代码分离的组件(以下简称数据展示模块)进行可视化展示。示例性地,采用数据存储和检索框架开源实现,如zipkin等。以开源的zipkin为例,部署好elasticsearch服务和对应的配置文件,启动的时候增加和数据采集模块参数联动,例如执行java-DKAFKA_BOOTSTRAP_SERVERS=localhost:9092-DSTORAGE_TYPE=elasticsearch-DES_HOSTS=localhost:9200-jar zipkin-server.jar--server.port=9005命令,将数据采集模块和数据存储模块对应的端口、存储方案、url(Uniform Resource Locator,统一资源定位符)地址配置之后,即可开启数据存储模块。在可视化展示时,可以对一次完整访问请求经过的服务节点、每个服务节点接口调用耗时、调用开始和结束时间进行查询和展示,也可以个性化的展示特定查询时间区间、特定请求uri(Uniform Resource Identifier,统一资源标识符)、调用请求耗时大于特定时间阈值的所有请求的列表。
图2是本发明可选实施例中的全链路监控的方法的流程示意图。以下结合图2对本发明实施例中全链路监控的方法的流程进行示例性说明。
假定应用web页面访问某个请求报文,将此次请求命名为request_transaction。系统管理员通过预设界面,对相关参数进行配置。相关参数包括但不限于:预设概率阈值Psample_th;特征参数的取值上限scoreLimit(j);特征参数的加权因子W(j);预设时间窗口tWin;监控uri黑名单参数;监控加权系数Wimportant(i,t)参数等。
系统管理员开启确定用户访问请求对应的调用链路的前端服务节点的模块(以下简称核心服务模块),完成计算机和集群操作系统初始化,完成相关配置参数的加载。非首次启动监控服务时,可以不进行此步骤。核心服务模块的核心服务包括但不限于:判断所述用户访问请求是否需要被监控的模块(以下简称自适应采样模块)的启动和初始化;数据采集模块的启动和初始化;消息队列模块的启动和初始化;数据存储模块相关服务的启动和初始化。
用户通过核心服务模块提供的核心服务暴露的访问url地址或者web页面进行操作,向对应的服务节点serverA发起调用;serverA获取来自页面的请求request_transaction;并调用serverA的自适应采样模块;该模块在分布式全链路监控领域里融合多特征进行智能自适应采样,综合根据多特征的计算机的负载状态进行了加权处理;同时依据概率模型对当前全链路请求是否采样进行动态的判决。特征参数包括但不限于流量状态、cpu状态、内存状态、磁盘IO读写状态。
针对request_transaction,定义一些参数:
t表示当前时刻;
tWin表示时间窗口;
i表示当前请求的标识序号;
j表示在发生时刻t上述请求i发生时计算机节点特征序号;例如j=1表示流量特征序号,j=2表示cpu特征序号等;
Wnosample(i,t)表示请求i在时刻t不采样的判决参数且满足如下条件;
Figure BDA0002311272140000131
Porigin(i,t)表示在时刻t请求被采样的原始概率;
Wimportant(i,t)表示请求i在时刻t采样的加权因子;对不同的请求可以进行匹配,对于例如对磁盘IO性能比较关注的场景,包含IO密集型的请求uri,该请求的加权因子更大;
P(i,t)表示在时刻t请求i被采样的抽样概率,且满足以下公式1:
Figure BDA0002311272140000132
scoreOrigin(j,t)表示特征参数j在当前时刻t的取值,取值越高,表明其对抽样概率的影响越大;
scoreLimit(j)表示特征参数j的取值上限;
此参数可以有多种途径获取,例如针对一个月,或者半年的历史数据进行统计分析,剔除异常点,获取最大值的0.8倍,作为当前特征j的最大值;
Porigin(i,j,t)表示在用户访问请求i对应的当前时刻t时特征参数j的影响概率;
对Porigin(i,j,t)定义如下公式2:
Figure BDA0002311272140000141
上述Porigin(i,j,t)定义的合理性在于,特征i对应的scoreOrigin(i,t)越高,则表示该特征参数对计算机性能影响越严重,例如i=1时表征当前网络流量很大,逼近scoreLimit(1),则此时服务节点的应用服务相关的并发流量使得计算机负担较重,监控服务开启对服务节点性能的影响非常明显,此时Porigin(i,j,t)趋近于0,大流量对于采样行为的影响概率为0,即大的网络流量的影响概率小,进而从流量消耗的角度来说,建议不开启监控采样;
scoreLimit(j)获取途径之所以不采用历史数据最大值作为scoreLimit(j),是因为历史数据的某些异常峰值不具有典型性,会使得Porigin(i,j,t)正常数据分布在零点附近无法增长,因此类似的削峰处理可以使得Porigin(i,j,t)数据分布和概率推断更加均匀分布在[0,1]区间;
W(j)表示特征参数j的影响概率Porigin(i,j,t)的加权因子;且满足以下公式3:
Figure BDA0002311272140000142
当加权因子一样的时候,W(j)=1/N退化成为平均加权公式;
至此,Porigin(i,t)可以定义为以下公式4:
Figure BDA0002311272140000143
且满足
Figure BDA0002311272140000144
Porigin(i,t)∈[0,1],P(i,t)∈[0,1];
将公式4代入公式1,获取抽样概率的完整公式,参见以下公式5:
Figure BDA0002311272140000151
例如,对j取1、2、3、4:
j=1表示流量特征;j=2表示cpu利用率特征,例如用当前节点的cpu利用百分比表示;j=3表示存储io使用率特征,例如用当前磁盘的IO使用百分比表示;j=4表示节点的内存特征,例如我们可以用当前节点内存利用率百分比表示;
cpu利用率特征,磁盘IO的利用率特征,内存利用率可以通过linux(一种克隆系统)命令获取,或者利用软件接口获取。
本实施例对流量特征的获取方式如下:
定义时间流量滑动窗口模型;
在内存中保存请求i在时刻t到来的时刻起,最近的时间区间[t-tWin,t]范围内的所有可通过监控软件监控的请求的时间戳;窗口中的请求数目表征了应用服务访问的并发程度和繁忙程度;
定义N(t,j)为[t-tWin,t]时间窗口内的请求总数;scoreOrigin(j)等同于N(t,j);在时刻t当访问密集的时候,scoreOrigin(j,t)较大,当前请求考虑流量因子进行判决的抽样概率Porigin(i,j,t)贡献较小;
定义Psample_th为采样阈值,如果满足以下公式6:
P(i,t)≥Psample_th
则此次请求进行采样监控。serverA在时刻t的请求i到达时刻,对网络流量特征、实时cpu特征、实时磁盘IO特征进行获取,判定此次请求的抽样判决结果是允许抽样监控还是丢弃不抽样。需要注意的是,如果不抽样,此次请求并没有丢弃,只是请求过程中不进行监控而已;如果允许抽样,请求正常执行的时候会执行监控逻辑。
在判定需要进行采用监控时,采集链路数据,将采集的链路数据发送至消息队列。将消费消息队列中的数据持久化保存。在可视化展示时,可以对链路数据进行查阅分析和性能诊断。
本发明根据服务节点的实时特征参数对当前用户访问请求是否需要被监控采样进行动态的判决,能够动态自适应调整分布式全链路监控的采样率,实现单节点、实时的、差异化、精细化设置采样率。
根据本发明实施例的第二方面,提供一种实现上述方法的装置。
图3是本发明实施例的全链路监控的装置的主要模块的示意图。如图3所示,全链路监控的装置300包括:核心服务模块301,自适应采样模块302和数据采集模块303;其中,
所述核心服务模块301确定用户访问请求对应的调用链路的前端服务节点;
所述自适应采样模块302根据所述前端服务节点的特征参数,判断所述用户访问请求是否需要被监控;
若是,则所述数据采集模块303在所述调用链路的各个服务节点中执行监控逻辑,对所述用户访问请求进行全链路监控。
可选地,所述自适应采样模块302根据所述前端服务节点的特征参数,判断所述用户访问请求是否需要被监控,包括:
根据所述前端服务节点的特征参数的取值,确定各个所述特征参数在当前时刻对判断结果产生影响的影响概率;
对各个所述特征参数的影响概率进行加权求和,根据加权求和的结果确定所述用户访问请求的抽样概率;
当所述抽样概率大于等于预设概率阈值时,判定所述用户访问请求需要被监控。
可选地,所述自适应采样模块302根据所述前端服务节点的特征参数的取值,确定各个所述特征参数在当前时刻对判断结果产生影响的影响概率,包括;
对于任意一个特征参数,获取所述当前时刻所述任意一个特征参数的取值;根据所述当前时刻所述任意一个特征参数的取值以及所述任意一个特征参数的取值上限,确定所述任意一个特征参数在当前时刻对判断结果产生影响的影响概率。
可选地,本发明实施例的装置还包括参数配置模块304,用于:对于任意一个特征参数,按照如下步骤确定所述任意一个特征参数的取值上限:
根据预设时间窗内各个用户访问请求对应的所述任意一个特征参数的取值,确定所述预设时间窗内所述任意一个特征参数的最大取值;以所述最大取值与所述任意一个特征参数的预设比例系数的乘积作为所述任意一个特征参数的取值上限。
可选地,所述参数配置模块304还用于:确定所述预设时间窗内所述任意一个特征参数的最大取值之前,将所述预设时间窗内各个用户访问请求对应的所述任意一个特征参数的取值中的异常值剔除。
可选地,所述数据采集模块303在所述调用链路的各个服务节点中执行监控逻辑,包括:
在所述前端服务节点生成所述调用链路的跟踪标识;对于所述调用链路中的每个服务节点,在调用过程中透传所述跟踪标识和所述每个服务节点的层级标识,采集链路数据。
可选地,本发明实施例的装置还包括:消息队列模块305和数据存储模块306;所述数据采集模块303采集链路数据之后,将所述链路数据发送至所述消息队列模块305中的消息队列,所述消息队列模块305调用数据存储模块306消费所述消息队列中的消息以持久化存储所述链路数据。
可选地,本发明实施例的装置还包括:数据展示模块307,用于可视化展示所示链路数据。
根据本发明实施例的第三方面,提供一种全链路监控的电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例第一方面提供的方法。
根据本发明实施例的第四方面,提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例第一方面提供的方法。
图4示出了可以应用本发明实施例的全链路监控的方法或全链路监控的装置的示例性系统架构400。
如图4所示,系统架构400可以包括终端设备401、402、403,网络404和服务器405。网络404用以在终端设备401、402、403和服务器405之间提供通信链路的介质。网络404可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备401、402、403通过网络404与服务器405交互,以接收或发送消息等。终端设备401、402、403上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备401、402、403可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器405可以是提供各种服务的服务器,例如对用户利用终端设备401、402、403所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的全链路监控的方法一般由服务器405执行,相应地,全链路监控的装置一般设置于服务器405中。
应该理解,图4中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图5,其示出了适于用来实现本发明实施例的终端设备的计算机系统500的结构示意图。图5示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括:核心服务模块,自适应采样模块和数据采集模块;其中,所述核心服务模块确定用户访问请求对应的调用链路的前端服务节点;所述自适应采样模块根据所述前端服务节点的特征参数,判断所述用户访问请求是否需要被监控;若是,则所述数据采集模块在所述调用链路的各个服务节点中执行监控逻辑,对所述用户访问请求进行全链路监控。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,核心服务模块还可以被描述为“在所述调用链路的各个服务节点中执行监控逻辑的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:确定用户访问请求对应的调用链路的前端服务节点;根据所述前端服务节点的特征参数,判断所述用户访问请求是否需要被监控;若是,则在所述调用链路的各个服务节点中执行监控逻辑,对所述用户访问请求进行全链路监控。
根据本发明实施例的技术方案,本发明根据服务节点的实时特征参数对当前用户访问请求是否需要被监控采样进行动态的判决,能够动态自适应调整分布式全链路监控的采样率,实现单节点、实时的、差异化、精细化设置采样率。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种全链路监控的方法,其特征在于,包括:
确定用户访问请求对应的调用链路的前端服务节点;
根据所述前端服务节点的特征参数,判断所述用户访问请求是否需要被监控;
若是,则在所述调用链路的各个服务节点中执行监控逻辑,对所述用户访问请求进行全链路监控。
2.如权利要求1所述的方法,其特征在于,根据所述前端服务节点的特征参数,判断所述用户访问请求是否需要被监控,包括:
根据所述前端服务节点的特征参数的取值,确定各个所述特征参数在当前时刻对判断结果产生影响的影响概率;
对各个所述特征参数的影响概率进行加权求和,根据加权求和的结果确定所述用户访问请求的抽样概率;
当所述抽样概率大于等于预设概率阈值时,判定所述用户访问请求需要被监控。
3.如权利要求2所述的方法,其特征在于,根据所述前端服务节点的特征参数的取值,确定各个所述特征参数在当前时刻对判断结果产生影响的影响概率,包括;
对于任意一个特征参数,获取所述当前时刻所述任意一个特征参数的取值;根据所述当前时刻所述任意一个特征参数的取值以及所述任意一个特征参数的取值上限,确定所述任意一个特征参数在当前时刻对判断结果产生影响的影响概率。
4.如权利要求3所述的方法,其特征在于,对于任意一个特征参数,所述任意一个特征参数的取值上限是按照如下步骤确定的:
根据预设时间窗内各个用户访问请求对应的所述任意一个特征参数的取值,确定所述预设时间窗内所述任意一个特征参数的最大取值;以所述最大取值与所述任意一个特征参数的预设比例系数的乘积作为所述任意一个特征参数的取值上限。
5.如权利要求4所述的方法,其特征在于,确定所述预设时间窗内所述任意一个特征参数的最大取值之前,还包括:
将所述预设时间窗内各个用户访问请求对应的所述任意一个特征参数的取值中的异常值剔除。
6.如权利要求4所述的方法,其特征在于,在所述调用链路的各个服务节点中执行监控逻辑,包括:
在所述前端服务节点生成所述调用链路的跟踪标识;对于所述调用链路中的每个服务节点,在调用过程中透传所述跟踪标识和所述每个服务节点的层级标识,采集链路数据。
7.如权利要求1-6任一所述的方法,其特征在于,采集链路数据之后,还包括:将所述链路数据发送至消息队列,消费所述消息队列中的消息以持久化存储所述链路数据。
8.一种全链路监控的装置,其特征在于,包括:核心服务模块,自适应采样模块和数据采集模块;其中,
所述核心服务模块确定用户访问请求对应的调用链路的前端服务节点;
所述自适应采样模块根据所述前端服务节点的特征参数,判断所述用户访问请求是否需要被监控;
若是,则所述数据采集模块在所述调用链路的各个服务节点中执行监控逻辑,对所述用户访问请求进行全链路监控。
9.一种全链路监控的电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN201911259633.3A 2019-12-10 2019-12-10 全链路监控的方法和装置 Active CN111124819B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911259633.3A CN111124819B (zh) 2019-12-10 2019-12-10 全链路监控的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911259633.3A CN111124819B (zh) 2019-12-10 2019-12-10 全链路监控的方法和装置

Publications (2)

Publication Number Publication Date
CN111124819A true CN111124819A (zh) 2020-05-08
CN111124819B CN111124819B (zh) 2023-09-22

Family

ID=70498140

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911259633.3A Active CN111124819B (zh) 2019-12-10 2019-12-10 全链路监控的方法和装置

Country Status (1)

Country Link
CN (1) CN111124819B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111679950A (zh) * 2020-05-25 2020-09-18 中国工商银行股份有限公司 接口级动态数据采样方法及装置
CN112363855A (zh) * 2020-11-13 2021-02-12 北京基调网络股份有限公司 调用链数据生成方法、拓扑生成方法及系统和计算机设备
CN112463561A (zh) * 2020-11-20 2021-03-09 中国建设银行股份有限公司 一种故障定位方法、装置、设备及存储介质
CN112702437A (zh) * 2020-12-30 2021-04-23 上海浦东发展银行股份有限公司 一种链路数据采样率实时自动调整方法
CN112860507A (zh) * 2021-01-13 2021-05-28 时时同云科技(成都)有限责任公司 分布式链路跟踪系统采样率的控制方法和装置
CN113064797A (zh) * 2021-04-22 2021-07-02 平安国际智慧城市科技股份有限公司 前端监控方法、装置、电子设备及存储介质
CN113064790A (zh) * 2021-03-15 2021-07-02 上海浦东发展银行股份有限公司 基于配置中心的调用链数据采集系统、方法及存储介质
CN113505036A (zh) * 2021-05-25 2021-10-15 建信金融科技有限责任公司 一种应用监控方法、客户端和服务器
CN113949624A (zh) * 2021-09-17 2022-01-18 远景智能国际私人投资有限公司 链路采样数的分配方法、装置、设备及介质
CN114143238A (zh) * 2021-08-23 2022-03-04 郑州时空隧道信息技术有限公司 一种基于跑腿业务进行的全链路压测系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011120278A1 (zh) * 2010-04-02 2011-10-06 中兴通讯股份有限公司 一种下行控制信息的检测方法和装置
CN104702680A (zh) * 2015-02-13 2015-06-10 安科智慧城市技术(中国)有限公司 一种资源监测方法及系统
CN105049368A (zh) * 2015-08-25 2015-11-11 湖南餐智科技有限公司 一种混合网络下基于优先权的负载均衡算法
WO2015196821A1 (zh) * 2014-06-27 2015-12-30 中兴通讯股份有限公司 WebSocket服务器监控方法及装置
US20160147280A1 (en) * 2014-11-26 2016-05-26 Tessil Thomas Controlling average power limits of a processor
CN106598702A (zh) * 2016-12-20 2017-04-26 东软集团股份有限公司 一种资源调整方法及装置
US20170177416A1 (en) * 2015-12-21 2017-06-22 International Business Machines Corporation Dynamically adapting a test workload to accelerate the identification of performance issues
CN108183927A (zh) * 2017-11-22 2018-06-19 链家网(北京)科技有限公司 一种分布式系统中链路调用的监控方法及系统
US20190073276A1 (en) * 2017-09-06 2019-03-07 Royal Bank Of Canada System and method for datacenter recovery
CN109600254A (zh) * 2018-11-29 2019-04-09 恒生电子股份有限公司 全链路日志的生成方法及相关系统
US20190150034A1 (en) * 2016-07-11 2019-05-16 Huawei Technologies Co., Ltd. Service Traffic Control Method and System and Decision Network Element
CN109873717A (zh) * 2019-01-18 2019-06-11 深圳壹账通智能科技有限公司 监控方法、装置、计算机设备及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011120278A1 (zh) * 2010-04-02 2011-10-06 中兴通讯股份有限公司 一种下行控制信息的检测方法和装置
WO2015196821A1 (zh) * 2014-06-27 2015-12-30 中兴通讯股份有限公司 WebSocket服务器监控方法及装置
US20160147280A1 (en) * 2014-11-26 2016-05-26 Tessil Thomas Controlling average power limits of a processor
CN104702680A (zh) * 2015-02-13 2015-06-10 安科智慧城市技术(中国)有限公司 一种资源监测方法及系统
CN105049368A (zh) * 2015-08-25 2015-11-11 湖南餐智科技有限公司 一种混合网络下基于优先权的负载均衡算法
US20170177416A1 (en) * 2015-12-21 2017-06-22 International Business Machines Corporation Dynamically adapting a test workload to accelerate the identification of performance issues
US20190150034A1 (en) * 2016-07-11 2019-05-16 Huawei Technologies Co., Ltd. Service Traffic Control Method and System and Decision Network Element
CN106598702A (zh) * 2016-12-20 2017-04-26 东软集团股份有限公司 一种资源调整方法及装置
US20190073276A1 (en) * 2017-09-06 2019-03-07 Royal Bank Of Canada System and method for datacenter recovery
CN108183927A (zh) * 2017-11-22 2018-06-19 链家网(北京)科技有限公司 一种分布式系统中链路调用的监控方法及系统
CN109600254A (zh) * 2018-11-29 2019-04-09 恒生电子股份有限公司 全链路日志的生成方法及相关系统
CN109873717A (zh) * 2019-01-18 2019-06-11 深圳壹账通智能科技有限公司 监控方法、装置、计算机设备及存储介质

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111679950B (zh) * 2020-05-25 2024-04-12 中国工商银行股份有限公司 接口级动态数据采样方法及装置
CN111679950A (zh) * 2020-05-25 2020-09-18 中国工商银行股份有限公司 接口级动态数据采样方法及装置
CN112363855A (zh) * 2020-11-13 2021-02-12 北京基调网络股份有限公司 调用链数据生成方法、拓扑生成方法及系统和计算机设备
CN112463561A (zh) * 2020-11-20 2021-03-09 中国建设银行股份有限公司 一种故障定位方法、装置、设备及存储介质
CN112702437B (zh) * 2020-12-30 2023-02-10 上海浦东发展银行股份有限公司 一种链路数据采样率实时自动调整方法
CN112702437A (zh) * 2020-12-30 2021-04-23 上海浦东发展银行股份有限公司 一种链路数据采样率实时自动调整方法
CN112860507A (zh) * 2021-01-13 2021-05-28 时时同云科技(成都)有限责任公司 分布式链路跟踪系统采样率的控制方法和装置
CN113064790A (zh) * 2021-03-15 2021-07-02 上海浦东发展银行股份有限公司 基于配置中心的调用链数据采集系统、方法及存储介质
CN113064790B (zh) * 2021-03-15 2023-08-11 上海浦东发展银行股份有限公司 基于配置中心的调用链数据采集系统、方法及存储介质
CN113064797A (zh) * 2021-04-22 2021-07-02 平安国际智慧城市科技股份有限公司 前端监控方法、装置、电子设备及存储介质
CN113505036A (zh) * 2021-05-25 2021-10-15 建信金融科技有限责任公司 一种应用监控方法、客户端和服务器
CN113505036B (zh) * 2021-05-25 2023-04-14 中国建设银行股份有限公司 一种应用监控方法、客户端和服务器
CN114143238A (zh) * 2021-08-23 2022-03-04 郑州时空隧道信息技术有限公司 一种基于跑腿业务进行的全链路压测系统
CN113949624A (zh) * 2021-09-17 2022-01-18 远景智能国际私人投资有限公司 链路采样数的分配方法、装置、设备及介质
CN113949624B (zh) * 2021-09-17 2023-07-21 远景智能国际私人投资有限公司 链路采样数的分配方法、装置、设备及介质

Also Published As

Publication number Publication date
CN111124819B (zh) 2023-09-22

Similar Documents

Publication Publication Date Title
CN111124819B (zh) 全链路监控的方法和装置
US10560465B2 (en) Real time anomaly detection for data streams
US20210184947A1 (en) Automatic capture of detailed analysis information based on remote server analysis
US9634915B2 (en) Methods and computer program products for generating a model of network application health
US10747592B2 (en) Router management by an event stream processing cluster manager
US10404556B2 (en) Methods and computer program products for correlation analysis of network traffic in a network device
US8868727B2 (en) Methods and computer program products for storing generated network application performance data
WO2017092582A1 (zh) 一种数据处理方法和装置
US20120072575A1 (en) Methods and computer program products for aggregating network application performance metrics by process pool
EP3796167A1 (en) Router management by an event stream processing cluster manager
US11570078B2 (en) Collecting route-based traffic metrics in a service-oriented system
CN110928934A (zh) 一种用于业务分析的数据处理方法和装置
CN111782692A (zh) 一种频率控制方法及装置
EP2634699A1 (en) Application monitoring
CN110071952B (zh) 服务调用量的控制方法和装置
US8312138B2 (en) Methods and computer program products for identifying and monitoring related business application processes
US11811894B2 (en) Reduction of data transmissions based on end-user context
CN115809119A (zh) 容器编排引擎的监控方法、系统及装置
CN116048846A (zh) 数据传输方法、装置、设备和存储介质
CN112994934B (zh) 数据交互方法、装置及系统
CN115086194A (zh) 云应用的数据传输方法、计算设备及计算机存储介质
CN110569424A (zh) 一种信息推介的方法和装置
CN113761433A (zh) 业务处理方法和装置
CN113760589A (zh) 一种基于实时流处理框架的服务熔断方法和装置
CN113778780A (zh) 应用稳定性的确定方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220923

Address after: 25 Financial Street, Xicheng District, Beijing 100033

Applicant after: CHINA CONSTRUCTION BANK Corp.

Address before: 25 Financial Street, Xicheng District, Beijing 100033

Applicant before: CHINA CONSTRUCTION BANK Corp.

Applicant before: Jianxin Financial Science and Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant