CN115529227A - 一种基于Web请求的链路跟踪和异常诊断方法 - Google Patents

一种基于Web请求的链路跟踪和异常诊断方法 Download PDF

Info

Publication number
CN115529227A
CN115529227A CN202211045533.2A CN202211045533A CN115529227A CN 115529227 A CN115529227 A CN 115529227A CN 202211045533 A CN202211045533 A CN 202211045533A CN 115529227 A CN115529227 A CN 115529227A
Authority
CN
China
Prior art keywords
service
data
link tracking
link
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211045533.2A
Other languages
English (en)
Inventor
王欢
李凯
张小东
刘磊
傅一鸣
于炎
解金澎
谢栋强
王文广
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Golden Mantis Digital Technology Suzhou Co ltd
Original Assignee
Golden Mantis Digital Technology Suzhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Golden Mantis Digital Technology Suzhou Co ltd filed Critical Golden Mantis Digital Technology Suzhou Co ltd
Priority to CN202211045533.2A priority Critical patent/CN115529227A/zh
Publication of CN115529227A publication Critical patent/CN115529227A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于Web请求的链路跟踪和异常诊断方法,包括以下步骤:S1、接收来自用户的业务请求,分布式系统中多个服务节点执行与业务请求相应的服务操作;S2、服务节点在执行完成服务操作后,生成链路跟踪数据;S3、数据监测设备接收各个服务节点的链路跟踪数据,获取链路跟踪数据中的TracingID,并将Tracing ID与链路跟踪数据相关联;S4、接收到请求链路跟踪命令后,获取请求链路跟踪命令中携带的Tracing ID,根据该Tracing ID从存储的所有链路跟踪数据中获取关联的链路跟踪数据;S5、对所有关联的链路跟踪数据进行分析,识别出符合预设异常标准的服务节点,生成异常捕获信息。本发明相较于现有技术,便于运维人员快速、准确的定位故障的服务节点。

Description

一种基于Web请求的链路跟踪和异常诊断方法
技术领域
本发明属于链路跟踪领域,尤其涉及一种基于Web请求的链路跟踪和异常诊断方法。
背景技术
微服务架构是一个分布式架构,它按业务划分服务单元,一个分布式系统往往有很多个服务单元。由于服务单元数量众多,业务的复杂性,如果出现了错误和异常,很难去定位。随着微服务架构的流行,各个服务被解耦拆分的更加细致,一次请求往往需要涉及到多个服务的执行结果。
基于微服务架构的分布式系统中,客户发起请求失败后,难以定位具体哪个服务节点出现问题,运维人员只能逐个服务节点去排查,或者根据异常信息和已有经验主观判断故障的节点,才能定位到对应的服务和日志记录,难以准确、快速的实现故障服务节点的定位。
发明内容
本发明的目的在于:提供一种基于Web请求的链路跟踪和异常诊断方法,便于运维人员快速、准确的定位故障的服务节点。
为了实现上述目的,本发明采用了如下技术方案:一种基于Web请求的链路跟踪和异常诊断方法,包括以下步骤:
S1、接收来自用户的业务请求,分布式系统中多个服务节点执行与业务请求相应的服务操作;
S2、服务节点在执行完成服务操作后,生成链路跟踪数据,并发送至数据监测设备;
S3、数据监测设备接收各个服务节点的链路跟踪数据,获取链路跟踪数据中的Tracing ID,并将Tracing ID与链路跟踪数据相关联,之后存储所有的链路跟踪数据;
S4、数据监测设备接收到请求链路跟踪命令后,获取请求链路跟踪命令中携带的Tracing ID,根据该Tracing ID从存储的所有链路跟踪数据中获取关联的链路跟踪数据;
S5、对所有关联的链路跟踪数据进行分析,识别出符合预设异常标准的服务节点,生成异常捕获信息。
作为上述技术方案的进一步描述:
链路跟踪数据还包括Span ID和服务操作执行信息,服务操作执行信息包括执行结果、调用节点标识、业务请求处理起止时间和业务请求处理时长。
作为上述技术方案的进一步描述:
在步骤S4中,数据监测设备根据链路跟踪数据中执行结果和业务请求处理时长,识别链路跟踪数据对应的服务节点是否符合预设异常标准。
作为上述技术方案的进一步描述:
调用节点标识用于关联当前服务节点与被调用的其他服务节点,调用节点标识包括当前服务节点对被调用服务节点的调用时间。
作为上述技术方案的进一步描述:
在步骤S4中,数据监测设备根据调用节点标识,比较当前服务节点和被调用服务节点的业务请求处理起止时间,识别服务节点是否符合预设异常标准。
作为上述技术方案的进一步描述:
分布式系统包括多个服务节点,服务节点包括请求接收模块、服务执行模块和链路跟踪数据生成模块,请求接收模块用于接收来自用户或其他服务节点的业务请求,服务执行模块用于执行与业务请求相应的服务操作,链路跟踪数据生成模块用于采集日志数据,过滤、脱敏、转化后得到链路跟踪数据。
作为上述技术方案的进一步描述:
数据监测设备包括数据存储模块、数据分析模块和异常告警模块,数据存储模块用于存储链路跟踪数据,数据分析模块用于识别链路跟踪数据对应的服务节点是否符合预设异常标准,异常告警模块用于根据识别出的、符合预设异常标准的服务节点,生成异常捕获信息。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1、本发明中,分布式系统中多个服务节点在执行与业务请求相应的服务操作后,生成链路跟踪数据并传输至数据监测设备,数据监测设备在收到请求链路跟踪命令后,根据请求链路跟踪命令中携带的Tracing ID,从存储的所有链路跟踪数据中获取关联的链路跟踪数据,并对所有关联的链路跟踪数据进行分析,识别出符合预设异常标准的服务节点,生成异常捕获信息,从而便于运维人员快速、准确的定位故障的服务节点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为一种基于Web请求的链路跟踪和异常诊断方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供一种技术方案:一种基于Web请求的链路跟踪和异常诊断方法,包括以下步骤:
S1、接收来自用户的业务请求,分布式系统中多个服务节点执行与业务请求相应的服务操作;
S2、服务节点在执行完成服务操作后,生成链路跟踪数据,并发送至数据监测设备;
S3、数据监测设备接收各个服务节点的链路跟踪数据,获取链路跟踪数据中的Tracing ID,并将Tracing ID与链路跟踪数据相关联,之后存储所有的链路跟踪数据;
S4、数据监测设备接收到请求链路跟踪命令后,获取请求链路跟踪命令中携带的Tracing ID,根据该Tracing ID从存储的所有链路跟踪数据中获取关联的链路跟踪数据;
S5、对所有关联的链路跟踪数据进行分析,识别出符合预设异常标准的服务节点,生成异常捕获信息。
链路跟踪数据还包括Span ID和服务操作执行信息,服务操作执行信息包括执行结果(具体包括执行成功、执行失败、故障)、调用节点标识、业务请求处理起止时间和业务请求处理时长。
在步骤S4中,数据监测设备根据链路跟踪数据中执行结果和业务请求处理时长,识别链路跟踪数据对应的服务节点是否符合预设异常标准。执行结果为执行成功且业务请求处理时长没有超过设定阈值的服务节点,为不符合预设异常标准的服务节点,不生成异常捕获信息,其他情况(如执行结果为故障或执行失败,业务请求处理时长超过设定阈值),则识别服务节点符合预设异常标准,生成异常捕获信息。
调用节点标识用于关联当前服务节点与被调用的其他服务节点,调用节点标识包括当前服务节点对被调用服务节点的调用时间。
在步骤S4中,数据监测设备根据调用节点标识,比较当前服务节点和被调用服务节点的业务请求处理起止时间,识别服务节点是否符合预设异常标准。如果当前服务节点的调用时间与被调用服务节点的业务请求处理起始时间之间的差值超出设定阈值,则说明两个服务节点之间的数据传输出现异常,识别两个服务节点符合预设异常标准。
分布式系统包括多个服务节点,服务节点包括请求接收模块、服务执行模块和链路跟踪数据生成模块,请求接收模块用于接收来自用户或其他服务节点的业务请求,服务执行模块用于执行与业务请求相应的服务操作,链路跟踪数据生成模块用于采集(服务节点执行与业务请求相应的服务操作过程中产生的)日志数据,过滤、脱敏、转化后得到链路跟踪数据。
数据监测设备包括数据存储模块、数据分析模块和异常告警模块,数据存储模块用于存储链路跟踪数据(链路跟踪数据存储之前,先提取链路跟踪数据中的Tracing ID,并将Tracing ID与链路跟踪数据相关联),数据分析模块用于识别链路跟踪数据对应的服务节点是否符合预设异常标准,异常告警模块用于根据识别出的、符合预设异常标准的服务节点,生成异常捕获信息(异常捕获信息包括符合预设异常标准的服务节点以及对应的链路跟踪数据)。
工作原理:分布式系统中多个服务节点在执行与业务请求相应的服务操作后,生成链路跟踪数据并传输至数据监测设备,数据监测设备在收到请求链路跟踪命令后,根据请求链路跟踪命令中携带的Tracing ID,从存储的所有链路跟踪数据中获取关联的链路跟踪数据,并对所有关联的链路跟踪数据进行分析,识别出符合预设异常标准的服务节点,生成异常捕获信息,从而便于运维人员快速、准确的定位故障的服务节点。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (7)

1.一种基于Web请求的链路跟踪和异常诊断方法,其特征在于,包括以下步骤:
S1、接收来自用户的业务请求,分布式系统中多个服务节点执行与业务请求相应的服务操作;
S2、服务节点在执行完成服务操作后,生成链路跟踪数据,并发送至数据监测设备;
S3、数据监测设备接收各个服务节点的链路跟踪数据,获取链路跟踪数据中的TracingID,并将Tracing ID与链路跟踪数据相关联,之后存储所有的链路跟踪数据;
S4、数据监测设备接收到请求链路跟踪命令后,获取请求链路跟踪命令中携带的Tracing ID,根据该Tracing ID从存储的所有链路跟踪数据中获取关联的链路跟踪数据;
S5、对所有关联的链路跟踪数据进行分析,识别出符合预设异常标准的服务节点,生成异常捕获信息。
2.根据权利要求1所述的一种基于Web请求的链路跟踪和异常诊断方法,其特征在于,所述链路跟踪数据还包括Span ID和服务操作执行信息,所述服务操作执行信息包括执行结果、调用节点标识、业务请求处理起止时间和业务请求处理时长。
3.根据权利要求2所述的一种基于Web请求的链路跟踪和异常诊断方法,其特征在于,在所述步骤S4中,数据监测设备根据链路跟踪数据中执行结果和业务请求处理时长,识别链路跟踪数据对应的服务节点是否符合预设异常标准。
4.根据权利要求3所述的一种基于Web请求的链路跟踪和异常诊断方法,其特征在于,调用节点标识用于关联当前服务节点与被调用的其他服务节点,调用节点标识包括当前服务节点对被调用服务节点的调用时间。
5.根据权利要求4所述的一种基于Web请求的链路跟踪和异常诊断方法,其特征在于,在所述步骤S4中,数据监测设备根据调用节点标识,比较当前服务节点和被调用服务节点的业务请求处理起止时间,识别服务节点是否符合预设异常标准。
6.根据权利要求1所述的一种基于Web请求的链路跟踪和异常诊断方法,其特征在于,所述分布式系统包括多个服务节点,所述服务节点包括请求接收模块、服务执行模块和链路跟踪数据生成模块,所述请求接收模块用于接收来自用户或其他服务节点的业务请求,所述服务执行模块用于执行与业务请求相应的服务操作,所述链路跟踪数据生成模块用于采集日志数据,过滤、脱敏、转化后得到链路跟踪数据。
7.根据权利要求1所述的一种基于Web请求的链路跟踪和异常诊断方法,其特征在于,数据监测设备包括数据存储模块、数据分析模块和异常告警模块,所述数据存储模块用于存储链路跟踪数据,所述数据分析模块用于识别链路跟踪数据对应的服务节点是否符合预设异常标准,所述异常告警模块用于根据识别出的、符合预设异常标准的服务节点,生成异常捕获信息。
CN202211045533.2A 2022-08-29 2022-08-29 一种基于Web请求的链路跟踪和异常诊断方法 Pending CN115529227A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211045533.2A CN115529227A (zh) 2022-08-29 2022-08-29 一种基于Web请求的链路跟踪和异常诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211045533.2A CN115529227A (zh) 2022-08-29 2022-08-29 一种基于Web请求的链路跟踪和异常诊断方法

Publications (1)

Publication Number Publication Date
CN115529227A true CN115529227A (zh) 2022-12-27

Family

ID=84697367

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211045533.2A Pending CN115529227A (zh) 2022-08-29 2022-08-29 一种基于Web请求的链路跟踪和异常诊断方法

Country Status (1)

Country Link
CN (1) CN115529227A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117176802A (zh) * 2023-11-02 2023-12-05 太平金融科技服务(上海)有限公司 一种业务请求的全链路监控方法、装置、电子设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110069354A (zh) * 2019-04-15 2019-07-30 必成汇(成都)科技有限公司 微服务全链路跟踪方法及微服务架构
CN112910945A (zh) * 2020-12-08 2021-06-04 江苏苏宁云计算有限公司 请求链路跟踪方法和业务请求处理方法
CN114185708A (zh) * 2021-12-15 2022-03-15 中国农业银行股份有限公司 基于分布式链路追踪的数据分析方法、装置和电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110069354A (zh) * 2019-04-15 2019-07-30 必成汇(成都)科技有限公司 微服务全链路跟踪方法及微服务架构
CN112910945A (zh) * 2020-12-08 2021-06-04 江苏苏宁云计算有限公司 请求链路跟踪方法和业务请求处理方法
CN114185708A (zh) * 2021-12-15 2022-03-15 中国农业银行股份有限公司 基于分布式链路追踪的数据分析方法、装置和电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117176802A (zh) * 2023-11-02 2023-12-05 太平金融科技服务(上海)有限公司 一种业务请求的全链路监控方法、装置、电子设备及介质
CN117176802B (zh) * 2023-11-02 2024-01-16 太平金融科技服务(上海)有限公司 一种业务请求的全链路监控方法、装置、电子设备及介质

Similar Documents

Publication Publication Date Title
US8375255B2 (en) Device and method for detecting and diagnosing correlated network anomalies
CN111831514A (zh) 一种设备监控方法、装置、设备及存储介质
CN111176879A (zh) 设备的故障修复方法及装置
CN107508722B (zh) 一种业务监控方法和装置
CN108521339B (zh) 一种基于集群日志的反馈式节点故障处理方法及系统
CN110716842B (zh) 集群故障检测方法和装置
CN101997925A (zh) 具有预警功能的服务器监控方法及其系统
CN112350854B (zh) 一种流量故障定位方法、装置、设备及存储介质
CN111046011A (zh) 日志收集方法、系统、节点、电子设备及可读存储介质
CN110209518A (zh) 一种多数据源日志数据集中收集存储方法及装置
CN110191000A (zh) 一种数据处理方法、消息追踪监控方法和分布式系统
CN115529227A (zh) 一种基于Web请求的链路跟踪和异常诊断方法
WO2015187001A2 (en) System and method for managing resources failure using fast cause and effect analysis in a cloud computing system
CN109802842B (zh) 应用拓扑的生成方法及相关设备
CN111752741A (zh) 一种系统性能检测的方法及装置
CN115357418A (zh) 微服务故障检测方法、装置、存储介质及计算机设备
CN113868021A (zh) 一种基于检测服务状态并自动重启的方法
CN116594840A (zh) 基于elk的日志故障采集与分析方法、系统、设备及介质
CN116302989A (zh) 压力测试方法及系统、存储介质、计算机设备
CN110572291A (zh) 面向分布式系统实现架构自动识别功能的系统及其方法
CN114448935A (zh) 一种ip地址可用性告警自动推送处理方法及装置
CN114338347A (zh) 基于Ampere平台的故障信息带外获取方法及装置
CN114629786A (zh) 日志实时分析方法、装置、存储介质及系统
CN113852984A (zh) 一种无线终端接入监控系统、方法、电子设备及可读存储装置
KR20170127876A (ko) 로그 결함 분석 기반 장애 대응 시스템 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination