WO2017071134A1

WO2017071134A1 - 分布式跟踪系统

Info

Publication number: WO2017071134A1
Application number: PCT/CN2016/072668
Authority: WO
Inventors: 许丹霞; 刘寅; 郑宇�
Original assignee: 北京汇商融通信息技术有限公司
Priority date: 2015-10-28
Filing date: 2016-01-29
Publication date: 2017-05-04
Also published as: CN105224445A; CN105224445B

Abstract

一种分布式跟踪系统，包括日志收集器，消息中间件集群，分布式流计算集群，统一配置中心，分布式文件系统，数据库，分布式跟踪系统服务集群，分布式跟踪系统web服务器，分布式文件存储和数据处理集群。该分布式跟踪系统能够高效地分析系统运行情况。

Description

分布式跟踪系统

技术领域

本发明涉及分布式跟踪系统，特别是涉及一种能够高效地分析系统运行情况的分布式跟踪系统。

背景技术

随着技术不断发展，如今互联网领域大多数后台服务都已经完成了SOA(面向服务的体系结构)化，所以对业务的跟踪可以直接简化为对服务调用框架的跟踪，所以越来越多的跟踪系统也涌现出来。目前分布式跟踪系统理论模型基本来源于GOOGLE的Dapper，它详细的阐述了如何对请求调用链进行跟踪，Dapper最初是为了追踪在线服务系统的请求处理过程。比如在搜索系统中，用户的一个请求在系统中会经过多个子系统的处理，而且这些处理是发生在不同机器甚至是不同集群上的，当请求处理发生异常时，需要快速发现问题，并准确定位到是哪个环节出了问题，这是非常重要的，Dapper就是为了解决这样的问题。但是Dapper只是为解决请求调用这一问题提出了理论模型和简单实现，功能比较单一，并不能提供全面的解决方案。

本发明的分布式跟踪系统是在Dapper模型的基础上进行扩展实现，提供了完整的分布式系统的业务跟踪的解决方案。更符合现有SOA架构的系统架构需求，可以在不影响现有系统性能的前提下，收集分析多台应用服务器的信息，开发人员可以实时监控系统运行状态，追踪业务请求链，根据分析结果查找系统的性能瓶颈，优化调整系统配置提前预防和解决问题，同时本发明的分布式跟踪系统提供实时预警功能保证在系统出现异常或宕机的情况下可以及时通知预警，保证系统的稳定性和高可用性。

发明内容

以往针对SOA这种分布式架构的监控主要依赖于各种日志的分析，如系统应用日志，jvm日志，操作系统日志等。通过日志解析可以分析出系统的运行情况和执行效率。但日志分布分散，搜集日志统一分析就成了问题，而且日志的内容也是需要依赖于开发人员和底层技术代码的支撑，不能准确定位想要关注分析的内容。通过全量分析日志也不是一个好的解决方案，分析效率和结果不容乐观，而且运营成本也是相当高的。

目前也有一些监控系统可以监控中间件的运行状态，实时显示系统运行状态，但关注的目标主要还是性能方面，如cpu、内存、线程、tps和pv等指标，并不能及时反馈整体系统的运行情况，而且这类系统的功能都比较单一，只能针对某一中间件如数据库、消息中间件等。只能横向分析性能平均值，不能够纵向分析系统某一流程的执行情况。

本发明的目的是解决分布式后台服务调用链的跟踪、搜集和分析，其中包括：

1.调用链的跟踪，通过代码在中间件埋点来记录日志，用一个全局的ID将分布式请求串接起来。

2.可变采样，可参数化配置采样，使用一个采样期望率来标识单位时间内采样的追踪，避免全量收集带来的大数据量压力，利于从跟踪数据中准确的分析。

3.多种数据采集，同时采集多种数据，包括请求调用链、系统状态参数、异常堆栈和JVM GClog等。

4.日志收集和存储，通过异步线程将缓存到内存队列的日志发送到消息队列中，统一通过storm进行汇总存储，同时支持实时汇总hbase、mysql和离线汇总hdfs存储。

5.调用链分析，支持离线汇总分析和实时的单链路分析。

6.实时预警，实现指标可配置，根据配置指标和分析结果，对不符合要求的分析结果进行预警。

为实现本发明之目的，采用以下技术方案予以实现：

一种分布式跟踪系统，包括日志收集器，消息中间件集群，分布式流计算集群，统一配置中心，分布式文件系统，数据库，分布式跟踪系统服务集群，分布式跟踪系统web服务器，分布式文件存储和数据处理集群，其中：

日志收集器，用于读取应用集群的日志以及实时读取统一配置中心的配置数据，并将读取到的日志写入日志收集器的缓冲队列；

消息中间件集群，用于从日志收集器实时读取日志，并将读取到的日志进行缓冲存储；

分布式流计算集群，用于读取消息中间件集群中的日志，根据读取的统一配置中心的配置数据实时分析处理读取的日志，之后将实时处理结果存入数据库中，并将读取的全量日志写入分布式文件系统进行存储；

分布式文件存储和数据处理集群，用于对分布式文件系统中存储的日志进行离线分布式数据分析，并将分析结果回写到分布式文件系统；

分布式跟踪系统服务集群，用于读取分布式文件系统中的离线分析结果，合并分析数据后将其存入数据库中；

分布式跟踪web服务器，用于提供查询服务和对统一配置中心进行维护。

所述的分布式跟踪系统，优选的：

日志收集器根据从统一配置中心读取的配置数据中的日志收集策略读取所需的日志。

所述的分布式跟踪系统，优选的：分布式流计算集群，对读取的日志进行的处理包括：

(1)验证：对日志中不符合规范的数据进行过滤，以达到能够处理的标准；

(2)分析：对日志中的调用链进行统计，分析调用来源和调用依赖；

(3)预警：对于日志中的错误信息或分析出有问题的调用链，结合从统一配置中心读取的告警配置信息，进行预警提示；

(4)存储：将日志全量存储到分布式文件系统以及将上述(2)中的分析结果存入数据库。

所述的分布式跟踪系统，优选的：

分布式跟踪系统服务集群为分布式跟踪web服务器提供查询服务。

所述的分布式跟踪系统，优选的：

统一配置中心基于zookeeper实现分布式统一配置服务。

一种分布式跟踪方法，包括以下步骤：

日志收集器读取应用集群的日志以及实时读取统一配置中心的配置数据，并将读取到的日志写入日志收集器的缓冲队列；

消息中间件集群从日志收集器实时读取日志，并将读取到的日志进行缓冲存储；

分布式流计算集群读取消息中间件集群中的日志，对日志进行实时处理，之后将实时处理结果存入数据库中，并将读取的全量日志写入分布式文件系统进行存储；

分布式文件存储和数据处理集群对分布式文件系统中存储的日志进行离线分布式数据分析，并将分析结果回写到分布式文件系统；

分布式跟踪系统服务集群读取分布式文件系统中的离线分析结果，合并分析数据后将其存入数据库中；

通过分布式跟踪web服务器查询日志分析结果以及对统一配置中心进行维护。

所述的分布式跟踪方法，优选的：

所述的分布式跟踪方法，优选的：分布式流计算集群对读取的日志进行的处理包括：

所述的分布式跟踪方法，优选的：

应用集群的日志生成策略主要通过在服务中间件添加拦截器或代码嵌入两种方式实现，一次请求生成一个上下文，用全局唯一的TraceID进行标识，通过ReqID标识日志的顺序和嵌套关系，服务中间件通过分布式跟踪系统服务集群提供的API生成日志后，将日志写到缓存队列中。

所述的分布式跟踪方法，优选的：分布式文件存储和数据处理集群对多条调用链路通过TraceID进行合并汇总，根据ReqID分析调用链的调用关系和依赖情况。

本发明为实现发明目的采用了以下的方式：

1.通过调取api的方式将日志写入本地文件。

2.通过基于java多线程实现的日志收集器读取日志文件写入消息队列中。

3.消息中间件基于kafka实现，提供日志的缓存和异步读写功能。

4.通过基于storm实现的分布式分析集群，读取消息队列中的日志进行验证分析，对单条调用链进行分析并将结果存储到数据库中，同时将全量日志存储到离线数据分析集群中。

5.通过基于hadoop实现的离线数据分析集群，提供hdfs存储和大数据离线分析功能。汇总单条调用链信息到完整调用链信息，并分析计算如pv、tps、依赖度等信息，最后将结果回写到hdfs中。

6.通过基于hbase和mysql两种数据库的方式提供数据库存储服务，存储调用链分析结果信息。

7.通过基于java架构实现的分布式跟踪系统集群，将离线数据分析集群计算分析的结果整合到数据库中。

8.通过分布式跟踪系统web服务器提供可视化界面进行分析结果展示和查询，同时支持对配置中心的配置功能。

9.通过基于zookeeper的统一配置中心，提供实时的配置信息读写服务。

附图说明

图1为本发明分布式跟踪系统示意图；

图2为本发明应用服务调用链示意图。

具体实施方式

如图1所示，分布式跟踪系统包括：

1.日志收集器：读取应用集群日志以及实时读取统一配置中心的配置数据。其中应用集群通过服务中间件产生日志并将日志写入日志文件，日志收集器读取该应用集群的日志。应用集群生成日志的操作可以基于disruptor实现并提供标准api，通过设置拦截器或者代码嵌入的方式调用api，将日志写入缓冲队列，并异步保存到本地日志文件中。日志收集器将读取的日志写入日志收集器的缓冲队列，如ringbuffer(环形缓冲区)。日志收集器实时读取统一配置中心的配置数据，根据配置数据的日志收集策略读取所需的日志，例如基于包括日志级别；具体业务类型日志如订单或商品；收集规则如实时收集、定时收集或者按日期收集等；请求类型如写操作或读操作；请求来源类型如http请求或接口请求等和中间件ip之类的采样标准，过滤日志并将其存储在日志收集器的缓冲队列中，存储成功后开启独立的线程，异步发送到消息中间件集群。日志收集器收集的日志包括：请求调用链、系统状态参数、异常堆栈和JVM GClog等。

2.消息中间件集群：用于实时收集日志，其可基于kafka(是linkedin用于日志处理的分布式消息队列)实现，提供日志消息队列缓冲功能，实现日志消息异步传输。

3.Storm(一种开源的、大数据处理系统)集群：基于storm实现的分布式流式处理框架，从消息中间件集群读取日志，接收日志消息队列中的日志，并根据读取的配置中心的配置信息实时分析处理日志，主要处理操作如下：

(1)验证：主要是对一些不符合规范的数据进行过滤，以达到系统能够处理的标准，包括对日志格式、请求链是否可分析、上下文信息是否完整等信息进行验证。Storm读取消息队列中的日志进行验证分析，对单条调用链进行分析并将结果存储到数据库中，同时将全量日志存储到离线数据分析集群中。

(2)分析：主要是对调用链进行统计，根据ReqID统计单条调用链的调用接口数、请求响应时间、cpu、内存和jvm(Java虚拟机)性能参数等数据，并根据ReqID来分析调用来源，调用依赖，并将分析结果写入Hbase或Mysql，同时将全量日志存入hdfs。

(3)预警：对于日志中的错误信息或分析出有问题的调用链，综合配置中心中的告警配置信息，通知相关的开发和运维人员。如根据统一配置中心的配置文件信息发现日志错误，则向配置文件中预先设定的预警信息接收地址(如邮箱地址等)发送预警信息-日志错误信息。

(4)存储：支持日志全量存储到hdfs和分析结果存入hbase或mysql。

4.分布式文件存储和数据处理集群，可为Hadoop集群：基于hadoop实现的分布式文件存储和数据处理框架，实现全量日志存储，通过MapReduce实现对日志的离线分布式数据分析，将具有相同TraceID调用链信息进行汇总，同时分析计算具体的性能参数，如tps(每秒处理请求数)、pv(访问并发数)、qps(每秒查询率)等，并将离线数据分析结果回写到hdfs。通过基于hadoop实现的离线数据分析集群，提供hdfs存储和大数据离线分析功能。汇总单条调用链信息到完整调用链信息，并分析计算如pv、tps、依赖度等信息，最后将结果回写到hdfs中。

5.分布式跟踪系统服务集群：读取hdfs中的离线统计分析结果，根据读取结果中的TraceID，将合并统计后的数据存入hbase或mysql中，补全具有相同TraceID的单条调用链分析结果(如tps(每秒处理请求数)、pv(访问并发数)、qps(每秒查询率)等)，同时存储完整的调用链分析结果，为分布式跟踪系统-web服务器提供查询服务。

6.分布式跟踪系统web服务器：基于web容器提供查询服务，通过UI界面实现分析结果可视化。配置中心维护功能，主要是对日志采样参数、错误预警级别参数、日志收集服务器地址等信息进行配置。

7.统一配置中心：基于zookeeper实现分布式统一配置服务，时效性和数据安全性都能得到保证，为分布式跟踪系统提供配置服务。

8.分布式文件系统：可以是HDFS，存储全量日志等。

结合图2，对本发明分布式跟踪系统具体工作过程进行描述。

1.日志生成策略：

如图2所示，一次服务调用由4个采集点组成，分别是ClientSend(客户端发送)、ServerRec(服务端接收)、ServerSend(服务端发送)、ClientRec(客户端接收)。ClientSend和ClientRec共同组成Client端请求上下文，ServerRec和ServerSend共同组成Sever 端请求上下文，其中Server端的ServerRec由Client发送的上下文信息组合而成。

日志的生成策略主要通过在服务中间件添加拦截器和代码嵌入两种方式实现，一次请求生成一个上下文用全局唯一的TraceID进行标识，对于本地业务通过threadlocal存储上下文，不同应用间通过网络传输上下文。

如表1所示，日志上下文主要包括以下内容：TraceID、ReqID、ServiceID、ServiceName、ServiceType、ProcessTime、NodeIP。其中TraceID是跟踪标识id，可以关联多个日志上下文，而ReqID则可以标识日志的顺序和嵌套关系，如图2所示，可以根据ReqID分析所有具有相同TraceID的日志的先后顺序和层级关系。

表1

2.日志存储：

日志的存储主要分为各个服务中间件的日志存储和收集分析之后的日志存储。

(1)服务中间件日志存储：服务中间件通过分布式跟踪系统提供的API生成日志后，异步的写到基于RingBuffer实现的缓存队列中，并异步保存到本地日志文件中。通过日志收集器日志文件中的日志，并进行采样之后存储的本地磁盘，同时通过线程异步发送到消息队列中，完成日志收集。

(2)收集分析后日志存储，主要依靠storm分布式流处理框架实现，通过读取消息队列中的日志，集中分析之后，将实时分析结果存入hbase或mysql中，同时将全量日志写入hdfs存储，通过hadoop离线分析汇总同一调用链的日志，最后由Nymph服务合并离线分析结果存储到hbase或mysql中。

3.日志分析

通过TraceID和ReqID对请求调用链进行链路分析，主要有实时分析、离线分析和合并分析三种方式：

(1)实时分析，Storm对单条日志信息直接分析，得到调用链的调用情况、错误信息和性能指标等信息直接入库。

(2)离线分析，Hadoop对多条调用链链路通过TraceID进行合并汇总，根据ReqID分析调用链的调用关系和依赖情况等。

(3)合并分析，分布式跟踪系统服务集群通过TraceID将离线分析的结果，如调用关系和依赖情况等，合并到实时分析结果中，最后将合并结果写到数据库中。

通过本发明能够实现以下效果：

1.定位慢服务：根据调用链生成的树形结构，可以逐层检查接口依赖情况，分析哪个服务为性能瓶颈。

2.业务逻辑分析定位：通过调用链的时序图和响应时间可以分析调用链的业务逻辑是否正确。对于正确的业务逻辑调用链，可以根据请求响应时间、pv、tps和成功率等性能指标确定效率低下的性能瓶颈服务，找到性能瓶颈服务后，进一步定位产生问题的业务逻辑点。

3.服务监控：日志收集器除了收集日志以外还支持收集服务中间件的性能参数，并将收集信息写入日志上下中，通过数据处理集群进行数据分析并写入到数据库中，通过分布式跟踪系统web服务器实现监控所有服务状态和查看服务依赖关系，包括服务名、方法名、调用时长、异常信息、QPS和依赖度等。同时支持查看服务器运行状态，包括ip(地址)、cpu、内存、io(输入输出)和磁盘使用情况等。

4.实时预警：在分析日志的同时可以及时发现错误信息并通知相关开发和运维人员处理。

Claims

一种分布式跟踪系统，包括日志收集器，消息中间件集群，分布式流计算集群，统一配置中心，分布式文件系统，数据库，分布式跟踪系统服务集群，分布式跟踪系统web服务器，分布式文件存储和数据处理集群，其特征在于：

日志收集器，用于读取应用集群的日志以及实时读取统一配置中心的配置数据，并将读取到的日志写入日志收集器的缓冲队列；

消息中间件集群，用于从日志收集器实时读取日志，并将读取到的日志进行缓冲存储；

分布式流计算集群，用于读取消息中间件集群中的日志，根据读取的统一配置中心的配置数据实时分析处理读取的日志，之后将实时处理结果存入数据库中，并将读取的全量日志写入分布式文件系统进行存储；

分布式文件存储和数据处理集群，用于对分布式文件系统中存储的日志进行离线分布式数据分析，并将分析结果回写到分布式文件系统；

分布式跟踪系统服务集群，用于读取分布式文件系统中的离线分析结果，合并分析数据后将其存入数据库中；

分布式跟踪web服务器，用于提供查询服务和对统一配置中心进行维护。
根据权利要求1所述的分布式跟踪系统，其特征在于：

日志收集器根据从统一配置中心读取的配置数据中的日志收集策略读取所需的日志。
根据权利要求1所述的分布式跟踪系统，其特征在于：分布式流计算集群，对读取的日志进行的处理包括：

(1)验证：对日志中不符合规范的数据进行过滤，以达到能够处理的标准；

(2)分析：对日志中的调用链进行统计，分析调用来源和调用依赖；

(3)预警：对于日志中的错误信息或分析出有问题的调用链，结合从统一配置中心读取的告警配置信息，进行预警提示；

(4)存储：将日志全量存储到分布式文件系统以及将上述(2)中的分析结果存入数据库。
根据权利要求1所述的分布式跟踪系统，其特征在于：

分布式跟踪系统服务集群为分布式跟踪web服务器提供查询服务。
根据权利要求1所述的分布式跟踪系统，其特征在于：

统一配置中心基于zookeeper实现分布式统一配置服务。
一种分布式跟踪方法，其特征在于包括以下步骤：

日志收集器读取应用集群的日志以及实时读取统一配置中心的配置数据，并将读取到的日志写入日志收集器的缓冲队列；

消息中间件集群从日志收集器实时读取日志，并将读取到的日志进行缓冲存储；

分布式流计算集群读取消息中间件集群中的日志，对日志进行实时处理，之后将实时处理结果存入数据库中，并将读取的全量日志写入分布式文件系统进行存储；

分布式文件存储和数据处理集群对分布式文件系统中存储的日志进行离线分布式数据分析，并将分析结果回写到分布式文件系统；

分布式跟踪系统服务集群读取分布式文件系统中的离线分析结果，合并分析数据后将其存入数据库中；

通过分布式跟踪web服务器查询日志分析结果以及对统一配置中心进行维护。
根据权利要求6所述的分布式跟踪方法，其特征在于：

日志收集器根据从统一配置中心读取的配置数据中的日志收集策略读取所需的日志。
根据权利要求6所述的分布式跟踪方法，其特征在于：分布式流计算集群对读取的日志进行的处理包括：

(1)验证：对日志中不符合规范的数据进行过滤，以达到能够处理的标准；

(2)分析：对日志中的调用链进行统计，分析调用来源和调用依赖；

(3)预警：对于日志中的错误信息或分析出有问题的调用链，结合从统一配置中心读取的告警配置信息，进行预警提示；

(4)存储：将日志全量存储到分布式文件系统以及将上述(2)中的分析结果存入数据库。
根据权利要求6所述的分布式跟踪方法，其特征在于：

应用集群的日志生成策略主要通过在服务中间件添加拦截器或代码嵌入两种方式实现，一次请求生成一个上下文，用全局唯一的TraceID进行标识，通过ReqID标识日志的顺序和嵌套关系，服务中间件通过分布式跟踪系统服务集群提供的API生成日志后，将日志写到缓存队列中。
根据权利要求9所述的分布式跟踪方法，其特征在于：分布式文件存储和数据处理集群对多条调用链路通过TraceID进行合并汇总，根据ReqID分析调用链的调用关系和依赖情况。