CN114143369A - 一种云平台的服务监控系统 - Google Patents

一种云平台的服务监控系统 Download PDF

Info

Publication number
CN114143369A
CN114143369A CN202111503792.0A CN202111503792A CN114143369A CN 114143369 A CN114143369 A CN 114143369A CN 202111503792 A CN202111503792 A CN 202111503792A CN 114143369 A CN114143369 A CN 114143369A
Authority
CN
China
Prior art keywords
processing
service
module
link
log
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111503792.0A
Other languages
English (en)
Inventor
刘必起
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Human Horizons Shanghai Internet Technology Co Ltd
Original Assignee
Human Horizons Shanghai Internet Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Human Horizons Shanghai Internet Technology Co Ltd filed Critical Human Horizons Shanghai Internet Technology Co Ltd
Priority to CN202111503792.0A priority Critical patent/CN114143369A/zh
Publication of CN114143369A publication Critical patent/CN114143369A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/146Markers for unambiguous identification of a particular session, e.g. session cookie or URL-encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/66Arrangements for connecting between networks having differing types of switching systems, e.g. gateways
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及计算机程序监控技术领域,具体涉及一种云平台的服务监控系统,包括:网关模块,接收用户发出的访问请求;跟踪模块,生成一与访问请求对应的全局跟踪标识;多个微服务,微服务对访问请求进行处理;日志模块,日志模块采集并记录处理行为和全局跟踪标识;链路跟踪模块,接收全局跟踪标识并建立处理链路;日志模块响应检索请求并根据处理链路生成对应于访问请求的处理日志。本发明的有益效果在于:通过设置与访问请求相关联的全局服务标识,可以有效地对单次访问行为进行跟踪,并关联到访问请求整体处理过程中的多个微服务,以实现较好的行为跟踪效果,便于在故障时快速定位到特定的微服务及相关的处理行为,以进行后续的处理工作。

Description

一种云平台的服务监控系统
技术领域
本发明涉及计算机程序监控技术领域,具体涉及一种云平台的服务监控系统。
背景技术
云原生是一种构建和运行应用程序的方法,其词源(CloudNative)是一个组合词,Cloud+Native。Cloud表示应用程序位于云中,而不是传统的数据中心;Native表示应用程序从设计之初即考虑到云的环境,原生为云而设计,在云上以最佳姿势运行,充分利用和发挥云平台的弹性+分布式优势。通过将应用程序整体构建在云上以实现服务的模块化、高部署性、易于测试、可替换等特性。因此,将部署在云上的应用程序进行云原生化,以实现在云平台上更好的特性是当前较优的技术发展方向。通过设置云原生平台可以快速构建大量微服务以实现相应的用户需求,并且使得每个微服务可以在运行过程中快速迭代,以较好地满足敏捷开发的需求。
现有技术中,针对服务的监控通常采用埋点法,即对服务的特定行为或事件进行跟踪。该方法是一种常用的数据采集方法。但是,该方法需要在服务开发的过程中对服务的源代码进行改造以实现数据采集,这导致了服务的整体开发和测试流程延长,不能很好地满足敏捷开发的需求。并且由于云平台中通过设置大量的微服务来实现相关业务,通过现有技术采集到的数据量较为庞大,无法直观地反映出每个微服务的具体的处理行为,使得监控效率低下,日志分析困难。
发明内容
针对现有技术中存在的上述问题,现提供一种云平台的服务监控系统。
具体技术方案如下:
一种云平台的服务监控系统,包括:
网关模块,所述网关模块与至少一个外部的用户信号连接,并接收所述用户发出的访问请求;
跟踪模块,所述跟踪模块生成一与所述访问请求对应的全局跟踪标识;
多个微服务,所述微服务对所述访问请求进行处理;
日志模块,所述日志模块采集并记录所述微服务的处理行为和所述处理行为对应的所述全局跟踪标识;
链路跟踪模块,所述链路跟踪模块接收所述全局跟踪标识并建立处理链路;
所述日志模块响应一检索请求并根据所述处理链路生成对应于所述访问请求的处理日志。
优选地,所述服务监控系统还包括:
多个与所述微服务对应的代理服务,所述代理服务根据所述处理行为生成元数据,所述元数据中包括所述全局跟踪标识;
链路跟踪模块,所述链路跟踪模块连接所述代理服务并接收所述元数据;
所述链路跟踪模块根据所述元数据建立所述处理链路,所述处理链路用于关联处理所述访问请求的多个所述微服务。
优选地,所述日志模块包括:
服务关联子模块,所述服务关联子模块连接所述链路跟踪模块并接收所述处理链路;
所述服务关联子模块根据所述处理链路和所述全局跟踪标识查找多个与所述处理链路对应的所述微服务;
行为检索子模块,所述行为检索子模块连接所述服务关联子模块,并根据所述检索请求自一日志存储子模块中获取所述微服务的处理行为,并生成所述处理日志;
所述日志存储子模块中存储有所述微服务的处理行为,以及所述处理行为对应的全局跟踪模块。
优选地,所述服务监控系统还包括:
资源监控模块,所述资源监控模块自所述云平台中获取资源信息,所述资源信息中包括每个所述微服务在不同时间点占用的硬件资源;
所述资源监控模块连接所述链路跟踪模块,根据所述处理链路和所述资源信息生成所述微服务在进行所述处理行为时占用的所述硬件资源。
优选地,所述元数据还包括:业务方法标识,所述业务方法标识与所述微服务的所述处理行为对应,用于标记所述微服务的所述处理行为。
优选地,所述链路跟踪模块包括:
元数据提取子模块,所述元数据提取子模块自所述代理服务中获取所述元数据;
全局链路建立子模块,所述全局链路建立子模块连接所述元数据提取子模块,根据所述元数据建立所述处理链路;
行为绑定子模块,所述行为绑定子模块根据所述处理链路和所述业务方法标识在所述处理链路中添加所述微服务的所述处理行为。
优选地,所述日志采集模块还包括:
版本跟踪子模块,所述版本跟踪子模块连接所述日志存储子模块,所述版本跟踪子模块根据所述全局跟踪标识自所述日志存储子模块中获取所述微服务的多个版本号。
优选地,多个所述微服务组成一微服务组,所述微服务组中的多个所述微服务依次对所述访问请求进行处理;
所述微服务完成对所述访问请求的处理后,将处理后的访问请求和所述全局跟踪标识转发至下一个所述微服务。
优选地,所述云平台接收到访问请求后,生成一对应于所述访问请求的所述全局跟踪标识,并调用至少一个所述微服务以处理所述访问请求;
所述云平台还采集所述微服务的处理行为和所述全局跟踪标识并存入一日志;
所述云平台根据所述全局跟踪标识生成所述处理链路;
所述云平台根据所述处理链路查询所述日志;
所述云平台根据所述日志的查询结果生成对应于所述访问请求的行为日志;
所述行为日志中以时间顺序记录有处理所述访问请求的所述微服务和所述处理行为。
优选地,还包括:
所述云平台根据所述全局跟踪标识生成所述处理链路;
所述云平台还获取所述云平台中每个所述微服务在所述不同时间点的硬件资源占用情况;
所述云平台根据所述处理链路和所述硬件资源占用情况生成所述访问请求的资源占用信息。
优选地,所述服务监控系统还包括:
可视化界面,所述可视化界面连接所述资源监控模块和所述日志模块;
所述可视化界面接收所述硬件资源;
所述可视化界面根据所述硬件资源生成并显示资源图表;
所述可视化界面显示所述处理日志。
上述技术方案具有如下优点或有益效果:通过设置与访问请求相关联的全局服务标识,可以有效地对单次访问行为进行跟踪,并关联到访问请求整体处理过程中的多个微服务,以实现较好的行为跟踪效果,便于在故障时快速定位到特定的微服务及相关的处理行为,以进行后续的处理工作。
附图说明
参考所附附图,以更加充分的描述本发明的实施例。然而,所附附图仅用于说明和阐述,并不构成对本发明范围的限制。
图1为本发明实施例的整体示意图;
图2为本发明实施例中日志模块示意图;
图3为本发明实施例中链路跟踪模块示意图;
图4为本发明实施例中监控方法示意图;
图5为本发明实施例中另一种监控方法示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
本发明包括:
一种云平台的服务监控系统,适用于一云原生平台,云原生平台中设置有多个微服务2A、2B、2C,包括:
网关模块1,网关模块1与至少一个外部的用户信号连接,并接收用户发出的访问请求;
跟踪模块2A1,跟踪模块2A1生成一与访问请求对应的全局跟踪标识;
多个微服务2A、2B、2C,微服务2A、2B、2C对访问请求进行处理;
日志模块3,日志模块3采集并记录微服务2A、2B、2C的处理行为和处理行为对应的全局跟踪标识;
链路跟踪模块5,链路跟踪模块5接收全局跟踪标识并建立处理链路;
日志模块3响应一检索请求并根据处理链路生成对应于访问请求的处理日志。
具体地,针对现有技术中存在的无法针对云原生平台中的多个微服务2A、2B、2C进行有效监控的问题,本发明提供了一种基于全局跟踪标识(trace_ID)的监控系统。当用户每一次发起访问请求时,都会生成一个对应于本次访问请求的全局跟踪标识,用于标记处理本次访问请求的微服务2A、2B、2C,随后由日志采集模采集相应的行为,随后根据全局跟踪标识生成某次访问请求的整体处理流程以及对应的处理行为,便于在发生故障时,根据触发故障的访问请求进行快速定位,找出相关的微服务2A、2B、2C并进行排障处理。
在具体实施过程中,云原生平台可以是现有技术中任意一种云原生平台。在一种实施例中,采用了Kubernetes作为上述微服务2A、2B、2C的容器,并选用Istio作为容器的监控服务,便于有效地对上述微服务2A、2B、2C进行管理。网关模块1可以是API Gateway。日志模块可以包括一部署于云原生平台中的Promtail客户端,其连接多个微服务2A、2B、2C以采集微服务2A、2B、2C的日志发送至日志采集模块。跟踪模块2A1在实际实施过程中可以是微服务2A、2B、2C中的一个子模块或子函数,根据第一个接收到访问请求的微服务的不同可以是设置在微服务2A、2B、2C任意一个中的子模块。
在一种较优的实施例中,服务监控系统还包括:
多个与微服务2A、2B、2C对应的代理服务4A、4B、4C,代理服务4A、4B、4C根据处理行为生成元数据,元数据中包括全局跟踪标识;
链路跟踪模块5连接代理服务4A、4B、4C并接收元数据;
链路跟踪模块5根据元数据建立访问请求的处理链路,处理链路用于关联处理访问请求的多个微服务2A、2B、2C。
具体地,针对现有技术中监控服务的具体行为需要在服务中埋点的问题,本发明所公开的技术方案采用了对应于微服务2A、2B、2C的代理服务4A、4B、4C作为对微服务2A、2B、2C的监控手段。当微服务2A、2B、2C对访问请求进行处理或触发特定事件时,代理服务4A、4B、4C会记录本次处理行为和对应于本次访问请求的全局跟踪标识,并根据处理行为、全局跟踪标识、处理行为对应的业务方法标识、时间戳等生成相应的元数据,并转发至链路跟踪模块5,由链路跟踪模块5生成对应于本次访问请求的整体的处理链路。作为可选的实施方式,处理链路以一可视化图形的方式显示在用户监控界面(GUI)上。
进一步地,在具体实施过程中,代理服务4A、4B、4C可以选用Envoy,其伴随着微服务2A、2B、2C的每一次执行生成一独立进程以实现在无侵入式埋点的情况下监控微服务2A、2B、2C的行为。
在一种较优的实施例中,如图2所示,日志模块3包括:
服务关联子模块31,服务关联子模块31连接链路跟踪模块5并接收处理链路;
服务关联子模块31根据处理链路和全局跟踪标识查找多个与处理链路对应的微服务2A、2B、2C;
行为检索子模块32,行为检索子模块32连接服务关联子模块31,根据检索请求自日志存储子模块33中获取微服务2A、2B、2C的处理行为;
日志存储子模块33中存储有微服务2A、2B、2C的处理行为,以及处理行为对应的全局跟踪模块。
具体地,在实际实施过程中,当部署在云原生平台中的日志采集客户端获取到了日志数据后,通过消息系统发送至日志采集模块中,并存储入日志模块3。消息系统可以通过现有技术实现,如NATS系统。日志模块3在实施过程中可以是现有技术中任意的一种数据库,在一实施例中选用为Cassandra数据库。当出现故障需要自日志中定位特定的微服务2A、2B、2C时,可根据链路跟踪模块5生成的对应于访问请求处理流程的处理链路和全局跟踪标识自日志存储子模块33中快速抓取出对应的微服务2A、2B、2C和该微服务2A、2B、2C执行的处理行为。
作为可选的实施方式,还可根据业务方法标识(span_ID)查找微服务2A、2B、2C执行的行为。
在一种较优的实施例中,服务监控系统还包括:
资源监控模块6,资源监控模块6自云平台中获取资源信息,资源信息中包括每个微服务2A、2B、2C在不同时间点占用的硬件资源;
资源监控模块6连接链路跟踪模块5,根据处理链路和资源信息生成微服务2A、2B、2C在进行处理行为时占用的硬件资源。
具体地,在微服务2A、2B、2C开发阶段往往需要进行相关的迭代优化以提升微服务2A、2B、2C的运行效率。本发明提供的技术方案针对处理链路的特性还额外提供了一种基于处理链路反映微服务2A、2B、2C在执行相关处理行为时的资源占用变化情况。通过设置资源监控模块6可以根据处理链路有效地反映出微服务2A、2B、2C在执行过程中占用的硬件资源的变化情况,从而为微服务2A、2B、2C的优化工作提供数据支撑。
在实施过程中,云原生平台预先部署一监控客户端,其可以是如Prometheus项目的监控系统,以获取云原生平台中每个微服务2A、2B、2C的硬件资源占用情况。在该实施例中,还选用Victorial Metrics作为关联于监控客户端的占用情况存储模块,用于根据时间序列存储硬件资源占用的变化情况。当需要查询微服务2A、2B、2C的硬件资源占用情况时,根据处理链路和需要查询的时间端自占用情况存储模块中可有效地提取出特定的一个或多个微服务2A、2B、2C在该时间段内占用的硬件资源,并通过可视化图表的方式反映出资源占用的变化情况。
在一种较优的实施例中,元数据还包括:业务方法标识,业务方法标识与微服务2A、2B、2C的处理行为对应;
则如图3所示,链路跟踪模块5包括:
元数据提取子模块51,元数据提取子模块51自代理服务4A、4B、4C中获取元数据;
全局链路建立子模块52,全局链路建立子模块52连接元数据提取子模块51,根据元数据建立处理链路;
行为绑定子模块53,行为绑定子模块53根据处理链路和业务方法标识在处理链路中添加微服务2A、2B、2C的处理行为。
具体地,针对现有技术中获取到的处理行为相对孤立的问题,本发明还提供了一种基于业务方法标识(span_ID)进行处理行为跟踪的方案。当微服务2A、2B、2C对相关访问请求进行处理时,微服务2A、2B、2C会生成对应于本次处理行为的业务方法标识,用于在进一步的分析中形成处理链路中每个节点对应的处理行为。
在具体实施过程中,链路跟踪模块5还包括一业务方法存储模块,其可以是形如ArangoDB的数据库系统,全局链路建立子模块52和行为绑定子模块53可以是形如ClickHouse的分析软件。
在一种较优的实施例中,日志采集模块还包括:
版本跟踪子模块34,版本跟踪子模块34连接日志存储子模块33,版本跟踪子模块34根据全局跟踪标识自日志存储子模块33中获取微服务2A、2B、2C的多个版本号。
具体地,针对现有技术中云原生平台的微服务2A、2B、2C迭代迅速的问题,本发明提供了一种基于全局跟踪标识获取微服务2A、2B、2C版本号的方法。具体地,当日志采集模块获取到处理行为时,同时获取当前微服务2A、2B、2C的版本号并存入日志存储子模块33。当需要定位微服务2A、2B、2C的故障时,根据全局跟踪标识查询日志存储子模块33,以避免根据版本号无法快速定位微服务2A、2B、2C的问题。
在一种较优的实施例中,多个微服务2A、2B、2C组成一微服务组,微服务组中的多个微服务2A、2B、2C依次对访问请求进行处理;
微服务2A、2B、2C完成对访问请求的处理后,将处理后的访问请求和全局跟踪标识转发至下一个微服务2A、2B、2C。
在一种较优的实施例中,云平台接收到访问请求后,生成一对应于访问请求的全局跟踪标识,并调用至少一个微服务2A、2B、2C以处理访问请求;
云平台还采集微服务2A、2B、2C的处理行为和全局跟踪标识并存入一日志;
云平台根据全局跟踪标识生成处理链路;
云平台根据处理链路查询日志;
云平台根据日志的查询结果生成对应于访问请求的行为日志;
行为日志中以时间顺序记录有处理访问请求的微服务2A、2B、2C和处理行为。
具体地,针对现有技术中云原生平台中微服务2A、2B、2C数量较多,无法准确定位到访问请求中存在故障的微服务的问题,本实施例通过生成处理链路实现了对微服务2A、2B、2C的准确定位,进而便于后续的维护工作。
在实施过程中,云平台可通过上述的网关模块1接收访问请求,并由第一个接收到访问请求的微服务2A中的跟踪模块2A1生成全局跟踪标识。日志存储在日志模块3中,并由链路跟踪模块5生成处理链路。日志模块3中设置有行为检索子模块32以根据处理链路从日志存储子模块33中获取相关的处理行为,进而输出行为日志。
在一种较优的实施例中,还包括:
云平台根据全局跟踪标识生成处理链路;
云平台还获取云平台中每个微服务在不同时间点的硬件资源占用情况;
云平台根据处理链路和硬件资源占用情况生成访问请求的资源占用信息。
具体地,针对现有技术中,云原生平台中微服务2A、2B、2C数量较多,无法有效获取到单次访问请求所对应的硬件资源占用的情况,本实施例中通过云平台生成处理链路实现了对访问请求的全程跟踪,进而获取到访问请求处理过程中的硬件占用量的变化情况。
在实施过程中,由链路跟踪模块5生成处理链路,云平台中预先存储有过去时间段中的每个微服务的硬件资源占用情况,由资源监控模块6从云平台中读取硬件资源占用情况,并结合链路跟踪模块5输出的处理链路生成访问请求在整体处理过程中占用的硬件资源,进而生成资源占用信息。
在一种较优的实施例中,服务监控系统还包括:
可视化界面7,可视化界面7连接资源监控模块6和日志模块3;
可视化界面7接收硬件资源;
可视化界面7根据硬件资源生成并显示资源图表;
可视化界面7显示处理日志。
具体地,为实现较好的服务监控效果,本实施例在服务监控系统中增加了可视化界面7,通过可视化界面7实现了对硬件资源和处理日志的可视化显示,便于用户通过可视化的方式获取云平台的硬件资源和处理行为。
在一种较优的实施例中,上述的服务监控系统可采用一服务监控方法运行。当云平台接收到访问请求后,生成一对应于请求的全局跟踪标识,并调用至少一个微服务以处理访问请求;
云平台还采集微服务的处理行为和全局跟踪标识;
则如图4所示,服务监控方法具体包括:
步骤A1:根据全局跟踪标识生成处理链路;
步骤A2:根据处理链路查询日志;
日志中存储有多个微服务的处理行为;
步骤A3:根据日志的查询结果生成对应于访问请求的行为日志;
行为日志中以时间顺序记录有处理访问请求的微服务和处理行为。
具体地,针对现有技术中存在的无法针对云原生平台中的多个微服务2A、2B、2C进行有效监控的问题,本发明提供了一种基于全局跟踪标识(trace_ID)的监控系统。当用户每一次发起访问请求时,都会生成一个对应于本次访问请求的全局跟踪标识,用于标记处理本次访问请求的微服务2A、2B、2C,随后由日志采集模采集相应的行为,随后根据全局跟踪标识生成某次访问请求的整体处理流程以及对应的处理行为,便于在发生故障时,根据触发故障的访问请求进行快速定位,找出相关的微服务2A、2B、2C并进行排障处理。
在一种较优的实施例中,如图5所示,服务监控方法还包括:
步骤B1:根据全局跟踪标识生成处理链路,并获取云平台的硬件资源占用情况;
步骤B2:根据处理链路和时间戳生成每个微服务在特定时间的硬件资源占用情况。
具体地,针对现有技术中云原生平台的微服务2A、2B、2C迭代迅速的问题,本发明提供了一种基于全局跟踪标识获取微服务2A、2B、2C版本号的方法。具体地,当日志采集模块获取到处理行为时,同时获取当前微服务2A、2B、2C的版本号并存入日志存储子模块33。当需要定位微服务2A、2B、2C的故障时,根据全局跟踪标识查询日志存储子模块33,以避免根据版本号无法快速定位微服务2A、2B、2C的问题。
本发明的有益效果在于:通过设置与访问请求相关联的全局服务标识,可以有效地对单次访问行为进行跟踪,并关联到访问请求整体处理过程中的多个微服务,以实现较好的行为跟踪效果,便于在故障时快速定位到特定的微服务及相关的处理行为,以进行后续的处理工作。
以上仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。

Claims (11)

1.一种云平台的服务监控系统,其特征在于,包括:
网关模块,所述网关模块与至少一个外部的用户信号连接,并接收所述用户发出的访问请求;
跟踪模块,所述跟踪模块生成一与所述访问请求对应的全局跟踪标识;
多个微服务,所述微服务对所述访问请求进行处理;
日志模块,所述日志模块采集并记录所述微服务的处理行为和所述处理行为对应的所述全局跟踪标识;
链路跟踪模块,所述链路跟踪模块接收所述全局跟踪标识并建立处理链路;
所述日志模块响应一检索请求并根据所述处理链路生成对应于所述访问请求的处理日志。
2.根据权利要求1所述的服务监控系统,其特征在于,所述服务监控系统还包括:
多个与所述微服务对应的代理服务,所述代理服务根据所述处理行为生成元数据,所述元数据中包括所述全局跟踪标识;
所述链路跟踪模块连接所述代理服务并接收所述元数据;
所述链路跟踪模块根据所述元数据建立所述处理链路,所述处理链路用于关联处理所述访问请求的多个所述微服务。
3.根据权利要求2所述的服务监控系统,其特征在于,所述日志模块包括:
服务关联子模块,所述服务关联子模块连接所述链路跟踪模块并接收所述处理链路;
所述服务关联子模块根据所述处理链路和所述全局跟踪标识查找多个与所述处理链路对应的所述微服务;
行为检索子模块,所述行为检索子模块连接所述服务关联子模块,并根据所述检索请求自一日志存储子模块中获取所述微服务的处理行为,并生成所述处理日志;
所述日志存储子模块中存储有所述微服务的处理行为,以及所述处理行为对应的全局跟踪模块。
4.根据权利要求1所述的服务监控系统,其特征在于,所述服务监控系统还包括:
资源监控模块,所述资源监控模块自所述云平台中获取资源信息,所述资源信息中包括每个所述微服务在不同时间点占用的硬件资源;
所述资源监控模块连接所述链路跟踪模块,根据所述处理链路和所述资源信息生成所述微服务在进行所述处理行为时占用的所述硬件资源。
5.根据权利要求2所述的服务监控系统,其特征在于,所述元数据还包括:业务方法标识,所述业务方法标识与所述微服务的所述处理行为对应,用于标记所述微服务的所述处理行为。
6.根据权利要求5所述的服务监控系统,其特征在于,所述链路跟踪模块包括:
元数据提取子模块,所述元数据提取子模块自所述代理服务中获取所述元数据;
全局链路建立子模块,所述全局链路建立子模块连接所述元数据提取子模块,根据所述元数据建立所述处理链路;
行为绑定子模块,所述行为绑定子模块根据所述处理链路和所述业务方法标识在所述处理链路中添加所述微服务的所述处理行为。
7.根据权利要求1所述的服务监控系统,其特征在于,所述日志采集模块还包括:
版本跟踪子模块,所述版本跟踪子模块连接所述日志存储子模块,所述版本跟踪子模块根据所述全局跟踪标识自所述日志存储子模块中获取所述微服务的多个版本号。
8.根据权利要求1所述的服务监控系统,其特征在于,多个所述微服务组成一微服务组,所述微服务组中的多个所述微服务依次对所述访问请求进行处理;
所述微服务完成对所述访问请求的处理后,将处理后的访问请求和所述全局跟踪标识转发至下一个所述微服务。
9.根据权利要求1所述的服务监控系统,其特征在于,所述云平台接收到访问请求后,生成一对应于所述访问请求的所述全局跟踪标识,并调用至少一个所述微服务以处理所述访问请求;
所述云平台还采集所述微服务的处理行为和所述全局跟踪标识并存入一日志;
所述云平台根据所述全局跟踪标识生成所述处理链路;
所述云平台根据所述处理链路查询所述日志;
所述云平台根据所述日志的查询结果生成对应于所述访问请求的行为日志;
所述行为日志中以时间顺序记录有处理所述访问请求的所述微服务和所述处理行为。
10.根据权利要求4所述的服务监控系统,其特征在于,还包括:
所述云平台根据所述全局跟踪标识生成所述处理链路;
所述云平台还获取所述云平台中每个所述微服务在所述不同时间点的硬件资源占用情况;
所述云平台根据所述处理链路和所述硬件资源占用情况生成所述访问请求的资源占用信息。
11.根据权利要求4所述的服务监控系统,其特征在于,所述服务监控系统还包括:
可视化界面,所述可视化界面连接所述资源监控模块和所述日志模块;
所述可视化界面接收所述硬件资源;
所述可视化界面根据所述硬件资源生成并显示资源图表;
所述可视化界面显示所述处理日志。
CN202111503792.0A 2021-12-09 2021-12-09 一种云平台的服务监控系统 Pending CN114143369A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111503792.0A CN114143369A (zh) 2021-12-09 2021-12-09 一种云平台的服务监控系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111503792.0A CN114143369A (zh) 2021-12-09 2021-12-09 一种云平台的服务监控系统

Publications (1)

Publication Number Publication Date
CN114143369A true CN114143369A (zh) 2022-03-04

Family

ID=80385895

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111503792.0A Pending CN114143369A (zh) 2021-12-09 2021-12-09 一种云平台的服务监控系统

Country Status (1)

Country Link
CN (1) CN114143369A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115883666A (zh) * 2022-11-14 2023-03-31 天翼云科技有限公司 基于cdn节点的一站式请求链路监测系统
CN116582406A (zh) * 2023-07-13 2023-08-11 支付宝(杭州)信息技术有限公司 监控数据的上传方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030056200A1 (en) * 2001-09-19 2003-03-20 Jun Li Runtime monitoring in component-based systems
US20150256508A1 (en) * 2014-03-04 2015-09-10 Opendns, Inc. Transparent Proxy Authentication Via DNS Processing
CN109921927A (zh) * 2019-02-20 2019-06-21 苏州人之众信息技术有限公司 基于微服务的实时调用链跟踪方法
CN111124670A (zh) * 2019-12-05 2020-05-08 航天科工网络信息发展有限公司 一种面向战术云的微服务平台
CN112612675A (zh) * 2020-12-25 2021-04-06 山东经伟晟睿数据技术有限公司 微服务架构下的分布式大数据日志链路跟踪方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030056200A1 (en) * 2001-09-19 2003-03-20 Jun Li Runtime monitoring in component-based systems
US20150256508A1 (en) * 2014-03-04 2015-09-10 Opendns, Inc. Transparent Proxy Authentication Via DNS Processing
CN109921927A (zh) * 2019-02-20 2019-06-21 苏州人之众信息技术有限公司 基于微服务的实时调用链跟踪方法
CN111124670A (zh) * 2019-12-05 2020-05-08 航天科工网络信息发展有限公司 一种面向战术云的微服务平台
CN112612675A (zh) * 2020-12-25 2021-04-06 山东经伟晟睿数据技术有限公司 微服务架构下的分布式大数据日志链路跟踪方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115883666A (zh) * 2022-11-14 2023-03-31 天翼云科技有限公司 基于cdn节点的一站式请求链路监测系统
CN116582406A (zh) * 2023-07-13 2023-08-11 支付宝(杭州)信息技术有限公司 监控数据的上传方法及装置
CN116582406B (zh) * 2023-07-13 2023-09-26 支付宝(杭州)信息技术有限公司 监控数据的上传方法及装置

Similar Documents

Publication Publication Date Title
CN112612675B (zh) 微服务架构下的分布式大数据日志链路跟踪方法及系统
CN107908541B (zh) 接口测试方法、装置、计算机设备及存储介质
CN111522922B (zh) 日志信息查询方法、装置、存储介质及计算机设备
CN109660397B (zh) 用于采集日志的系统、方法和装置
CN114143369A (zh) 一种云平台的服务监控系统
CN112506894A (zh) 基于链路追踪的服务链日志处理方法、装置和计算机设备
US11809406B2 (en) Event records in a log file
CN109885496B (zh) 测试日志管理方法及系统
US7913233B2 (en) Performance analyzer
CN111614483A (zh) 链路监控方法、装置、存储介质及计算机设备
CN111061696B (zh) 一种交易报文日志的解析方法及装置
CN111355802B (zh) 信息推送方法和装置
CN110764980A (zh) 日志处理方法和装置
CN109802842B (zh) 应用拓扑的生成方法及相关设备
CN112084249A (zh) 一种访问记录提取方法及装置
CN112235128B (zh) 一种交易路径分析方法、装置、服务器及存储介质
CN112068981B (zh) Linux操作系统中基于知识库的故障扫描恢复方法及系统
JP3139459B2 (ja) 並列分散システムのデバッグ装置及びデバッグ方法
CN112527619A (zh) 一种基于有向无环图结构的分析链路调用方法及系统
CN111427736A (zh) 日志监控方法、装置、设备及计算机可读存储介质
CN112104480B (zh) 提高告警质量的方法及其系统
CN111352824B (zh) 测试方法、装置及计算机设备
CN115220992A (zh) 接口变更监控方法、装置、计算机设备和存储介质
CN114416420A (zh) 设备问题反馈方法和系统
CN112230897A (zh) 银行分行接口改造的监控方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination