CN117971600A - 性能监控方法、设备、可读存储介质及计算机程序产品 - Google Patents

性能监控方法、设备、可读存储介质及计算机程序产品 Download PDF

Info

Publication number
CN117971600A
CN117971600A CN202410176060.2A CN202410176060A CN117971600A CN 117971600 A CN117971600 A CN 117971600A CN 202410176060 A CN202410176060 A CN 202410176060A CN 117971600 A CN117971600 A CN 117971600A
Authority
CN
China
Prior art keywords
trace data
timeout
overtime
data
trace
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410176060.2A
Other languages
English (en)
Inventor
王春华
王菁菁
宋潇
陈劼
张焓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Jiangsu Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Jiangsu Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Jiangsu Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202410176060.2A priority Critical patent/CN117971600A/zh
Publication of CN117971600A publication Critical patent/CN117971600A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9027Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种性能监控方法、设备、可读存储介质及计算机程序产品,涉及应用监控技术领域。所述性能监控方法包括:响应于用户的页面操作,生成所述页面操作的trace数据;根据所述trace数据中的请求耗时,判断所述trace数据是否超时;若所述trace数据超时,则在所述trace数据中设置超时标志,将设置有超时标志的trace数据进行上报并存储至预设数据库。本申请提高了对于系统性能异常的分析效率。

Description

性能监控方法、设备、可读存储介质及计算机程序产品
技术领域
本申请涉及应用监控技术领域,尤其涉及一种性能监控方法、设备、可读存储介质及计算机程序产品。
背景技术
随着计算机技术的演进,软件系统架构发展为面向服务架构。在面向服务架构时,用户系统、应用规模急剧增加,并且系统之间、应用之间存在复杂的调用关系。
在系统出现性能瓶颈后,需要运维人员进行定位原因。当前通常是运维人员凭借应用性能监控系统,对海量的trace数据逐一进行分析,从海量的trace数据中筛选出超时的trace数据。即当前对于系统性能异常的分析效率偏低。
上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
发明内容
本申请的主要目的在于提供一种性能监控方法,旨在解决当前对于系统性能异常的分析效率偏低的技术问题。
为实现上述目的,本申请提供一种性能监控方法,所述方法包括:
响应于用户的页面操作,生成所述页面操作的trace数据;
根据所述trace数据中的请求耗时,判断所述trace数据是否超时;
若所述trace数据超时,则在所述trace数据中设置超时标志,将设置有超时标志的trace数据进行上报并存储至预设数据库。
可选地,在所述将设置有超时标志的trace数据进行上报的步骤之前,包括:
获取设置有超时标志的trace数据对应的第一线程栈信息;
根据所述第一线程栈信息,生成完整调用信息;
将所述完整调用信息设置在超时标志的trace数据中。
可选地,在将设置有超时标志的trace数据存储至预设数据库的步骤之前,包括:
获取设置有超时标志的trace数据的业务信息;
对设置有超时标志的trace数据进行数据预处理后,将所述业务信息设置在超时标志的trace数据中。
可选地,在所述将设置有超时标志的trace数据进行上报并存储至预设数据库的步骤之后,包括:
根据所述超时标志,从所述预设数据库中抽取超时trace数据;
对所述超时trace数据进行数据聚合,得到聚合结果;
响应于用户查询指令,从所述聚合结果中筛选出目标trace数据;
基于所述目标trace数据的上下游调用关系,构建超时trace树。
可选地,所述对所述超时trace数据进行数据聚合,得到聚合结果的步骤,包括:
获取目标业务维度,其中所述目标业务维度包括业务应用、应用实例中的至少一项;
按照业务应用和应用实例中的至少一项,对所述超时trace数据进行数据聚合,得到聚合结果。
可选地,所述对所述超时trace数据进行数据聚合,得到聚合结果的步骤,还包括:
获取目标时间维度,其中所述目标时间维度包括分钟级、小时级、天级中的至少一项;
按照分钟级、小时级和天级中的至少一项,对所述超时trace数据进行数据聚合,得到聚合结果。
可选地,在所述基于所述目标trace数据的上下游调用关系,构建超时trace树的步骤之后,包括:
获取所述超时trace树的第二线程栈信息;
将所述第二线程栈信息与所述超时trace树中各trace数据进行关联;
响应于用户选取指令,展示所述用户选取指令选取的指定trace数据关联的第二线程栈信息。
此外,为实现上述目的,本申请还提供一种性能监控设备,所述性能监控设备包括:存储器、处理器以及存储在所述存储器上的计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的性能监控方法的步骤。
此外,为实现上述目的,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有性能监控程序,所述性能监控程序被处理器执行时实现如上任一项所述的性能监控方法的步骤。
此外,为实现上述目的,本申请还提供一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被处理器执行时,实现如上任一项所述的性能监控方法的步骤。
本申请提出的一种性能监控方法,通过响应于用户的页面操作,生成所述页面操作的trace数据;根据所述trace数据中的请求耗时,判断所述trace数据是否超时;若所述trace数据超时,则在所述trace数据中设置超时标志,将设置有超时标志的trace数据进行上报并存储至预设数据库。本申请在生成trace数据的同时,就会对所述trace数据进行超时判别,然后在超时的trace数据中设置超时标志进行上报,并存储至预设数据库中。由此,相较于现有在系统明显出现性能瓶颈后才由运维人员进行超时分析的方式而言,本申请在第一时间即可发现超时trace数据的出现,并且无需对海量的trace数据进行超时分析,从而对于系统性能异常的分析效率更高,并且时效性也更强。
附图说明
图1为本申请实施例方案涉及的硬件运行环境的设备结构示意图;
图2为本申请性能监控方法第一实施例的流程示意图;
图3为本申请性能监控方法第二实施例的流程示意图;
图4为本申请性能监控方法第三实施例的流程示意图;
图5为本申请性能监控方法第四实施例的流程示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
为了更好地描述本申请的技术方案,以下结合部分现有技术对本申请的技术方案进行说明:
在应用出现性能瓶颈后,需要运维人员进行定位原因。当前通常是运维人员凭借应用性能监控系统进行性能异常分析。在应用性能监控领域,应用性能监控系统主要从客户应用中采集Tracing、Metrics、Logging、Event、Meta等监控数据。其中,Tracing提供了一个请求从接收到处理完毕整个生命周期的跟踪路径,通常请求都是在分布式系统中处理,所以也叫做分布式链路追踪。Metrics提供量化的系统内/外部各个维度的指标。Log提供系统最精细化的信息,比如某个关键字、事件、访问记录等。Event提供了系统中各类事件和异常等信息。Meta主要是描述系统的相关元数据。
当前的应用异常分析流程通常是运维人员基于Metrics的告警和趋势发现系统问题,进而对trace数据进行超时分析,然后通过超时的trace数据定位问题所在实例或者模块,最终通过Tracing和Logging定位到问题的根源。
本申请在生成trace数据的同时,就会对所述trace数据进行超时判别,然后在超时的trace数据中设置超时标志进行上报,并存储至预设数据库中。由此,相较于现有在系统明显出现性能瓶颈后才由运维人员进行超时分析的方式而言,本申请在第一时间即可发现超时trace数据的出现,并且无需对海量的trace数据进行超时分析,从而对于系统性能异常的分析效率更高,并且时效性也更强。
如图1所示,图1为本申请实施例方案涉及的硬件运行环境的设备结构示意图。
示例性地,所述性能监控设备可以为PC(Personal Computer,个人计算机)、平板电脑、便携式计算机或者服务器等设备。
如图1所示,所述性能监控设备包括:处理器1001,例如CPU,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如触摸屏或键盘(Keyboard),用户接口1003还可以包括标准的有线接口、无线接口。可选地,网络接口1004可以包括标准的有线接口、无线接口(如Wi-Fi接口)。存储器1005可以是高速RAM存储器,也可以是非易失性存储器(Non-Volatile Memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
本领域技术人员可以理解,图1中示出的设备结构并不构成对所述性能监控设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及性能监控应用程序。
在图1所示的设备中,处理器1001可以用于调用存储器1005中存储的性能监控应用程序,并执行如下各实施例中性能监控方法的操作。
参照图2,图2为本申请性能监控方法第一实施例的流程示意图。
本申请第一实施例提供一种性能监控方法,所述方法包括以下步骤:
步骤S100,响应于用户的页面操作,生成所述页面操作的trace数据;
本实施例中,需要说明的是,所述trace数据包括页面操作的traceId(唯一的标识符,用于标识所述页面操作的请求链路)、操作名称、操作类型、操作状态、开始时间、结束时间、请求耗时、spanId(用于标识当前应用)、parentSpanId(用于标识上游应用)以及其他相关的附加信息。
本实施例在目标应用中部署采集器(即用于采集数据的软件工具)后,当用户的页面操作调用到所述目标应用的应用服务端后,采集器会对所述页面操作进行一系列的数据采集,采集内容包括traceId、操作名称、操作类型、操作状态、开始时间、结束时间、请求耗时、spanId、parentSpanId以及其他相关的附加信息,由此生成所述页面操作的trace数据。其中目标应用为期望进行应用性能监控的应用程序。
在生成所述页面操作的trace数据的过程中,采集器会将context(上下文信息)传递给下游应用,可以理解的是,当前应用和下游应用指能够被所述采集器监控的应用,比如使用java Web技术开发的计费应用和登录认证应用,其中计费应用会调用登录认证应用,因此计费应用可以认为是当前应用,登录认证应用就属于下游应用。context包含traceId、spanId、parentSpanId等信息。多个应用之间的trace数据通过traceId、spanId、parentSpanId进行串联,组成一条分布式调用trace数据。当一次页面操作的分布式调用跨了多个应用时,每个应用都会生成一条当前应用的分布式调用trace数据,这些分布式调用trace数据中的traceId相同,因此可以将多个分布式调用trace数据会归属到一组中。由于上游应用的分布式调用trace数据中的spanId是下游应用的分布式调用trace数据的parentSpanId,通过spanId和parentSpanId串联上下游应用的分布式调用trace数据来保证数据的顺序,得到所述页面操作的trace数据。
步骤S200,根据所述trace数据中的请求耗时,判断所述trace数据是否超时;
由于所述trace数据包括页面操作的请求耗时,所述请求耗时为所述页面操作的业务请求完成所耗费的时长。
因此本实施例可以在所述采集器中内置该预设超时阈值,该预设超时阈值可以是预先设置的默认数值,也可以是用户根据需要设置的数值,所述预设超时阈值被调整后支持动态生效。进而在用户进行页面操作,所述采集器在生成所述页面操作的trace数据后,所述采集器可以判断所述trace数据中的请求耗时是否大于预设超时阈值。若所述请求耗时大于预设超时阈值,则判定所述trace数据超时。若所述请求耗时不大于预设超时阈值,则判定所述trace数据未超时。
步骤S300,若所述trace数据超时,则在所述trace数据中设置超时标志,将设置有超时标志的trace数据进行上报并存储至预设数据库。
本实施例中,需要说明的是,所述超时标志为预先设置用于标识trace数据超时的字符。
本实施例通过所述采集器判别trace数据是否超时,以确定是否需要上报接收器若所述trace数据超时,则在所述trace数据中设置超时标志,将设置有超时标志的trace数据上报至接收器(用于接收所述采集器上报数据的软件工具)由此提醒运维人员出现超时的trace数据。本实施例会将设置有超时标志的trace数据写入到采集器内部的缓存队列中。采集器的异步发送线程从采集器内部的缓存队列中读设置有超时标志的trace数据,并批量将设置有超时标志的trace数据上报到所述接收器。并将设置有超时标志的trace数据存储至预设数据库。
本申请第一实施例中,通过响应于用户的页面操作,生成所述页面操作的trace数据;根据所述trace数据中的请求耗时,判断所述trace数据是否超时;若所述trace数据超时,则在所述trace数据中设置超时标志,将设置有超时标志的trace数据进行上报并存储至预设数据库。本实施例在生成trace数据的同时,就会对所述trace数据进行超时判别,然后在超时的trace数据中设置超时标志进行上报,并存储至预设数据库中。由此,相较于现有在系统明显出现性能瓶颈后才由运维人员进行超时分析的方式而言,本实施例在第一时间即可发现超时事件的出现,并且无需对海量的trace数据进行超时分析,从而对于系统性能异常的分析效率更高,并且时效性也更强。
参照图3,图3为本申请性能监控方法第二实施例的流程示意图。
本申请第二实施例提供一种性能监控方法,在步骤S300中所述将设置有超时标志的trace数据进行上报的步骤之前,包括:
步骤S310,获取设置有超时标志的trace数据对应的第一线程栈信息;
步骤S320,根据所述第一线程栈信息,生成完整调用信息;
步骤S330,将所述完整调用信息设置在超时标志的trace数据中。
本实施例中,需要说明的是,所述第一线程栈信息为设置有超时标志的trace数据的线程栈信息,包含线程状态以及调用关系的瞬时快照。
本实施例可以通过所述采集器采集设置有超时标志的trace数据对应的第一线程栈信息。本实施例根据所述第一线程栈信息中的调用关系,识别出所述页面操作的业务请求经历过的所有执行方法,每个执行方法会包含其执行耗时时间以及所述执行方法在业务请求在线程栈中的顺序。本实施例可以将线程栈中各个执行方法的执行耗时时间以及各执行方法在线程栈中对应的顺序,生成所述页面操作的业务请求的完整调用信息,进而将所述完整调用信息设置在超时标志的trace数据中。由此,本实施例通过将超时的trace数据的完整调用信息设置至trace数据中,以供运维人员进行性能异常分析使用,可以有效提高了运维人员对于系统性能异常的分析效率。
在步骤S300中将设置有超时标志的trace数据存储至预设数据库的步骤之前,还包括:
步骤S340,获取设置有超时标志的trace数据的业务信息;
步骤S350,对设置有超时标志的trace数据进行数据预处理后,将所述业务信息设置在超时标志的trace数据中。
本实施例中,需要说明的是,所述业务信息包括所述trace数据对应的应用实例、应用实例所属的应用、应用所属的业务系统等信息。所述数据预处理包括数据清洗、数据转换、数据规范化等处理操作,其中所述数据清洗可以包括去除重复值、处理缺失值、处理异常值等操作。所述数据转换包括数据类型的转换、数据格式的转换等操作。
本实施例可以根据设置有超时标志的trace数据的中的spanId从接收器内部的缓存中获取spanId对应的应用实例、应用实例所属的应用、应用所属的业务系统等业务信息。可以理解的是,接收器内部的缓存是一个map数据结构,其key为spanId,其value为spanId对应的应用实例关联的应用和业务系统。应用实例是采集器在启动时上报的应用实例;应用实例所属的应用、应用所属的业务系统等信息则是通过提前将应用实例、应用、业务系统之间的关系进行绑定获得。然后对设置有超时标志的trace数据进行数据预处理后,将所述业务信息设置在超时标志的trace数据中。由此,本实施例通过将超时的trace数据的应用实例、应用、业务系统等业务信息设置至trace数据中,以供运维人员进行性能异常分析使用,可以有效提高了运维人员对于系统性能异常的分析效率。
本申请第二实施例,通过获取设置有超时标志的trace数据对应的第一线程栈信息;根据所述第一线程栈信息,生成完整调用信息;将所述完整调用信息设置在超时标志的trace数据中。由此,本实施例通过将超时的trace数据的完整调用信息设置至trace数据中。此外,通过获取设置有超时标志的trace数据的业务信息;对设置有超时标志的trace数据进行数据预处理后,将所述业务信息设置在超时标志的trace数据中。由此本实施例在设置有超时标志的trace数据中设置有其完整调用信息和业务信息,以供运维人员进行性能异常分析使用,可以有效提高了运维人员对于系统性能异常的分析效率。
参照图4,图4为本申请性能监控方法第三实施例的流程示意图。
本申请第三实施例提供一种性能监控方法,在步骤S300中所述将设置有超时标志的trace数据进行上报并存储至预设数据库的步骤之后,包括:
步骤A10,根据所述超时标志,从所述预设数据库中抽取超时trace数据;
步骤A20,对所述超时trace数据进行数据聚合,得到聚合结果;
步骤A30,响应于用户查询指令,从所述聚合结果中筛选出目标trace数据;
步骤A40,基于所述目标trace数据的上下游调用关系,构建超时trace树。
本实施例中,需要说明的是,所述数据聚合为将数据整合到一起的处理操作,所述数据聚合可以是基于业务维度进行聚合,也可以是基于时间维度聚合。所述上下游调用关系为页面操作对应的业务请求调用的应用的顺序。
本实施例可以根据所述超时标志,从所述预设数据库中抽取设置有所述超时标志的trace数据作为超时trace数据。进而可以对所述超时trace数据进行基于业务维度和/或时间维度进行数据聚合,得到聚合结果。运维人员可以下发用户查询指令,所述用户查询指令为用于指示用户期望查询的超时trace数据。由此本实施例可响应于所述用户查询指令,从所述聚合结果中筛选出目标trace数据。示例性地,运维人员可以根据业务维度,从高维度的业务系统、应用、应用实例下选择对应的业务对象,此外还可以在所述业务对象的基础上加上时间范围作为用户查询指令,从所述聚类结果中筛选出目标trace数据。在分布式系统中,用户的一次页面操作会经过多个应用才完成一次业务请求。在业务请求流转的多个应用中,每个应用都会生成一条trace数据。这些trace数据中的traceId相同,因此可以将多个trace数据会归属到一组中。上游应用的trace数据中的spanId是下游应用的trace数据的parentSpanId,通过spanId和parentSpanId来得到所述目标trace数据的上下游调用关系。进而本实施例可以基于所述目标trace数据的上下游调用关系,将所述目标trace数据按照所述上下游调用关系构建为树状结构,得到超时trace树。本实施例中,可以理解的是,所述超时trace树中不仅包括超时trace数据,还包括所述超时trace数据上下游应用的trace数据。由此本实施例不仅可以从聚合后的超时trace数据中筛选出符合用户查询需求的目标trace数据,而且将所述目标trace数据构建为超时trace树,由此用户还可以快速识别出目标trace数据的上下游调用关系,可以有效提高了运维人员对于系统性能异常的分析效率。
在一些实施例中,步骤A20中所述对所述超时trace数据进行数据聚合,得到聚合结果的步骤,包括:
步骤B10,获取目标业务维度,其中所述目标业务维度包括业务系统、应用、应用实例中的至少一项;
步骤B20,按照业务系统、应用和应用实例中的至少一项,对所述超时trace数据进行数据聚合,得到聚合结果。
本实施例中,需要说明的是,所述目标业务维度包括业务系统、应用、应用实例中的至少一项。
本申请可以获取目标业务维度,其中所述目标业务维度包括业务系统、应用、应用实例中的至少一项。本实施例可以按照业务系统对所述超时trace数据进行数据聚合,得到聚合结果。或者可以按照应用对所述超时trace数据进行数据聚合,得到聚合结果。或者可以按照应用实例对所述超时trace数据进行数据聚合,得到聚合结果。或者可以按照业务系统和应用对所述超时trace数据进行数据聚合,得到聚合结果。或者可以按照业务系统、应用和应用实例对所述超时trace数据进行数据聚合,得到聚合结果。本实施例在业务维度上对所述超时trace数据进行数据聚合,得到聚合结果。
在一些实施例中,步骤A20中所述对所述超时trace数据进行数据聚合,得到聚合结果的步骤,还包括:
步骤C10,获取目标时间维度,其中所述目标时间维度包括分钟级、小时级、天级中的至少一项;
步骤C20,按照分钟级、小时级和天级中的至少一项,对所述超时trace数据进行数据聚合,得到聚合结果。
本实施例中,需要说明的是,所述目标时间维度包括分钟级、小时级、天级中的至少一项。
本申请可以获取目标时间维度,其中所述目标时间维度包括分钟级、小时级、天级中的至少一项。本实施例可以按照分钟级对所述超时trace数据进行数据聚合,得到聚合结果。或者可以按照小时级对所述超时trace数据进行数据聚合,得到聚合结果。或者可以按照天级对所述超时trace数据进行数据聚合,得到聚合结果。或者可以按照分钟级和小时级对所述超时trace数据进行数据聚合,得到聚合结果。或者可以按照分钟级、小时级和天级对所述超时trace数据进行数据聚合,得到聚合结果。本实施例在时间维度上对所述超时trace数据进行数据聚合,得到聚合结果。
本申请第三实施例,通过根据所述超时标志,从所述预设数据库中抽取超时trace数据;对所述超时trace数据进行数据聚合,得到聚合结果;响应于用户查询指令,从所述聚合结果中筛选出目标trace数据;基于所述目标trace数据的上下游调用关系,构建超时trace树。由此本实施例不仅可以从聚合后的超时trace数据中筛选出符合用户查询需求的目标trace数据,而且将所述目标trace数据构建为超时trace树,由此用户还可以快速识别出目标trace数据的上下游调用关系,可以有效提高了运维人员对于系统性能异常的分析效率。
参照图5,图5为本申请性能监控方法第四实施例的流程示意图。
本申请第四实施例提供一种性能监控方法,在步骤A40中所述基于所述目标trace数据的上下游调用关系,构建超时trace树的步骤之后,包括:
步骤D10,获取所述超时trace树的第二线程栈信息;
步骤D20,将所述第二线程栈信息与所述超时trace树中各trace数据进行关联;
步骤D30,响应于用户选取指令,展示所述用户选取指令选取的指定trace数据关联的第二线程栈信息。
本实施例中,需要说明的是,所述第二线程栈信息包括所述超时trace树中各trace数据的线程栈信息。
本实施例可以对所述超时trace树进行展示,为了便于运维人员识别出所述超时trace树中的超时trace数据,可以对所述超时trace树中的超时trace数据进行差异化标识(如采用醒目的颜色和/或字号进行标识)。运维人员可以通过点击所述超时trace树的节点下发用户选取指令,由此可以响应于用户选取指令,确定所述用户选取指令选取的指定trace数据,展示所述用户选取指令选取的指定trace数据关联的第二线程栈信息。由此运维人员可以看到指定trace数据的详细的线程栈信息,运维人员通过查看所述第二线程栈信息,可以明确判断在具体某个类的某个方法上耗时比较长,进而可以针对性的进行更进一步的分析和优化系统性能异常。
本申请第四实施例,通过获取所述超时trace树的第二线程栈信息;将所述第二线程栈信息与所述超时trace树中各trace数据进行关联;应于用户选取指令,展示所述用户选取指令选取的指定trace数据关联的第二线程栈信息。由此可以向运维人员展示指定trace数据的详细的线程栈信息,运维人员通过查看所述第二线程栈信息,可以明确判断在具体某个类的某个方法上耗时比较长,进而可以针对性的进行更进一步的分析和优化系统性能异常,从而可以有效提高了运维人员对于系统性能异常的分析效率。
此外,本申请实施例还提出一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例提供的性能监控方法中的操作,具体步骤此处不再过多赘述。
此外,本申请实施例还提出一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被处理器执行时,实现上述实施例提供的性能监控方法中的操作,具体步骤此处不再过多赘述。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体/操作/对象与另一个实体/操作/对象区分开来,而不一定要求或者暗示这些实体/操作/对象之间存在任何这种实际的关系或者顺序;术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
对于设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台性能监控设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种性能监控方法,其特征在于,所述方法包括:
响应于用户的页面操作,生成所述页面操作的trace数据;
根据所述trace数据中的请求耗时,判断所述trace数据是否超时;
若所述trace数据超时,则在所述trace数据中设置超时标志,将设置有超时标志的trace数据进行上报并存储至预设数据库。
2.根据权利要求1所述的方法,其特征在于,在所述将设置有超时标志的trace数据进行上报的步骤之前,包括:
获取设置有超时标志的trace数据对应的第一线程栈信息;
根据所述第一线程栈信息,生成完整调用信息;
将所述完整调用信息设置在超时标志的trace数据中。
3.根据权利要求1所述的方法,其特征在于,在将设置有超时标志的trace数据存储至预设数据库的步骤之前,包括:
获取设置有超时标志的trace数据的业务信息;
对设置有超时标志的trace数据进行数据预处理后,将所述业务信息设置在超时标志的trace数据中。
4.根据权利要求1所述的方法,其特征在于,在所述将设置有超时标志的trace数据进行上报并存储至预设数据库的步骤之后,包括:
根据所述超时标志,从所述预设数据库中抽取超时trace数据;
对所述超时trace数据进行数据聚合,得到聚合结果;
响应于用户查询指令,从所述聚合结果中筛选出目标trace数据;
基于所述目标trace数据的上下游调用关系,构建超时trace树。
5.根据权利要求4所述的方法,其特征在于,所述对所述超时trace数据进行数据聚合,得到聚合结果的步骤,包括:
获取目标业务维度,其中所述目标业务维度包括业务系统、应用、应用实例中的至少一项;
按照业务系统、应用和应用实例中的至少一项,对所述超时trace数据进行数据聚合,得到聚合结果。
6.根据权利要求4所述的方法,其特征在于,所述对所述超时trace数据进行数据聚合,得到聚合结果的步骤,还包括:
获取目标时间维度,其中所述目标时间维度包括分钟级、小时级、天级中的至少一项;
按照分钟级、小时级和天级中的至少一项,对所述超时trace数据进行数据聚合,得到聚合结果。
7.根据权利要求4所述的方法,其特征在于,在所述基于所述目标trace数据的上下游调用关系,构建超时trace树的步骤之后,包括:
获取所述超时trace树的第二线程栈信息;
将所述第二线程栈信息与所述超时trace树中各trace数据进行关联;
响应于用户选取指令,展示所述用户选取指令选取的指定trace数据关联的第二线程栈信息。
8.一种性能监控设备,其特征在于,所述性能监控设备包括:存储器、处理器以及存储在所述存储器上的计算机程序,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的性能监控方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有性能监控程序,所述性能监控程序被处理器执行时实现权利要求1至7中任一项所述的性能监控方法的步骤。
10.一种计算机程序产品,其特征在于,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被处理器执行时,实现权利要求1至7中任一项所述的性能监控方法的步骤。
CN202410176060.2A 2024-02-07 2024-02-07 性能监控方法、设备、可读存储介质及计算机程序产品 Pending CN117971600A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410176060.2A CN117971600A (zh) 2024-02-07 2024-02-07 性能监控方法、设备、可读存储介质及计算机程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410176060.2A CN117971600A (zh) 2024-02-07 2024-02-07 性能监控方法、设备、可读存储介质及计算机程序产品

Publications (1)

Publication Number Publication Date
CN117971600A true CN117971600A (zh) 2024-05-03

Family

ID=90863030

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410176060.2A Pending CN117971600A (zh) 2024-02-07 2024-02-07 性能监控方法、设备、可读存储介质及计算机程序产品

Country Status (1)

Country Link
CN (1) CN117971600A (zh)

Similar Documents

Publication Publication Date Title
CN110086666B (zh) 一种告警方法、装置及系统
US11409645B1 (en) Intermittent failure metrics in technological processes
CN110428127B (zh) 自动化分析方法、用户设备、存储介质及装置
US11042525B2 (en) Extracting and labeling custom information from log messages
CN111866016A (zh) 日志的分析方法及系统
CN110471945B (zh) 活跃数据的处理方法、系统、计算机设备和存储介质
CN110083391A (zh) 调用请求监控方法、装置、设备及存储介质
US11201802B2 (en) Systems and methods for providing infrastructure metrics
US20080168044A1 (en) System and method for providing performance statistics for application components
CN111259073A (zh) 基于日志、流量和业务访问的业务系统运行状态智能研判系统
EP3864516A1 (en) Veto-based model for measuring product health
CN114648393A (zh) 一种应用于招投标的数据挖掘方法、系统及设备
CN111367760A (zh) 日志采集方法及装置、计算机设备、存储介质
CN113760677A (zh) 异常链路分析方法、装置、设备及存储介质
CN110677271A (zh) 基于elk的大数据告警方法、装置、设备及存储介质
CN107908525B (zh) 告警处理方法、设备及可读存储介质
CN114116872A (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
CN117130853A (zh) 基于数字化的数据全链路自动化处理方法、装置
CN110011845B (zh) 日志采集方法及系统
CN117971600A (zh) 性能监控方法、设备、可读存储介质及计算机程序产品
KR20240072451A (ko) 잠재 공간 기반 로그 모니터링 처리 시스템 및 방법
CN115545452A (zh) 运维方法、运维系统、设备及存储介质
CN111865696B (zh) 网络安全的可视化方法、装置、设备及介质
KR20220032706A (ko) 이벤트의 인과관계 가시화 장치 및 그 방법
CN112765213A (zh) 一种二代征信自动化查询方法、系统及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination