CN112463561A - 一种故障定位方法、装置、设备及存储介质 - Google Patents
一种故障定位方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112463561A CN112463561A CN202011316744.6A CN202011316744A CN112463561A CN 112463561 A CN112463561 A CN 112463561A CN 202011316744 A CN202011316744 A CN 202011316744A CN 112463561 A CN112463561 A CN 112463561A
- Authority
- CN
- China
- Prior art keywords
- task
- target
- bare metal
- fault
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 131
- 239000002184 metal Substances 0.000 claims abstract description 123
- 230000008569 process Effects 0.000 claims abstract description 66
- 238000013507 mapping Methods 0.000 claims abstract description 17
- 238000012544 monitoring process Methods 0.000 claims description 58
- 238000004458 analytical method Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 6
- 230000004807 localization Effects 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 6
- 238000007689 inspection Methods 0.000 description 6
- 238000012423 maintenance Methods 0.000 description 6
- 238000013480 data collection Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 230000002085 persistent effect Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000002688 persistence Effects 0.000 description 3
- 230000000750 progressive effect Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 208000034423 Delivery Diseases 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3058—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3485—Performance evaluation by tracing or monitoring for I/O devices
Abstract
本申请公开了一种故障定位方法、系统、装置、设备及存储介质,所述方法包括:响应对裸金属系统的任务执行请求,所述任务执行请求包括目标任务的任务类型;基于任务接口映射关系,确定与所述任务类型对应的目标接口;利用所述目标接口调用所述裸金属系统中与所述目标任务对应的多个任务节点,以使所述多个任务节点执行所述目标任务,并各自生成所述目标任务执行过程中的链路日志;接收所述多个任务节点分别发送的各自对应的链路日志,并基于所述链路日志生成所述目标任务执行过程中的全链路日志;当监测到所述目标任务执行失败时,基于所述全链路日志对所述裸金属系统进行故障定位,本申请不仅提高了故障定位的精确性,也使得故障定位更加简便。
Description
技术领域
本申请涉及计算机技术领域,具体涉及一种故障定位方法、装置、设备及存储介质。
背景技术
目前,裸金属服务器产品为用户提供了一键式物理服务器交付的服务,用户可以通过租户控制台、开放接口两种渠道对物理服务器进行对应操作。裸金属服务器产品还为用户提供了丰富的软件开发工具包,并支持多种主流的编程语言,如Java、Python等。由于裸金属服务器产品涉及到物理服务器交付,在判断物理服务器是否满足交付投放条件时需要进行的检查项较多,其中任何一项出现错误都可能导致物理服务器投放失败。当物理服务器投放失败时,需要运维人员针对众多检查项排查具体原因,这在一定程度上给运维人员的日常运维工作带来了难度。
现在运用范围广泛的Zabbix自动化运维工具较多运用在对服务器的管理与监控方面。而且,Zabbix工具没有给普通用户提供全面的接口监控,操作页面友好程度较低。对于裸金属服务器的产品交付流程的任务编排与全链路跟踪,Zabbix工具也只能对每个任务节点独立监控,无法做到对任务链路的集成监控。目前,基于任务节点的独立监控日志生成相应任务链路的集成监控日志需要耗费大量的时间与人力成本。因此,需要提供更加可靠高效的方案。
发明内容
为了解决现有技术的问题,本申请提供了一种故障定位方法、装置、设备及存储介质。所述技术方案如下:
一方面,提供了一种故障定位方法,所述方法包括:
故障定位端响应于对裸金属系统的任务执行请求,所述任务执行请求包括目标任务的任务类型;
所述故障定位端基于任务接口映射关系,确定与所述任务类型对应的目标接口;
所述故障定位端利用所述目标接口调用所述裸金属系统中与所述目标任务对应的多个任务节点;
所述多个任务节点执行所述目标任务,并各自生成所述目标任务执行过程中的链路日志;
所述多个任务节点分别向所述故障定位端发送各自对应的链路日志;
所述故障定位端接收所述多个任务节点各自对应的链路日志,并基于所述链路日志生成所述目标任务执行过程中的全链路日志;
当监测到所述目标任务执行失败时,所述故障定位端基于所述全链路日志对所述裸金属系统进行故障定位。
另一方面,提供了一种故障定位方法,所述方法包括:
响应对裸金属系统的任务执行请求,所述任务执行请求包括目标任务的任务类型;
基于任务接口映射关系,确定与所述任务类型对应的目标接口;
利用所述目标接口调用所述裸金属系统中与所述目标任务对应的多个任务节点,以使所述多个任务节点执行所述目标任务,并各自生成所述目标任务执行过程中的链路日志;
接收所述多个任务节点分别发送的各自对应的链路日志,并基于所述链路日志生成所述目标任务执行过程中的全链路日志;
当监测到所述目标任务执行失败时,基于所述全链路日志对所述裸金属系统进行故障定位。
另一方面,提供了一种故障定位系统,所述系统包括:故障定位端、多个任务节点;其中,
所述故障定位端,用于响应对裸金属系统的任务执行请求,所述任务执行请求包括目标任务的任务类型;基于任务接口映射关系,确定与所述任务类型对应的目标接口;利用所述目标接口调用所述裸金属系统中与所述目标任务对应的多个任务节点;接收所述多个任务节点各自对应的链路日志,并基于所述链路日志生成所述目标任务执行过程中的全链路日志;当监测到所述目标任务执行失败时,基于所述全链路日志对所述裸金属系统进行故障定位;
所述多个任务节点,用于执行所述目标任务,并各自生成所述目标任务执行过程中的链路日志;分别向所述故障定位端发送各自对应的链路日志。
另一方面,提供了一种故障定位装置,所述装置包括:
任务执行请求接收模块,用于响应对裸金属系统的任务执行请求,所述任务执行请求包括目标任务的任务类型;
目标接口确定模块,用于基于任务接口映射关系,确定与所述任务类型对应的目标接口;
任务节点调用模块,用于利用所述目标接口调用所述裸金属系统中与所述目标任务对应的多个任务节点,以使所述多个任务节点执行所述目标任务,并各自生成所述目标任务执行过程中的链路日志;
全链路日志生成模块,用于接收所述多个任务节点分别发送的各自对应的链路日志,并基于所述链路日志生成所述目标任务执行过程中的全链路日志;
故障定位模块,用于当监测到所述目标任务执行失败时,基于所述全链路日志对所述裸金属系统进行故障定位。
另一方面,提供了一种故障定位设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述的故障定位方法。
另一方面,提供了一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如上述的故障定位方法。
本申请提供的故障定位方法、系统、装置、设备及存储介质,具有如下技术效果:
本申请通过响应故障定位前端的裸金属系统的任务执行请求,故障定位后台会自动寻找任务接口映射关系,通过开放接口调用相关任务节点,获取任务执行过程中的全链路日志,实现故障的快速定位,提高了故障定位的精确性,也使得故障定位更加简便。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本申请实施例提供的一种应用环境的示意图;
图2是本申请实施例提供的一种故障定位方法的流程图;
图3是本申请实施例提供的多个任务节点执行目标任务的流程示意图;
图4是本申请实施例提供的另一种故障定位方法的流程图;
图5是本申请实施例提供的一种故障定位装置示意图;
图6是本申请实施例提供的一种故障定位方法的故障定位后台服务器的硬件结构框图;
图7是本申请实施例提供的一种故障定位方法的故障定位端的软件结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
请参阅图1,图1是本申请实施例提供的一种应用环境的示意图,如图1所示,上述应用环境包括故障定位端01、多个任务节点02、裸金属服务器03。
具体的,故障定位端01可以包括故障定位前端011和故障定位后台012。故障定位前端011可以包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、智能可穿戴设备等类型的实体设备,也可以包括运行于实体设备中的软体,例如应用程序(APP)、网页、微信小程序等。具体的,故障定位前端011可以向后台发送对裸金属系统的任务执行请求。
具体的,故障定位后台012可以包括一个独立运行的服务器,或者分布式服务器,或者由多个服务器组成的服务器集群。故障定位后台012可以包括有网络通信单元、处理器和存储器等等。具体的,故障定位后台012可以响应故障定位前端对裸金属系统的任务执行请求,上述任务执行请求包括目标任务的任务类型;基于任务接口映射关系,确定与上述任务类型对应的目标接口;利用上述目标接口调用上述裸金属系统中与上述目标任务对应的多个任务节点,以使上述多个任务节点执行上述目标任务,并各自生成上述目标任务执行过程中的链路日志;接收上述多个任务节点分别发送的各自对应的链路日志,并基于上述链路日志生成上述目标任务执行过程中的全链路日志;当监测到上述目标任务执行失败时,基于上述全链路日志对上述裸金属系统进行故障定位。
具体的,多个任务节点02可以为在任务管控端为裸金属服务器提供服务支撑的多个应用组件。具体的,多个任务节点02可以执行上述目标任务,并各自生成上述目标任务执行过程中的链路日志;分别向上述故障定位端发送各自对应的链路日志。
具体的,裸金属服务器03可以包括一个独立运行的服务器,或者分布式服务器,或者由多个服务器组成的服务器集群。裸金属服务器可以包括有网络通信单元、处理器和存储器等等。具体的,裸金属服务器03可以接收目标任务对应的控制指令并执行控制指令。
以下介绍本申请实施例提供的一种故障定位方法,图2为本申请实施例提供的一种故障定位方法的流程示意图。需要说明的是,本说明书提供了如实施例或流程图上述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图2所示,上述方法可以包括:
S201,故障定位端响应于对裸金属系统的任务执行请求,所述任务执行请求包括目标任务的任务类型。
在本说明书实施例中,故障定位端可以包括故障定位前端和故障定位后台。运维人员可以在故障定位前端自定义编排任务,故障定位前端触发任务执行请求,上述自定义编排任务可以包括自定义编排裸金属服务器交付流程检查任务和自定义编排开放平台接口检查任务。
具体的,上述裸金属服务器交付流程检查为对裸金属服务器交付流程的全生命周期中租户可能执行的所有操作进行整体性检查,具体的,裸金属服务器交付流程的全生命周期为裸金属服务器的实例从被租户购买到被租户退还所经历的所有状态,包括但不限于对实例进行新建、开机、关机、重启和重装操作,上述实例为裸金属系统中基于裸金属服务器的物理计算资源。
上述开放平台接口检查为对裸金属服务器交付流程的全生命周期中租户可能执行的所有操作对应的目标接口进行功能检查,上述目标接口可以为Open API接口(开放平台接口)。
在本说明书实施例中,故障定位前端向故障定位后台发送对裸金属系统的任务执行请求,故障定位后台响应于上述任务执行请求。
具体的,上述任务执行请求可以包括目标任务的任务类型、运行配置信息和预设执行时间,上述任务类型可以包括但不限于实例新建、实例开机、实例关机、实例重启和实例重启,上述运行配置信息可以包括但不限于裸金属服务器CPU、内存、硬盘、操作系统、RAID(磁盘阵列)配置、私有网络,上述预设执行时间可以为24小时中的任一时间点,例如可以为9:30、16:40或者22:22。
在本说明书实施例中,当上述目标任务包括多个任务时,在上述响应于对裸金属系统的任务执行请求之后,上述方法还包括:
为每个任务分配各自的进程标识符。
在本说明书实施例中,每个任务各自的进程标识符在每个任务的执行进程中作为标识信息以区分不同任务。
S203,上述故障定位端基于任务接口映射关系,确定与上述任务类型对应的目标接口。
在本说明书实施例中,基于任务接口映射关系,每种任务类型对应一个目标接口,属于同种任务类型的多个任务在调用同一目标接口时分别设置对应的路径参数。
S205,上述故障定位端利用上述目标接口调用上述裸金属系统中与上述目标任务对应的多个任务节点。
在本说明书实施例中,上述多个任务节点为与目标任务的子任务执行顺序对应的多个任务节点。
具体的,故障定位端利用上述目标接口调用上述裸金属系统中与上述目标任务对应的多个任务节点可以包括:
故障定位端向多个任务节点中的中心任务节点发送目标任务执行请求,目标任务执行请求包括目标任务的子任务执行顺序信息,子任务执行顺序信息为目标任务的多个子任务执行过程中对应的多个任务节点中的非中心任务节点的调用顺序。
在本说明书实施例中,当上述目标任务包括多个任务时,上述目标任务执行请求包括多个任务执行请求,每个任务执行请求包括该任务的进程标识符和该任务的子任务执行顺序信息。
S207,上述多个任务节点执行上述目标任务,并各自生成上述目标任务执行过程中的链路日志。
具体的,如图3所示,上述执行上述目标任务,并各自生成上述目标任务执行过程中的链路日志可以包括:
S301,上述中心任务节点接收上述故障定位端发送的目标任务执行请求。
S303,上述中心任务节点基于上述子任务执行顺序信息向上述非中心任务节点发送调用请求。
具体的,中心任务节点基于目标任务的多个子任务执行过程中对应的非中心任务节点的调用顺序依次向多个非中心任务节点发送调用请求。
S305,上述非中心任务节点接收上述调用请求,并执行上述子任务。
S307,上述非中心任务节点向上述中心任务节点发送上述子任务的执行结果。
S309,根据上述子任务执行顺序信息调用的最后一个非中心任务节点将上述目标任务对应的控制指令发送给与对应的裸金属服务器,并获取上述控制指令的反馈结果。
具体的,根据上述子任务执行顺序信息调用的多个非中心任务节点中的最后一个非中心任务节点将上述目标任务对应的控制指令发送给与对应的裸金属服务器,并获取上述控制指令的反馈结果可以包括:
1)最后一个非中心任务节点将目标任务对应的控制指令发送给与目标任务的运行配置信息对应的裸金属服务器;
2)裸金属服务器接收上述控制指令并执行上述控制指令;
3)最后一个非中心任务节点获取上述控制指令的反馈结果,上述反馈结果可以包括控制指令的发送结果和执行结果。
S311,上述多个任务节点各自生成上述目标任务的上述子任务执行过程中的链路日志。
具体的,中心任务节点和非中心任务节点各自生成上述目标任务的上述子任务执行过程中的链路日志,链路日志可以包括任务节点的实际调用结果和子任务执行结果,最后一个非中心任务节点的子任务执行结果还包括对裸金属服务器的控制指令的反馈结果。
在本说明书实施例中,当目标任务包括多个任务时,每个任务的多个任务节点基于每个任务的进程标识符各自生成每个任务的子任务执行过程中的链路日志。
S209,上述多个任务节点分别向上述故障定位端发送各自对应的链路日志。
S211,上述故障定位端接收上述多个任务节点各自对应的链路日志,并基于上述链路日志生成上述目标任务执行过程中的全链路日志。
具体的,全链路日志可以包括目标接口的调用结果、多个任务节点的实际调用顺序、调用结果和子任务执行结果。
在本说明书实施例中,当目标任务包括多个任务时,全链路日志包括多个任务中的每个任务的全链路日志。
S213,当监测到上述目标任务执行失败时,上述故障定位端基于上述全链路日志对上述裸金属系统进行故障定位。
在本说明书实施例中,上述故障定位方法还包括:
1)基于不同类别的监控代理组件对上述裸金属系统的任务节点、网关服务器和裸金属服务器分别进行目标监控项的数据收集;
具体的,基于命令行类监控代理组件对任务节点进行目标监控项的数据收集,任务节点的目标监控项可以包括但不限于CPU监控、内存监控、I/O(输入/输出)监控、进程监控;
基于脚本类监控代理组件对网关服务器进行目标监控项的数据收集,网关服务器的目标监控项可以包括但不限于CPU监控、内存监控、I/O(输入/输出)监控、进程监控、路由表监控、转发包监控;
基于软件开发包类监控代理组件对裸金属服务器进行目标监控项的数据收集,裸金属服务器的目标监控项可以包括但不限于CPU监控、内存监控、I/O(输入/输出)监控。
2)根据收集的目标监控数据分别生成所述任务节点、所述网关服务器和所述裸金属服务器的监控日志。
具体的,任务节点的监控日志包括性能日志、进程日志;网关服务器的监控日志可以包括性能日志、进程日志、路由表更新日志、转发包错误日志;裸金属服务器的监控日志包括性能日志。
在一些实施例中,上述当监测到上述目标任务执行失败时,基于上述全链路日志对上述裸金属系统进行故障定位包括:
1)根据对所述全链路日志的分析,从执行失败的目标任务对应的任务节点和裸金属服务器中确定故障点;
具体的,根据对全链路日志的分析,当目标任务执行失败是由于某个任务节点调用失败导致时,将该任务节点作为故障点;当目标任务执行失败是由于裸金属服务器接收控制指令失败或执行控制指令失败导致时,将裸金属服务器作为故障点。
2)基于故障点的监控日志生成裸金属系统的故障分析结果。
具体的,当故障点为任务节点时,基于该任务节点的监控日志生成裸金属系统的故障分析结果;当故障点为裸金属服务器时,基于裸金属服务器的监控日志生成裸金属系统的故障分析结果。
在另一些实施例中,当上述目标任务包括多个任务时,上述当监测到上述目标任务执行失败时,基于上述全链路日志对上述裸金属系统进行故障定位包括:
1)当监测到任一任务执行失败时,基于执行失败的任务的进程标识符查询执行失败的任务的全链路日志。
具体的,当监测到任一任务执行失败时,从所有任务的全链路日志中基于执行失败的任务的进程标识符查询执行失败的任务的全链路日志。
2)根据对全链路日志的分析,从执行失败的任务对应的任务节点和裸金属服务器中确定故障点。
具体的,根据对全链路日志的分析,当目标任务执行失败是由于某个任务节点调用失败导致时,将该任务节点作为故障点;当目标任务执行失败是由于裸金属服务器接收控制指令失败或执行控制指令失败导致时,将裸金属服务器作为故障点。
3)基于故障点的监控日志生成裸金属系统的故障分析结果。
具体的,当故障点为任务节点时,基于该任务节点的监控日志生成裸金属系统的故障分析结果;当故障点为裸金属服务器时,基于裸金属服务器的监控日志生成裸金属系统的故障分析结果。
在实际应用中,运维人员可以通过裸金属系统的故障分析结果对裸金属系统进行维护,以保证裸金属系统的裸金属服务器面向租户时实现正常交付。
以下以故障定位端为执行主体介绍本说明书另一种故障定位方法的具体实施例,图4是本发明实施例提供的一种故障定位方法的流程示意图,本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图4所示,上述方法可以包括:
S401,响应对裸金属系统的任务执行请求,上述任务执行请求包括目标任务的任务类型。
S403,基于任务接口映射关系,确定与上述任务类型对应的目标接口。
S405,利用上述目标接口调用上述裸金属系统中与上述目标任务对应的多个任务节点,以使上述多个任务节点执行上述目标任务,并各自生成上述目标任务执行过程中的链路日志。
S407,接收上述多个任务节点分别发送的各自对应的链路日志,并基于上述链路日志生成上述目标任务执行过程中的全链路日志。
S409,当监测到上述目标任务执行失败时,基于上述全链路日志对上述裸金属系统进行故障定位。
上述从故障定位端单侧撰写的故障定位方法的实施例的具体细化步骤可以参见上述交互侧故障定位方法的实施例,在此不再赘述。
本申请实施例还提供了一种故障定位系统,用以实现图2所示的方法。本系统实施例与前述方法实施例对应,能够实现前述方法实施例中的全部内容。为便于阅读,本系统实施例仅对前述方法实施例中的内容进行概要性描述,不对方法实施例中的细节内容进行逐一赘述。上述系统包括:故障定位端和多个任务节点;其中,
上述故障定位端,用于响应对裸金属系统的任务执行请求,上述任务执行请求包括目标任务的任务类型;基于任务接口映射关系,确定与上述任务类型对应的目标接口;利用上述目标接口调用上述裸金属系统中与上述目标任务对应的多个任务节点;接收上述多个任务节点各自对应的链路日志,并基于上述链路日志生成上述目标任务执行过程中的全链路日志;当监测到上述目标任务执行失败时,基于上述全链路日志对上述裸金属系统进行故障定位;
上述多个任务节点,用于执行上述目标任务,并各自生成上述目标任务执行过程中的链路日志;分别向上述故障定位端发送各自对应的链路日志。
在本说明书实施例中,上述系统中上述多个任务节点包括:中心任务节点和非中心任务节点,非中心节点还包括:根据上述子任务执行顺序信息调用的最后一个非中心任务节点,其中:
上述中心任务节点,用于接收上述故障定位端发送的目标任务执行请求;基于上述子任务执行顺序信息向上述非中心任务节点发送调用请求;各自生成上述目标任务的上述子任务执行过程中的链路日志;
上述非中心任务节点,用于接收上述调用请求,并执行上述子任务;向上述中心任务节点发送上述子任务的执行结果;各自生成上述目标任务的上述子任务执行过程中的链路日志;
上述最后一个非中心任务节点,还用于将上述目标任务对应的控制指令发送给与对应的裸金属服务器,并获取上述控制指令的反馈结果。
在本说明书实施例中,上述系统还可以包括:裸金属服务器,其中:
上述裸金属服务器,用于接收上述控制指令并执行上述控制指令。
从以上的描述中,可以看出,在本申请实施例中,上述故障定位端响应于对裸金属系统的任务执行请求,上述任务执行请求包括目标任务的任务类型;接着,上述故障定位端基于任务接口映射关系,确定与上述任务类型对应的目标接口;然后,上述故障定位端利用上述目标接口调用上述裸金属系统中与上述目标任务对应的多个任务节点;上述多个任务节点执行上述目标任务,其中:上述中心任务节点接收上述故障定位端发送的目标任务执行请求,还基于上述子任务执行顺序信息向上述非中心任务节点发送调用请求;上述非中心任务节点接收上述调用请求,并执行上述子任务,向上述中心任务节点发送上述子任务的执行结果;上述最后一个非中心任务节点将上述目标任务对应的控制指令发送给与对应的裸金属服务器,并获取上述控制指令的反馈结果;随后,上述多个任务节点各自生成上述目标任务执行过程中的链路日志,并分别向上述故障定位端发送各自对应的链路日志;上述故障定位端接收上述多个任务节点各自对应的链路日志,并基于上述链路日志生成上述目标任务执行过程中的全链路日志;最后,当监测到上述目标任务执行失败时,上述故障定位端基于上述全链路日志对上述裸金属系统进行故障定位,提高了故障定位的精确性,也使得故障定位更加简便。
本申请实施例还提供了一种故障定位装置,如图5所示,上述装置包括:
任务执行请求接收模块510,用于响应对裸金属系统的任务执行请求,上述任务执行请求包括目标任务的任务类型;
目标接口确定模块520,用于基于任务接口映射关系,确定与上述任务类型对应的目标接口;
任务节点调用模块530,用于利用上述目标接口调用上述裸金属系统中与上述目标任务对应的多个任务节点,以使上述多个任务节点执行上述目标任务,并各自生成上述目标任务执行过程中的链路日志;
全链路日志生成模块540,用于接收上述多个任务节点分别发送的各自对应的链路日志,并基于上述链路日志生成上述目标任务执行过程中的全链路日志;
故障定位模块550,用于当监测到上述目标任务执行失败时,基于上述全链路日志对上述裸金属系统进行故障定位。
在本说明书实施例中,上述装置还可以包括:
目标监控项的数据收集模块,用于基于不同类别的监控代理组件对上述裸金属系统的任务节点、网关服务器和裸金属服务器分别进行目标监控项的数据收集;
监控日志生成模块,用于根据收集的目标监控数据分别生成所述任务节点、所述网关服务器和所述裸金属服务器的监控日志。
在本说明书实施例中,当上述目标任务包括多个任务时,在上述任务执行请求接收模块510之后,上述装置还可以包括:
进程标识符分配模块,用于为每个任务分配各自的进程标识符。
在本说明书实施例中,上述任务节点调用模块530还可以包括:
目标任务执行请求发送单元,用于向多个任务节点中的中心任务节点发送目标任务执行请求。
在本说明书实施例中,上述故障定位模块550还可以包括:
故障点确定单元,用于根据对全链路日志的分析,从执行失败的任务对应的任务节点和裸金属服务器中确定故障点;
故障分析结果生成单元,用于基于故障点的监控日志生成裸金属系统的故障分析结果。
在本说明书实施例中,当上述目标任务包括多个任务时,上述故障定位模块550还可以包括:
执行失败的任务的全链路日志查询单元,用于当监测到任一任务执行失败时,基于执行失败的任务的进程标识符查询执行失败的任务的全链路日志。
上述的装置实施例中的装置与方法实施例基于同样的申请构思。
本申请实施例提供了一种故障定位设备,该故障定位设备包括处理器和存储器,该存储器中存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现如上述方法实施例所提供的故障定位方法。
存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、功能所需的应用程序等;存储数据区可存储根据上述设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器还可以包括存储器控制器,以提供处理器对存储器的访问。
本申请实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行,即上述计算机设备可以包括移动终端、计算机终端、服务器或者类似的运算装置。以运行在服务器上为例,图6是本申请实施例提供的一种故障定位方法的故障定位后台服务器的硬件结构框图。如图6所示,该故障定位后台服务器600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central ProcessingUnits,CPU)610(处理器610可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器630,一个或一个以上存储应用程序623或数据622的存储介质620(例如一个或一个以上海量存储设备)。其中,存储器630和存储介质620可以是短暂存储或持久存储。存储在存储介质620的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器610可以设置为与存储介质620通信,在故障定位后台服务器600上执行存储介质620中的一系列指令操作。故障定位后台服务器600还可以包括一个或一个以上电源660,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口640,和/或,一个或一个以上操作系统621,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
输入输出接口640可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括故障定位后台服务器600的通信供应商提供的无线网络。在一个实例中,输入输出接口640包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,输入输出接口640可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
本领域普通技术人员可以理解,图6所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,故障定位后台服务器600还可包括比图6中所示更多或者更少的组件,或者具有与图6所示不同的配置。
本申请实施例提供了一种故障定位方法的故障定位端的软件结构,如图7所示,该故障定位端的软件结构依托Spring框架(开源的轻量级的Java开发框架),采用MVC模式(Model View Controller模式,模型-视图-控制器模式)将展示层、业务层和持久层分离。故障定位端的故障定位前端的UI(User Interface,用户界面)使用Vue.js框架(Vue.JavaScript,用于构建用户界面的渐进式JavaScript框架)并通过JavaScript(解释性脚本语言)、CSS(Cascading Style Sheets,层叠样式表)进行页面的渲染,故障定位前端通过Ajax(Asynchronous JavaScript And eXtensible Markup Language,异步JavaScript和XML,创建交互式、快速动态网页应用的网页开发技术)与故障定位后台展示层交互,故障定位前端与故障定位后台展示层的交互通过http(超文本传输协议)中的post(新建资源)请求与get(获取资源)请求发送。
故障定位后台展示层基于故障定位前端的Vue.js框架(Vue.JavaScript,用于构建用户界面的渐进式JavaScript框架)的模版引擎渲染进行UI(User Interface,用户界面)展示,并基于故障定位前端的Ajax(Asynchronous JavaScript And eXtensibleMarkup Language,异步JavaScript和XML,创建交互式、快速动态网页应用的网页开发技术)交互进行数据展示。故障定位前端与故障定位后台展示层交互中使用http(超文本传输协议)的post方式的接口,并在http(超文本传输协议)请求的body(请求体)中引入LogResultVo类(统一返回)作为故障定位前端与故障定位后台交互调用的参数,调用成功返回LogResultVo.asSuccess(统一返回成功),如果调用产生参数则放入LogResultVo(统一返回)对象中,而调用失败返回LogResultVo.asError(统一返回失败),并通过代码层报错日志输出错误信息。
故障定位后台业务层为故障定位后台功能实现部分,相关功能包括:裸金属服务器交付流程检查、开放平台接口检查、任务节点的目标监控项监控、网关服务器的目标监控项监控、裸金属服务器的目标监控项监控。业务层的工程结构划分包括:工程启动类置于项目代码层根目录下;配置信息类置于config(configuration,配置信息)包下;常量接口类(constant)置于constants(常量接口)包下;dao(data access object,数据访问对象)包是MyBatis框架(持久层框架)生成的目录机构,dao(data access object,数据访问对象)包下包含mapper(数据持久化)与model(对应数据库表结构的实体类);和数据库表结构无关的实体类放置在entity(实体)包下;(外观模式)包下包含facade.controller(外观模式控制器)包和facade.handler(外观模式处理器)包,前端控制器置于facade.controller(外观模式控制器)包下,全局异常catch(捕获)置于facade.handler(外观模式处理器)包下;客户机类(client)置于factory(工厂模式)包下;数据服务层(Service)置于service(数据服务)包下,数据服务的实现接口(serviceImpl,serviceImplement)置于service.impl(service.implement,数据服务实现)包下;工具类置于utils(工具)包下;数据传输类(vo,value object)置于vo(value object,值对象)包下。业务层根据该工程结构划分生成相应的工程目录结构。
故障定位后台持久层使用MySQL(My Structured Query Language,关系型数据库管理系统)与Redis(Remote Dictionary Server,远程字典服务)作为数据库,在LocalCache(本地缓存)中存放本地缓存数据,选择MyBatis框架(持久层框架)并且通过generator插件(自动生成代码插件)根据数据库表结果自动生成model(对应数据库表结构的实体类)、mapper(数据持久化)配置文件和dao(data access object,数据访问对象)层代码,能够很轻便地为数据库进行配置操作。
本软件结构实施例实现了故障定位端代码块之间的高内聚和低耦合,当裸金属系统后续产品迭代中引入新的接口或修改裸金属服务器交付流程时,能够进行多接口的横向拓展与任务多节点的纵向拓展,增加发明本身的适用范围和能力。
本申请实施例还提供了一种存储介质,上述存储介质可设置于服务器之中以保存用于实现方法实施例中一种的故障定位方法相关的至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现上述方法实施例提供的故障定位方法。
可选地,在本实施例中,上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
由上述本申请提供的故障定位方法、系统、装置、设备或存储介质的实施例可见,本申请能够实现对裸金属服务器交付流程检查和开放平台接口检查的自动化执行,并实现对执行失败的任务的快速故障定位,不仅提高了故障定位的精确性,也使得故障定位更加简便。
需要说明的是:上述本申请实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备和存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指示相关的硬件完成,上述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种故障定位方法,其特征在于,所述方法包括:
故障定位端响应于对裸金属系统的任务执行请求,所述任务执行请求包括目标任务的任务类型;
所述故障定位端基于任务接口映射关系,确定与所述任务类型对应的目标接口;
所述故障定位端利用所述目标接口调用所述裸金属系统中与所述目标任务对应的多个任务节点;
所述多个任务节点执行所述目标任务,并各自生成所述目标任务执行过程中的链路日志;
所述多个任务节点分别向所述故障定位端发送各自对应的链路日志;
所述故障定位端接收所述多个任务节点各自对应的链路日志,并基于所述链路日志生成所述目标任务执行过程中的全链路日志;
当监测到所述目标任务执行失败时,所述故障定位端基于所述全链路日志对所述裸金属系统进行故障定位。
2.根据权利要求1所述的方法,其特征在于,所述多个任务节点为与所述目标任务的子任务执行顺序对应的多个任务节点,所述多个任务节点执行所述目标任务,并各自生成所述目标任务执行过程中的链路日志包括:
所述多个任务节点中的中心任务节点接收所述故障定位端发送的目标任务执行请求,所述目标任务执行请求包括所述目标任务的子任务执行顺序信息,所述子任务执行顺序信息为所述目标任务的多个子任务执行过程中对应的所述多个任务节点中的非中心任务节点的调用顺序;
所述中心任务节点基于所述子任务执行顺序信息向所述非中心任务节点发送调用请求;
所述非中心任务节点接收所述调用请求,并执行所述子任务;
所述非中心任务节点向所述中心任务节点发送所述子任务的执行结果;
根据所述子任务执行顺序信息调用的最后一个非中心任务节点将所述目标任务对应的控制指令发送给与对应的裸金属服务器,并获取所述控制指令的反馈结果;
所述多个任务节点各自生成所述目标任务的所述子任务执行过程中的链路日志。
3.一种故障定位方法,其特征在于,所述方法包括:
响应对裸金属系统的任务执行请求,所述任务执行请求包括目标任务的任务类型;
基于任务接口映射关系,确定与所述任务类型对应的目标接口;
利用所述目标接口调用所述裸金属系统中与所述目标任务对应的多个任务节点,以使所述多个任务节点执行所述目标任务,并各自生成所述目标任务执行过程中的链路日志;
接收所述多个任务节点分别发送的各自对应的链路日志,并基于所述链路日志生成所述目标任务执行过程中的全链路日志;
当监测到所述目标任务执行失败时,基于所述全链路日志对所述裸金属系统进行故障定位。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
基于不同类别的监控代理组件对所述裸金属系统的任务节点、网关服务器和裸金属服务器分别进行目标监控项的数据收集;
根据收集的目标监控数据分别生成所述任务节点、所述网关服务器和所述裸金属服务器的监控日志。
5.根据权利要求4所述的方法,其特征在于,所述多个任务节点为与所述目标任务的子任务执行顺序对应的多个任务节点,所述利用所述目标接口调用所述裸金属系统中与所述目标任务对应的多个任务节点包括:
向所述多个任务节点中的中心任务节点发送目标任务执行请求,所述目标任务执行请求包括所述目标任务的子任务执行顺序信息,所述子任务执行顺序信息为所述目标任务的多个子任务执行过程中对应的所述多个任务节点中的非中心任务节点的调用顺序。
6.根据权利要求5所述的方法,其特征在于,所述当监测到所述目标任务执行失败时,基于所述全链路日志对所述裸金属系统进行故障定位包括:
根据对所述全链路日志的分析,从执行失败的目标任务对应的任务节点和裸金属服务器中确定故障点;
基于所述故障点的所述监控日志生成所述裸金属系统的故障分析结果。
7.一种故障定位系统,其特征在于,所述系统包括:故障定位端、多个任务节点;其中,
所述故障定位端,用于响应对裸金属系统的任务执行请求,所述任务执行请求包括目标任务的任务类型;基于任务接口映射关系,确定与所述任务类型对应的目标接口;利用所述目标接口调用所述裸金属系统中与所述目标任务对应的多个任务节点;接收所述多个任务节点各自对应的链路日志,并基于所述链路日志生成所述目标任务执行过程中的全链路日志;当监测到所述目标任务执行失败时,基于所述全链路日志对所述裸金属系统进行故障定位;
所述多个任务节点,用于执行所述目标任务,并各自生成所述目标任务执行过程中的链路日志;分别向所述故障定位端发送各自对应的链路日志。
8.一种故障定位装置,其特征在于,所述装置包括:
任务执行请求接收模块,用于响应对裸金属系统的任务执行请求,所述任务执行请求包括目标任务的任务类型;
目标接口确定模块,用于基于任务接口映射关系,确定与所述任务类型对应的目标接口;
任务节点调用模块,用于利用所述目标接口调用所述裸金属系统中与所述目标任务对应的多个任务节点,以使所述多个任务节点执行所述目标任务,并各自生成所述目标任务执行过程中的链路日志;
全链路日志生成模块,用于接收所述多个任务节点分别发送的各自对应的链路日志,并基于所述链路日志生成所述目标任务执行过程中的全链路日志;
故障定位模块,用于当监测到所述目标任务执行失败时,基于所述全链路日志对所述裸金属系统进行故障定位。
9.一种故障定位设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如权利要求1至6任一所述的故障定位方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1至6任一所述的故障定位方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011316744.6A CN112463561A (zh) | 2020-11-20 | 2020-11-20 | 一种故障定位方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011316744.6A CN112463561A (zh) | 2020-11-20 | 2020-11-20 | 一种故障定位方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112463561A true CN112463561A (zh) | 2021-03-09 |
Family
ID=74798307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011316744.6A Pending CN112463561A (zh) | 2020-11-20 | 2020-11-20 | 一种故障定位方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112463561A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115410290A (zh) * | 2021-09-30 | 2022-11-29 | 北京罗克维尔斯科技有限公司 | 日志传输方法、装置及计算设备 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8661295B1 (en) * | 2011-03-31 | 2014-02-25 | Amazon Technologies, Inc. | Monitoring and detecting causes of failures of network paths |
US20140082184A1 (en) * | 2012-09-14 | 2014-03-20 | Alibaba Group Holding Limited | Method and system for monitoring execution of user request in distributed system |
WO2018045756A1 (zh) * | 2016-09-06 | 2018-03-15 | 华为技术有限公司 | 故障定位平台、故障定位方法及装置 |
CN109451583A (zh) * | 2018-11-19 | 2019-03-08 | 希诺麦田技术(深圳)有限公司 | 基于超帧的自组网方法、装置、节点终端和存储介质 |
CN110457190A (zh) * | 2019-07-09 | 2019-11-15 | 优估(上海)信息科技有限公司 | 一种基于区块链的全链路监控方法、装置及系统 |
CN110489317A (zh) * | 2019-08-14 | 2019-11-22 | 中国科学院计算技术研究所 | 基于工作流的云系统任务运行故障诊断方法与系统 |
CN111124819A (zh) * | 2019-12-10 | 2020-05-08 | 中国建设银行股份有限公司 | 全链路监控的方法和装置 |
CN111290854A (zh) * | 2020-01-20 | 2020-06-16 | 腾讯科技(深圳)有限公司 | 任务管理方法、装置、系统、计算机存储介质及电子设备 |
CN111611100A (zh) * | 2020-05-26 | 2020-09-01 | 中国工商银行股份有限公司 | 交易故障检测方法、装置、计算设备以及介质 |
CN111625410A (zh) * | 2019-02-27 | 2020-09-04 | 阿里巴巴集团控股有限公司 | 信息处理方法、设备及计算机存储介质 |
CN111666138A (zh) * | 2020-05-19 | 2020-09-15 | 微民保险代理有限公司 | 定时任务处理方法、装置、系统、计算机设备和存储介质 |
CN111740860A (zh) * | 2020-06-15 | 2020-10-02 | 中国工商银行股份有限公司 | 日志数据传输链路监控方法及装置 |
-
2020
- 2020-11-20 CN CN202011316744.6A patent/CN112463561A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8661295B1 (en) * | 2011-03-31 | 2014-02-25 | Amazon Technologies, Inc. | Monitoring and detecting causes of failures of network paths |
US20140082184A1 (en) * | 2012-09-14 | 2014-03-20 | Alibaba Group Holding Limited | Method and system for monitoring execution of user request in distributed system |
WO2018045756A1 (zh) * | 2016-09-06 | 2018-03-15 | 华为技术有限公司 | 故障定位平台、故障定位方法及装置 |
CN109451583A (zh) * | 2018-11-19 | 2019-03-08 | 希诺麦田技术(深圳)有限公司 | 基于超帧的自组网方法、装置、节点终端和存储介质 |
CN111625410A (zh) * | 2019-02-27 | 2020-09-04 | 阿里巴巴集团控股有限公司 | 信息处理方法、设备及计算机存储介质 |
CN110457190A (zh) * | 2019-07-09 | 2019-11-15 | 优估(上海)信息科技有限公司 | 一种基于区块链的全链路监控方法、装置及系统 |
CN110489317A (zh) * | 2019-08-14 | 2019-11-22 | 中国科学院计算技术研究所 | 基于工作流的云系统任务运行故障诊断方法与系统 |
CN111124819A (zh) * | 2019-12-10 | 2020-05-08 | 中国建设银行股份有限公司 | 全链路监控的方法和装置 |
CN111290854A (zh) * | 2020-01-20 | 2020-06-16 | 腾讯科技(深圳)有限公司 | 任务管理方法、装置、系统、计算机存储介质及电子设备 |
CN111666138A (zh) * | 2020-05-19 | 2020-09-15 | 微民保险代理有限公司 | 定时任务处理方法、装置、系统、计算机设备和存储介质 |
CN111611100A (zh) * | 2020-05-26 | 2020-09-01 | 中国工商银行股份有限公司 | 交易故障检测方法、装置、计算设备以及介质 |
CN111740860A (zh) * | 2020-06-15 | 2020-10-02 | 中国工商银行股份有限公司 | 日志数据传输链路监控方法及装置 |
Non-Patent Citations (1)
Title |
---|
封万里 等: "日志全链路分析系统的实施", 《广东通信技术》, no. 2020, pages 53 - 56 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115410290A (zh) * | 2021-09-30 | 2022-11-29 | 北京罗克维尔斯科技有限公司 | 日志传输方法、装置及计算设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ostermann et al. | A performance analysis of EC2 cloud computing services for scientific computing | |
CN107665228B (zh) | 一种关联信息查询方法、终端及设备 | |
CN102722559B (zh) | 一种异常页面的进程控制方法、装置和系统 | |
CN110083455B (zh) | 图计算处理方法、装置、介质及电子设备 | |
US10084637B2 (en) | Automatic task tracking | |
CN112433899A (zh) | 一种云服务器批量检测方法、装置、设备及存储介质 | |
CN109814957B (zh) | 一种用于ios系统的标签添加方法和装置 | |
CN111104548B (zh) | 一种数据反馈方法、系统及存储介质 | |
WO2018200961A1 (en) | Hyper dynamic java management extension | |
CN112463561A (zh) | 一种故障定位方法、装置、设备及存储介质 | |
Rahmatulloh et al. | Event-Driven Architecture to Improve Performance and Scalability in Microservices-Based Systems | |
CN110011827A (zh) | 面向医联体的多用户大数据分析服务系统和方法 | |
CN115705190A (zh) | 依赖程度的确定方法及装置 | |
CN114691445A (zh) | 集群故障处理方法、装置、电子设备及可读存储介质 | |
CN112579406B (zh) | 一种日志调用链生成方法和装置 | |
US10073689B2 (en) | Managing application lifecycles within a federation of distributed software applications | |
CN111698109A (zh) | 监控日志的方法和装置 | |
CN115269331A (zh) | 面向微服务组的服务拓扑监控方法及相关设备 | |
CN111177100B (zh) | 一种训练数据处理方法、装置及存储介质 | |
CN113961228A (zh) | 一种变更提醒方法、装置、设备及存储介质 | |
CN114816914A (zh) | 基于Kubernetes的数据处理方法、设备及介质 | |
González et al. | HerdMonitor: monitoring live migrating containers in cloud environments | |
Weinreich et al. | Dynamic analysis of distributed object-oriented applications | |
US11811804B1 (en) | System and method for detecting process anomalies in a distributed computation system utilizing containers | |
US11567800B2 (en) | Early identification of problems in execution of background processes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |