CN118055004A - 目标节点确定方法以及装置 - Google Patents

目标节点确定方法以及装置 Download PDF

Info

Publication number
CN118055004A
CN118055004A CN202410205131.7A CN202410205131A CN118055004A CN 118055004 A CN118055004 A CN 118055004A CN 202410205131 A CN202410205131 A CN 202410205131A CN 118055004 A CN118055004 A CN 118055004A
Authority
CN
China
Prior art keywords
service
node
knowledge graph
access
service call
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410205131.7A
Other languages
English (en)
Inventor
朱震宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang eCommerce Bank Co Ltd
Original Assignee
Zhejiang eCommerce Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang eCommerce Bank Co Ltd filed Critical Zhejiang eCommerce Bank Co Ltd
Priority to CN202410205131.7A priority Critical patent/CN118055004A/zh
Publication of CN118055004A publication Critical patent/CN118055004A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本说明书实施例提供一种目标节点确定方法以及装置,其中该方法包括:获取应用服务系统的运行日志,其中,应用服务系统包括预设数量的服务,服务之间存在调用关系;根据运行日志中的服务调用信息生成服务调用知识图谱;根据节点访问策略以及服务调用知识图谱,确定服务调用知识图谱中的目标节点,其中,节点访问策略根据服务调用异常信息确定。通过服务的运行日志生成服务调用知识图谱,并且服务调用知识图谱中包含服务调用异常信息,在服务调用知识图谱中根据由服务调用异常信息确定的节点访问策略,进行目标节点的确定,由于根据异常信息自动进行目标节点的搜寻,提高了搜寻效率。

Description

目标节点确定方法以及装置
本申请为申请号202210926465.4,申请日2022年08月03日,发明名称为“目标节点确定方法以及装置”的分案申请。
技术领域
本说明书实施例涉及数据处理技术领域,特别涉及一种目标节点确定方法。
背景技术
随着互联网微服务系统架构的普及,企业应用数量增多,企业应用与应用之间以微服务的形态进行交互,形成业务链路。一个具体业务的任务运行,背后涉及多个应用服务。在复杂业务链路景下,应用服务节点数量增加,当线上出现异常时,需要逐步排查各个节点,应急效率低下,人力消耗严重,且无法及时定位异常根因。由此亟需一种更有效率的技术方案解决上述问题。
发明内容
有鉴于此,本说明书实施例提供了一种目标节点确定方法。本说明书一个或者多个实施例同时涉及一种目标节点确定装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种目标节点确定方法,包括:
获取应用服务系统的运行日志,其中,所述应用服务系统包括预设数量的服务,所述服务之间存在调用关系;
根据所述运行日志中的服务调用信息生成服务调用知识图谱,其中,所述服务调用知识图谱中包括所述服务对应的节点,以及服务调用异常信息;
根据节点访问策略以及所述服务调用知识图谱,确定所述服务调用知识图谱中的目标节点,其中,所述节点访问策略根据所述服务调用异常信息确定。
根据本说明书实施例的第二方面,提供了一种目标节点确定装置,包括:
数据获取模块,被配置为获取应用服务系统的运行日志,其中,所述应用服务系统包括预设数量的服务,所述服务之间存在调用关系;
生成模块,被配置为根据所述运行日志中的服务调用信息生成服务调用知识图谱,其中,所述服务调用知识图谱中包括所述服务对应的节点,以及服务调用异常信息;
访问模块,被配置为根据节点访问策略以及所述服务调用知识图谱,确定所述服务调用知识图谱中的目标节点,其中,所述节点访问策略根据所述服务调用异常信息确定。
根据本说明书实施例的第三方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述目标节点确定方法的步骤。
根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述目标节点确定方法的步骤。
根据本说明书实施例的第五方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述目标节点确定方法的步骤。
本说明书实施例提供一种目标节点确定方法以及装置,其中所述目标节点确定方法包括:获取应用服务系统的运行日志,其中,所述应用服务系统包括预设数量的服务,所述服务之间存在调用关系;根据所述运行日志中的服务调用信息生成服务调用知识图谱,其中,所述服务调用知识图谱中包括所述服务对应的节点,以及服务调用异常信息;根据节点访问策略以及所述服务调用知识图谱,确定所述服务调用知识图谱中的目标节点,其中,所述节点访问策略根据所述服务调用异常信息确定。通过服务的运行日志生成服务调用知识图谱,并且服务调用知识图谱中包含服务调用异常信息,在服务调用知识图谱中根据由服务调用异常信息确定的节点访问策略,进行目标节点的确定,由于根据异常信息生成节点访问策略,自动根据节点访问策略进行目标节点的搜寻,提高了搜寻效率。
附图说明
图1是本说明书一个实施例提供的一种目标节点确定方法的场景示意图;
图2是本说明书一个实施例提供的一种目标节点确定方法的流程图;
图3a是本说明书一个实施例提供的一种目标节点确定方法的调用关系树状图的示意图;
图3b是本说明书一个实施例提供的一种目标节点确定方法的服务调用知识图谱的示意图;
图3c是本说明书一个实施例提供的一种目标节点确定方法的另一服务调用知识图谱的示意图;
图4是本说明书一个实施例提供的一种目标节点确定方法的处理过程流程图;
图5是本说明书一个实施例提供的一种目标节点确定方法的框架示意图;
图6是本说明书一个实施例提供的一种目标节点确定装置的结构示意图;
图7是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
微服务:是指将应用程序分解为多个较小的服务或者实例,并分布在不同的集群/机器上运行。
根本原因分析(RCA):英文全称是Root Cause Analysis,它是一项结构化的问题处理法,用以逐步找出问题的根本原因并加以解决,而不是仅仅关注问题的表征。
服务依赖:在分布式软件系统中,系统所提供的服务是基于不同子服务之间的组合与协作提供的。服务依赖则常被用于描述系统中一个服务为完成对该服务的请求的响应,对其它服务的调用关系。
数据清洗:是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。
Python:一种计算机语言。
Java:一种计算机语言。
ruby:一种计算机语言。
目前在微服务架构系统中的根因分析(根本原因分析),是通过人工经验构建特定的分析图谱结构,在异常发生时,采集全局异常事件,通过关系推导定位根因。例如,在金融企业的转账业务场景中,涉及多条业务链路的多个应用系统,为保障转账业务的稳定运行,运维人员根据链路监测日志监测业务运行情况,当转账失败率上升时,运维人员需要介入逐个排查可能导致异常的业务链路,同时针对每一个应用的异常状态进行分析,人力消耗增大。同时,链路的复杂节点,可能导致人工存在排查遗漏的情况,人工排查的实效性和准确性已经无法满足要求。
由此,目前的根因分析依赖专家经验较多,异常指标间的关系结构和推导规则,依赖人工经验,经验的偏差,直接影响了异常定位的结果。并且在异常信息缺失,异常结果出现多个时,需要较为复杂的推导策略,无法较好的评估异常结果的优先级。所以,综上来看,上述的根因分析方法不适用于链路较为复杂时的异常定位场景。
基于此,在本说明书中,提供了一种目标节点确定方法,本说明书同时涉及一种目标节点确定装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
参见图1,图1示出了根据本说明书一个实施例提供的一种目标节点确定方法的场景示意图,如图所示,微服务架构的系统中包括应用服务实例A1、应用服务实例A2、应用服务实例A3、应用服务实例A4、应用服务实例A5、应用服务实例A6、应用服务实例A7、应用服务实例A8、数据库、容器1、容器2、容器3,其中,容器1、容器2、容器3均基于机器。在系统出现错误的情况下,获取系统的运行日志,根据运行日志中的服务调用信息生成服务调用知识图谱,根据节点访问策略以及服务调用知识图谱,确定服务调用知识图谱中的目标节点,其中,节点访问策略中包括权重概率,即,节点访问节点的概率,权重概率根据历史特征提取得到,例如,在应用服务到数据库、应用服务到应用服务的场景下,应用服务到数据库之间的权重为0.6,应用服务到应用服务之间的权重为0.4。在应用服务到容器、应用服务到应用服务的场景下,应用服务到容器之间的权重为0.7,应用服务到应用服务之间的权重为0.3。在应用服务到应用服务、应用服务到应用服务的场景下,权重均为0.5。
通过服务的运行日志生成服务调用知识图谱,并且服务调用知识图谱中包含服务调用异常信息,在服务调用知识图谱中根据由服务调用异常信息确定的节点访问策略,进行目标节点的确定,由于根据异常信息生成节点访问策略,自动根据节点访问策略进行目标节点的搜寻,提高了搜寻效率。
参见图2,图2示出了根据本说明书一个实施例提供的一种目标节点确定方法的流程图,具体包括以下步骤。
步骤202:获取应用服务系统的运行日志,其中,所述应用服务系统包括预设数量的服务,所述服务之间存在调用关系。
其中,应用服务系统可以为基于微服务架构的系统,也可以为应用程序,运行日志可以为服务运行时记录的内存的占用率、处理器的占用率或者调用其它服务的记录等运行日志;预设数量可以为微服务架构中的服务的数量,也可以为应用程序中服务的数量;服务可以为应用服务,如:商品查询服务、商品下单服务等,也可以是数据库、容器等,具体地,例如,基于python的product page(产品页面)服务,基于java的reviews(评价)服务以及基于ruby的details(细节描述)服务等。
在实际应用中,在微服务架构的系统中,服务之间存在服务依赖的关系,并且相关联的服务架可能存在成千上百个服务,因此,在其中一个或多个服务出现问题的情况下,造成难以确定根因的困难,因为可能涉及到的服务数量较多,且微服务架构的系统中会存储服务的运行日志,那么可以通过获取运行日志,对运行日志进行分析以确定异常的根因。
例如,在基于微服务架构的系统中出现了错误情况,则获取微服务架构的系统中服务调用,错误日志,应用CPU,应用内存,应用线程数等指标数据。
本说明书实施例根据出现的错误情况获取系统的运行日志,可以根据运行日志进行后续的分析,提高了目标节点确定的准确性。
在一种可实现的方式中,所述获取应用服务系统的运行日志,包括:
获取所述应用服务系统的初始日志;
在所述初始日志中存在缺失数据的情况下,对所述初始日志进行补缺处理得到运行日志。
其中,初始日志可以为未经过修改的日志,即,直接从系统提取的日志;在所述初始日志中存在缺失数据的情况下,可以理解为在日志中没有一段时间或者某一部分的数据,例如,在三点至四点中不存在服务A的部分日志;补缺处理可以为通过缺失数据的前一段数据和后一段数据预测缺失数据的处理,例如,在三点至四点中不存在服务A的部分日志,则通过前一段时间,两点到三点的数据,以及后一段时间,四点到五点的数据,通过两点到三点的数据和对四点到五点的数据三点至四点中的数据进行补缺处理。
在实际应用中,配置采集应用链路,根据应用服务日志,从应用监测平台上,采集获取应用服务调用,错误日志,应用CPU,应用内存,应用线程数等指标数据,并对这些指标数据进行数据补缺清洗,处理成为应用服务调用链路,也就是说,在获取到运行日志后,需要对运行日志进行数据清洗,相应地,运行日志中可能存在缺失的数据,那么就需要对日志中的数据进行补缺处理。
例如,在初始日志中,服务A的数据中不存在三点至四点的处理器占用率的数据,那么,在初始日志中可以找到前一段时间,两点到三点的数据,以及后一段时间,四点到五点的数据,通过两点到三点的数据和对四点到五点的数据三点至四点中的数据进行补缺处理。具体的,两点到三点的处理器占用率为百分之三十,四点到五点的处理器占用率为百分之五十,那么可以将两点到三点的处理器占用率与四点到五点的处理器占用率相加,并求平均值,将求得的平均值作为服务A的三点至四点的处理器占用率,即,百分之三十加百分之五十等于百分之八十,再将百分之八十除以二得到百分之四十。
需要说明的是,对数据进行补缺处理可以使用任何一种处理缺失值的方法,本说明书实施例不进行限定。
本说明书实施例根据上下文对丢失的数据进行补缺处理,可以在数据不完整的情况下,继续进行目标节点的查找,提高了方案的可用性。
步骤204:根据所述运行日志中的服务调用信息生成服务调用知识图谱,其中,所述服务调用知识图谱中包括所述服务对应的节点,以及服务调用异常信息。
由于在步骤202中获取了运行日志,因此可以根据所述运行日志中的服务调用信息生成服务调用知识图谱。
其中,服务调用信息可以为服务之间的调用产生的信息,例如,服务调用信息为服务A调用了服务B;服务调用知识图谱可以为根据服务之间的调用生成的知识图谱,也就是说,服务调用知识图谱中展示了服务之间的调用关系;服务调用异常信息可以为服务之间的异常信息,例如,服务A调用服务B的情况下,处理器的占用率过高,则确定服务调用异常信息为占用率过高。
在实际应用中,服务调用异常信息包括多个类型,可能包括访问错误,内存占用率以及处理器占用率等情况,根据获取的应用服务调用链路,将其从树状链路结构,进行相同节点合并,转化成为知识图谱结构,并在边上保留应用服务错误数等异常数据。
例如,在服务A对应的运行日志中服务调用关系为服务A需要调用服务B,则服务A和服务B之间存在服务调用关系,并且存在服务A调用服务B的情况下,处理器的占用率过高的记录,那么,服务调用异常信息为处理器的占用率,可以根据服务A需要调用服务B,则服务A和服务B之间存在服务调用关系生成服务调用知识图谱,其中,服务调用知识图谱中服务A和服务B之间的路径中保留着处理器的占用率过高的服务调用异常信息。
本说明书实施例根据服务调用信息生成服务调用知识图谱,对服务调用异常信息进行保留,便于后续根据服务调用异常信息查找目标节点。
在一种可能的实现方式中,所述根据所述运行日志中的服务调用信息生成服务调用知识图谱,包括:
根据所述运行日志中的服务调用信息,确定所述服务之间的服务调用关系;
根据所述服务以及所述服务之间的服务调用关系,生成服务调用树状图;
对所述服务调用树状图中的服务调用关系进行处理,生成服务调用知识图谱。
其中,服务调用关系即为服务之间的服务依赖关系,例如,服务调用关系为服务A需要调用服务B,则服务A和服务B之间存在服务调用关系;服务调用树状图可以是包括服务之间的调用关系的树状图;服务调用知识图谱可以为基于服务调用树状图,对树状图中的路径进行处理得到的知识图谱。
在实际应用中,为了便于对服务之间的调用关系的处理,可以先生成服务调用关系树状图。举例来说,参见图3a,图3a示出一种调用关系树状图的示意图,其中,服务1至服务6均为该调用关系树状图中的节点,服务1依赖于服务2和服务3,服务2依赖于服务4和服务5,服务5依赖于服务6;服务3依赖于服务5和服务6,服务5依赖于服务6,服务6依赖于服务4。那么,服务调用关系树状图还存在多个相同的依赖关系,那么需要将这些依赖关系进行处理,以简化生成的知识图谱。
本说明书实施例根据服务调用信息生成服务调用树状图,对调用树状图进行简化得到服务调用知识图谱,便于后续对服务调用知识图谱进行游走查找异常节点。
具体地,对所述服务调用树状图中的服务调用关系进行处理可以为进行简化的处理,具体实施方式如下所述。
所述对所述服务调用树状图中的服务调用关系进行处理,生成服务调用知识图谱,包括:
确定所述服务调用树状图中相同的服务调用关系,并对所述相同的服务调用关系进行合并得到初始知识图谱;
删除所述初始知识图谱中不存在所述服务调用异常信息的服务调用关系,生成服务调用知识图谱。
其中,相同的服务调用关系可以理解为,在树状图的不同分支存在相同的调用关系,例如,上述实施例中的服务2依赖于服务4或者服务5,服务5依赖于服务6;服务3依赖于服务5和服务6,服务5依赖于服务6,其中,存在两条相同的调用关系,即,服务5依赖于服务6;不存在所述服务调用异常信息的服务调用关系可以理解为,服务之间存在调用关系,但没有异常信息,例如,服务7依赖于服务8,但是没有出现异常信息。
在实际应用中,可以对于服务调用知识图谱中路径相同的调用关系进行合并,调用关系中没有异常信息的进行删除,以简化服务调用知识图谱。
沿用上例,根据上述实施例中的服务调用树状图生成的服务调用知识图谱,参见图3b,图3b示出了一种服务调用知识图谱的示意图,其中的服务2依赖于服务4和服务5,服务5依赖于服务6;服务3依赖于服务5和服务6,服务5依赖于服务6,那么存在相同的调用关系服务5依赖于服务6,并且根据其中的服务3依赖于服务5和服务6,服务5依赖于服务6,服务6依赖于服务4可知,存在两条相同的调用关系,即,服务6依赖于服务4。还需要对该服务调用知识图谱进行合并,参见图3c,图3c示出了另一种服务调用知识图谱的示意图,也就是可以分别将两条服务5依赖于服务6的路径、两条服务6依赖于服务4的路径进行合并,可以得到图3c中的服务调用知识图谱。
本说明书实施例根据对于服务调用知识图谱中路径相同的调用关系进行合并,调用关系中没有异常信息的进行删除以避免在后续的搜寻步骤中,出现不必要的路径,由此提高了搜寻效率。
进一步地,所述根据节点访问策略以及所述服务调用知识图谱,确定所述服务调用知识图谱中的目标节点之前,还包括:
根据所述服务调用异常信息生成节点访问策略。
上述的节点访问策略可以为怎么在服务调用知识图谱中进行异常节点查询的策略。
在一种可实现的方式中,所述根据所述服务调用异常信息生成节点访问策略,包括:
根据所述运行日志中的服务调用信息,确定所述服务之间的服务调用关系;
根据所述服务调用关系对应的服务调用异常信息生成节点访问策略。
其中,服务调用关系可以理解为上述实施例中的调用关系;服务调用关系对应的服务调用异常信息可以理解为在服务的调用过程中产生的异常信息,例如,服务A调用服务B的情况下,处理器占用率过高。
在实际应用中,因为异常信息代表服务调用存在异常问题的情况,所以可以根据异常信息生成进行节点访问策略,节点访问策略用于寻找异常节点。并且,存在至少两个服务调用关系的情况下,会存在访问选择的问题,也就是说,节点访问策略可以是存在至少两个服务调用关系的情况下,对其中某一个节点进行访问的策略。
例如,在运行日志中存在服务A调用服务B的记录,也存在服务A调用服务C的记录。那么可以确定服务A和服务B之间存在服务调用关系,并且可以确定服务A和服务C之间存在服务调用关系,根据服务A调用服务B对应的服务调用异常信息,以及根据服务A调用服务C对应的服务调用异常信息生成节点访问策略。
本说明书实施例根据所述服务调用关系对应的服务调用异常信息生成节点访问策略,在制定场景匹配规则时,只需适当调整节点权重初始策略,即可进行各自业务链路的定位场景适配,具备较强的通用性。
在一种可实现的方式中,所述根据所述服务调用关系对应的服务调用异常信息生成节点访问策略,包括:
根据所述服务调用关系对应的服务调用异常信息生成异常信息权重;
根据所述异常信息权重的比值确定访问概率,并根据访问概率生成节点访问策略。
其中,异常信息权重可以为图谱节点游走过程(访问过程)中,选择下一个节点时,根据节点类型不同,给予策略不同的权重,例如,服务A为应用服务,服务B为容器,服务C为数据库,服务A到服务B的异常信息权重为0.6,服务A到服务C的异常信息权重为0.8;访问概率可以为一个服务访问另一个服务的概率,例如,服务A到服务B的异常信息权重为0.6,服务A到服务C的异常信息权重为0.8,那么,服务A访问服务B的概率为七分之三,服务A访问服务C的概率为七分之四。
沿用上例,在运行日志中存在服务A调用服务B的记录,也存在服务A调用服务C的记录。那么可以确定服务A和服务B之间存在服务调用关系,并且可以确定服务A和服务C之间存在服务调用关系。确定服务A调用服务B对应的服务调用异常信息:错误数为80,以及确定服务A调用服务C对应的服务调用异常信息:错误数为20,根据错误数生成服务A到服务B的异常信息权重为80,根据错误数生成服务A到服务C的异常信息权重为20。那么可以确定服务A访问服务B的概率为百分之八十,服务A访问服务C的概率为百分之二十,生成的节点访问策略为在服务A存在两条访问路径,一条访问路径为服务A访问服务B,另一条访问路径为服务A访问服务C的情况下,服务A访问服务B的概率为百分之八十,服务A访问服务C的概率为百分之二十。
在另一种可实现的方式中,还可以根据节点的类型以及错误数确定访问权重,具体实现方式如下所述。
又例如,服务A为应用服务,服务B为容器,服务C为数据库,在运行日志中存在服务A调用服务B的记录,也存在服务A调用服务C的记录。那么可以确定服务A和服务B之间存在服务调用关系,并且可以确定服务A和服务C之间存在服务调用关系。确定服务A调用服务B对应的服务调用异常信息以及类型权重:错误数为80,服务A到服务B的类型权重为0.6,以及确定服务A调用服务C对应的服务调用异常信息以及类型权重:错误数为20,服务A到服务C的类型权重为0.8,根据错误数生成服务A到服务B的异常信息权重为80乘以0.6等于48,根据错误数和类型权重生成服务A到服务C的异常信息权重,即20乘以0.8等于16。那么可以确定服务A访问服务B的概率为百分之七十五,服务A访问服务C的概率为百分之二十五,生成的节点访问策略为在服务A存在两条访问路径,一条访问路径为服务A访问服务B,另一条访问路径为服务A访问服务C的情况下,服务A访问服务B的概率为百分之七十五,服务A访问服务C的概率为百分之二十五。
需要说明的是,上述权重计算方法仅为示例性描述,可以通过其他计算方法确定异常信息权重,本说明书实施例不进行限定。
本说明书实施例只需补充对应的服务节点,即可将异常定位的范围扩大,如需要定位物理机异常,只需补充物理机节点和边数据即可,无需大量历史数据训练。
步骤206:根据节点访问策略以及所述服务调用知识图谱,确定所述服务调用知识图谱中的目标节点,其中,所述节点访问策略根据所述服务调用异常信息确定。
由于在根据节点访问策略以及所述服务调用知识图谱,确定所述服务调用知识图谱中的目标节点之前生成了节点访问策略,因此可以根据节点访问策略以及所述服务调用知识图谱,确定所述服务调用知识图谱中的目标节点。
其中,节点访问策略可以理解为上述实施例中的节点访问策略,目标节点可以理解为寻找到的异常节点。
在实际应用中,通过节点访问策略对服务调用知识图谱中的节点进行访问,最终停留的节点即为目标节点,也就可能为异常节点。
在一种可实现的方式中,所述根据节点访问策略以及所述服务调用知识图谱,确定所述服务调用知识图谱中的目标节点,包括:
根据预设访问次数以及预设访问步数,利用节点访问策略,在所述服务调用知识图谱中进行节点访问,确定所述服务调用知识图谱中的目标节点。
上述的预设访问次数可以理解为对服务调用知识图谱进行多少次访问,例如,对服务调用知识图谱进行100次访问,那么也就是说,确定100次目标节点,预设访问次数为100;预设访问步数可以理解为服务调用知识图谱进行访问的次数,例如,在服务调用知识图谱中访问100次以确定目标节点,那么,预设访问步数可以为100。
在实际应用中,因为节点访问策略中存在访问概率,那么需要多次对服务调用知识图谱中的节点进行访问,才能得到准确的结果。也就是说,多次运行节点游走,根据权重游走策略,从没有上游的节点开始,进行节点游走,直到找到最下游异常节点。重复上述游走,保留找到的异常节点。
需要说明的是,预设访问次数越大,得到的结果就越准确,所以预设访问次数可以根据实际需求进行设定,本说明书实施例不对预设访问次数进行限定,同样的,预设访问步数越大,得到的结果就越准确,所以预设访问步数可以根据实际需求进行设定,本说明书实施例不对预设访问步数进行限定。
具体地,所述根据预设访问次数以及预设访问步数,利用节点访问策略,在所述服务调用知识图谱中进行节点访问,确定所述服务调用知识图谱中的目标节点,包括:
S2、确定所述服务调用知识图谱中的当前节点;
S4、确定所述服务调用知识图谱中,与所述当前节点存在服务调用关系的关联节点;
S6、根据所述当前节点与所述关联节点的访问概率,访问所述关联节点,并确定当前访问步数;
S8、判断当前访问步数是否大于等于预设访问步数;
若是,则结束,并继续执行步骤S2,
若否,则将所述关联节点确定为当前节点,继续执行步骤S4,直至满足预设访问条件结束,并确定当前访问次数;
判断所述当前访问次数是否大于等于所述预设访问次数,
若是,则结束;
若否,则将所述当前访问次数自增1,继续执行步骤S2。
其中,当前节点可以为服务调用知识图谱中任意一个节点,当前节点可以理解为以哪个节点的身份进行访问,例如,服务A访问服务B,则当前节点为服务A;关联节点可以为当前节点可以访问的节点,例如,服务A和服务B之间存在访问路径,服务A和服务C之间存在访问路径,那么,服务A的关联节点包括服务C和服务B。
在实际应用中,可以设置双循环的执行逻辑,即,每根据预设访问步数进行完一次目标节点的确定,就增加依次预设访问次数的计数,直至达到预设访问次数为止。
例如,预设访问次数为100,预设访问步数为100,服务1依赖于服务2和服务3,服务2依赖于服务4或者服务5,服务5依赖于服务6;服务3依赖于服务5和服务6,服务5依赖于服务6,服务6依赖于服务4。服务1到服务2的访问概率为百分之八十,服务1到服务3的概率为百分之二十,服务2到服务5的概率为百分之二十五,服务2到服务4的概率为百分之七十五,服务3到服务5的概率为百分之五十,服务3到服务6的概率为百分之五十,另外的,服务6仅存在到服务4的访问路径,则访问概率为一,访问概率为一可以理解为仅有一个节点可以访问,服务5仅存在到服务6的访问路径,则访问概率为一。那么在第一次访问次数中,确定从服务1开始进行节点访问,第一步:服务1选择访问服务2,第二步:服务2选择访问服务4,第三步,服务4选择访问服务2……直至第100步,停留在了服务4,那么确定服务4为目标节点。
又例如,预设访问次数为100,预设访问步数为100,服务1依赖于服务2和服务3,服务2依赖于服务4或者服务5,服务5依赖于服务6;服务3依赖于服务5和服务6,服务5依赖于服务6,服务6依赖于服务4。服务1到服务2的访问概率为百分之八十,服务1到服务3的概率为百分之二十,服务2到服务5的概率为百分之二十五,服务2到服务4的概率为百分之七十五,服务3到服务5的概率为百分之五十,服务3到服务6的概率为百分之五十,另外的,服务6仅存在到服务4的访问路径,则访问概率为一,服务5仅存在到服务6的访问路径,则访问概率为一。那么在第一次访问次数中,确定从服务1开始进行节点访问,第一步:服务1选择访问服务2,第二步:服务2选择访问服务4,第三步,服务4选择访问服务2……在第25步时,发现服务4为最下游的节点,则确定服务4为目标节点。
需要说明的是,通过一次访问次数确定的目标节点可以为两个及两个以上,那么就可以出现循环访问的情况,在出现循环访问的情况下,可以根据下述的预设访问条件确定目标节点。
在一种可能的实现方式中,所述预设访问条件,包括:
所述当前节点与所述当前节点的关联节点的连续访问次数、大于或等于预设次数阈值。
上述的预设次数阈值可以为小于10次的阈值,例如,5次。
在实际应用中,如果多次在两个节点之间循环访问,则可能两个节点均为目标节点,那么也可以提前结束本次访问。
例如,那么在第一次访问次数中,确定从服务1开始进行节点访问,第一步:服务1选择访问服务2,第二步:服务2选择访问服务4,第三步,服务4选择访问服务2……,第四步、第五步、第六步以及第七步均为服务4和服务2之间进行循环,那么可以提前结束本次访问,确定服务4和服务2均为目标节点。
在一种可实现的方式中,所述确定所述服务调用知识图谱中的目标节点之后,还包括:
在所述目标节点为至少两个的情况下,确定每个目标节点的出现次数;
根据所述出现次数进行排序生成异常定位结果,并显示所述异常定位结果以及所述服务调用知识图谱。
在实际应用中,异常结果排序定位,统计异常节点出现次数,根据出现次数排序,即为异常根因优先级,次数最大则疑似为最有可能的异常根因,并构建图谱结果输出,组装异常传播路径图谱与根因定位结果,最终进行输出。
举例来说,预设访问次数为100,也就是说,需要在服务调用知识图谱中完成100次的访问,在完成100次的访问次数的情况下,可以对目标节点的结果进行统计,100次的访问次数对应的目标节点的结果为服务4被确定为56次目标节点,服务6被确定为44次目标节点,则将服务4被确定为56次目标节点和服务6被确定为44次目标节点进行排序并显示,同时显示服务调用知识图谱。
本说明书实施例通过对目标节点的结果进行排序得到异常定位结果,并且对异常定位结果以及服务调用知识图谱进行展示,可以使工作人员直观看到异常节点确定的结果。
本说明书实施例提供一种目标节点确定方法以及装置,其中所述目标节点确定方法包括:获取应用服务系统的运行日志,其中,所述应用服务系统包括预设数量的服务,所述服务之间存在调用关系;根据所述运行日志中的服务调用信息生成服务调用知识图谱,其中,所述服务调用知识图谱中包括所述服务对应的节点,以及服务调用异常信息;根据节点访问策略以及所述服务调用知识图谱,确定所述服务调用知识图谱中的目标节点,其中,所述节点访问策略根据所述服务调用异常信息确定。通过服务的运行日志生成服务调用知识图谱,并且服务调用知识图谱中包含服务调用异常信息,在服务调用知识图谱中根据由服务调用异常信息确定的节点访问策略,进行目标节点的确定,由于根据异常信息自动进行目标节点的搜寻,提高了搜寻效率。
下述结合附图4,以本说明书提供的目标节点确定方法在服务器的应用为例,对所述目标节点确定方法进行进一步说明。其中,图4示出了本说明书一个实施例提供的一种目标节点确定方法的处理过程流程图,具体包括以下步骤。
步骤402:获取所述应用服务系统的初始日志,在所述初始日志中存在缺失数据的情况下,对所述初始日志进行补缺处理得到运行日志。
例如,在初始日志中,服务1的数据中不存在三点至四点的处理器占用率的数据,那么,在初始日志中可以找到前一段时间,两点到三点的数据,以及后一段时间,四点到五点的数据,通过两点到三点的数据和对四点到五点的数据三点至四点中的数据进行补缺处理。具体的,两点到三点的处理器占用率为百分之三十,四点到五点的处理器占用率为百分之五十,那么可以将两点到三点的处理器占用率与四点到五点的处理器占用率相加,并求平均值,将求得的平均值作为服务1的三点至四点的处理器占用率,即,百分之三十加百分之五十等于百分之八十,再将百分之八十除以二得到百分之四十。
步骤404:根据所述运行日志中的服务调用信息,确定所述服务之间的服务调用关系。
例如,服务2依赖于服务4或者服务5,服务5依赖于服务6;服务3依赖于服务5和服务6,服务5依赖于服务6,那么存在相同的调用关系服务5依赖于服务6,并且根据其中的服务3依赖于服务5和服务6,服务5依赖于服务6,服务6依赖于服务4。
步骤406:根据所述服务以及所述服务之间的服务调用关系,生成服务调用树状图,对所述服务调用树状图中的服务调用关系进行处理,生成服务调用知识图谱。
例如,存在两条相同的调用关系,即,服务6依赖于服务4。还需要对该服务调用知识图谱进行合并,可以分别将两条服务5依赖于服务6的路径、两条服务6依赖于服务4的路径进行合并,可以得到服务调用知识图谱。
步骤408:根据所述服务调用关系对应的服务调用异常信息生成节点访问策略。
沿用上例,在运行日志中存在服务1调用服务2的记录,也存在服务1调用服务3的记录。那么可以确定服务1和服务2之间存在服务调用关系,并且可以确定服务1和服务3之间存在服务调用关系。确定服务1调用服务2对应的服务调用异常信息:错误数为80,以及确定服务1调用服务3对应的服务调用异常信息:错误数为20,根据错误数生成服务1到服务2的异常信息权重为80,根据错误数生成服务1到服务3的异常信息权重为20。那么可以确定服务1访问服务2的概率为百分之八十,服务1访问服务3的概率为百分之二十,生成的节点访问策略为在服务1存在两条访问路径,一条访问路径为服务1访问服务2,另一条访问路径为服务1访问服务3的情况下,服务1访问服务2的概率为百分之八十,服务1访问服务3的概率为百分之二十。
在另一种可实现的方式中,还可以根据节点的类型以及错误数确定访问权重,具体实现方式如下所述。
又例如,服务1为应用服务,服务2为容器,服务3为数据库,在运行日志中存在服务1调用服务2的记录,也存在服务1调用服务3的记录。那么可以确定服务1和服务2之间存在服务调用关系,并且可以确定服务1和服务3之间存在服务调用关系。确定服务1调用服务2对应的服务调用异常信息以及类型权重:错误数为80,服务1到服务2的类型权重为0.6,以及确定服务1调用服务3对应的服务调用异常信息以及类型权重:错误数为20,服务1到服务3的类型权重为0.8,根据错误数生成服务1到服务2的异常信息权重为80乘以0.6等于48,根据错误数和类型权重生成服务1到服务3的异常信息权重,即20乘以0.8等于16。那么可以确定服务1访问服务2的概率为百分之七十五,服务1访问服务3的概率为百分之二十五,生成的节点访问策略为在服务1存在两条访问路径,一条访问路径为服务1访问服务2,另一条访问路径为服务1访问服务3的情况下,服务1访问服务2的概率为百分之七十五,服务1访问服务3的概率为百分之二十五。
步骤410:利用节点访问策略,在所述服务调用知识图谱中进行节点访问。
例如,预设访问次数为100,预设访问步数为100,服务1依赖于服务2和服务3,服务2依赖于服务4或者服务5,服务5依赖于服务6;服务3依赖于服务5和服务6,服务5依赖于服务6,服务6依赖于服务4。服务1到服务2的访问概率为百分之八十,服务1到服务3的概率为百分之二十,服务2到服务5的概率为百分之二十五,服务2到服务4的概率为百分之七十五,服务3到服务5的概率为百分之五十,服务3到服务6的概率为百分之五十,另外的,服务6仅存在到服务4的访问路径,则访问概率为一,服务5仅存在到服务6的访问路径,则访问概率为一。那么在第一次访问次数中,确定从服务1开始进行节点访问,第一步:服务1选择访问服务2。
步骤412:判断是否达到预设访问步数,若是,则执行步骤414。若否,执行步骤410。
例如,判断是否达到预设访问步数100,没有则继续执行第二步:服务2选择访问服务4,第三步,服务4选择访问服务2……。
步骤414:确定所述服务调用知识图谱中的目标节点。
例如,直至第100步,停留在了服务4,那么确定服务4为目标节点。
步骤416:判断是否达到预设访问次数。若是,则执行步骤418。若否,执行步骤410。
例如,确定服务4为目标节点后,判断是否到预设访问次数,若满足则执行步骤418。
步骤418:在所述目标节点为至少两个的情况下,确定每个目标节点的出现次数,根据所述出现次数进行排序生成异常定位结果,并显示所述异常定位结果以及所述服务调用知识图谱。
对目标节点的结果进行统计,100次的访问次数对应的目标节点的结果为服务4被确定为56次目标节点,服务6被确定为44次目标节点,则将服务4被确定为56次目标节点和服务6被确定为44次目标节点进行排序并显示,同时显示服务调用知识图谱。
通过服务的运行日志生成服务调用知识图谱,并且服务调用知识图谱中包含服务调用异常信息,在服务调用知识图谱中根据由服务调用异常信息确定的节点访问策略,进行目标节点的确定,由于根据异常信息自动进行目标节点的搜寻,提高了搜寻效率。
在实际应用中,参见图5,图5示出,可以将本说明书实施例中的目标节点确定方法进行工程化配置,其中,工程化配置包括统一链路配置模块502,权重指定模块504,构建传播图谱模块506,策略运行模块508,以及根因结果组装模块510。其中,统一链路配置模块502用于获取应用服务系统的运行日志,并根据运行日志生成调用链路;权重指定模块504用于对节点与节点之间的访问权重进行设定;构建传播图谱模块506用于根据调用链路以及设定的权重生成知识图谱;策略运行模块508用于根据预设的策略进行知识图谱的游走访问,根因结果组装模块510用于对得到的知识图谱以及异常节点推荐结果进行组合以进行显示。进一步地,策略运行模块508可以配置为可插拔的模块,包括加载策略模型单元512,加载决策脚本单元514,运行节点游走单元516以及应用特征权重单元518,其中,运行节点游走单元516可以进行定位根因,以得到故障传播图520以及根因推荐522。应用特征权重单元518可以分配各种类服务的权重,如,根据物理机特征、容器特征、数据库特征、缓存特征,消息特征,传输协议特征确定权重,并且,物理机特征、容器特征、数据库特征可以根据事件采集得到,也就是异常事件监听;缓存特征,消息特征,传输协议特征可以根据指标分析得到,也就是指标异常检测。
与上述方法实施例相对应,本说明书还提供了目标节点确定装置实施例,图6示出了本说明书一个实施例提供的一种目标节点确定装置的结构示意图。如图6所示,该装置包括:
数据获取模块602,被配置为获取应用服务系统的运行日志,其中,所述应用服务系统包括预设数量的服务,所述服务之间存在调用关系;
生成模块604,被配置为根据所述运行日志中的服务调用信息生成服务调用知识图谱,其中,所述服务调用知识图谱中包括所述服务对应的节点,以及服务调用异常信息;
访问模块606,被配置为根据节点访问策略以及所述服务调用知识图谱,确定所述服务调用知识图谱中的目标节点,其中,所述节点访问策略根据所述服务调用异常信息确定。
进一步地,生成模块604,还被配置为:
根据所述运行日志中的服务调用信息,确定所述服务之间的服务调用关系;
根据所述服务以及所述服务之间的服务调用关系,生成服务调用树状图;
对所述服务调用树状图中的服务调用关系进行处理,生成服务调用知识图谱。
进一步地,生成模块604,还被配置为:
确定所述服务调用树状图中相同的服务调用关系,并对所述相同的服务调用关系进行合并得到初始知识图谱;
删除所述初始知识图谱中不存在所述服务调用异常信息的服务调用关系,生成服务调用知识图谱。
进一步地,生成模块604,还被配置为:
根据所述服务调用异常信息生成节点访问策略。
进一步地,生成模块604,还被配置为:
根据所述运行日志中的服务调用信息,确定所述服务之间的服务调用关系;
根据所述服务调用关系对应的服务调用异常信息生成节点访问策略。
进一步地,生成模块604,还被配置为:
根据所述服务调用关系对应的服务调用异常信息生成异常信息权重;
根据所述异常信息权重的比值确定访问概率,并根据访问概率生成节点访问策略。
进一步地,访问模块606,还被配置为:
根据预设访问次数以及预设访问步数,利用节点访问策略,在所述服务调用知识图谱中进行节点访问,确定所述服务调用知识图谱中的目标节点。
进一步地,访问模块606,还被配置为:
S2、确定所述服务调用知识图谱中的当前节点;
S4、确定所述服务调用知识图谱中,与所述当前节点存在服务调用关系的关联节点;
S6、根据所述当前节点与所述关联节点的访问概率,访问所述关联节点,并确定当前访问步数;
S8、判断当前访问步数是否大于等于预设访问步数;
若是,则结束,并继续执行步骤S2,
若否,则将所述关联节点确定为当前节点,继续执行步骤S4,直至满足预设访问条件结束,并确定当前访问次数;
判断所述当前访问次数是否大于等于所述预设访问次数,
若是,则结束;
若否,则将所述当前访问次数自增1,继续执行步骤S2。
进一步地,访问模块606,还被配置为:
所述当前节点与所述当前节点的关联节点的连续访问次数、大于或等于预设次数阈值。
进一步地,访问模块606,还被配置为:
在所述目标节点为至少两个的情况下,确定每个目标节点的出现次数;
根据所述出现次数进行排序生成异常定位结果,并显示所述异常定位结果以及所述服务调用知识图谱。
进一步地,数据获取模块602,还被配置为:
获取所述应用服务系统的初始日志;
在所述初始日志中存在缺失数据的情况下,对所述初始日志进行补缺处理得到运行日志。
本说明书实施例提供一种目标节点确定方法以及装置,其中所述目标节点确定装置包括:数据获取模块,被配置为获取应用服务系统的运行日志,其中,所述应用服务系统包括预设数量的服务,所述服务之间存在调用关系;生成模块,被配置为根据所述运行日志中的服务调用信息生成服务调用知识图谱,其中,所述服务调用知识图谱中包括所述服务对应的节点,以及服务调用异常信息;访问模块,被配置为根据节点访问策略以及所述服务调用知识图谱,确定所述服务调用知识图谱中的目标节点,其中,所述节点访问策略根据所述服务调用异常信息确定。通过服务的运行日志生成服务调用知识图谱,并且服务调用知识图谱中包含服务调用异常信息,在服务调用知识图谱中根据由服务调用异常信息确定的节点访问策略,进行目标节点的确定,由于根据异常信息自动进行目标节点的搜寻,提高了搜寻效率。
上述为本实施例的一种目标节点确定装置的示意性方案。需要说明的是,该目标节点确定装置的技术方案与上述的目标节点确定方法的技术方案属于同一构思,目标节点确定装置的技术方案未详细描述的细节内容,均可以参见上述目标节点确定方法的技术方案的描述。
图7示出了根据本说明书一个实施例提供的一种计算设备700的结构框图。该计算设备700的部件包括但不限于存储器710和处理器720。处理器720与存储器710通过总线730相连接,数据库750用于保存数据。
计算设备700还包括接入设备740,接入设备740使得计算设备700能够经由一个或多个网络760通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备740可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备700的上述部件以及图7中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图7所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备700可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备700还可以是移动式或静止式的服务器。
其中,处理器720用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述目标节点确定方法的步骤。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的目标节点确定方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述目标节点确定方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述目标节点确定方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的目标节点确定方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述目标节点确定方法的技术方案的描述。
本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述目标节点确定方法的步骤。
上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的目标节点确定方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述目标节点确定方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims (14)

1.一种目标节点确定方法,包括:
获取应用服务系统的运行日志,其中,所述应用服务系统包括预设数量的服务,所述服务之间存在调用关系;
根据所述运行日志中的服务调用信息生成服务调用知识图谱,其中,所述服务调用知识图谱中包括所述服务对应的节点,以及服务调用异常信息;
根据节点访问策略以及所述服务调用知识图谱,确定所述服务调用知识图谱中的目标节点,其中,所述节点访问策略根据所述服务调用异常信息确定,且所述节点访问策略用于在所述服务调用知识图谱中进行节点访问。
2.根据权利要求1所述的方法,所述根据所述运行日志中的服务调用信息生成服务调用知识图谱,包括:
根据所述运行日志中的服务调用信息,确定所述服务之间的服务调用关系;
根据所述服务以及所述服务之间的服务调用关系,生成服务调用树状图;
对所述服务调用树状图中的服务调用关系进行处理,生成服务调用知识图谱。
3.根据权利要求2所述的方法,所述对所述服务调用树状图中的服务调用关系进行处理,生成服务调用知识图谱,包括:
确定所述服务调用树状图中相同的服务调用关系,并对所述相同的服务调用关系进行合并得到初始知识图谱;
删除所述初始知识图谱中不存在所述服务调用异常信息的服务调用关系,生成服务调用知识图谱。
4.根据权利要求3所述的方法,所述根据节点访问策略以及所述服务调用知识图谱,确定所述服务调用知识图谱中的目标节点之前,还包括:
根据所述服务调用异常信息生成节点访问策略。
5.根据权利要求4所述的方法,所述根据所述服务调用异常信息生成节点访问策略,包括:
根据所述运行日志中的服务调用信息,确定所述服务之间的服务调用关系;
根据所述服务调用关系对应的服务调用异常信息生成节点访问策略。
6.根据权利要求5所述的方法,所述根据所述服务调用关系对应的服务调用异常信息生成节点访问策略,包括:
根据所述服务调用关系对应的服务调用异常信息生成异常信息权重;
根据所述异常信息权重的比值确定访问概率,并根据访问概率生成节点访问策略。
7.根据权利要求1所述的方法,所述根据节点访问策略以及所述服务调用知识图谱,确定所述服务调用知识图谱中的目标节点,包括:
根据预设访问次数以及预设访问步数,利用节点访问策略,在所述服务调用知识图谱中进行节点访问,确定所述服务调用知识图谱中的目标节点。
8.根据权利要求7所述的方法,所述根据预设访问次数以及预设访问步数,利用节点访问策略,在所述服务调用知识图谱中进行节点访问,确定所述服务调用知识图谱中的目标节点,包括:
S2、确定所述服务调用知识图谱中的当前节点;
S4、确定所述服务调用知识图谱中,与所述当前节点存在服务调用关系的关联节点;
S6、根据所述当前节点与所述关联节点的访问概率,访问所述关联节点,并确定当前访问步数;
S8、判断当前访问步数是否大于等于预设访问步数;
若是,则结束,并继续执行步骤S2,
若否,则将所述关联节点确定为当前节点,继续执行步骤S4,直至满足预设访问条件结束,并确定当前访问次数;
判断所述当前访问次数是否大于等于所述预设访问次数,
若是,则结束;
若否,则将所述当前访问次数自增1,继续执行步骤S2。
9.根据权利要求8所述的方法,所述预设访问条件,包括:
所述当前节点与所述当前节点的关联节点的连续访问次数、大于或等于预设次数阈值。
10.根据权利要求7所述的方法,所述确定所述服务调用知识图谱中的目标节点之后,还包括:
在所述目标节点为至少两个的情况下,确定每个目标节点的出现次数;
根据所述出现次数进行排序生成异常定位结果,并显示所述异常定位结果以及所述服务调用知识图谱。
11.根据权利要求1所述的方法,所述获取应用服务系统的运行日志,包括:
获取所述应用服务系统的初始日志;
在所述初始日志中存在缺失数据的情况下,对所述初始日志进行补缺处理得到运行日志。
12.一种目标节点确定装置,包括:
数据获取模块,被配置为获取应用服务系统的运行日志,其中,所述应用服务系统包括预设数量的服务,所述服务之间存在调用关系;
生成模块,被配置为根据所述运行日志中的服务调用信息生成服务调用知识图谱,其中,所述服务调用知识图谱中包括所述服务对应的节点,以及服务调用异常信息;
访问模块,被配置为根据节点访问策略以及所述服务调用知识图谱,确定所述服务调用知识图谱中的目标节点,其中,所述节点访问策略根据所述服务调用异常信息确定,且所述节点访问策略用于在所述服务调用知识图谱中进行节点访问。
13.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至11任意一项所述目标节点确定方法的步骤。
14.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至11任意一项所述目标节点确定方法的步骤。
CN202410205131.7A 2022-08-03 2022-08-03 目标节点确定方法以及装置 Pending CN118055004A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410205131.7A CN118055004A (zh) 2022-08-03 2022-08-03 目标节点确定方法以及装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202210926465.4A CN115242613B (zh) 2022-08-03 2022-08-03 目标节点确定方法以及装置
CN202410205131.7A CN118055004A (zh) 2022-08-03 2022-08-03 目标节点确定方法以及装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN202210926465.4A Division CN115242613B (zh) 2022-08-03 2022-08-03 目标节点确定方法以及装置

Publications (1)

Publication Number Publication Date
CN118055004A true CN118055004A (zh) 2024-05-17

Family

ID=83677518

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202410205131.7A Pending CN118055004A (zh) 2022-08-03 2022-08-03 目标节点确定方法以及装置
CN202210926465.4A Active CN115242613B (zh) 2022-08-03 2022-08-03 目标节点确定方法以及装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202210926465.4A Active CN115242613B (zh) 2022-08-03 2022-08-03 目标节点确定方法以及装置

Country Status (1)

Country Link
CN (2) CN118055004A (zh)

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107306196A (zh) * 2016-04-20 2017-10-31 中兴通讯股份有限公司 虚拟化服务监控方法和装置
US11379598B2 (en) * 2018-02-28 2022-07-05 International Business Machines Corporation Knowledge graph access limitation by discovery restrictions
CN109495291B (zh) * 2018-09-30 2021-11-16 创新先进技术有限公司 调用异常的定位方法、装置和服务器
FR3102259B1 (fr) * 2019-10-17 2023-01-20 Amadeus Sas Surveillance d’un environnement de serveur d’applications distribué
CN112615849B (zh) * 2020-12-15 2022-04-26 平安科技(深圳)有限公司 微服务访问方法、装置、设备及存储介质
CN113179179B (zh) * 2021-04-22 2023-01-06 南京大学 一种用于定位服务调用成功率指标异常线索的方法
CN113238888A (zh) * 2021-06-02 2021-08-10 浙江网商银行股份有限公司 数据处理方法、系统及装置
CN114064439B (zh) * 2021-11-29 2024-01-30 北京火山引擎科技有限公司 微服务工作流运行时长预测方法、装置、设备以及介质
CN114218403B (zh) * 2021-12-20 2024-04-09 平安付科技服务有限公司 基于知识图谱的故障根因定位方法、装置、设备及介质
CN114844797A (zh) * 2022-05-27 2022-08-02 中国银行股份有限公司 调用链日志与监控日志关联方法及微服务异常检测方法

Also Published As

Publication number Publication date
CN115242613A (zh) 2022-10-25
CN115242613B (zh) 2024-03-15

Similar Documents

Publication Publication Date Title
US11269718B1 (en) Root cause detection and corrective action diagnosis system
US11409645B1 (en) Intermittent failure metrics in technological processes
CN110457175B (zh) 业务数据处理方法、装置、电子设备及介质
CN114430365B (zh) 故障根因分析方法、装置、电子设备和存储介质
CN110995459A (zh) 异常对象识别方法、装置、介质及电子设备
CN115309575A (zh) 基于图卷积神经网络的微服务故障诊断方法、装置及设备
CN111815467A (zh) 审核方法以及装置
CN115202847A (zh) 任务的调度方法和装置
CN114138601A (zh) 一种业务告警方法、装置、设备及存储介质
CN113296991B (zh) 异常检测方法以及装置
CN115242613B (zh) 目标节点确定方法以及装置
CN112163154A (zh) 数据处理方法、装置、设备及存储介质
CN116149877A (zh) 故障检测方法以及装置
CN114490408A (zh) 一种测试用例生成方法、装置、设备、存储介质及产品
CN110365520B (zh) 分布式系统中节点的巡检方法、装置及设备
CN113722141A (zh) 数据任务的延迟原因确定方法、装置、电子设备及介质
CN110852854B (zh) 一种量化收益模型的生成方法和风险控制策略的评价方法
CN111722977A (zh) 系统巡检方法、装置及电子设备
CN113781237B (zh) 基于分布式人工智能系统的产品订购单消费方法
CN115576732B (zh) 根因定位方法以及系统
CN117290113B (zh) 一种任务处理方法、装置、系统和存储介质
CN116955504B (zh) 一种数据处理方法、装置、电子设备和存储介质
CN115174366B (zh) 数据处理方法以及装置
CN114818645B (zh) 基于数据主体的自动化报告生成方法、装置、设备及介质
CN117056663A (zh) 一种数据处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination