WO2022134911A1

WO2022134911A1 - 诊断方法、装置、终端及存储介质

Info

Publication number: WO2022134911A1
Application number: PCT/CN2021/129869
Authority: WO
Inventors: 韩静; 张百胜; 陈力; 严心月; 贾统; 侯传嘉; 吴一凡; 李影
Original assignee: 中兴通讯股份有限公司; 北京大学
Priority date: 2020-12-21
Filing date: 2021-11-10
Publication date: 2022-06-30
Also published as: CN114647525A

Abstract

一种诊断方法、装置、终端及存储介质，该诊断方法包括：获取日志流信息(S100)；获取故障诊断模型(S200)；利用故障诊断模型对所述日志流信息进行诊断，得到诊断结果(S300)；获取对应于所述诊断结果的诊断误报信息(S400)；根据所述误报信息进行故障诊断模型调整(S500)。

Description

诊断方法、装置、终端及存储介质

相关申请的交叉引用

本申请基于申请号为202011519995.4、申请日为2020年12月21日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本申请实施例涉及日志诊断技术领域，尤其涉及一种诊断方法、装置、终端及存储介质。

背景技术

随着人工智能(Artificial Intelligence，AI)的发展，智能运维(Artificial Intelligence for IT Operations，AIOps)于2016年首次被提出，即通过机器学习(Machine Learning)等算法分析来自于多种运维工具和设备的大规模数据，自动发现并实时响应系统出现的问题，进而提升信息技术(Information Technology，IT)运维能力和自动化程度。在AIOps逐渐普及趋势下，以系统日志数据分析为核心的自动化、智能化的故障诊断成为分布式软件系统故障诊断技术的重要组成部分和发展趋势。

目前，基于系统日志分析的故障诊断技术存在着误报率高、难以在真实环境中使用的问题。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本申请实施例提供一种诊断方法、装置、终端及存储介质，能够对所述日志流信息进行模型异常诊断，根据误报信息对故障诊断模型进行动态更新，提高了诊断方法学习的效率。

第一方面，本申请实施例提供一种诊断方法，包括：获取日志流信息；获取故障诊断模型；利用故障诊断模型对所述日志流信息进行诊断，得到诊断结果；获取对应于所述诊断结果的诊断误报信息；根据所述误报信息进行故障诊断模型调整。

第二方面，本申请实施例提供一种诊断装置，包括：日志获取模块，被设置成获取日志流信息；故障诊断模型生成模块，被设置成根据所述日志流信息生成故障诊断模型；误报信息获取模块，获取所述故障诊断模型的误报信息；误报信息诊断模块，被设置成根据所述误报信息对所述故障诊断模型进行模型诊断，获取模型异常信息类型；并根据所述模型异常信息类型进行故障诊断模型调整；故障诊断模块，被设置成根据所述故障诊断模型对所述日志流信息进行模型异常诊断。

第三方面，本申请实施例提供一种终端，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述的诊断方法。

第四方面，本申请实施例提供一种存储介质，用于计算机可读存储，所述存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现如第一方面所述的诊断方法。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请实施例的一些实施例，对于本领域普通技术人员来说，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个实施例提供的诊断方法的流程图；

图2是本申请另一个实施例提供的诊断方法的流程图；

图3是本申请一个实施例提供的诊断装置；

图4是本申请一实施例提供的故障模型诊断模块；

图5是本申请另一个实施例提供的诊断装置。

附图标记：

诊断装置100；日志获取模块110；日志模板生成模块120；故障诊断模型生成模块130；故障模型诊断模块140；故障诊断模型更新器141；故障诊断模型存储器142；故障诊断器143；诊断结果展示器144；误报信息获取模块150；故障修复模块160；反馈模块170；误报故障标注器171；故障诊断模型更新器172。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请实施例。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请实施例的描述。

需要说明的是，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

还应当理解，在本申请实施例说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请实施例的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”，除非是以其他方式另外特别强调。

本申请实施例提供了一种诊断方法、装置、终端及计算机可读存储介质，应用诊断方法获取日志流信息；根据所述日志流信息生成日志模板；根据所述日志模板生成故障诊断模型；利用故障诊断模型对所述日志模板进行诊断，得到诊断结果；获取对应于诊断结果的诊断误报信息；根据所述误报信息进行故障诊断模型调整，能够对所述日志流信息进行模型异常诊断，根据误报信息对故障诊断模型进行动态更新，提高了诊断方法学习的效率。通过添加故障信息反馈，可以对模型进行针对性的调整。

下面结合附图，对本申请实施例作进一步阐述。

图1是本申请一个实施例提供的诊断方法的流程图，如图1所示，根据本申请第一方面实施例提供的一种诊断方法，至少包括以下步骤：S100：获取日志流信息；S200：获取故障诊断模型；S300：利用故障诊断模型对日志流信息进行诊断，得到诊断结果；S400：获取对应于诊断结果的诊断误报信息；S500：根据误报信息进行故障诊断模型调整。

S100：获取日志流信息。

在一些实施例中，获取系统日志信息。由于在线系统日志是不断产生的，因此也可以称为日志流信息。例如，将在线日志流信息记为L＝{l ₁,l ₂,l ₃,…l _i,…}，其中l _i为一条日志。

S200：获取故障诊断模型。

在一些实施例中，每当步骤S100中的一条日志转化完成后，实时构建、训练和更新当前时刻的控制流图故障诊断模型。

在一些实施例中，按序将在线日志流中的日志依次转化为日志模板。例如，令l _i的时间戳为t _i，令l _i对应的日志模板为T _i，将日志流信息生成日志模板转换成为日志模板可以简化故障诊断模型的数据结构。

S300：利用故障诊断模型对日志流信息进行诊断，得到诊断结果。

在一些实施例中，针对当前时刻的日志数据，利用已更新的当前时刻的控制流图故障诊断模型，在线诊断系统故障。例如，分别计算t _i前w时间段内每一条日志对应的日志模板与T _i之间的转移概率更新梯度。根据转移概率更新梯度进行故障诊断。

S400：获取对应于诊断结果的诊断误报信息。

在一些实施例中，根据诊断的结果，获取误报信息。

在一些实施例中，根据诊断误报信息相应地更新当前的控制流图故障诊断模型。

例如，通过接收误报信息，调整故障诊断模型的相应参数，从而降低故障诊断模型的误报率。

在一些实施例中，诊断误报信息可以通过故障模型诊断模块140获得。例如，故障模型诊断模块140可以是人机交互模块，也可以是远程通信模块。可以设置显示屏显示诊断结果，并通过输入模块(鼠标、键盘、触摸屏)获取用户输入的误报信息，进而对误报信息进行诊断。

在一些实施例中，报信息包括模型异常信息类型信息。

S500：根据误报信息进行故障诊断模型调整。

在一些实施例中，根据误报信息进行故障诊断模型调整，以便后续利用调整后的故障诊断模型对日志流信息进行诊断，以提高故障诊断模型诊断时的正确率。

图2是本申请另一个实施例提供的诊断方法的流程图，至少包括以下步骤：S410：获取误报状态信息；S420：根据误报状态信息，获取模型异常信息类型信息。

S410：获取误报状态信息。

在一些实施例中，获取误报状态信息。模型异常信息类型信息至少包括以下之一：延迟异常、冗余异常或序列异常。

S420：根据误报状态信息，获取模型异常信息类型信息。

在一些实施例中，根据误报信息进行故障诊断模型调整，包括：若模型异常信息类型为延迟异常，则调整故障诊断模型的时间权重；若模型异常信息类型为冗余异常，则更新故障诊断模型的模板节点；若模型异常信息类型为序列异常，则进一步判断序列异常的类型，根据判断结果，对故障诊断模型进行调整。延迟异常的误报一般是由于控制流图故障诊断模型中的时间权重过低，导致一些正常的延迟起伏被诊断为故障。冗余异常的误报一般是由于控制流图故障诊断模型中不存在特定的模板节点，从而使系统将原应处于控制流图中的节点诊断为异常模板。序列异常包括故障诊断模型未学习序列关系和故障诊断模型误学习序列关系。其中，故障诊断模型未学习序列关系包括三类未学习类型。第一类包括由于网络、消息队列、共享内存等进程或线程数据共享机制导致模板转移关系未被学习到、第二类包括偏远请求执行路径导致模板转移关系未被学习到、第三类包括请求路径中包括长任务执行过程导致模板转移关系未被学习到。其中，故障诊断模型误学习序列关系包括两类误学习类型。即，误学习到其他模板至请求起始模板或操作型日志模板的转移关系两种。若异常类型为延迟异常，则提高步长γ并降低衰变率β。若异常类型为冗余异常，则降低步长γ并提高衰变率β。若异常类型为未学习序列关系，则提高步长γ并降低衰变率β。若异常类型为误学习序列关系，则降低步长γ并提高衰变率β。

在一些实施例中，故障诊断模型为有向图模型，有向图模型包括作为节点的日志模板集合和作为有向边的日志模板转移概率参数矩阵；转移概率参数矩阵包括时间权重参数、步长参数和衰变率参数；对应的，利用故障诊断模型对日志流信息进行诊断，得到诊断结果；包括：将日志流信息转换为日志模板；利用故障诊断模型对日志模板进行诊断，得到诊断结果。

在一些实施例中，获取故障诊断模型，包括：根据日志模板，更新日志模板集合和/或更新模板转移概率参数矩阵；根据新的日志模板集合和/或更新模板转移概率参数矩阵更新故障诊断模型。

在一些实施例中，根据新的日志模板集合和/或更新模板转移概率参数矩阵更新故障诊断模型可以进一步降低故障诊断模型的故障率。

在一些实施例中，故障诊断模型包括时间参数；根据日志模板生成故障诊断模型，包括：根据日志模板内日志流信息的时间戳计算日志流信息的转移概率。

在一些实施例中，延迟异常的误报一般是由于控制流图故障诊断模型中的时间权重过低，导致一些正常的延迟起伏被诊断为故障。相应地，根据反馈的结果更新时间权重来解决。时间权重在计算时可以应用控制参数δ来表示。

在一些实施例中，延迟异常的误报可以通过故障模型诊断模块140获得。例如，故障模型诊断模块140可以是人机交互模块，也可以是远程通信模块。可以设置显示屏显示诊断结果，并通过输入模块(鼠标、键盘、触摸屏)获取用户输入的误报信息，诊断延迟异常的误报。

在一些实施例中，冗余异常的误报一般是由于控制流图故障诊断模型中不存在特定的模板节点，从而使系统将原应处于控制流图中的节点诊断为异常模板。相应地，根据反馈的结果更新模板来解决冗余异常的误报。

在一些实施例中，冗余异常的误报可以通过人工进行确认。

在一些实施例中，冗余异常的误报可以通过故障模型诊断模块140获得。例如，故障模型诊断模块140可以是人机交互模块，也可以是远程通信模块。可以设置显示屏显示诊断结果，并通过输入模块(鼠标、键盘、触摸屏)获取用户输入的误报信息，诊断冗余异常的误报。

在一些实施例中，序列异常的类型包括：故障诊断模型未学习序列关系；或者，故障诊断模型误学习序列关系。

在一些实施例中，对于序列异常，可按照需要调整的参数将误报原因分为两类，分别为故障诊断模型未学习序列关系；或者，故障诊断模型误学习序列关系。

在一些实施例中，故障诊断模型未学习序列关系包括三类未学习类型。第一类包括由于网络、消息队列、共享内存等进程或线程数据共享机制导致模板转移关系未被学习到、第二类包括偏远请求执行路径导致模板转移关系未被学习到、第三类包括请求路径中包括长任务执行过程导致模板转移关系未被学习到。

在一些实施例中，故障诊断模型误学习序列关系包括两类误学习类型。即，误学习到其他模板至请求起始模板或操作型日志模板的转移关系两种。

在一些实施例中，根据判断结果，对故障诊断模型进行调整，还包括：若故障诊断模型未学习序列关系，则提高故障诊断模型的步长并降低衰变率；若故障诊断模型误学习序列关系，则降低故障诊断模型的步长并提高衰变率。

在一些实施例中，若故障诊断模型为未学习序列关系，则通过提升长转移时间的模板关系学习效率，并提升频率低的模板关系学习效率得以解决，具体实施上，即为提高步长γ并降低衰变率β。

在一些实施例中，若故障诊断模型为误学习序列关系，则通过降低无父节点的模板的学习效率解决，具体实施上，即为降低步长γ并提高衰变率β。

在一些实施例中，日志模板包括常量和占位符；根据日志流信息生成日志模板，包括：根据日志流信息中的变量信息替换日志模板中的占位符。

在一些实施例中，应用在线日志模板挖掘算法，实时处理在线日志流，将日志流中的日志依次转化为日志模板。其中，日志模板是将日志中的常量部分为标识的日志类型进行抽象。通过保留日志中的常量部分，以占位符标识日志中的变量部分的方式，将日志转化为日志模板。即，日志对应的日志模板包括日志中的常量部分和占位符。

在一些实施例中，故障诊断模型包括时间参数，根据日志模板生成故障诊断模型，包括：根据日志模板内日志流信息的时间戳计算日志流信息的转移概率。

在一些实施例中，根据故障诊断模型对日志流信息进行异常诊断，以获取诊断结果，包括：判断日志流信息的转移概率是否超过阈值；若超过阈值，则上报故障信息。

在一些实施例中，维护所有日志模板之间的转移概率函数参数矩阵，若日志模板之间的转移概率函数参数大于阈值β，则在日志模板之间添加一条有向边，否则两个日志模板独立，进而构建任意时刻的动态控制流图故障诊断模型。在训练和更新过程中，使用梯度下降方法更新转移概率函数参数。另外，通过引入衰变机制，降低日志模板之间的转移概率函数参数，使控制流图模型兼备实时演化和实时退化的特性。

在一些实施例中，控制流图故障诊断模型应用无回路有向图(Directed Acyclic Graph，DAG)模型。DAG数据结构用于跟踪基本块中值和变量的计算和赋值；块中使用的来自别处的值表示为叶子节点；值上的操作表示为内部节点；新值的赋值表示为将目标变量或临时变量的名字附加到表示赋值的节点上。

在一些实施例中，两个日志模板之间的转移概率更新梯度包括：将在线日志流记为L＝{l ₁,l ₂,l ₃,…l _i,…}，其中l _i为一条日志；令l _i的时间戳为t _i，令l _i对应的日志模板为T _i；分别计算t _i前w时间段内每一条日志对应的日志模板与T _i之间的转移概率更新梯度。令L _w＝{l _j,l _j+1,…l _i}，满足t _i-t _j<w且t _i-t _j-1≥w，令l _k∈L _w，如果T _i在首次出现，则T _k与T _i之间的转移概率参数更新梯度

表示为：

其中，δ是控制参数；如果T _i非首次出现，则

表示为

其中

为当前转移概率函数参数矩阵中日志模板T _x与日志模板T _i之间的转移概率函数参数。

在一些实施例中，更新转移概率函数参数的计算包括：在得到转移概率函数参数更新梯度

后，更新转移概率函数参数

其中σ为更新步长，其中

代表更新后的T _k与T _i之间的转移概率函数参数，

代表更新前的T _k与T _i之间的转移概率函数参数。

在一些实施例中，为日志信息引入随着时间的衰变：

其中γ为衰变步长。

为更新前的转移概率函数参数；

为更新后的转移概率函数参数。

在一些实施例中，衰变可以根据模型进行优化设置，如每五分钟、十分钟或十五分钟，转移概率函数参数矩阵中的所有元素经历一次衰变。

根据本申请实施例提供的一种诊断装置100，至少包括以下部分：日志获取模块110；日志模板生成模块120；故障诊断模型生成模块130；故障模型诊断模块140；误报信息获取模块150；故障修复模块160。

图3是本申请第二方面实施例提供的一种诊断装置100，如图3所示的诊断装置100，至少包括以下部分：日志获取模块110；日志模板生成模块120；故障诊断模型生成模块130；故障模型诊断模块140；误报信息获取模块150；故障修复模块160。

在一些实施例中，日志获取模块110，被设置成获取日志流信息；日志模板生成模块120，被设置成根据日志流信息生成日志模板；故障诊断模型生成模块130，被设置成根据日志模板生成故障诊断模型；故障模型诊断模块140，被设置成利用故障诊断模型对日志模板进行诊断，得到诊断结果；误报信息获取模块150，被设置成获取对应于诊断结果的诊断误报信息；故障修复模块160，被设置成根据误报信息进行故障诊断模型调整。

在一些实施例中，日志获取模块110被设置成从在线日志流中挖掘日志模板并将日志转化为其对应的日志模板。该模块挖掘的日志模板集合为Templates＝{T ₁,T ₂,…,T _n}，日志与日志模板是多对一的关系，日志流L＝{l ₁,l ₂,l ₃,…l _k,…}中每个日志l _i被转化为T _i，其中T _i∈Templates。

图4是本申请一实施例提供的一种故障模型诊断模块140，如图4所示的故障模型诊断模块140，至少包括以下部分：故障诊断模型更新器141；故障诊断模型存储器142；故障诊断器143；诊断结果展示器144。

在一些实施例中，故障模型诊断模块140被设置成根据日志流和日志对应的日志模板，构建与更新控制流图故障诊断模型，并使用故障诊断模型在线分析日志流进而发现系统异常并诊断系统故障。故障模型诊断模块140包括四个子模块：故障诊断模型更新器141；故障诊断模型存储器142；故障诊断器143；诊断结果展示器144。

在一些实施例中，故障诊断模型更新器141是一个有向图模型G＝{Nodes,Edges}，其中节点为Nodes为日志模板集合Templates＝{T ₁,T ₂,…,T _n}，边Edges为日志模板之间的转移关系。故障诊断模型更新器维持一个临时的日志模板集合Templates和一个日志模板转移概率参数矩阵

伴随日志流输入使用动态控制流图模型构建方法更新矩阵中的值或扩展矩阵。每经过一段时间，故障诊断模型更新器将Templates和(α)传递给故障诊断模型存储器。

在一些实施例中，故障诊断模型存储器142维持一个稳定的日志模板集合Templates和一个日志模板转移概率参数矩阵(α)，从故障诊断模型更新器获取最新的模型信息，并对外提供矩阵(α)的查询服务。

在一些实施例中，故障诊断器143首先从故障诊断模型存储器中查询最新的故障诊断模型参数矩阵(α)，然后根据故障诊断方法计算日志模板之间的转移概率并与日志流中的转移关系比对，进而发现系统异常，并将异常结果输入诊断结果展示器。

在一些实施例中，诊断结果展示器144被设置成展示故障诊断器发现的系统异常和故障，具体包括故障时间，故障日志片段，故障控制流图链路。

在一些实施例中，诊断装置100还包括反馈模块被设置成根据运维人员标注的误报故障，更新控制流图故障诊断模型。

图5是本申请以实施例提供的一种诊断装置100，如图5所示的诊断装置100，至少包括以下部分：日志获取模块110；日志模板生成模块120；故障模型诊断模块140；故障诊断模型更新器141；故障诊断模型存储器142；故障诊断器143；诊断结果展示器144；误报信息获取模块150；反馈模块170；误报故障标注器171；故障诊断模型更新器172。

在一些实施例中，图5所示的诊断装置100将图3中的故障诊断模型生成模块130、误报信息获取模块150和故障修复模块160结合成为反馈模块170，降低了诊断装置100的系统复杂度，提高了系统的稳定性。

在一些实施例中，人工反馈模块包括误报故障标注器和故障诊断模型更新器。

在一些实施例中，误报故障标注器为运维人员提供标注误报故障的功能。运维人员从诊断结果展示器中查看诊断出的故障，然后通过误报故障标注器标注出误报故障。

在一些实施例中，故障诊断模型更新器根据人工反馈的结果，对控制流图故障诊断模型进行更新。每经过一段时间，将故障诊断模型传递给故障诊断模型存储器。

根据本申请第三方面实施例提供的一种终端，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现如第一方面实施例的诊断方法。

处理器和存储器可以通过总线或者其他方式连接。

存储器作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外，存储器可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中，存储器可包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

实现上述实施例的诊断方法所需的非暂态软件程序以及指令存储在存储器中，当被处理器执行时，执行上述实施例中的诊断方法，例如，执行以上描述的图1中的方法步骤S100至S500、图2中的方法步骤S410至S420。

根据本申请第四方面实施例提供的一种计算机可读存储介质，用于计算机可读存储，存储介质存储有一个或者多个程序，一个或者多个程序可被一个或者多个处理器执行，以实现如第一方面实施例的诊断方法。

该计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令被一个处理器或控制器执行，例如，被上述车辆连接器实施例中的一个处理器执行，可使得上述处理器执行上述实施例中的车辆远程诊断方法，例如，执行以上描述的图1中的方法步骤S100至S500、图2中的方法步骤S410至S420。

本申请实施例提供的诊断方法、诊断装置、终端和存储介质，与一些技术方案相比，能够对所述日志流信息进行模型异常诊断，根据误报信息对故障诊断模型进行动态更新，提高了诊断方法学习的效率。通过添加故障信息反馈，可以对模型进行针对性的调整，从而有效降低诊断误报率。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

以上是对本申请实施例的一些实施进行了具体说明，但本申请实施例并不局限于上述实施方式，熟悉本领域的技术人员在不违背本申请实施例精神的前提下还可作出种种的等同变形或替换，这些等同的变形或替换均包含在本申请实施例权利要求所限定的范围内。

Claims

一种诊断方法，包括：

获取日志流信息；

获取故障诊断模型；

利用故障诊断模型对所述日志流信息进行诊断，得到诊断结果；

获取对应于所述诊断结果的诊断误报信息；

根据所述误报信息进行故障诊断模型调整。
根据权利要求1所述的诊断方法，其中，所述故障诊断模型为有向图模型，所述有向图模型包括作为节点的日志模板集合和作为有向边的日志模板转移概率参数矩阵；所述转移概率参数矩阵包括时间权重参数、步长参数和衰变率参数；

对应的，所述利用故障诊断模型对所述日志流信息进行诊断，得到诊断结果，包括：

将所述日志流信息转换为日志模板；

利用故障诊断模型对所述日志模板进行诊断，得到诊断结果。
根据权利要求2所述的诊断方法，其中，所述日志模板包括常量和占位符；

对应的，所述日志流信息转换为日志模板，包括：

根据所述日志流信息中的变量信息替换所述日志模板中的所述占位符。
根据权利要求2或3所述的诊断方法，其中，所述误报信息包括模型异常信息类型信息；

所述获取对应于诊断结果的诊断误报信息，包括：

获取误报状态信息；

根据所述误报状态信息，获取所述模型异常信息类型信息；

所述模型异常信息类型信息至少包括以下之一：

延迟异常、冗余异常或序列异常。
根据权利要求4所述的诊断方法，其中，所述根据所述误报信息进行故障诊断模型调整，包括：

若所述模型异常信息类型为所述延迟异常，则调整所述故障诊断模型的时间权重；

若所述模型异常信息类型为所述冗余异常，则更新所述故障诊断模型的模板节点；

若所述模型异常信息类型为所述序列异常，则进一步判断所述序列异常的类型，根据判断结果，对所述故障诊断模型进行调整。
根据权利要求5所述的诊断方法，其中，所述序列异常的类型包括：

所述故障诊断模型未学习序列关系；或者，

所述故障诊断模型误学习所述序列关系。
根据权利要求6所述的诊断方法，其中，所述根据判断结果，对所述故障诊断模型进行调整，还包括：

若所述故障诊断模型未学习序列关系，则提高所述故障诊断模型的步长并降低衰变率；

若所述故障诊断模型误学习所述序列关系，则降低所述故障诊断模型的步长并提高衰变率。
根据权利要求2至3、5至7中任一项所述的诊断方法，其中，所述获取故障诊断模型，包括：

根据所述日志模板，更新所述日志模板集合和/或更新所述模板转移概率参数矩阵；

根据新的日志模板集合和/或更新模板转移概率参数矩阵更新所述故障诊断模型。
根据权利要求8所述的诊断方法，其中，所述故障诊断模型包括时间戳；

所述根据所述日志模板生成故障诊断模型，包括：

根据所述日志模板内所述日志流信息的所述时间戳计算所述日志流信息的转移概率参数。
根据权利要求9所述的诊断方法，其中，所述根据所述故障诊断模型对所述日志流信息进行异常诊断，以获取诊断结果，包括：

将所述日志流信息的转移概率参数和所述故障诊断模型转移概率对比；

判断对比结果是否低于预设阈值；

若低于所述预设阈值，则判断为故障。
一种诊断装置，包括：

日志获取模块，被设置成获取日志流信息；

故障诊断模型生成模块，被设置成根据所述日志流信息生成故障诊断模型；

故障模型诊断模块，被设置成利用故障诊断模型对所述日志模板进行诊断，得到诊断结果；

误报信息获取模块，被设置成获取对应于诊断结果的诊断误报信息；

故障修复模块，被设置成根据所述误报信息进行故障诊断模型调整。
一种终端，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述计算机程序时实现如权利要求1至10任意一项所述的诊断方法。
一种计算机可读存储介质，用于计算机可读存储，其中，所述存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现权利要求1至10任一项所述的诊断方法。