CN117130819B - 一种基于时延方差和相关系数值的微服务故障诊断方法 - Google Patents

一种基于时延方差和相关系数值的微服务故障诊断方法 Download PDF

Info

Publication number
CN117130819B
CN117130819B CN202311403291.4A CN202311403291A CN117130819B CN 117130819 B CN117130819 B CN 117130819B CN 202311403291 A CN202311403291 A CN 202311403291A CN 117130819 B CN117130819 B CN 117130819B
Authority
CN
China
Prior art keywords
fault
time delay
micro
service
variance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311403291.4A
Other languages
English (en)
Other versions
CN117130819A (zh
Inventor
曾祥意
马勇
郑文胜
戴梦轩
郭晶晶
李凡
李康顺
夏云霓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi Normal University
Original Assignee
Jiangxi Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxi Normal University filed Critical Jiangxi Normal University
Priority to CN202311403291.4A priority Critical patent/CN117130819B/zh
Publication of CN117130819A publication Critical patent/CN117130819A/zh
Application granted granted Critical
Publication of CN117130819B publication Critical patent/CN117130819B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/259Fusion by voting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Abstract

本发明公开了一种基于时延方差和相关系数值的微服务故障诊断方法,通过服务器收集微服务日志信息,获取带标签的微服务的时延曲线,并进行预处理,通过微服务故障时延曲线预测模型,得到预测故障时延曲线,计算预测故障时延曲线与故障时延曲线的时延方差的差值,并构建微服务故障区间集合树,根据故障类型判别规则,判断故障时延方差值所属故障时延方差区间,若故障时延方差的差值处于独立故障区间,则对微服务进行故障诊断得到微服务故障类型,若故障时延方差的差值处于混合故障区间,则通过微服务故障分类模型,得到微服务故障类型。通过上述方式,本发明能够提升微服务故障检测效率,降低维护的复杂性以及人工成本,实现运维的自动化。

Description

一种基于时延方差和相关系数值的微服务故障诊断方法
技术领域
本发明涉及微服务故障检测领域,特别是涉及一种基于时延方差和相关系数值的微服务故障诊断方法。
背景技术
目前针对微服务系统的故障诊断方法的研究工作主要集中于如何对关联关系模型进行建模,考虑如何加入更多的影响因素以提高故障诊断的全面性和准确性。然而,故障影响因素种类的增加,关联关系模型的复杂化,会极大地影响故障诊断效率,传统软件与微服务软件的差异性并没有完全体现,传统的故障诊断方法不适用于微服务软件的问题也未得到根本性解决。
公开号为CN111290900A,名称为一种基于微服务日志的软件故障检测方法的专利文献,通过拓扑检测模型对微服务关键程度进行排名,越关键的微服务越有可能是出现故障的微服务,减少盲目逐个微服务进行故障分析检测所带来的开销,随后通过模式匹配服务避免每次都进行机器学习而带来的故障检测效率低下,最后通过对日志文本特征的提取、降维、学习,构建了一个可以对微服务是否为故障服务进行分类的机器学习模型,但是该方法仅对关键微服务进行故障诊断,忽略了其他微服务出现故障的可能。
公开号为CN116627693A,名称为一种微服务系统中的故障检测方法及装置的专利文献,通过获取目标系统的分布式跟踪数据,并通过分布式跟踪数据进行构建,构建出服务调用链;获取目标系统监控数据,使用PCA方法进行降维获得监控数据向量;将所述的监控数据向量作为所述服务调用链的权重嵌入服务调用链中;将聚合后的服务调用链作为异常检测模型的输入,得到异常检测模型输出的对目标系统的异常检测结果,但是该方法仅考虑系统监控数据向量,对检测结果的影响,忽略了不同类型故障监控数据向量所造成的影响不同。
发明内容
为解决上述技术问题,本发明采用的一个技术方案是:提供一种基于时延方差和相关系数值的微服务故障诊断方法,该方法包括:
S100:通过服务器收集微服务日志信息,获取带标签的微服务的时延曲线;
S200:将所述带标签的微服务的时延曲线进行预处理,得到故障时延曲线、正常时延曲线和故障时延曲线片段;
S300:构建微服务故障时延曲线预测模型,对所述故障时延曲线片段进行预测,得到预测故障时延曲线;
S400:计算所述预测故障时延曲线的时延方差值与所述故障时延曲线的时延方差值,获得故障时延方差的差值;
S500:通过对多组故障时延曲线计算不同类型故障所对应的故障时延方差的差值,得到不同类型故障所对应的故障时延方差区间,构建微服务故障区间集合树;
S600:构建故障类型判别规则,根据所述微服务故障区间集合树判断所述故障时延方差值所属故障时延方差区间,若所述故障时延方差的差值处于独立故障区间,则转S800,若所述故障时延方差的差值处于混合故障区间,则转S700;
S700:构建微服务故障分类模型,对故障时延曲线所属故障类别进行分类,得到微服务故障类型;
S800:根据所述故障类型判别规则,对微服务进行故障诊断,得到微服务故障类型;
所述微服务日志信息包括:微服务的时延曲线、微服务时延曲线故障波动起始点、时延最高峰值、故障持续时间、历史的资源占用率、服务器负载率、服务请求信息、网络流量,故障标签;
所述S700,包括:
S710:通过服务器收集微服务日志信息,获取当前微服务历史故障信息数据,并对故障信息数据中各信息特征进行独热编码转换,获得微服务故障特征;
S720:计算所述微服务故障特征的故障相关性系数,获得各类型故障的故障特征系数组成模式;
S730:根据所述故障特征系数组成模式计算故障时延曲线的特征,获得各模式下故障时延曲线特征数据;
S740:构建微服务故障分类模型,对所述故障时延曲线特征数据进行分类,获得故障时延曲线所对应的故障类型。
进一步地,所述将所述带标签的微服务的时延曲线进行预处理,对故障标签对微服务的时延曲线进行划分,得到故障时延曲线和正常时延曲线;
所述故障时延曲线片段,是故障时延曲线中故障波动起始点左侧以故障持续时间T为区间大小的正常时延曲线片段。
进一步地,所述微服务故障时延预测模型,是指采用长短期记忆网络连接一个全连接网络组成的模型,模型采用所述正常时延曲线进行训练;
所述微服务故障时延预测模型表示为:
其中,为模型预测值,/>是指微服务的时延数据,/>为全连接网络。
进一步地,所述计算故障时延方差的差值,所述计算公式为:
其中,是指故障时延曲线方差值,/>是指预测故障时延曲线方差值,/>是指故障时延方差的差值;
所述故障时延曲线方差值,是通过对故障时延曲线采用微服务监控系统监控间隔为周期,计算从故障波动起始点到故障持续时间T区间内时延的方差值;
所述预测故障时延曲线方差值,是通过对预测故障时延曲线采用微服务监控系统监控间隔为周期,计算从故障波动起始点到故障持续时间T区间内时延的方差值。
进一步地,所述微服务故障区间集合树,是指通过对多组故障时延曲线进行方差的差值计算,获得同类型故障方差的差值区间,通过所述方差的差值区间对不同类型的故障建立集合树,所述微服务故障区间集合树表示为:
其中,是指微服务故障区间集合树,/>是指第M个微服务,/>是指第N个故障类型,/>是指第N个故障类型所对应的故障区间。
进一步地,所述故障类型判别规则,分为非故障情形、未知故障情形、独立故障情形、混合故障情形;
所述非故障情形,是指当故障方差的差值小于微服务故障区间集合树范围时,则判定为该故障时延曲线为偶然性波动事件,认定不存在故障发生;
所述未知故障情形,是指当故障方差的差值大于微服务故障区间集合树范围时,认定该故障时延曲线所对应的故障类型为未知故障,交由人工进行分析;
所述独立故障情形,是指当故障方差的差值在故障区间集合树范围内并且属于独立故障区间,则认定该故障时延曲线所对应的故障类型为故障区间所对应的故障类型;
所述混合故障情形,是指当故障方差的差值在故障区间集合树范围内并且属于混合故障区间,即该故障方差差值属于不同的故障区间,则通过S700对微服务故障类型进行判断;
所述独立故障区间,是指故障方差的差值仅被单独类型的故障区间所包含;
所述混合故障区间,是指故障方差的差值被多个不同类型故障区间所包含。
进一步地,所述故障信息数据包括:历史峰值、持续时间、日志级别、服务器负载、内存使用率、请求信息、网络流量;
所述独热编码转化,是指将所述故障信息数据中特征数据转化为二进制特征,将离散的类别特征数据转化为可计算的数值特征数据;
所述计算所述微服务故障特征的故障相关性系数,计算公式为:
其中,是指故障类型为/>的第/>个故障特征的相关性系数,n是指微服务历史故障信息数据中故障类型为/>的个数,m是指微服务历史故障信息数据中故障类型不为/>的个数,/>是指当前故障特征/>在微服务历史故障信息数据中的平均数,/>是指当前故障特征/>在故障类型为/>的平均数,/>是指当前故障特征/>在其他故障类型的平均数, />是指第s个当前故障特征/>所对应的特征值;
所述特征系数组成模式,表示为:
其中,是指故障/>的特征系数组成模式,/>是指故障类型/>中第1个故障特征的相关性系数;
所述微服务故障分类模型,是在KNN算法的基础上,采用加权投票机制来决定故障时延曲线所对应故障类型;
所述加权投票机制,是统计不同模式下的故障时延曲线特征数据在KNN中所属故障类别次数,计算各模式下的不同故障类型的综合次数,选择故障类型综合次数最大的故障类型作为故障时延曲线所对应故障类型,计算公式为:
其中,是指在模式h下故障类型k的综合次数,/>是指故障类型k在所有故障类型中所占比例,/>是指模式h下故障k的次数。
本发明的有益效果是:
1、本发明通过微服务故障时延预测模型,预测故障时延发生情况下原本的正常时延曲线,和实际故障时延曲线进行比较,以故障时延方差差值为基础,对故障类型进行分析,逻辑清晰明了,易于使用,能够降低维护的复杂性以及人工成本;
2、本发明建立微服务故障区间集合树结构,通过微服务故障区间集合树能够实现微服务故障类型的快速查找,提升微服务故障检测效率。
附图说明
图1是一种基于时延方差和相关系数值的微服务故障诊断方法的流程图。
图2是一种基于时延方差和相关系数值的微服务故障诊断方法的故障分类示意图。
图3是一种基于时延方差和相关系数值的微服务故障诊断方法的微服务故障区间集合树示意图。
具体实施方式
下面结合附图对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
请参阅图1、图2和图3,本发明实施例包括:
如图1所示,一种基于时延方差和相关系数值的微服务故障诊断方法,该方法包括:
S100:通过服务器收集微服务日志信息,获取带标签的微服务的时延曲线;
所述微服务日志信息包括:微服务的时延曲线、微服务时延曲线故障波动起始点、时延最高峰值、故障持续时间、历史的资源占用率、服务器负载率、服务请求信息、网络流量,故障标签。
S200:将所述带标签的微服务的时延曲线进行预处理,得到故障时延曲线、正常时延曲线和故障时延曲线片段。
进一步地,所述将所述带标签的微服务的时延曲线进行预处理,对故障标签对微服务的时延曲线进行划分,得到故障时延曲线和正常时延曲线;
所述故障时延曲线片段,是故障时延曲线中故障波动起始点左侧以故障持续时间T为区间大小的正常时延曲线片段。
S300:构建微服务故障时延曲线预测模型,对所述故障时延曲线片段进行预测,得到预测故障时延曲线。
进一步地,所述微服务故障时延预测模型,是指采用长短期记忆网络连接一个全连接网络组成的模型,模型采用所述正常时延曲线进行训练;
所述微服务故障时延预测模型表示为:
其中,为模型预测值,/>是指微服务的时延数据,/>为全连接网络。
S400:计算所述预测故障时延曲线的时延方差值与所述故障时延曲线的时延方差值,获得故障时延方差的差值。
进一步地,所述计算故障时延方差的差值,所述计算公式为:
其中,是指故障时延曲线方差值,/>是指预测故障时延曲线方差值,/>是指故障时延方差的差值;
所述故障时延曲线方差值,是通过对故障时延曲线采用微服务监控系统监控间隔为周期,计算从故障波动起始点到故障持续时间T区间内时延的方差值;
所述预测故障时延曲线方差值,是通过对预测故障时延曲线采用微服务监控系统监控间隔为周期,计算从故障波动起始点到故障持续时间T区间内时延的方差值。
S500:通过对多组故障时延曲线计算不同类型故障所对应的故障时延方差的差值,得到不同类型故障所对应的故障时延方差区间,构建微服务故障区间集合树。
进一步地,如图3所示,所述微服务故障区间集合树,是指通过对多组故障时延曲线进行方差的差值计算,获得同类型故障方差的差值区间,通过所述方差的差值区间对不同类型的故障建立集合树,所述微服务故障区间集合树表示为:
其中,是指微服务故障区间集合树,/>是指第M个微服务,/>是指第N个故障类型,/>是指第N个故障类型所对应的故障区间。
S600:构建故障类型判别规则,根据所述微服务故障区间集合树判断所述故障时延方差值所属故障时延方差区间,若所述故障时延方差的差值处于独立故障区间,则转S800,若所述故障时延方差的差值处于混合故障区间,则转S700。
进一步地,所述故障类型判别规则,分为非故障情形、未知故障情形、独立故障情形、混合故障情形;
所述非故障情形,是指当故障方差的差值小于微服务故障区间集合树范围时,则判定为该故障时延曲线为偶然性波动事件,认定不存在故障发生;
所述未知故障情形,是指当故障方差的差值大于微服务故障区间集合树范围时,认定该故障时延曲线所对应的故障类型为未知故障,交由人工进行分析;
所述独立故障情形,是指当故障方差的差值在故障区间集合树范围内并且属于独立故障区间,则认定该故障时延曲线所对应的故障类型为故障区间所对应的故障类型;
所述混合故障情形,是指当故障方差的差值在故障区间集合树范围内并且属于混合故障区间,即该故障方差差值属于不同的故障区间,则通过S700对微服务故障类型进行判断;
所述独立故障区间,是指故障方差的差值仅被单独类型的故障区间所包含;
所述混合故障区间,是指故障方差的差值被多个不同类型故障区间所包含。
S700:构建微服务故障分类模型,对故障时延曲线所属故障类别进行分类,得到微服务故障类型;
如图2所示,所述S700,包括:
S710:通过服务器收集微服务日志信息,获取当前微服务历史故障信息数据,并对故障信息数据中各信息特征进行独热编码转换,获得微服务故障特征;
S720:计算所述微服务故障特征的故障相关性系数,获得各类型故障的故障特征系数组成模式;
S730:根据所述故障特征系数组成模式计算故障时延曲线的特征,获得各模式下故障时延曲线特征数据;
S740:构建微服务故障分类模型,对所述故障时延曲线特征数据进行分类,获得故障时延曲线所对应的故障类型。
进一步地,所述故障信息数据包括:历史峰值、持续时间、日志级别、服务器负载、内存使用率、请求信息、网络流量;
所述独热编码转化,是指将所述故障信息数据中特征数据转化为二进制特征,将离散的类别特征数据转化为可计算的数值特征数据;
所述计算所述微服务故障特征的故障相关性系数,计算公式为:
其中,是指故障类型为/>的第/>个故障特征的相关性系数,n是指微服务历史故障信息数据中故障类型为/>的个数,m是指微服务历史故障信息数据中故障类型不为/>的个数,/>是指当前故障特征/>在微服务历史故障信息数据中的平均数,/>是指当前故障特征/>在故障类型为/>的平均数,/>是指当前故障特征/>在其他故障类型的平均数, />是指第s个当前故障特征/>所对应的特征值;
其中,是指故障/>的特征系数组成模式,/>是指故障类型/>中第1个故障特征的相关性系数;
所述微服务故障分类模型,是在KNN算法的基础上,采用加权投票机制来决定故障时延曲线所对应故障类型;
所述加权投票机制,是统计不同模式下的故障时延曲线特征数据在KNN中所属故障类别次数,计算各模式下的不同故障类型的综合次数,选择故障类型综合次数最大的故障类型作为故障时延曲线所对应故障类型,计算公式为:
其中,是指在模式h下故障类型k的综合次数,/>是指故障类型k在所有故障类型中所占比例,/>是指模式h下故障k的次数。
S800:根据所述故障类型判别规则,对微服务进行故障诊断,得到微服务故障类型。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (4)

1.一种基于时延方差和相关系数值的微服务故障诊断方法,其特征在于,包括:
S100:通过服务器收集微服务日志信息,获取带标签的微服务的时延曲线;
S200:将所述带标签的微服务的时延曲线进行预处理,得到故障时延曲线、正常时延曲线和故障时延曲线片段;
S300:构建微服务故障时延曲线预测模型,对所述故障时延曲线片段进行预测,得到预测故障时延曲线;
S400:计算所述预测故障时延曲线的时延方差值与所述故障时延曲线的时延方差值,获得故障时延方差的差值;
S500:通过对多组故障时延曲线计算不同类型故障所对应的故障时延方差的差值,得到不同类型故障所对应的故障时延方差区间,构建微服务故障区间集合树;
S600:构建故障类型判别规则,根据所述微服务故障区间集合树判断所述故障时延方差值所属故障时延方差区间,若所述故障时延方差的差值处于独立故障区间,则转S800,若所述故障时延方差的差值处于混合故障区间,则转S700;
S700:构建微服务故障分类模型,对故障时延曲线所属故障类别进行分类,得到微服务故障类型;
S800:根据所述故障类型判别规则,对微服务进行故障诊断,得到微服务故障类型;
所述微服务日志信息包括:微服务的时延曲线、微服务时延曲线故障波动起始点、时延最高峰值、故障持续时间、历史的资源占用率、服务器负载率、服务请求信息、网络流量,故障标签;
所述将所述带标签的微服务的时延曲线进行预处理,对故障标签对微服务的时延曲线进行划分,得到故障时延曲线和正常时延曲线;
所述故障时延曲线片段,是故障时延曲线中故障波动起始点左侧以故障持续时间T为区间大小的正常时延曲线片段;
所述故障类型判别规则,分为非故障情形、未知故障情形、独立故障情形、混合故障情形;
所述非故障情形,是指当故障方差的差值小于微服务故障区间集合树范围时,则判定为该故障时延曲线为偶然性波动事件,认定不存在故障发生;
所述未知故障情形,是指当故障方差的差值大于微服务故障区间集合树范围时,认定该故障时延曲线所对应的故障类型为未知故障,交由人工进行分析;
所述独立故障情形,是指当故障方差的差值在故障区间集合树范围内并且属于独立故障区间,则认定该故障时延曲线所对应的故障类型为故障区间所对应的故障类型;
所述混合故障情形,是指当故障方差的差值在故障区间集合树范围内并且属于混合故障区间,即该故障方差差值属于不同的故障区间,则通过S700对微服务故障类型进行判断;
所述独立故障区间,是指故障方差的差值仅被单独类型的故障区间所包含;
所述混合故障区间,是指故障方差的差值被多个不同类型故障区间所包含;
所述S700,包括:
S710:通过服务器收集微服务日志信息,获取当前微服务历史故障信息数据,并对故障信息数据中各信息特征进行独热编码转换,获得微服务故障特征;
S720:计算所述微服务故障特征的故障相关性系数,获得各类型故障的故障特征系数组成模式;
S730:根据所述故障特征系数组成模式计算故障时延曲线的特征,获得各模式下故障时延曲线特征数据;
S740:构建微服务故障分类模型,对所述故障时延曲线特征数据进行分类,获得故障时延曲线所对应的故障类型;
所述故障信息数据包括:历史峰值、持续时间、日志级别、服务器负载、内存使用率、请求信息、网络流量;
所述独热编码转化,是指将所述故障信息数据中特征数据转化为二进制特征,将离散的类别特征数据转化为可计算的数值特征数据;
所述计算所述微服务故障特征的故障相关性系数,计算公式为:
其中,是指故障类型为/>的第/>个故障特征的相关性系数,n是指微服务历史故障信息数据中故障类型为/>的个数,m是指微服务历史故障信息数据中故障类型不为/>的个数,是指当前故障特征/>在微服务历史故障信息数据中的平均数,/>是指当前故障特征/>在故障类型为/>的平均数,/>是指当前故障特征/>在其他故障类型的平均数,/>是指第s个当前故障特征/>所对应的特征值;
所述特征系数组成模式,表示为:
其中,是指故障/>的特征系数组成模式,/>是指故障类型/>中第1个故障特征的相关性系数;
所述微服务故障分类模型,是在KNN算法的基础上,采用加权投票机制来决定故障时延曲线所对应故障类型;
所述加权投票机制,是统计不同模式下的故障时延曲线特征数据在KNN中所属故障类别次数,计算各模式下的不同故障类型的综合次数,选择故障类型综合次数最大的故障类型作为故障时延曲线所对应故障类型,计算公式为:
其中,是指在模式h下故障类型k的综合次数,/>是指故障类型k在所有故障类型中所占比例,/>是指模式h下故障k的次数。
2.如权利要求1所述的一种基于时延方差和相关系数值的微服务故障诊断方法,其特征在于,所述微服务故障时延预测模型,是指采用长短期记忆网络连接一个全连接网络组成的模型,模型采用所述正常时延曲线进行训练;
所述微服务故障时延预测模型表示为:
其中,为模型预测值,/>是指微服务的时延数据,/>为全连接网络。
3.如权利要求1所述的一种基于时延方差和相关系数值的微服务故障诊断方法,其特征在于,所述计算故障时延方差的差值,计算公式为:
其中,是指故障时延曲线方差值,/>是指预测故障时延曲线方差值,是指故障时延方差的差值;
所述故障时延曲线方差值,是通过对故障时延曲线采用微服务监控系统监控间隔为周期,计算从故障波动起始点到故障持续时间T区间内时延的方差值;
所述预测故障时延曲线方差值,是通过对预测故障时延曲线采用微服务监控系统监控间隔为周期,计算从故障波动起始点到故障持续时间T区间内时延的方差值。
4.如权利要求1所述的一种基于时延方差和相关系数值的微服务故障诊断方法,其特征在于,所述微服务故障区间集合树,是指通过对多组故障时延曲线进行方差的差值计算,获得同类型故障方差的差值区间,通过所述方差的差值区间对不同类型的故障建立集合树,所述微服务故障区间集合树表示为:
其中,是指微服务故障区间集合树,/>是指第M个微服务,/>是指第N个故障类型,/>是指第N个故障类型所对应的故障区间。
CN202311403291.4A 2023-10-27 2023-10-27 一种基于时延方差和相关系数值的微服务故障诊断方法 Active CN117130819B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311403291.4A CN117130819B (zh) 2023-10-27 2023-10-27 一种基于时延方差和相关系数值的微服务故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311403291.4A CN117130819B (zh) 2023-10-27 2023-10-27 一种基于时延方差和相关系数值的微服务故障诊断方法

Publications (2)

Publication Number Publication Date
CN117130819A CN117130819A (zh) 2023-11-28
CN117130819B true CN117130819B (zh) 2024-01-30

Family

ID=88851228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311403291.4A Active CN117130819B (zh) 2023-10-27 2023-10-27 一种基于时延方差和相关系数值的微服务故障诊断方法

Country Status (1)

Country Link
CN (1) CN117130819B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111400141A (zh) * 2020-03-19 2020-07-10 深圳前海微众银行股份有限公司 一种异常检测的方法及装置
CN112947359A (zh) * 2021-01-26 2021-06-11 北京理工大学 针对集群协同系统的大通讯时延补偿和传感器故障诊断方法
CN113608916A (zh) * 2021-10-08 2021-11-05 苏州浪潮智能科技有限公司 故障诊断的方法、装置、电子设备及存储介质
CN114765574A (zh) * 2020-12-30 2022-07-19 中盈优创资讯科技有限公司 一种网络异常定界定位方法及装置
CN115357418A (zh) * 2022-06-21 2022-11-18 南开大学 微服务故障检测方法、装置、存储介质及计算机设备
CN116089142A (zh) * 2022-12-27 2023-05-09 天翼云科技有限公司 一种新型的服务故障根因分析方法
CN116225752A (zh) * 2022-12-23 2023-06-06 山东大学 基于故障模式库的微服务系统故障根因分析方法及系统
WO2023109251A1 (zh) * 2021-12-17 2023-06-22 浪潮电子信息产业股份有限公司 一种系统故障检测方法、装置、设备及介质
CN116719664A (zh) * 2023-08-09 2023-09-08 国网江苏省电力有限公司信息通信分公司 基于微服务部署的应用和云平台跨层故障分析方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111400141A (zh) * 2020-03-19 2020-07-10 深圳前海微众银行股份有限公司 一种异常检测的方法及装置
CN114765574A (zh) * 2020-12-30 2022-07-19 中盈优创资讯科技有限公司 一种网络异常定界定位方法及装置
CN112947359A (zh) * 2021-01-26 2021-06-11 北京理工大学 针对集群协同系统的大通讯时延补偿和传感器故障诊断方法
CN113608916A (zh) * 2021-10-08 2021-11-05 苏州浪潮智能科技有限公司 故障诊断的方法、装置、电子设备及存储介质
WO2023109251A1 (zh) * 2021-12-17 2023-06-22 浪潮电子信息产业股份有限公司 一种系统故障检测方法、装置、设备及介质
CN115357418A (zh) * 2022-06-21 2022-11-18 南开大学 微服务故障检测方法、装置、存储介质及计算机设备
CN116225752A (zh) * 2022-12-23 2023-06-06 山东大学 基于故障模式库的微服务系统故障根因分析方法及系统
CN116089142A (zh) * 2022-12-27 2023-05-09 天翼云科技有限公司 一种新型的服务故障根因分析方法
CN116719664A (zh) * 2023-08-09 2023-09-08 国网江苏省电力有限公司信息通信分公司 基于微服务部署的应用和云平台跨层故障分析方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Testing and diagnosis faults in FinFet circuits based on advanced test algorithm;Rayudu.KVBV;ICRIEECE 2018;全文 *
云环境下服务器故障自适应诊断算法研究;程莹;邵清;;软件导刊(第09期);全文 *
微服务故障诊断相关技术研究探讨;赵建涛;黄立松;;网络新媒体技术(第01期);全文 *
组合时延预测的无人机传感器故障诊断研究;王洋等;电光与控制;第第26卷卷(第第5期期);86-89 *

Also Published As

Publication number Publication date
CN117130819A (zh) 2023-11-28

Similar Documents

Publication Publication Date Title
CN113255795B (zh) 一种基于多指标集群分析的设备状态监测方法
CN116625438B (zh) 燃气管网安全在线监测系统及其方法
CN113762329A (zh) 一种大型轧机状态预测模型的构建方法及构建系统
CN114676742A (zh) 一种基于注意力机制和残差网络的电网异常用电检测方法
CN116937575A (zh) 一种网格系统用的能源监控管理系统
CN117354171B (zh) 基于物联网平台的平台健康状况预警方法及系统
CN113526282A (zh) 一种电梯中长期老化故障诊断方法、装置、介质和设备
CN116915582A (zh) 一种通信终端故障根因诊断分析方法及装置
CN108805427B (zh) 一种基于大数据的配电网运行状态风险预警系统
CN117130819B (zh) 一种基于时延方差和相关系数值的微服务故障诊断方法
CN113608968A (zh) 一种基于密度距离综合决策的电力调度监控数据异常检测方法
CN117034123B (zh) 健身器材的故障监控系统及其方法
CN117273203A (zh) 一种基于GAT-Transformer时间序列模型的水质预测方法与系统
CN114923715A (zh) 一种均化增粘反应釜装置异常状态检测方法及系统
CN114167837B (zh) 一种铁路信号系统的智能故障诊断方法及系统
CN116956089A (zh) 电器设备温度异常检测模型训练方法以及检测方法
Bey-Temsamani et al. A practical approach to combine data mining and prognostics for improved predictive maintenance
CN114936614A (zh) 一种基于神经网络的作业风险识别方法及系统
CN116796617A (zh) 基于数据标识的滚动轴承设备剩余寿命预测方法及系统
CN113435794A (zh) 一种基于图像处理的喷嘴铸件后处理智能监测方法
CN111476383A (zh) 一种泵站机组状态检修动态决策方法
CN117575176B (zh) 一种电力数据中异常值的处理方法及系统
CN116756619B (zh) 一种基于大数据的设备智能诊断方法及系统
CN118055073A (zh) 一种基于行业定制终端的物联网通信方法
CN117474345B (zh) 一种智慧环境环保远程实时监测预警方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant