CN108932559A - 航空系统地面监管集群综合性能评价方法和系统 - Google Patents
航空系统地面监管集群综合性能评价方法和系统 Download PDFInfo
- Publication number
- CN108932559A CN108932559A CN201810550907.3A CN201810550907A CN108932559A CN 108932559 A CN108932559 A CN 108932559A CN 201810550907 A CN201810550907 A CN 201810550907A CN 108932559 A CN108932559 A CN 108932559A
- Authority
- CN
- China
- Prior art keywords
- cluster
- air line
- failure
- line ground
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Educational Administration (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种航空系统地面监管集群综合性能评价方法和系统,包括S1:定时采集并存储航空系统地面监管集群的硬件及软件性能指标;S2:对采集到的性能指标数据进行过滤及预处理;S3:采用异常检测算法对最近一个周期的性能指标进行计算,判定航空系统地面监管集群当前是否存在故障;S4:采用故障预测算法对最近多个周期的指标进行计算,预估航空系统地面监管集群在未来某个时刻是否会出现故障;S5:综合航空系统地面监管集群当前是否存在故障的判断和未来是否会出现故障的判断,得到集群健康度的评价值。本发明既可判断集群每个节点和集群整体当前是否存在故障,又能预测集群在未来某个时刻的运行情况,并可采取针对性的预防措施。
Description
技术领域
本发明涉及一种大数据处理方法和系统,尤其涉及一种航空系统地面监管集群综合性能评价方法,运用机器学习和大数据技术,对分布式系统(集群)的健康度进行实时自动化评价,从而大大提高航空系统地面监管集群运行的安全性和稳定性。
背景技术
集群是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理。一个客户与集群相互作用时,集群像是一个独立的服务器。集群配置是用于提高可用性和可缩放性。通过集群技术,可以使用较为廉价的硬件获得性能上的水平扩展,且可靠性和灵活性也有较强的保证,使得这种技术在应用服务、负载均衡、数据库、大数据等领域广泛使用。然而,使用廉价硬件导致硬件故障成为常态,复杂的互联方式使得系统架构复杂,分布式的处理逻辑使得软件问题追踪困难,这些问题都导致对集群的运维远比传统的单机运维困难。
特别是对于航空系统地面监管集群,不但涉及的服务器数量众多,而且对安全性及可靠性的要求也非常高。民航监管局分为运输处、综合处、飞行标准处、航空安全办公室、航务处、机场处、空防处、空中交通管理处以及适航维修处,任一集群故障的发生均会影响整个监管系统运行的可靠性。因此,有必要通过机器学习和大数据技术,量化评价集群整体和各个节点的运行情况,从而为集群故障的预警及处理提供指引方案。
发明内容
本发明所要解决的技术问题是提供一种航空系统地面监管集群综合性能评价方法和系统,能够量化评价航空监管集群整体和各个节点的运行情况,既可判断集群每个节点和集群整体当前是否存在故障,又能预测集群在未来某个时刻的运行情况,并可采取针对性的预防措施。
本发明为解决上述技术问题而采用的技术方案是提供一种航空系统地面监管集群综合性能评价方法,包括如下步骤:S1:定时采集并存储航空系统地面监管集群的硬件及软件性能指标;S2:对采集到的性能指标数据进行过滤及预处理;S3:采用异常检测算法对最近一个周期的性能指标进行计算,以判定航空系统地面监管集群当前是否存在故障;S4:采用故障预测算法对最近多个周期的指标进行计算,以预估航空系统地面监管集群在未来某个时刻是否会出现故障;S5:综合航空系统地面监管集群当前是否存在故障的判断和未来是否会出现故障的判断,得到集群健康度的评价值。
上述的航空系统地面监管集群综合性能评价方法,其中,所述航空系统地面监管集群分为维护空域资源数据库、机场/临时起降点数据库、航图数据库、运输处、综合处、飞行标准处、航空安全办公室、航务处、机场处、空防处、空中交通管理处以及适航维修处;所述步骤S1按硬件和软件分别采集航空系统地面监管集群每个节点的性能指标;硬件性能指标包括CPU使用率、内存使用率、操作系统进程数、磁盘IO访问次数、磁盘空间使用率和网络端口吞吐量;软件性能指标包括特定进程每秒响应请求数、系统平均响应时间、最大并发用户数和系统每秒处理的交易/事务总量。
上述的航空系统地面监管集群综合性能评价方法,其中,所述步骤S2包括:采集到的性能指标数据进行残缺数据清洗,错误数据清洗或重复数据清洗;对清洗后的数据采用占比法、最大最小值法或对数法进行预处理。
上述的航空系统地面监管集群综合性能评价方法,其中,所述步骤S3包括:S31:对于取出的每个指标,将该集群每个节点的该指标进行汇总,使用异常检测算法进行计算,得到该指标的节点正常概率值;S32:综合所有指标的节点正常概率值,计算每个节点的正常概率值,并归一化得到该节点的健康度瞬时值;S33:如果某节点的健康度瞬时值低于阈值,则判定该节点当前存在故障或负载偏高,储存该健康度瞬时值数据;S34:根据各节点的健康度瞬时值,通过一种评价算法计算出集群当前时刻的健康度瞬时值;S35:如果某集群的健康度瞬时值低于阈值,则判定该集群当前存在故障或负载偏高,储存该集群健康度瞬时值数据。
上述的航空系统地面监管集群综合性能评价方法,其中,所述步骤S34中的评价算法为健康节点计数法、最低值法、中位数法或均值法。
上述的航空系统地面监管集群综合性能评价方法,其中,所述步骤S4包括:获取出最近n个周期的指标,包括集群每个节点的用于故障预测的所有指标;N的值根据指标采集频率和所需的故障预测精度确定;对于取出的每个指标,将该集群最近N个周期的每个节点的该指标进行汇总,使用故障预测算法进行计算,得到该指标的集群未来预测值;综合所有指标的集群未来预测值,结合各指标的阈值,计算航空系统地面监管集群的健康度预测值;如果健康度预测值低于阈值,则判断该集群未来会出现故障或负载升高,储存该健康值预测数据。
上述的航空系统地面监管集群综合性能评价方法,其中,所述步骤S5包括:根据集群当前时刻的健康度瞬时值和未来时刻的健康度预测值,加权计算集群健康度的评价值;储存该集群的健康度的评价值数据,并用绿色、黄色和红色对集群健康状态进行标记。
本发明为解决上述技术问题还提供一种航空系统地面监管集群综合性能评价系统,其中,包括:监管集群数据采集模块,用于定时采集并存储航空系统地面监管集群的硬件及软件性能指标;数据过滤及预处理模块,用于对采集到的性能指标数据进行过滤及预处理;当前瞬时值计算模块,用于采用异常检测算法对最近一个周期的性能指标进行计算,以判定航空系统地面监管集群当前是否存在故障;预测值计算模块,用于采用故障预测算法对最近多个周期的指标进行计算,以预估航空系统地面监管集群在未来某个时刻是否会出现故障;监管集群综合性能评价模块,用于综合航空系统地面监管集群当前是否存在故障的判断和未来是否会出现故障的判断,得到集群健康度的评价值。
本发明对比现有技术有如下的有益效果:本发明提供的航空系统地面监管集群综合性能评价方法和系统,通过判断集群每个节点和集群整体当前是否存在故障,使得运维人员既可以及时处理个别节点的故障,又能掌握整个集群的健康状况;通过使用预测集群在未来某个时刻的运行情况,使得运维人员可以提前介入,采取针对性的预防措施;综合两者得到集群健康度的评价值,对集群整体健康状况进行量化及趋势判断,从而既可判断集群每个节点和集群整体当前是否存在故障,又能预测集群在未来某个时刻的运行情况,并可采取针对性的预防措施。
附图说明
图1为本发明航空系统地面监管集群综合性能评价流程示意图;
图2为本发明航空系统地面监管集群综合性能评价系统模块架构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的描述。
图1为本发明航空系统地面监管集群综合性能评价流程示意图。
请参见图1,本发明的航空系统地面监管集群综合性能评价方法,包括如下步骤:
S1:定时采集并存储航空系统地面监管集群的硬件及软件性能指标。
航空系统地面监管集群分为维护空域资源数据库、机场/临时起降点数据库、航图数据库、运输处、综合处、飞行标准处、航空安全办公室、航务处、机场处、空防处、空中交通管理处以及适航维修处等。本发明需要以一定频率采集上游集群的各种硬件性能指标,包括CPU使用率、内存使用率、操作系统进程数、磁盘IO访问次数、磁盘空间使用率和网络端口吞吐量等工作指标。同时,本发明还需要以一定频率采集上游集群的各种软件性能指标,包括特定进程每秒响应请求数、系统平均响应时间、最大并发用户数和系统每秒处理的交易/事务总量。然后使用本地硬盘、数据库、内存、网络存储、消息队列等介质存储。
S2:对采集到的性能指标数据进行过滤及预处理。
为保证采集到的指标的数据质量,需要对采集到的性能指标数据进行清洗,比如采用如下一种方法:
残缺数据清洗,由于硬件故障、软件故障、网络超时等非正常因素,可能会出现某些采集批次中的某些指标未采到值的情况。为便于后续步骤识别和处理,可使用某种默认值,比如0、-1、Null等,填充逻辑来进行补全。
错误数据清洗,由于硬件故障、软件故障、统计误差等非正常因素,可能会出现某些采集批次中的某些指标出现错误数据的情况,例如CPU使用率超过100%、物理内存使用量超过物理内存安装量等情况。为保证后续步骤工作正常,可使用某种替换逻辑来进行纠正,比如替换为0或者上个周期值等。
重复数据清洗,由于硬件故障、软件故障、网络超时等非正常因素,可能会出现某些采集批次中的某些指标出现多于一个值的情况。为保证后续步骤工作正常,可使用某种保留逻辑来进行纠正。
对清洗后的数据进行预处理,预处理后的数据,可写回存储介质,也可保留在内存中供后续使用。方法包括并不限于:
占比法,使用实际值除以物理门限值,如对物理内存使用量指标,使用实际物理内存使用量除以物理内存安装量。
最大最小值法,先了解该指标历史上出现过的最大值和最小值,如对操作系统进程数指标,实施者清楚其历史最大值Max和历史最小值Min,且有本周期实际值Act,则可使用(Act-Min)/(Max-Min)。
对数法,适合实际值的标量较大,且无法确定物理门限值或历史最大最小值的情况,如对磁盘IO次数,有本周期实际值Act,可使用lognAct,对数的底n可根据实际情况选择2、e或10等值。
S3:采用异常检测算法对最近一个周期的性能指标进行计算,以判定航空系统地面监管集群当前是否存在故障。
本发明根据执行异常检测算法需要的指标,取出集群每个节点上这些指标最近一个周期的值;然后使用异常检测算法进行计算,得到该指标的节点正常概率值。综合所有指标的节点正常概率值,计算每个节点的正常概率值,并归一化得到该节点的健康度瞬时值。判断是否有节点的健康度瞬时值低于阈值,如果有节点健康度瞬时值低于阈值,则储存所有非健康节点的健康度瞬时值;否则若全部节点均无低于阈值的情况,则通过一种评价算法计算出集群当前时刻的健康度瞬时值。
本发明计算集群当前时刻的健康度瞬时值Hour可使用的评价算法如下:
健康节点计数法:对每个节点判断节点的健康度瞬时值是否低于阈值,不低于阈值的节点称之为健康,则Hour=健康节点数/总节点数*100。
最低值法:使用最小的节点健康度瞬时值作为整个集群的健康度瞬时值,
中位数法:使用所有节点健康度瞬时值的中位数作为整个集群的健康度瞬时值。
均值数法:使用所有节点健康度瞬时值的平均数作为整个集群的健康度瞬时值。
S4:采用故障预测算法对最近多个周期的指标进行计算,以预估航空系统地面监管集群在未来某个时刻是否会出现故障。
获取出最近n个周期的指标,包括集群每个节点的需要用于故障预测的所有指标。本发明根据执行故障预测算法需要的指标,取出集群每个节点上这些指标最近n个周期的值。n的值可以根据指标采集频率、所需的故障预测精度等考量,在实施时确定。如采集频率为1分钟,可将n设置为20、40或60等。
本发明使用故障预测算法进行计算,得到该指标的集群未来预测值。故障预测算法首先对取出的每个节点的最近n个周期的指标,按指标名和所属时间周期聚合出集群维度的最近n个周期的值,可使用的聚合方法如下:
最低值法:对于某指标和某周期,使用所有节点中最小的指标值作为整个集群的指标值。
中位数法:对于某指标和某周期,使用所有节点的中位数指标值作为整个集群的指标值。
均值数法:对于某指标和某周期,使用所有节点的平均指标值作为整个集群的指标值。
假设上述计算得到指标Y的集群维度的最近n个周期的值分别为yi,其中i=1,2,…,N。令xi为第i个指标采集时刻的系统时间毫秒数,则这N个值可用(xi,yi)表示。设有曲线y=Φ(x),需要使该曲线能近似穿过这N个点,即求解曲线拟合问题。拟合的方法包括并不限于:最小二乘法、指数平滑法、Bezier曲线法或B样条曲线法。实际使用时,因不同指标数据点的波动情况很大,可使用多种方法对历史数据测试后选取预测效果最好的。优选地,本发明使用最小二乘法来求解。
S5:综合航空系统地面监管集群当前是否存在故障的判断和未来是否会出现故障的判断,得到集群健康度的评价值,并可用绿色、黄色和红色对集群健康状态进行标记,比如红色表示个别分片或副本不可用;黄色表示个别副本不可用;绿色为健康。
本发明综合所有指标的集群未来预测值,结合各指标的阈值,计算集群的健康度预测值。本发明计算集群的健康度预测值使用如下方法。设指标Yj的阈值为Tj,该阈值可根据经验和集群的实际工作状况指定,未来预测值为Pi。指标Yi的健康度预测值Hi可用如下公式估计:
集群的健康度预测值Hpre可用如下公式估计,其中n为指标种类总数:
集群健康度的评价值可用如下公式计算:
H=α*Hour+β*Hvre
其中α,β为系数且有α≥0,β≥0,α+β=1。具体实施时,可根据实际监控场景更关注处理当前故障还是更关注预防未发生的故障,来设定α,β的具体值。
图2为本发明航空系统地面监管集群综合性能评价系统架构示意图。
请继续参见图2,本发明提供的航空系统地面监管集群综合性能评价系统,包括:
201、监管集群数据采集模块。用于定时采集并存储集群的硬件及软件性能指标。
202、数据过滤及预处理模块。用于对采集到的性能指标数据进行过滤及预处理。
203、当前瞬时值计算模块。采用异常检测算法对最近一个周期的指标进行计算,以判定集群当前是否存在故障。
204、预测值计算模块。采用故障预测算法对最近n个周期的指标进行计算,以判定集群在未来某个时刻是否可能出现故障。
205、监管集群综合性能评价模块。用于综合集群当前是否存在故障的判断和未来是否可能出现故障的判断,得到集群健康度的评价值。
综上所述,本发明通过使用异常检测算法,可以快速、精准地判断集群每个节点和集群整体当前是否存在故障;以节点各种指标在整个集群内的概率分布来评价节点的瞬时健康情况,从而很好地利用了这种个别和整体的关系,进一步可使用多种算法计算集群整体的瞬时健康情况,使得技术人员可以及时发现、精确定位故障。此外,本发明通过使用故障预测算法,可以预测集群在未来某个时刻的运行情况,使得运维人员可以提前介入,采取针对性的预防措施。本发明通过综合两者得到集群健康度的评价值,对集群整体健康状况进行量化及趋势判断,从而既可判断集群每个节点和集群整体当前是否存在故障,又能预测集群在未来某个时刻的运行情况,并可采取针对性的预防措施。
虽然本发明已以较佳实施例揭示如上,然其并非用以限定本发明,任何本领域技术人员,在不脱离本发明的精神和范围内,当可作些许的修改和完善,因此本发明的保护范围当以权利要求书所界定的为准。
Claims (8)
1.一种航空系统地面监管集群综合性能评价方法,其特征在于,包括如下步骤:
S1:定时采集并存储航空系统地面监管集群的硬件及软件性能指标;
S2:对采集到的性能指标数据进行过滤及预处理;
S3:采用异常检测算法对最近一个周期的性能指标进行计算,以判定航空系统地面监管集群当前是否存在故障;
S4:采用故障预测算法对最近多个周期的指标进行计算,以预估航空系统地面监管集群在未来某个时刻是否会出现故障;
S5:综合航空系统地面监管集群当前是否存在故障的判断和未来是否会出现故障的判断,得到集群健康度的评价值。
2.如权利要求1所述的航空系统地面监管集群综合性能评价方法,其特征在于,所述航空系统地面监管集群分为维护空域资源数据库、机场/临时起降点数据库、航图数据库、运输处、综合处、飞行标准处、航空安全办公室、航务处、机场处、空防处、空中交通管理处以及适航维修处;所述步骤S1按硬件和软件分别采集航空系统地面监管集群每个节点的性能指标;硬件性能指标包括CPU使用率、内存使用率、操作系统进程数、磁盘IO访问次数、磁盘空间使用率和网络端口吞吐量;软件性能指标包括特定进程每秒响应请求数、系统平均响应时间、最大并发用户数和系统每秒处理的交易/事务总量。
3.如权利要求1所述的航空系统地面监管集群综合性能评价方法,其特征在于,所述步骤S2包括:
对采集到的性能指标数据进行残缺数据清洗,错误数据清洗或重复数据清洗;
对清洗后的数据采用占比法、最大最小值法或对数法进行预处理。
4.如权利要求1所述的航空系统地面监管集群综合性能评价方法,其特征在于,所述步骤S3包括:
S31:对于取出的每个指标,将该集群每个节点的该指标进行汇总,使用异常检测算法进行计算,得到该指标的节点正常概率值;
S32:综合所有指标的节点正常概率值,计算每个节点的正常概率值,并归一化得到该节点的健康度瞬时值;
S33:如果某节点的健康度瞬时值低于阈值,则判定该节点当前存在故障或负载偏高,储存该健康度瞬时值数据;
S34:根据各节点的健康度瞬时值,通过一种评价算法计算出集群当前时刻的健康度瞬时值;
S35:如果某集群的健康度瞬时值低于阈值,则判定该集群当前存在故障或负载偏高,储存该集群健康度瞬时值数据。
5.如权利要求4所述的航空系统地面监管集群综合性能评价方法,其特征在于,所述步骤S34中的评价算法为健康节点计数法、最低值法、中位数法或均值法。
6.如权利要求4所述的航空系统地面监管集群综合性能评价方法,其特征在于,所述步骤S4包括:
获取出最近n个周期的指标,包括集群每个节点的用于故障预测的所有指标;n的值根据指标采集频率和所需的故障预测精度确定;
对于取出的每个指标,将该集群最近n个周期的每个节点的该指标进行汇总,使用故障预测算法进行计算,得到该指标的集群未来预测值;
综合所有指标的集群未来预测值,结合各指标的阈值,计算航空系统地面监管集群的健康度预测值;如果健康度预测值低于阈值,则判断该集群未来会出现故障或负载升高,储存该健康值预测数据。
7.如权利要求6所述的航空系统地面监管集群综合性能评价方法,其特征在于,所述步骤S5包括:根据集群当前时刻的健康度瞬时值和未来时刻的健康度预测值,加权计算集群健康度的评价值;储存该集群的健康度的评价值数据,并用绿色、黄色和红色对集群健康状态进行标记。
8.一种航空系统地面监管集群综合性能评价系统,其特征在于,包括:
监管集群数据采集模块,用于定时采集并存储航空系统地面监管集群的硬件及软件性能指标;
数据过滤及预处理模块,用于对采集到的性能指标数据进行过滤及预处理;
当前瞬时值计算模块,用于采用异常检测算法对最近一个周期的性能指标进行计算,以判定航空系统地面监管集群当前是否存在故障;
预测值计算模块,用于采用故障预测算法对最近多个周期的指标进行计算,以预估航空系统地面监管集群在未来某个时刻是否会出现故障;
监管集群综合性能评价模块,用于综合航空系统地面监管集群当前是否存在故障的判断和未来是否会出现故障的判断,得到集群健康度的评价值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810550907.3A CN108932559A (zh) | 2018-05-31 | 2018-05-31 | 航空系统地面监管集群综合性能评价方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810550907.3A CN108932559A (zh) | 2018-05-31 | 2018-05-31 | 航空系统地面监管集群综合性能评价方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108932559A true CN108932559A (zh) | 2018-12-04 |
Family
ID=64449663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810550907.3A Pending CN108932559A (zh) | 2018-05-31 | 2018-05-31 | 航空系统地面监管集群综合性能评价方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108932559A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112801316A (zh) * | 2021-01-28 | 2021-05-14 | 中国人寿保险股份有限公司上海数据中心 | 基于多指标数据的故障定位方法、系统设备及存储介质 |
WO2022088806A1 (zh) * | 2020-10-27 | 2022-05-05 | 苏州浪潮智能科技有限公司 | 计算集群错误预测方法及相关设备 |
CN116127149A (zh) * | 2023-04-14 | 2023-05-16 | 杭州悦数科技有限公司 | 图数据库集群健康度的量化方法和系统 |
CN117130851A (zh) * | 2023-07-26 | 2023-11-28 | 是石科技(江苏)有限公司 | 一种高性能计算集群运行效率评价方法及系统 |
-
2018
- 2018-05-31 CN CN201810550907.3A patent/CN108932559A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022088806A1 (zh) * | 2020-10-27 | 2022-05-05 | 苏州浪潮智能科技有限公司 | 计算集群错误预测方法及相关设备 |
CN112801316A (zh) * | 2021-01-28 | 2021-05-14 | 中国人寿保险股份有限公司上海数据中心 | 基于多指标数据的故障定位方法、系统设备及存储介质 |
CN116127149A (zh) * | 2023-04-14 | 2023-05-16 | 杭州悦数科技有限公司 | 图数据库集群健康度的量化方法和系统 |
CN117130851A (zh) * | 2023-07-26 | 2023-11-28 | 是石科技(江苏)有限公司 | 一种高性能计算集群运行效率评价方法及系统 |
CN117130851B (zh) * | 2023-07-26 | 2024-03-26 | 是石科技(江苏)有限公司 | 一种高性能计算集群运行效率评价方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108932559A (zh) | 航空系统地面监管集群综合性能评价方法和系统 | |
CN106209432B (zh) | 基于动态阈值的网络设备亚健康预警方法及装置 | |
CN108197845A (zh) | 一种基于深度学习模型lstm的交易指标异常的监测方法 | |
CN109491850A (zh) | 一种磁盘故障预测方法及装置 | |
CN106844161A (zh) | 一种带状态流计算系统中的异常监控及预测方法和系统 | |
CN108123849A (zh) | 检测网络流量的阈值的确定方法、装置、设备及存储介质 | |
CN107679734A (zh) | 一种用于无标签数据分类预测的方法和系统 | |
CN112966441B (zh) | 一种基于连续Weiner过程损伤的设备剩余寿命评估方法 | |
CN105871634A (zh) | 检测集群异常的方法及应用、管理集群的系统 | |
CN111538311B (zh) | 一种基于数据挖掘的机械设备柔性多状态自适应预警方法及装置 | |
CN110188015B (zh) | 一种主机访问关系异常行为自适应检测装置及其监测方法 | |
CN111176953B (zh) | 一种异常检测及其模型训练方法、计算机设备和存储介质 | |
CN116049146B (zh) | 一种数据库故障处理方法、装置、设备及存储介质 | |
CN115858303B (zh) | 一种基于Zabbix的服务器性能监控方法及系统 | |
CN103914482B (zh) | 基于cmdb的集中监控事件影响性确定方法 | |
CN109087490B (zh) | 一种基于报警持续时间特征的干扰报警识别方法 | |
CN114816917A (zh) | 监测数据处理方法、装置、设备及存储介质 | |
CN107590008B (zh) | 一种通过加权熵判断分布式集群可靠度的方法和系统 | |
CN117421188A (zh) | 告警定级方法、装置、设备及可读存储介质 | |
CN113778805A (zh) | 一种dcgw集群告警方法及系统 | |
US20170302506A1 (en) | Methods and apparatus for fault detection | |
Park et al. | Empirical approaches to outlier detection in intelligent transportation systems data | |
CN115664928A (zh) | 一种可解释的基于图的根因定位方法及装置 | |
Woodard et al. | Online model-based clustering for crisis identification in distributed computing | |
CN113132360A (zh) | 一种基于边缘计算的电表计量系统虚假数据检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181204 |