CN115470079A - 一种系统故障预警方法、装置及服务器 - Google Patents

一种系统故障预警方法、装置及服务器 Download PDF

Info

Publication number
CN115470079A
CN115470079A CN202211141325.2A CN202211141325A CN115470079A CN 115470079 A CN115470079 A CN 115470079A CN 202211141325 A CN202211141325 A CN 202211141325A CN 115470079 A CN115470079 A CN 115470079A
Authority
CN
China
Prior art keywords
fault
data
early warning
index
digital twin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211141325.2A
Other languages
English (en)
Inventor
申得普
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Digital Zhejiang Technology Operation Co ltd
Original Assignee
Digital Zhejiang Technology Operation Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital Zhejiang Technology Operation Co ltd filed Critical Digital Zhejiang Technology Operation Co ltd
Priority to CN202211141325.2A priority Critical patent/CN115470079A/zh
Publication of CN115470079A publication Critical patent/CN115470079A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种系统故障预警方法、装置及服务器,涉及故障监控技术领域,包括:当接收到系统指标数据时,从故障预警功能中确定目标预警功能;如果目标预警功能为数字孪生功能,基于系统指标数据中的当前系统真实指标进行实时计算,生成第一数字孪生模型;如果接收到系统变化信息,利用系统变化信息对第一数字孪生模型进行更新,得到第二数字孪生模型;通过第二数字孪生模型生成告警阈值;如果当前系统真实指标满足告警阈值,生成阈值告警信息。本发明通过实时进行多指标综合计算得到的数字孪生模型及对应的告警阈值,可以提升系统故障预警的准确性。

Description

一种系统故障预警方法、装置及服务器
技术领域
本发明涉及故障监控技术领域,尤其是涉及一种系统故障预警方法、装置及服务器。
背景技术
在复杂业务系统运行中,监控告警是保障系统稳定性的一个比较重要的一环。目前,相关技术提出,可以通过数字孪生生成固定的告警阈值进行监控告警,但现有技术的数字孪生模型不具备“大运维”多业务系统关联性告警的能力,不能全面反映对应系统,且不能随着本体动态变化,缺乏故障预测及时性设计,并且,固定的告警阈值会导致告警故障转化率较低,同时缺乏动态刻画故障画像的能力,从而导致预测故障能力不足。
发明内容
有鉴于此,本发明的目的在于提供一种系统故障预警方法、装置及服务器,通过实时进行多指标综合计算得到的数字孪生模型及对应的告警阈值,可以提升系统故障预警的准确性。
第一方面,本发明实施例提供了一种系统故障预警方法,方法应用于服务器,服务器配置有多个故障预警功能,方法包括:当接收到系统指标数据时,从故障预警功能中确定目标预警功能;如果目标预警功能为数字孪生功能,基于系统指标数据中的当前系统真实指标进行实时计算,生成第一数字孪生模型;如果接收到系统变化信息,利用系统变化信息对第一数字孪生模型进行更新,得到第二数字孪生模型,其中,系统变化信息包括:真实测量数据、流量透传率、在线服务器的数量变化、应用性能变化和调用关系变化;通过第二数字孪生模型生成告警阈值;如果当前系统真实指标满足告警阈值,生成阈值告警信息。
在一种实施方式中,方法还包括:如果未接收到系统变化信息,则基于第一数字孪生模型生成告警阈值。
在一种实施方式中,目标预警功能还包括:故障画像功能,方法还包括:将满足告警阈值的当前系统真实指标确定为系统故障数据,并利用系统故障数据生成故障画像;根据预先设定的分析规则对故障画像进行趋势分析,得到目标故障预警信息。
在一种实施方式中,在利用系统故障数据生成故障画像的步骤之后,包括:根据预先设置的离线计算分析系统对故障画像进行特征数据分析,得到特征分析结果;根据特征分析结果对故障画像的底层数据信息进行校对,其中,底层数据包括系统故障数据和系统间关联数据。
在一种实施方式中,根据预先设定的分析规则对故障画像进行趋势分析,得到目标故障预警信息的步骤,包括:利用趋势预测算法对故障画像中底层数据信息进行趋势分析,得到第一故障预警信息,其中,趋势预测算法包括单指标趋势预测算法、多指标趋势预测算法和关联数据趋势预测算法中的一种或多种。
在一种实施方式中,在利用趋势预测算法对故障画像中的指标数据进行趋势分析,得到第一故障预警信息的步骤之后,还包括:将不满足告警阈值的当前系统真实指标确定为系统正常数据;根据系统正常数据计算故障画像中指标数据的偏离率;基于第一故障预警信息和偏离率对故障画像中指标数据进行偏离率辅助分析,得到第二故障预警信息。
在一种实施方式中,故障画像为单系统故障画像和/或多个系统综合画像,方法还包括:利用系统故障数据与历史故障数据进行数据离线分析,得到单系统故障画像和/或多个系统综合画像。
第二方面,本发明实施例还提供一种系统故障预警装置,装置包括:功能选取模块,当接收到系统指标数据时,从故障预警功能中确定目标预警功能;模型建立模块,如果目标预警功能为数字孪生功能,基于系统指标数据中的当前系统真实指标进行实时计算,生成第一数字孪生模型;模型更新模块,如果接收到系统变化信息,利用系统变化信息对第一数字孪生模型进行更新,得到第二数字孪生模型,其中,系统变化信息包括:真实测量数据、流量透传率、在线服务器的数量变化、应用性能变化和调用关系变化;阈值生成模块,通过第二数字孪生模型生成告警阈值;告警生成模块,如果当前系统真实指标满足告警阈值,生成阈值告警信息。
第三方面,本发明实施例还提供一种服务器,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现第一方面提供的任一项的方法。
第四方面,本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现第一方面提供的任一项的方法。
本发明实施例带来了以下有益效果:
本发明实施例提供的一种系统故障预警方法、装置及服务器,当接收到系统指标数据时,从故障预警功能中确定目标预警功能,如果目标预警功能为数字孪生功能,基于系统指标数据中的当前系统真实指标进行实时计算,生成第一数字孪生模型,如果接收到系统变化信息,利用系统变化信息对第一数字孪生模型进行更新,得到第二数字孪生模型,其中,系统变化信息包括:真实测量数据、流量透传率、在线服务器的数量变化、应用性能变化和调用关系变化,通过第二数字孪生模型生成告警阈值,如果当前系统真实指标满足告警阈值,生成阈值告警信息。本发明的目的在于提供一种系统故障预警方法、装置及服务器,通过实时进行多指标综合计算得到的数字孪生模型及对应的告警阈值,可以提升系统故障预警的准确性。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种系统故障预警方法的流程示意图;
图2为本发明实施例提供的一种生成告警阈值的示意图;
图3为本发明实施例提供的一种生成故障画像的示意图;
图4为本发明实施例提供的一种故障预警的示意图;
图5为本发明实施例提供的另一种系统故障预警方法的流程示意图;
图6为本发明实施例提供的一种系统故障预警装置的结构示意图;
图7为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,在复杂业务系统运行中,监控告警是保障系统稳定性的一个比较重要的一环。如何根据获取的系统各类数据,生成数字孪生,并基于数字孪生预测故障的发生,是企业不断努力的方向,现有各类方案根据采集的各类指标生成数字孪生,并基于数字孪生系统,利用已有历史故障数据建立一些简单的故障模型;现有各类技术生成的数字孪生不能全面反映对应系统,且不能随着本体动态变化,缺乏故障预测及时性设计,同时存在告警阈值设置固定,告警故障转化率不高的问题,缺乏动态刻画故障画像的能力,从而导致预测故障能力不足,并且,不具备“大运维”多业务系统关联性告警的能力,基于此,本发明实施通过实时进行多指标综合计算得到的数字孪生模型及对应的告警阈值,可以提升系统故障预警的准确性。
基于图1所示的一种系统故障预警方法的流程示意图,该方法主要包括以下步骤S102至步骤S110:
步骤S102,当接收到系统指标数据时,从故障预警功能中确定目标预警功能,其中,目标预警功能包括数字孪生功能和故障画像功能,在一种实施方式中,系统指标数据包括:全链路压测系统数据和监控系统数据,全链路压测系统数据包括RT、QPS和流量透传率,监控系统数据包括:基础资源监控、调用关系监控、应用数据监控性能指标、日志监控和网关监控。
步骤S104,如果目标预警功能为数字孪生功能,基于系统指标数据中的当前系统真实指标进行实时计算,生成第一数字孪生模型。其中,数字孪生模型包括各业务系统本体及本体关联关系,第一数字孪生模型为更新前的数字孪生模型。在一种实施方式中,可以通过多指标进行实时计算,实现多指标综合计算和大量数据的快速分析,对数字孪生模型进行更新,从而解决传统告警基于单指标少量数据导致的预警结果不准确的问题,并应对流量徒增等短时间内出现故障的场景。
步骤S106,如果接收到系统变化信息,利用系统变化信息对第一数字孪生模型进行更新,得到第二数字孪生模型,其中,系统变化信息包括:真实测量数据、流量透传率(变化值)、在线服务器的数量变化、应用性能变化和调用关系变化,在一种实施方式中,如图2所示,如果未接收到系统变化信息,则基于第一数字孪生模型生成告警阈值。在另一种实施方式中,系统变化信息主要为系统本身目标性能指标和系统在真实链路里真实性能指标要求。
步骤S108,通过第二数字孪生模型生成告警阈值,其中,第二数字孪生模型为变化后的数字孪生模型,在一种实施方式中,通过对数字孪生模型进行更新调整告警阈值的具体数值,从而提升系统故障预测的准确性。
步骤S110,如果当前系统真实指标满足告警阈值,生成阈值告警信息,在一种实施方式中,可以根据告警阈值判断系统是否出现故障,并将出现故障的数据存储至存储单元,作为历史故障数据。
本发明实施例提供的上述系统故障预警方法,通过实时进行多指标综合计算得到的数字孪生模型及对应的告警阈值,可以提升系统故障预警的准确性。
本发明实施例还提供了一种故障预警的实施方式,具体的参见如下(1)至(2):
(1)如图3所示,将满足告警阈值的当前系统真实指标确定为系统故障数据,并利用系统故障数据生成故障画像的实施方式如下:
根据预先设置的离线计算分析系统对故障画像进行特征数据分析,得到特征分析结果,并根据特征分析结果对故障画像的底层数据信息进行校对,其中,底层数据包括系统故障数据和系统间关联数据,目标预警功能还包括:故障画像功能,故障画像为单系统故障画像和/或多个系统综合画像,在一种实施方式中,利用系统故障数据与历史故障数据进行数据离线分析,得到单系统故障画像和/或多个系统综合画像。在另一种实施方式中,可以对历史故障进行数据分析,并通过专家经验进行人为分析生成故障画像,并根据真实的故障数据离线分析和完善。
(2)如图4所示,根据预先设定的分析规则对故障画像进行趋势分析,得到目标故障预警信息的实施方式,具体的参见如下(a)至(b):
(a)利用趋势预测算法对故障画像中底层数据信息进行趋势分析,得到第一故障预警信息,其中,趋势预测算法包括单指标趋势预测算法、多指标趋势预测算法和关联数据趋势预测算法中的一种或多种,在一种实施方式中,基于多指标进行实时计算生成并更新数字孪生模型,而故障画像主要基于历史故障数据建立。
(b)将不满足告警阈值的当前系统真实指标确定为系统正常数据,并根据系统正常数据计算故障画像中指标数据的偏离率,基于第一故障预警信息和偏离率对故障画像中指标数据进行偏离率辅助分析,得到第二故障预警信息,其中,第二故障预警信息为校正后的故障预警信息,在一种实施方式中,通过实时计算系统,结合趋势预测、故障画像、正常指标提前预测及发现系统问题,一定程度上避免了线上问题的发生,保障了线上应用的稳定性。
为便于对上述实施例提供的系统故障预警方法进行理解,本发明实施例提供了一种系统故障预警方法的应用示例,参见图5所示的另一种系统故障预警方法的流程示意图,该方法主要包括以下步骤S502至步骤S506:
步骤S502,根据监控数据和全链路压测数据建立复杂业务系统的数字孪生模型,并生成告警阈值,在一种实施方式中,可以根据全链路压测数据、流量透传率、在线服务器的数量变化、应用性能变化和调用关系变化等建立数字孪生模型。在另一种实施方式中,可以根据告警阈值判断系统是否出现故障,并将出现故障的数据存储至存储单元,作为历史故障数据。
步骤S504,根据历史故障数据分析建立复杂系统单个应用的故障画像和多个应用的综合故障画像,在一种实施方式中,可以对历史故障进行数据分析,并通过专家经验进行人为分析生成故障画像,并根据真实的故障数据离线分析和完善。
步骤S506,根据已经建立的故障画像,使用趋势预测算法,并使用正常指标的偏离率辅助分析,提前判断未来发生故障的可能性。在一种实施方式中,可以通过多指标进行实时计算,实现多指标综合计算和大量数据的快速分析,从而解决传统告警基于单指标少量数据导致的预警结果不准确的问题,并应对流量徒增等短时间内出现故障的场景。
综上所述,本发明通过实时进行多指标综合计算得到的数字孪生模型及对应的告警阈值,可以提升系统故障预警的准确性。
对于前述实施例提供的系统故障预警方法,本发明实施例提供了一种系统故障预警装置,参见图6所示的一种系统故障预警装置的结构示意图,该装置包括以下部分:
功能选取模块602,当接收到系统指标数据时,从故障预警功能中确定目标预警功能;
模型建立模块604,如果目标预警功能为数字孪生功能,基于系统指标数据中的当前系统真实指标进行实时计算,生成第一数字孪生模型;
模型更新模块606,如果接收到系统变化信息,利用系统变化信息对第一数字孪生模型进行更新,得到第二数字孪生模型;
阈值生成模块608,通过第二数字孪生模型生成告警阈值;
告警生成模块610,告警生成模块,如果当前系统真实指标满足告警阈值,生成阈值告警信息。
本申请实施例提供的上述数据处理装置通过数字孪生的动态变化实现告警阈值动态调节,减少了人工配置的工作量的同时,相比人工配置也提高了配置的准确性,并且,通过实时计算系统,结合趋势预测、故障画像、正常指标提前预测及发现系统问题,一定程度上避免了线上问题的发生,保障了线上应用的稳定性。
一种实施方式中,上述阈值生成模块608还用于:如果未接收到系统变化信息,则基于第一数字孪生模型生成告警阈值。
一种实施方式中,目标预警功能还包括:故障画像功能,上述告警生成模块610还用于:将满足告警阈值的当前系统真实指标确定为系统故障数据,并利用系统故障数据生成故障画像;根据预先设定的分析规则对故障画像进行趋势分析,得到目标故障预警信息。
一种实施方式中,在进行利用系统故障数据生成故障画像的步骤之后,上述告警生成模块610还用于:根据预先设置的离线计算分析系统对故障画像进行特征数据分析,得到特征分析结果;根据特征分析结果对故障画像的底层数据信息进行校对,其中,底层数据包括系统故障数据和系统间关联数据。
一种实施方式中,在进行根据预先设定的分析规则对故障画像进行趋势分析,得到目标故障预警信息的步骤时,上述告警生成模块610还用于:利用趋势预测算法对故障画像中底层数据信息进行趋势分析,得到第一故障预警信息,其中,趋势预测算法包括单指标趋势预测算法、多指标趋势预测算法和关联数据趋势预测算法中的一种或多种。
一种实施方式中,在进行利用趋势预测算法对故障画像中的指标数据进行趋势分析,得到第一故障预警信息的步骤之后,上述告警生成模块610还用于:将不满足告警阈值的当前系统真实指标确定为系统正常数据;根据系统正常数据计算故障画像中指标数据的偏离率;基于第一故障预警信息和偏离率对故障画像中指标数据进行偏离率辅助分析,得到第二故障预警信息。
一种实施方式中,故障画像为单系统故障画像和/或多个系统综合画像,上述告警生成模块610还用于:利用系统故障数据与历史故障数据进行数据离线分析,得到单系统故障画像和/或多个系统综合画像。
本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
本发明实施例提供了一种电子设备,具体的,该电子设备包括处理器和存储装置;存储装置上存储有计算机程序,计算机程序在被所述处理器运行时执行如上所述实施方式的任一项所述的方法。
图7为本发明实施例提供的一种电子设备的结构示意图,该电子设备100包括:处理器70,存储器71,总线72和通信接口73,所述处理器70、通信接口73和存储器71通过总线72连接;处理器70用于执行存储器71中存储的可执行模块,例如计算机程序。
其中,存储器71可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口73(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线72可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器71用于存储程序,所述处理器70在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器70中,或者由处理器70实现。
处理器70可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器70中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器70可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器71,处理器70读取存储器71中的信息,结合其硬件完成上述方法的步骤。
本发明实施例所提供的可读存储介质的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见前述方法实施例,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种系统故障预警方法,其特征在于,所述方法应用于服务器,所述服务器配置有多个故障预警功能,所述方法包括:
当接收到系统指标数据时,从所述故障预警功能中确定目标预警功能;
如果所述目标预警功能为数字孪生功能,基于所述系统指标数据中的当前系统真实指标进行实时计算,生成第一数字孪生模型;
如果接收到系统变化信息,利用所述系统变化信息对所述第一数字孪生模型进行更新,得到第二数字孪生模型,其中,所述系统变化信息包括:真实测量数据、流量透传率、在线服务器的数量变化、应用性能变化和调用关系变化;
通过所述第二数字孪生模型生成告警阈值;
如果所述当前系统真实指标满足所述告警阈值,生成阈值告警信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果未接收到系统变化信息,则基于所述第一数字孪生模型生成所述告警阈值。
3.根据权利要求1所述的方法,其特征在于,所述目标预警功能还包括:故障画像功能,所述方法还包括:
将满足所述告警阈值的当前系统真实指标确定为系统故障数据,并利用所述系统故障数据生成故障画像;
根据预先设定的分析规则对所述故障画像进行趋势分析,得到目标故障预警信息。
4.根据权利要求3所述的方法,其特征在于,在所述利用所述系统故障数据生成故障画像的步骤之后,包括:
根据预先设置的离线计算分析系统对所述故障画像进行特征数据分析,得到特征分析结果;
根据所述特征分析结果对所述故障画像的底层数据信息进行校对,其中,所述底层数据包括所述系统故障数据和系统间关联数据。
5.根据权利要求3所述的方法,其特征在于,所述根据预先设定的分析规则对所述故障画像进行趋势分析,得到目标故障预警信息的步骤,包括:
利用趋势预测算法对所述故障画像中底层数据信息进行趋势分析,得到第一故障预警信息,其中,所述趋势预测算法包括单指标趋势预测算法、多指标趋势预测算法和关联数据趋势预测算法中的一种或多种。
6.根据权利要求5所述的方法,其特征在于,在所述利用趋势预测算法对所述故障画像中的指标数据进行趋势分析,得到第一故障预警信息的步骤之后,还包括:
将不满足所述告警阈值的当前系统真实指标确定为系统正常数据;
根据所述系统正常数据计算所述故障画像中所述指标数据的偏离率;
基于所述第一故障预警信息和所述偏离率对所述故障画像中所述指标数据进行偏离率辅助分析,得到第二故障预警信息。
7.根据权利要求3所述的方法,其特征在于,所述故障画像为单系统故障画像和/或多个系统综合画像,所述方法还包括:
利用所述系统故障数据与历史故障数据进行数据离线分析,得到所述单系统故障画像和/或所述多个系统综合画像。
8.一种系统故障预警装置,其特征在于,所述装置包括:
功能选取模块,当接收到系统指标数据时,从所述故障预警功能中确定目标预警功能;
模型建立模块,如果所述目标预警功能为数字孪生功能,基于所述系统指标数据中的当前系统真实指标进行实时计算,生成第一数字孪生模型;
模型更新模块,如果接收到系统变化信息,利用所述系统变化信息对所述第一数字孪生模型进行更新,得到第二数字孪生模型,其中,所述系统变化信息包括:真实测量数据、流量透传率、在线服务器的数量变化、应用性能变化和调用关系变化;
阈值生成模块,通过所述第二数字孪生模型生成告警阈值;
告警生成模块,如果所述当前系统真实指标满足所述告警阈值,生成阈值告警信息。
9.一种服务器,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现权利要求1至7任一项所述的方法。
CN202211141325.2A 2022-09-20 2022-09-20 一种系统故障预警方法、装置及服务器 Pending CN115470079A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211141325.2A CN115470079A (zh) 2022-09-20 2022-09-20 一种系统故障预警方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211141325.2A CN115470079A (zh) 2022-09-20 2022-09-20 一种系统故障预警方法、装置及服务器

Publications (1)

Publication Number Publication Date
CN115470079A true CN115470079A (zh) 2022-12-13

Family

ID=84333631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211141325.2A Pending CN115470079A (zh) 2022-09-20 2022-09-20 一种系统故障预警方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN115470079A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115660429A (zh) * 2022-12-29 2023-01-31 南京数信智能科技有限公司 适用于水泥智能制造的数据处理方法及装置
CN116070802A (zh) * 2023-04-03 2023-05-05 中国电子科技集团公司第十五研究所 一种基于数据孪生的智能监控运维方法和系统
CN117471979A (zh) * 2023-12-27 2024-01-30 成都川哈工机器人及智能装备产业技术研究院有限公司 一种基于数字孪生平台的数据采集处理方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115660429A (zh) * 2022-12-29 2023-01-31 南京数信智能科技有限公司 适用于水泥智能制造的数据处理方法及装置
CN116070802A (zh) * 2023-04-03 2023-05-05 中国电子科技集团公司第十五研究所 一种基于数据孪生的智能监控运维方法和系统
CN116070802B (zh) * 2023-04-03 2023-09-29 中国电子科技集团公司第十五研究所 一种基于数据孪生的智能监控运维方法和系统
CN117471979A (zh) * 2023-12-27 2024-01-30 成都川哈工机器人及智能装备产业技术研究院有限公司 一种基于数字孪生平台的数据采集处理方法及系统
CN117471979B (zh) * 2023-12-27 2024-03-08 成都川哈工机器人及智能装备产业技术研究院有限公司 一种基于数字孪生平台的数据采集处理方法及系统

Similar Documents

Publication Publication Date Title
CN115470079A (zh) 一种系统故障预警方法、装置及服务器
US20200287814A1 (en) Training method and apparatus for service quality assessment model
CN112988398A (zh) 一种微服务动态伸缩及迁移方法和装置
CN110955586A (zh) 一种基于日志的系统故障预测方法、装置和设备
CN110569166A (zh) 异常检测方法、装置、电子设备及介质
CN112506619B (zh) 作业处理方法、装置、电子设备和存储介质
CN114490078A (zh) 一种微服务的动态缩扩容方法、装置及设备
CN115622867A (zh) 一种工控系统安全事件预警分类方法及系统
CN110851333A (zh) 根分区的监控方法、装置和监控服务器
CN108463813B (zh) 一种进行数据处理的方法和装置
CN113326132A (zh) 一种信息调节方法、设备及存储介质
CN114116128B (zh) 容器实例的故障诊断方法、装置、设备和存储介质
CN114157486B (zh) 通信流量数据异常检测方法、装置、电子设备及存储介质
CN114328078A (zh) 一种阈值动态计算方法、装置及计算机可读存储介质
CN112860763B (zh) 实时流数据处理方法、装置、计算机设备和存储介质
CN115309638A (zh) 协助模型优化的方法及装置
CN113821933A (zh) App流量预测方法、装置、计算机设备及存储介质
CN113808727A (zh) 设备监控方法、装置、计算机设备和可读存储介质
CN113158497A (zh) 在线服务实验方法、装置、计算机设备和存储介质
CN111782479A (zh) 日志处理方法、装置、电子设备及计算机可读存储介质
CN116127149B (zh) 图数据库集群健康度的量化方法和系统
KR102255252B1 (ko) 대용량 원천데이터로부터 써머리값을 결정하는 방법 및 서버
EP4372613A1 (en) Service execution system and related product
CN114997879B (zh) 一种支付路由方法、装置、设备和存储介质
CN115292081B (zh) 信息发送方法、装置、电子设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination