CN112463834A - 流式处理中自动实现根因分析的方法、装置及电子设备 - Google Patents

流式处理中自动实现根因分析的方法、装置及电子设备 Download PDF

Info

Publication number
CN112463834A
CN112463834A CN202011400960.9A CN202011400960A CN112463834A CN 112463834 A CN112463834 A CN 112463834A CN 202011400960 A CN202011400960 A CN 202011400960A CN 112463834 A CN112463834 A CN 112463834A
Authority
CN
China
Prior art keywords
index
service
data
alarm
root cause
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011400960.9A
Other languages
English (en)
Other versions
CN112463834B (zh
Inventor
李小波
李琪
赵子健
刘伯松
高昊阳
王�琦
耿金伶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202011400960.9A priority Critical patent/CN112463834B/zh
Publication of CN112463834A publication Critical patent/CN112463834A/zh
Application granted granted Critical
Publication of CN112463834B publication Critical patent/CN112463834B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Debugging And Monitoring (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请公开了一种流式处理中自动实现根因分析的方法、装置及电子设备,所述方法包括:获得流式处理中的业务明细数据;根据预先获得的一个或多个业务指标,获得所述业务明细数据中分别在每个所述业务指标上的指标统计数据;至少根据每个所述业务指标对应的指标标准数据,分别判断每个所述业务指标上的指标统计数据是否满足所述业务指标对应的指标告警规则,以得到告警信息;所述指标标准数据为根据历史明细数据所生成的基线数据;在所述告警信息表征存在所述指标统计数据满足所述业务指标对应的指标告警规则的情况下,根据所述告警信息进行根因分析,以得到根因分析结果。

Description

流式处理中自动实现根因分析的方法、装置及电子设备
技术领域
本申请涉及流式处理技术领域,尤其涉及一种流式处理中自动实现根因分析的方法、装置及电子设备。
背景技术
各个大数据业务场景下,服务器中的各个交易系统每天生成海量的数据,对于海量的数据处理分析主要分为两种方式:离线数据分析和实时数据分析。其中,实时数据分析是对流式数据进行处理和分析,通过流式数据分析可以实现秒级的监控和实时的根因分析。在对流式数据的分析方法中要求低延迟、高并发。
随着业务对实时计算需求的提出,目前通常采用诸如Spark Streaming和Flink等流式计算框架来处理流式数据。流式框架的出现解决了流式计算问题,但是在计算过程中出现错误或者监控指标出现异常,需要对引起问题的原因进行科学分析,以便于及时进行系统修复。而引起问题的原因通常很多,比如物理条件、人为因素、系统行为、或者流程因素等等。
目前对流式处理场景下的根因分析实现方案中,如果在流式计算过程出现异常情况,那么需要记录“案发”现场,同时保持计算不中断,然后通过离线(线下)的方式由运维人员进行根因分析,会增加根因分析所消耗的工作时长,导致效率较低。
因此,亟需一种能够提高流式处理中根因分析的效率的技术方案。
发明内容
有鉴于此,本申请提供一种流式处理中自动实现根因分析的方法、装置及电子设备,用以解决现有技术中流式处理中根因分析的效率较低的技术问题,具体如下:
一种流式处理中自动实现根因分析的方法,所述方法包括:
获得流式处理中的业务明细数据;
根据预先获得的一个或多个业务指标,获得所述业务明细数据中分别在每个所述业务指标上的指标统计数据;
至少根据每个所述业务指标对应的指标标准数据,分别判断每个所述业务指标上的指标统计数据是否满足所述业务指标对应的指标告警规则,以得到告警信息;所述指标标准数据为根据历史明细数据所生成的基线数据;
在所述告警信息表征存在所述指标统计数据满足所述业务指标对应的指标告警规则的情况下,根据所述告警信息进行根因分析,以得到根因分析结果。
上述方法,优选的,根据所述告警信息进行根因分析,以得到根因分析结果,包括:
对所述告警信息进行分析,以得到所述告警信息中的告警对象;
根据所述告警对象,确定出现告警的物理设备信息,所述物理设备信息中至少包含出现告警的物理子系统的系统标识、所述物理子系统中出现告警的业务的交易码以及所述交易码对应的业务中出现告警的业务应用。
上述方法,优选的,还包括:
对所述告警信息进行分析,以得到所述告警信息中的告警时间;
在日志库中获得所述告警时间对应的目标日志;
根据所述目标日志,获得所述告警信息对应的告警问题信息。
上述方法,优选的,还包括:
预先获得指标规则集合,所述指标规则集合中包含有多个指标告警规则,所述指标告警规则至少为关于告警时段、告警等级、是否发送告警信息、告警压制次数、告警上下基线阈值中的任意一项或任意多项的规则。
上述方法,优选的,在根据预先获得的一个或多个业务指标,获得所述业务明细数据中分别在每个所述业务指标上的指标统计数据之后,所述方法还包括:
判断在预先获得的指标规则集合中是否存在与预先获得的一个或多个业务指标中的每个所述业务指标分别对应的指标告警规则;
在所述指标规则集合中存在与每个所述业务指标分别对应的指标告警规则的情况下,判断在预设的基线数据集合中是否存在与每个所述业务指标分别对应的指标标准数据;
在所述基线数据集合中存在与每个所述业务指标分别对应的指标标准数据的情况下,执行所述步骤:至少根据每个所述业务指标对应的指标标准数据,分别判断每个所述指标统计数据是否满足所述业务指标对应的指标告警规则,以得到告警信息。
上述方法,优选的,至少根据每个所述业务指标对应的指标标准数据,分别判断每个所述指标统计数据是否满足所述业务指标对应的指标告警规则,包括:
分别将每个所述业务指标对应的指标统计数据与指标标准数据进行比对,以得到每个所述业务指标对应的数据对比结果,所述数据比对结果至少表征所述指标统计数据与所述指标标准数据之间的数据偏差;
分别判断每个所述业务指标对应的数据比对结果是否满足所述业务指标对应的指标告警规则,以分别得到每个所述业务指标上对应的告警信息。
上述方法,优选的,在至少根据每个所述业务指标对应的指标标准数据,分别判断每个所述指标统计数据是否满足所述业务指标对应的指标告警规则之前,所述方法还包括:
在预设的基线数据集合中读取所述指标统计数据所在目标时段上对应的指标标准数据;所述目标时段上对应的指标标准数据在所述目标时段的上一时段被存储在所述目标存储区域中;
获得所述目标时段的下一时段上对应的指标标准数据并将所述目标时段的下一时段上对应的指标标准数据存储至基线数据集合中;
删除所述基线数据集合中所述目标时段的上一时段对应的指标标准数据。
上述方法,优选的,在获得流式处理中的业务明细数据之后,所述方法还包括:
对所述业务明细数据进行解析,以得到解析结果;
根据所述解析结果,对所述业务明细数据是否满足预设的交易合法规则进行判断,以得到判断结果;
在所述判断结果表明所述业务明细数据满足所述交易合法规则的情况下,执行所述步骤:根据预先获得的多个业务指标,获得所述业务明显数据中分别在每个所述业务指标上的指标统计数据。
一种流式处理中自动实现根因分析的装置,所述装置包括:
明细获得单元,用于获得流式处理中的业务明细数据;
统计获得单元,用于根据预先获得的一个或多个业务指标,获得所述业务明细数据中分别在每个所述业务指标上的指标统计数据;
告警判断单元,用于至少根据每个所述业务指标对应的指标标准数据,分别判断每个所述业务指标上的指标统计数据是否满足所述业务指标对应的指标告警规则,以得到告警信息;所述指标标准数据为根据历史明细数据所生成的基线数据;
根因触发单元,用于在所述告警信息表征存在所述指标统计数据满足所述业务指标对应的指标告警规则的情况下,根据所述告警信息进行根因分析,以得到根因分析结果。
一种电子设备,包括:
存储器,用于存储应用程序及所述应用程序运行所产生的数据;
处理器,用于执行所述应用程序,以实现:获得流式处理中的业务明细数据;根据预先获得的一个或多个业务指标,获得所述业务明细数据中分别在每个所述业务指标上的指标统计数据;至少根据每个所述业务指标对应的指标标准数据,分别判断每个所述业务指标上的指标统计数据是否满足所述业务指标对应的指标告警规则,以得到告警信息;所述指标标准数据为根据历史明细数据所生成的基线数据;在所述告警信息表征存在所述指标统计数据满足所述业务指标对应的指标告警规则的情况下,根据所述告警信息进行根因分析,以得到根因分析结果。
从上述技术方案可以看出,本申请公开的一种流式处理中自动实现根因分析的方法、装置及电子设备中,在获得到流式处理中的业务明细数据之后,可以根据预先获得的多个业务指标获得到业务明细数据中分别在每个业务指标上的指标统计数据,基于此,就可以根据每个业务指标对应的指标标准数据分别判断出每个业务指标上的指标统计数据是否满足相应的指标告警规则,而这些指标标准数据是根据历史明细数据所生成的基线数据,因此可以通过判断得到告警信息,相应的,在告警信息表征存在指标统计数据满足业务指标对应的指标告警规则的情况下,就可以自动根据告警信息进行根因分析,从而得到根因分析结果。可见,本申请中在保持流式处理不中断的情况下,能够自动触发根因分析的流程,从而不需要通过离线(线下)的方式由运维人员进行根因分析,由此避免根因分析消耗过多的工作时长,从而提高流式处理中根因分析的效率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例一提供的一种流式处理中自动实现根因分析的方法的流程图;
图2为流式处理的整体数据流转示意图;
图3-图6分别为本申请实施例一提供的一种流式处理中自动实现根因分析的方法的另一流程图;
图7为本申请实施例二提供的一种流式处理中自动实现根因分析的装置的结构示意图;
图8为本申请实施例三提供的一种电子设备的结构示意图;
图9-图14分别为本申请适用于银行领域实现流式处理中进行根因分析自动实现的示例图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参考图1所示,为本申请实施例一提供的一种流式处理中自动实现根因分析的方法的流程图,该方法可以适用于能够进行数据处理的电子设备中,如计算机或服务器等,该电子设备与流式处理的设备相连接,本实施例中的技术方案主要用于对流式处理中的业务明细数据进行告警监测并自动实现根因分析,以提高流式处理中根因分析的效率。
具体的,本实施例中的方法可以包括以下步骤:
步骤101:获得流式处理中的业务明细数据。
其中,本实施例中可以在流式处理中的消息队列中读取到需要进行告警监测的业务明细数据。
需要说明的是,这里的消息队列是指流式处理中消息中间件中的消息队列,如图2中所示,为流式处理中的整体数据流转流程图,其中,在业务应用的运行过程中,通过图2中所示的模块对业务应用中的交易数据进行处理,即流式处理,具体如下:
数据采集器,用于通过预先配置采集规则和采集频率,将符合条件的文件内容发送给数据转发器,其中,数据采集器可以部署在各个业务应用的客户端,而业务应用所生成的交易数据被数据采集器收集;
数据转发器,用于接收数据采集器发送过来的数据文件,并进行文件格式的校验、数据解析、数据过滤以及数据相关信息的填充等处理,然后将处理后的交易数据发送到消息中间件;
消息中间件,可以采用高吞吐的分布式发布订阅消息架构实现,在消息中间件中配置消息队列用于存储待处理的交易数据和处理所得到的计算结果;
流式计算模块,用于通过流式计算框架处理核心的业务逻辑,对消息队列中的交易数据进行处理,并将流式处理所输出的计算结果推送到消息中间件中的消息队列中进行缓存;
数据存储器,用于将消息中间件中的流式计算结果存储起来。其中,可以通过分布式全文搜索引擎进行数据存储。
基于此,本实施例中是在流式处理过程中,读取消息中间件内消息队列中的业务明细数据,以便于在流式处理的过程中,实现对业务明细数据的告警检测及根因分析。
步骤102:根据预先获得的一个或多个业务指标,获得业务明细数据中分别在每个业务指标上的指标统计数据。
其中,本实施例中可以预先设置多个业务指标,每个业务指标分别表征业务应用的一个告警监测维度。基于此,在实际应用中,可以在预先设置的这些业务指标中根据业务明细数据的数据内容以及告警监测的需求等提取出所需要的一个或多个业务指标,经过提取的业务指标是与业务明细数据相关的,因此,根据这些提取到的业务指标,在业务明细数据中分别统计每个业务指标上的指标统计数据。
在具体实现中,步骤102中所提取出的业务指标可以有:交易量、业务成功率、系统成功率、平均响应时间、平均处理时间、长交易量、长交易率、平均交易质量值等中的任意一种或任意多种。其中:
交易量,是指预设的统计时长如1分钟(或者10秒)内的业务交易的数量;
业务成功率,是指预设的统计时长内如1分钟(或者10秒)内,业务交易成功的数量在总交易量的占比;
系统成功率,是指预设的统计时长内如1分钟(或者10秒)内,系统交易成功的数量在总交易量的占比;
平均响应时间,是指在预设的统计时长内如1分钟(或者10秒)内,系统响应时间在总交易时间的占比;
平均处理时间,是指在预设的统计时长内如1分钟(或者10秒)内,业务处理时间在总交易时间的占比;
长交易量,是指交易处理时间大于一个阈值的业务交易在预设的统计时长内如1分钟(或者10秒)内的数量,其中,交易处理时间大于一个阈值的业务交易称为长交易;
长交易率,是指在预设的统计时长内如1分钟(或者10秒)内,长交易量在总交易量的占比;
平均交易质量值,是指在预设的统计时长如1分钟(或者10秒)内统计时间内,统计交易的平均交易质量值。其中,每个业务应用所在的业务系统均定义处理一个Apdex阈值,并基于此来确定交易质量,如果处理时间大于Apdex阈值,质量值等于0;如果处理时间处于75%-100%的Apdex阈值,质量值为50;如果处理时间处于25%-75%的Apdex阈值,质量值为75;如果处理时间处于0%-25%的Apdex阈值,质量值100。
基于此,步骤102中可以通过对业务明细数据进行数据解析,以统计出在每个业务指标上的指标统计数据。
需要说明的是,本实施例中可以在获得到每个业务指标上的指标统计数据之后,将这些指标统计数据存储到流式处理的消息中间件中。
步骤103:至少根据每个业务指标对应的指标标准数据,分别判断每个业务指标上的指标统计数据是否满足业务指标对应的指标告警规则,以得到告警信息,在告警信息表征存在指标统计数据满足业务指标对应的指标告警规则的情况下,执行步骤104。
其中,指标标准数据为根据历史明细数据所生成的基线数据。这些指标标准数据存储在预先获得的基线数据集合中,基线数据集合则是根据历史明细数据所生成的。
具体的,在生成每个业务指标对应的基线数据时,可以先加载历史明细数据如消息队列中未产生告警以及根因分析的历史数据,之后,剔除历史明细数据中的异常值,进而在这些历史明细数据中统计出相应业务指标上的历史统计数据,再根据这些历史统计数据生成基线数据,组成基线数据集合,即指标标准数据组成的基线数据集合。
而每个业务指标对应的指标告警规则可以在预先获得的指标规则集合中查找得到。在指标规则集合中包含有多个指标告警规则,每个指标告警规则分别对应于一个业务指标,而每个指标告警规则至少为关于告警时段、告警等级、是否发送告警信息、告警压制次数、告警上下基线阈值等中的任意一项或多项的规则。
基于此,本实施例中可以分别针对每个业务指标上的指标统计数据,根据该业务指标对应的指标标准数据对相应的指标统计数据是否满足相应的指标告警规则进行判断,所得到的告警信息能够表征相应业务指标上的指标统计数据是否满足指标告警规则,也表征该业务指标上的指标统计数据是否存在异常,也就表征是否对该业务指标上的指标统计数据进行告警。
具体的,步骤103可以通过以下方式实现:
首先,分别将每个业务指标对应的指标统计数据与指标标准数据进行对比,以得到每个业务指标对应的数据比对结果,其中,数据比对结果中至少表征指标统计数据与指标表征数据之间的数据偏差;例如,在交易量指标上,将指标统计数据中的交易量与指标标准数据中的交易量做差,以得到交易量偏差值;
之后,分别判断每个业务指标对应的数据比对结果是否满足该业务指标对应的指标告警规则,以分别得到每个业务指标上对应的告警信息。例如,在交易量指标上,将交易量偏差值与相应指标告警规则中的偏差阈值进行比对,如果交易量偏差值大于或等于指标告警规则中的偏差阈值,那么所得到的交易量告警信息表征交易量指标上的指标统计数据满足指标告警规则,需要对交易量指标进行告警,如果交易量偏差值小于指标告警规则中的偏差阈值,那么所得到的交易量告警信息表征交易量指标上的指标统计数据不满足指标告警规则,不需要对交易量指标进行告警。
步骤104:根据告警信息进行根因分析,以根因分析结果。
具体的,本实施例中可以通过对告警信息进行分析,以得到业务系统中哪些物理子系统存在告警、物理子系统哪些业务的交易码存在告警以及交易码对应的业务中哪些业务应用存在告警等等的根因分析结果。
例如,本实施例中可以首先对告警信息进行分析,以得到告警信息中的告警对象,如出现告警的实体或虚拟对象等,如物理子系统或业务应用等,之后,根据这些告警对象,确定出现告警的物理设备信息,这里的物理设备信息中可以包含有:出现告警的物理子系统的系统标识,如服务器标识等,还可以包含有出现告警的物理子系统中出现告警的业务的交易码,如期货交易的交易码等,还可以包含有出现告警的交易码对应的业务中出现告警的业务应用等,如支付应用等。
基于此,在将根因分析结果输出给运维人员之后,运维人员能够对这些根问分析结果所涉及的物理子系统、交易码对应的业务以及业务应用等进行调整,以及时修正业务系统,满足用户的业务交易需求。
由上述技术方案可知,本申请实施例一提供的一种流式处理中自动实现根因分析的方法中,在获得到流式处理中的业务明细数据之后,可以根据预先获得的多个业务指标获得到业务明细数据中分别在每个业务指标上的指标统计数据,基于此,就可以根据每个业务指标对应的指标标准数据分别判断出每个业务指标上的指标统计数据是否满足相应的指标告警规则,而这些指标标准数据是根据历史明细数据所生成的基线数据,因此可以通过判断得到告警信息,相应的,在告警信息表征存在指标统计数据满足业务指标对应的指标告警规则的情况下,就可以自动根据告警信息进行根因分析,从而得到根因分析结果。可见,本实施例中在保持流式处理不中断的情况下,能够自动触发根因分析的流程,从而不需要通过离线(线下)的方式由运维人员进行根因分析,由此避免根因分析消耗过多的工作时长,从而提高流式处理中根因分析的效率。
在一种实现方式中,在步骤103中得到告警信息之后,还可以包括以下步骤,如图3中所示:
步骤105:对告警信息进行分析,以得到告警信息中的告警时间。
其中,告警时间是指业务指标上对应的指标统计数据满足指标告警规则时对应的时间,表征业务系统中存在异常的时间。
具体的,本实施例中可以通过对告警信息中的时间信息进行分析,以得到告警信息中的告警时间。
步骤106:在日志库中获得告警时间对应的目标日志。
其中,日志库以分布式文件的形式存储,基于此,本实施例中在得到告警时间之后,检索存储在分布式文件上的日志,以得到告警时间对应的目标日志。这些目标日志即为业务系统中存在异常时所产生的系统日志。
步骤107:根据目标日志,获得告警信息对应的告警问题信息。
具体的,本实施例中可以对目标日志中所记录的日志内容,对异常问题进行解析,进而得到告警问题信息,即可定位到使得物理子系统中交易码对应的业务中出现异常的业务应用所存在的异常问题,如用户违规操作使得业务应用产生异常或者业务应用被恶意攻击产生异常等问题。
在一种实现方式中,在步骤102之后,本实施例中的方法还可以包括以下步骤,如图4中所示:
步骤108:判断在预先获得的指标规则集合中是否存在与预先获得的一个或多个业务指标中的每个业务指标分别对应的指标告警规则,如果在指标规则集合中均存在与每个业务指标分别对应的指标告警规则,执行步骤109,否则,结束当前根因分析流程。
其中,本实施例中可以通过业务指标查找的方式,在指标规则集合中查找是否有与每个业务指标相对应的指标告警规则,在指标规则集合中均有指标告警规则与每个业务指标相对应的情况下,那么继续执行后续的根因分析流程,否则,直接结束当前根因分析流程;
步骤109:判断在预设的基线数据集合中是否存在与每个业务指标分别对应的指标标准数据,如果在基线数据集合中存在与每个业务指标分别对应的指标标准数据,那么执行步骤103,否则,结束当前根因分析流程。
其中,本实施例中可以通过业务指标查找的方式,在基线数据集合中查找是否有与每个业务指标相对应的指标标准数据,在基线数据集合中均有指标标准数据与每个业务指标相对应的情况下,那么可以执行步骤103及后续的根因分析流程,否则,直接结束当前根因分析流程。
在一种实现方式中,在步骤103之前,本实施例中的方法还可以包括以下步骤,如图5中所示:
步骤110:在预设的基线数据集合中读取指标统计数据在目标时段上对应的指标标准数据。
其中,目标时段上对应的指标标准数据在目标时段的上一时段被存储在基线数据集合中。
需要说明的是,这里的时段可以理解为一天中的时段或者一个月中的时段或者一年中的时段,如每天的10点到12点,每个月的1号到10号,每年的1月份到3月份,等等。
也就是说,本实施例中在对指标统计数据是否满足指标告警规则进行判断时,是在缓存有指标标准数据的基线数据集合中读取到目标时段对应的指标标准数据,而目标时段是指需要进行告警监测的业务明细数据所对应的时段。而该目标时段上对应的指标标准数据是在该目标时段的上一时段即对上一时段的业务明细数据进行告警监测的时段生成并预加载到基线数据集合中的,基于此,在当前的目标时段上可以直接在缓存的基线数据集合中读取到所需要的指标标准数据,而无需等待指标标准数据被生成的时长,从而提高效率。
步骤111:获得目标时段的下一时段上对应的指标标准数据并将目标时段的下一时段上对应的指标标准数据存储至基线数据集合。
其中,在当前的目标时段上对应的指标标准数据被读取并用于告警监测的时候,对目标时段的下一时段上对应的指标标准数据进行预生成并预加载,加载到基线数据集合中,从而实现基线数据的预加载,进一步的提高效率。
步骤112:删除基线数据集合中目标时段的上一时段对应的指标标准数据。
其中,本实施例中为了减轻作为缓存区域的基线数据集合的存储压力,可以在进行当前的目标时段的告警监测的时候,将已经完成告警监测的目标时段的上一时段所对应的指标标准数据进行删除,从而增加基线缓存集合中的存储空间,减轻存储压力。
在一种实现方式中,在步骤101之后,本实施例中的方法还可以包括以下步骤,如图6中所示:
步骤113:对业务明细数据进行解析,以得到解析结果。
具体的,本实施例中可以对业务明细数据的数据格式、数据维度、数量等维度进行解析,以得到业务明细数据中的数据格式、数据维度、数量等多个维度上的解析结果。
步骤114:根据解析结果,对业务明细数据是否满足预设的交易合法规则进行判断,以得到判断结果,在判断结果表明业务明细数据满足交易合法规则的情况下,执行步骤102及后续根因分析流程,否则,直接结束当前根因分析流程。
具体的,交易合法规则为根据需求预先设置,且其中配置有在数据格式、数据维度及数量等各个维度上的合法范围或条件,本实施例中在得到解析结果之后,可以将解析结果中的各项数据分别与交易合法规则中的范围或条件进行比对,从而得到能够表名业务明细数据是否满足交易合法规则的判断结果。
参考图7,为本申请实施例二提供的一种流式处理中自动实现根因分析的装置的结构示意图,该装置可以适用于能够进行数据处理的电子设备中,如计算机或服务器等,该电子设备与流式处理的设备相连接,本实施例中的技术方案主要用于对流式处理中的业务明细数据进行告警监测并自动实现根因分析,以提高流式处理中根因分析的效率。
具体的,本实施例中的装置可以包括以下单元:
明细获得单元701,用于获得流式处理中的业务明细数据;
统计获得单元702,用于根据预先获得的一个或多个业务指标,获得所述业务明细数据中分别在每个所述业务指标上的指标统计数据;
告警判断单元703,用于至少根据每个所述业务指标对应的指标标准数据,分别判断每个所述业务指标上的指标统计数据是否满足所述业务指标对应的指标告警规则,以得到告警信息;所述指标标准数据为根据历史明细数据所生成的基线数据;
根因触发单元704,用于在所述告警信息表征存在所述指标统计数据满足所述业务指标对应的指标告警规则的情况下,根据所述告警信息进行根因分析,以得到根因分析结果。
由上述方案可知,本申请实施例二提供的一种流式处理中自动实现根因分析的装置中,在获得到流式处理中的业务明细数据之后,可以根据预先获得的多个业务指标获得到业务明细数据中分别在每个业务指标上的指标统计数据,基于此,就可以根据每个业务指标对应的指标标准数据分别判断出每个业务指标上的指标统计数据是否满足相应的指标告警规则,而这些指标标准数据是根据历史明细数据所生成的基线数据,因此可以通过判断得到告警信息,相应的,在告警信息表征存在指标统计数据满足业务指标对应的指标告警规则的情况下,就可以自动根据告警信息进行根因分析,从而得到根因分析结果。可见,本实施例中在保持流式处理不中断的情况下,能够自动触发根因分析的流程,从而不需要通过离线(线下)的方式由运维人员进行根因分析,由此避免根因分析消耗过多的工作时长,从而提高流式处理中根因分析的效率。
在一种实现方式中,根因触发单元704具体用于:对所述告警信息进行分析,以得到所述告警信息中的告警对象;根据所述告警对象,确定出现告警的物理设备信息,所述物理设备信息中至少包含出现告警的物理子系统的系统标识、所述物理子系统中出现告警的业务的交易码以及所述交易码对应的业务中出现告警的业务应用。
在一种实现方式中,本实施例中的装置还可以包括:
告警定位单元705,用于:对所述告警信息进行分析,以得到所述告警信息中的告警时间;在日志库中获得所述告警时间对应的目标日志;根据所述目标日志,获得所述告警信息对应的告警问题信息。
在一种实现方式中,告警判断单元703还用于:预先获得指标规则集合,所述指标规则集合中包含有多个指标告警规则,所述指标告警规则至少为关于告警时段、告警等级、是否发送告警信息、告警压制次数、告警上下基线阈值中的任意一项或任意多项的规则。
在一种实现方式中,告警判断单元703在统计获得单元702根据预先获得的一个或多个业务指标,获得所述业务明细数据中分别在每个所述业务指标上的指标统计数据之后,还用于:判断在预先获得的指标规则集合中是否存在与预先获得的一个或多个业务指标中的每个所述业务指标分别对应的指标告警规则;在所述指标规则集合中存在与每个所述业务指标分别对应的指标告警规则的情况下,判断在预设的基线数据集合中是否存在与每个所述业务指标分别对应的指标标准数据;在所述基线数据集合中存在与每个所述业务指标分别对应的指标标准数据的情况下,执行所述步骤:至少根据每个所述业务指标对应的指标标准数据,分别判断每个所述指标统计数据是否满足所述业务指标对应的指标告警规则,以得到告警信息。
在一种实现方式中,告警判断单元703具体用于:分别将每个所述业务指标对应的指标统计数据与指标标准数据进行比对,以得到每个所述业务指标对应的数据对比结果,所述数据比对结果至少表征所述指标统计数据与所述指标标准数据之间的数据偏差;分别判断每个所述业务指标对应的数据比对结果是否满足所述业务指标对应的指标告警规则,以分别得到每个所述业务指标上对应的告警信息。
在一种实现方式中,告警判断单元703在至少根据每个所述业务指标对应的指标标准数据,分别判断每个所述指标统计数据是否满足所述业务指标对应的指标告警规则之前,还用于:在预设的基线数据集合中读取所述指标统计数据所在目标时段上对应的指标标准数据;所述目标时段上对应的指标标准数据在所述目标时段的上一时段被存储在所述目标存储区域中;获得所述目标时段的下一时段上对应的指标标准数据并将所述目标时段的下一时段上对应的指标标准数据存储至基线数据集合中;删除所述基线数据集合中所述目标时段的上一时段对应的指标标准数据。
在一种实现方式中,明细获得单元701在获得流式处理中的业务明细数据之后,还用于:对所述业务明细数据进行解析,以得到解析结果;根据所述解析结果,对所述业务明细数据是否满足预设的交易合法规则进行判断,以得到判断结果;在所述判断结果表明所述业务明细数据满足所述交易合法规则的情况下,执行所述步骤:根据预先获得的多个业务指标,获得所述业务明显数据中分别在每个所述业务指标上的指标统计数据。
需要说明的是,本实施例中各单元的具体实现可以参考前文中相应的内容,此处不再详述。
参考图8,为本申请实施例三提供的一种电子设备的结构示意图,该电子设备可以为能够进行数据处理的电子设备,如计算机或服务器等,该电子设备与流式处理的设备相连接,本实施例中的技术方案主要用于对流式处理中的业务明细数据进行告警监测并自动实现根因分析,以提高流式处理中根因分析的效率。
具体的,本实施例中的电子设备可以包括以下结构:
存储器801,用于存储应用程序及所述应用程序运行所产生的数据;
处理器802,用于执行所述应用程序,以实现:获得流式处理中的业务明细数据;根据预先获得的一个或多个业务指标,获得所述业务明细数据中分别在每个所述业务指标上的指标统计数据;至少根据每个所述业务指标对应的指标标准数据,分别判断每个所述业务指标上的指标统计数据是否满足所述业务指标对应的指标告警规则,以得到告警信息;所述指标标准数据为根据历史明细数据所生成的基线数据;在所述告警信息表征存在所述指标统计数据满足所述业务指标对应的指标告警规则的情况下,根据所述告警信息进行根因分析,以得到根因分析结果。
由上述方案可知,本申请实施例三提供的一种电子设备中,在获得到流式处理中的业务明细数据之后,可以根据预先获得的多个业务指标获得到业务明细数据中分别在每个业务指标上的指标统计数据,基于此,就可以根据每个业务指标对应的指标标准数据分别判断出每个业务指标上的指标统计数据是否满足相应的指标告警规则,而这些指标标准数据是根据历史明细数据所生成的基线数据,因此可以通过判断得到告警信息,相应的,在告警信息表征存在指标统计数据满足业务指标对应的指标告警规则的情况下,就可以自动根据告警信息进行根因分析,从而得到根因分析结果。可见,本实施例中在保持流式处理不中断的情况下,能够自动触发根因分析的流程,从而不需要通过离线(线下)的方式由运维人员进行根因分析,由此避免根因分析消耗过多的工作时长,从而提高流式处理中根因分析的效率。
需要说明的是,本实施例中处理器的具体实现可以参考前文中相应的内容,此处不再详述。
以电子设备为服务器为例,对本申请的技术方案所实现的程序适用于银行业领域中进行流式处理自动根因分析触发的技术方案进行举例说明:
结合图2中所示的整体数据流转流程,以下首先介绍本实施例所实现的程序中获得基线数据集合的方式:
如图9中所示,本实施例中在获得基线数据集合时,首先加载历史数据,如银行服务器中的历史交易明细数据等等,之后,对这些历史数据进行数据预处理、数据提取、数据计算等处理,得到基线数据baseline,即前文中所提到的指标标准数据,最后,将这些基线数据进行存储,具体可以存储到基线数据集合中,基线数据集合可以存储在消息中间件中;
以下对流式处理中的告警监测以及根因分析的触发流程进行说明:
如图10中所示,本实施例中在进行告警监测时,可以包含以下流程:
首先,定时加载baseline。其中,在进行流式计算的前置的工作是baseline(基线)的计算和存储。将历史的数据加载到本实施例所实现的程序中,然后计算生成基线数据以供流式计算使用。计算基线的方法根据业务场景来确定。比如过去15天内同一时间段内交易量的平均值即为该时间段内baseline(基线)值。为了系统具有鲁棒性,本实施例中可以剔除异常值和采用多种算法融合的方式进行baseline(基线)的计算;
需要说明的是,由于baseline随着时间不断变换且baseline的数据量巨大,故在本实施例所实现的程序启动的时候需要定时加载一段时间内baseline。
基于此,后续的流式计算核心过程如下:
读取交易明细数据:从消息队列中读取业务明细数据后,需要加工、补充关联信息,以供业务明细数据中各个维度指标的统计数据。
数据解析:对业务明细数据是否合法进行解析,在业务明细数据为合法数据的情况下,执行后续的流程、
明细数据存储入消息中间件:将业务明细数据存储到消息中间件,以做备份和缓存。
业务指标提取:根据明细信息和业务规则进行指标提取。本实施例中可以提取出的8个业务指标,如下:
交易量、业务成功率、系统成功率、平均响应时间、平均处理时间、长交易量、长交易率、平均交易质量值。
业务指标统计:对每个业务指标上的统计数据进行获取。
统计数据存入消息中间件:当前时段的统计数据通过消息中间件,最终存储入分布式全文搜索引擎,提供历史查询和基线计算使用。
告警规则加载:通过网页的方式可以配置各种各样的告警规则,告警规则包括时段、告警等级、是否发送告警信息、配置压制次数、上下基线阈值等。对于相同告警规则配置不同系统上,本实施例中可以采用套餐的方式统一配置管理,进而可以极大减少配置的工作量。
是否存在对应业务指标的告警规则:在加载的告警规则中查找是否针对每个业务指标均有相应的告警规则。
是否存在对应业务指标的baseline:在加载的baseline中查找是否针对每个业务指标均有相应的baseline。
触发告警:在加载的告警规则中针对每个业务指标均有相应的告警规则且在加载的baseline中针对每个业务指标均有相应的baseline的情况下,根据baseline和告警规则,实现触发告警逻辑判断,即判断每个业务指标上的统计数据是否与相应的baseline均满足告警规则,如果是,那么推送所生成的告警通知,即前文中的告警消息。
是否触发根因分析:判断告警消息是否表征每个业务指标上的统计数据与相应的baseline均满足告警规则,如果是,则触发根因分析。
根因分析:根据生成的告警信息,分析该告警产生的原因生分析结果,定位问题日志。定位问题日志的详细的流程如图11所示。本实施例所实现的程序中的根因分析模块获取告警信息,根据告警信息中的告警对象,确定哪个机器和哪台机器出现的问题,同时根据告警时间,检索存储在分布式文件上的日志,记录定位日志结果信息,由此实现问题快速定位。
以下结合图12、图13及图14中所示的示例图说明根因分析的过程。如下:
当本实施例所实现的监控系统在发现某个系统(如图12所示的总览视图)的业务成功率只有89%时候低于正常要求(比如99%)的时候,本实施例所实现的系统自动钻取二级视图交易码视图(如图13所示的二级视图),根据业务成功率进行倒叙排列,发现某些交易码的业务成功率低,基于此,钻取业务应用视图(如图14所示的三级视图),根据业务成功率倒叙排序,定位到是具体哪些业务应用的业务成功率低。进而通过检索对应业务应用上的日志,查询错误关键词定位问题。
可见,本申请所实现的实时数据流式处理处理的根因分析自动触发的方案中,集合实时数据流式处理、告警、告警规则配置和告警发生后根因分析自动触发于一体,减少了运维人员对问题的分析排查时间,提高部门工作效率,更好保证系统的稳定性,整个流程基本上实现全流程自动化,降低人工参与度。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种流式处理中自动实现根因分析的方法,其特征在于,所述方法包括:
获得流式处理中的业务明细数据;
根据预先获得的一个或多个业务指标,获得所述业务明细数据中分别在每个所述业务指标上的指标统计数据;
至少根据每个所述业务指标对应的指标标准数据,分别判断每个所述业务指标上的指标统计数据是否满足所述业务指标对应的指标告警规则,以得到告警信息;所述指标标准数据为根据历史明细数据所生成的基线数据;
在所述告警信息表征存在所述指标统计数据满足所述业务指标对应的指标告警规则的情况下,根据所述告警信息进行根因分析,以得到根因分析结果。
2.根据权利要求1所述的方法,其特征在于,根据所述告警信息进行根因分析,以得到根因分析结果,包括:
对所述告警信息进行分析,以得到所述告警信息中的告警对象;
根据所述告警对象,确定出现告警的物理设备信息,所述物理设备信息中至少包含出现告警的物理子系统的系统标识、所述物理子系统中出现告警的业务的交易码以及所述交易码对应的业务中出现告警的业务应用。
3.根据权利要求1或2所述的方法,其特征在于,还包括:
对所述告警信息进行分析,以得到所述告警信息中的告警时间;
在日志库中获得所述告警时间对应的目标日志;
根据所述目标日志,获得所述告警信息对应的告警问题信息。
4.根据权利要求1所述的方法,其特征在于,还包括:
预先获得指标规则集合,所述指标规则集合中包含有多个指标告警规则,所述指标告警规则至少为关于告警时段、告警等级、是否发送告警信息、告警压制次数、告警上下基线阈值中的任意一项或任意多项的规则。
5.根据权利要求1所述的方法,其特征在于,在根据预先获得的一个或多个业务指标,获得所述业务明细数据中分别在每个所述业务指标上的指标统计数据之后,所述方法还包括:
判断在预先获得的指标规则集合中是否存在与预先获得的一个或多个业务指标中的每个所述业务指标分别对应的指标告警规则;
在所述指标规则集合中存在与每个所述业务指标分别对应的指标告警规则的情况下,判断在预设的基线数据集合中是否存在与每个所述业务指标分别对应的指标标准数据;
在所述基线数据集合中存在与每个所述业务指标分别对应的指标标准数据的情况下,执行所述步骤:至少根据每个所述业务指标对应的指标标准数据,分别判断每个所述指标统计数据是否满足所述业务指标对应的指标告警规则,以得到告警信息。
6.根据权利要求1或5所述的方法,其特征在于,至少根据每个所述业务指标对应的指标标准数据,分别判断每个所述指标统计数据是否满足所述业务指标对应的指标告警规则,包括:
分别将每个所述业务指标对应的指标统计数据与指标标准数据进行比对,以得到每个所述业务指标对应的数据对比结果,所述数据比对结果至少表征所述指标统计数据与所述指标标准数据之间的数据偏差;
分别判断每个所述业务指标对应的数据比对结果是否满足所述业务指标对应的指标告警规则,以分别得到每个所述业务指标上对应的告警信息。
7.根据权利要求1所述的方法,其特征在于,在至少根据每个所述业务指标对应的指标标准数据,分别判断每个所述指标统计数据是否满足所述业务指标对应的指标告警规则之前,所述方法还包括:
在预设的基线数据集合中读取所述指标统计数据所在目标时段上对应的指标标准数据;所述目标时段上对应的指标标准数据在所述目标时段的上一时段被存储在所述目标存储区域中;
获得所述目标时段的下一时段上对应的指标标准数据并将所述目标时段的下一时段上对应的指标标准数据存储至基线数据集合中;
删除所述基线数据集合中所述目标时段的上一时段对应的指标标准数据。
8.根据权利要求1所述的方法,其特征在于,在获得流式处理中的业务明细数据之后,所述方法还包括:
对所述业务明细数据进行解析,以得到解析结果;
根据所述解析结果,对所述业务明细数据是否满足预设的交易合法规则进行判断,以得到判断结果;
在所述判断结果表明所述业务明细数据满足所述交易合法规则的情况下,执行所述步骤:根据预先获得的多个业务指标,获得所述业务明显数据中分别在每个所述业务指标上的指标统计数据。
9.一种流式处理中自动实现根因分析的装置,其特征在于,所述装置包括:
明细获得单元,用于获得流式处理中的业务明细数据;
统计获得单元,用于根据预先获得的一个或多个业务指标,获得所述业务明细数据中分别在每个所述业务指标上的指标统计数据;
告警判断单元,用于至少根据每个所述业务指标对应的指标标准数据,分别判断每个所述业务指标上的指标统计数据是否满足所述业务指标对应的指标告警规则,以得到告警信息;所述指标标准数据为根据历史明细数据所生成的基线数据;
根因触发单元,用于在所述告警信息表征存在所述指标统计数据满足所述业务指标对应的指标告警规则的情况下,根据所述告警信息进行根因分析,以得到根因分析结果。
10.一种电子设备,其特征在于,包括:
存储器,用于存储应用程序及所述应用程序运行所产生的数据;
处理器,用于执行所述应用程序,以实现:获得流式处理中的业务明细数据;根据预先获得的一个或多个业务指标,获得所述业务明细数据中分别在每个所述业务指标上的指标统计数据;至少根据每个所述业务指标对应的指标标准数据,分别判断每个所述业务指标上的指标统计数据是否满足所述业务指标对应的指标告警规则,以得到告警信息;所述指标标准数据为根据历史明细数据所生成的基线数据;在所述告警信息表征存在所述指标统计数据满足所述业务指标对应的指标告警规则的情况下,根据所述告警信息进行根因分析,以得到根因分析结果。
CN202011400960.9A 2020-12-02 2020-12-02 流式处理中自动实现根因分析的方法、装置及电子设备 Active CN112463834B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011400960.9A CN112463834B (zh) 2020-12-02 2020-12-02 流式处理中自动实现根因分析的方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011400960.9A CN112463834B (zh) 2020-12-02 2020-12-02 流式处理中自动实现根因分析的方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN112463834A true CN112463834A (zh) 2021-03-09
CN112463834B CN112463834B (zh) 2024-08-27

Family

ID=74805561

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011400960.9A Active CN112463834B (zh) 2020-12-02 2020-12-02 流式处理中自动实现根因分析的方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN112463834B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113590579A (zh) * 2021-06-22 2021-11-02 微梦创科网络科技(中国)有限公司 一种基于数据仓库的根因分析方法、装置及系统
CN113590427A (zh) * 2021-08-09 2021-11-02 中国建设银行股份有限公司 一种监控指标异常的告警方法、装置、存储介质和设备
CN113961555A (zh) * 2021-11-15 2022-01-21 中国建设银行股份有限公司 数据修正方法及装置、存储介质及电子设备
CN115081969A (zh) * 2022-08-23 2022-09-20 中国中金财富证券有限公司 异常数据确定方法及相关装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170277582A1 (en) * 2016-03-28 2017-09-28 Ca, Inc. Identification of distinguishable anomalies extracted from real time data streams
CN109783322A (zh) * 2018-11-22 2019-05-21 远光软件股份有限公司 一种企业信息系统运行状态的监控分析系统及其方法
CN110351150A (zh) * 2019-07-26 2019-10-18 中国工商银行股份有限公司 故障根源确定方法及装置、电子设备和可读存储介质
CN110955575A (zh) * 2019-11-14 2020-04-03 国网浙江省电力有限公司信息通信分公司 一种基于关联分析模型的业务系统故障定位方法
CN111639011A (zh) * 2020-06-11 2020-09-08 支付宝(杭州)信息技术有限公司 一种数据监控方法、装置及设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170277582A1 (en) * 2016-03-28 2017-09-28 Ca, Inc. Identification of distinguishable anomalies extracted from real time data streams
CN109783322A (zh) * 2018-11-22 2019-05-21 远光软件股份有限公司 一种企业信息系统运行状态的监控分析系统及其方法
CN110351150A (zh) * 2019-07-26 2019-10-18 中国工商银行股份有限公司 故障根源确定方法及装置、电子设备和可读存储介质
CN110955575A (zh) * 2019-11-14 2020-04-03 国网浙江省电力有限公司信息通信分公司 一种基于关联分析模型的业务系统故障定位方法
CN111639011A (zh) * 2020-06-11 2020-09-08 支付宝(杭州)信息技术有限公司 一种数据监控方法、装置及设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113590579A (zh) * 2021-06-22 2021-11-02 微梦创科网络科技(中国)有限公司 一种基于数据仓库的根因分析方法、装置及系统
CN113590579B (zh) * 2021-06-22 2024-05-31 微梦创科网络科技(中国)有限公司 一种基于数据仓库的根因分析方法、装置及系统
CN113590427A (zh) * 2021-08-09 2021-11-02 中国建设银行股份有限公司 一种监控指标异常的告警方法、装置、存储介质和设备
CN113590427B (zh) * 2021-08-09 2024-05-03 中国建设银行股份有限公司 一种监控指标异常的告警方法、装置、存储介质和设备
CN113961555A (zh) * 2021-11-15 2022-01-21 中国建设银行股份有限公司 数据修正方法及装置、存储介质及电子设备
CN115081969A (zh) * 2022-08-23 2022-09-20 中国中金财富证券有限公司 异常数据确定方法及相关装置

Also Published As

Publication number Publication date
CN112463834B (zh) 2024-08-27

Similar Documents

Publication Publication Date Title
CN112463834B (zh) 流式处理中自动实现根因分析的方法、装置及电子设备
CN110661659B (zh) 一种告警方法、装置、系统及电子设备
CN107992398B (zh) 一种业务系统的监控方法和监控系统
CN110058977B (zh) 基于流式处理的监控指标异常检测方法、装置及设备
CN113176978B (zh) 基于日志文件的监控方法、系统、设备及可读存储介质
CN112416724B (zh) 告警处理方法、系统、计算机设备和存储介质
US7908239B2 (en) System for storing event data using a sum calculator that sums the cubes and squares of events
CN113297183B (zh) 一种时间窗口的告警分析方法及装置
CN108923972B (zh) 一种去重流量提示方法、装置、服务器及存储介质
CN109034423B (zh) 一种故障预警判定的方法、装置、设备及存储介质
CN112148561B (zh) 业务系统的运行状态预测方法、装置及服务器
CN111078513A (zh) 日志处理方法、装置、设备、存储介质及日志告警系统
CN112800061B (zh) 一种数据存储方法、装置、服务器及存储介质
CN113986595A (zh) 一种异常定位方法及装置
CN111143103A (zh) 一种关联关系确定方法、装置、设备及可读存储介质
CN110363381B (zh) 一种信息处理方法和装置
CN110941543A (zh) 日志处理方法、装置、计算机设备和存储介质
CN110677271A (zh) 基于elk的大数据告警方法、装置、设备及存储介质
CN117687874A (zh) 针对运维平台的监控方法及装置
CN113254308A (zh) 日志处理方法及设备
CN111784176A (zh) 一种数据处理方法、装置、服务器及介质
CN114253819A (zh) 一种用户操作监控方法、装置及相关设备
CN114547406A (zh) 数据监控方法、系统、存储介质及电子装置
CN113760669A (zh) 问题数据的告警方法及装置、电子设备、存储介质
CN112559645A (zh) 一种海量运维数据的处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant