CN108960455A - 业务运行状态分析方法、装置、计算设备及存储介质 - Google Patents

业务运行状态分析方法、装置、计算设备及存储介质 Download PDF

Info

Publication number
CN108960455A
CN108960455A CN201810908458.5A CN201810908458A CN108960455A CN 108960455 A CN108960455 A CN 108960455A CN 201810908458 A CN201810908458 A CN 201810908458A CN 108960455 A CN108960455 A CN 108960455A
Authority
CN
China
Prior art keywords
service operation
operation state
data
analysis
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810908458.5A
Other languages
English (en)
Other versions
CN108960455B (zh
Inventor
陈茁
何任天
李林静
朱祥意
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201810908458.5A priority Critical patent/CN108960455B/zh
Publication of CN108960455A publication Critical patent/CN108960455A/zh
Application granted granted Critical
Publication of CN108960455B publication Critical patent/CN108960455B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种业务运行状态分析方法、装置、计算设备及计算机存储介质,其中,业务运行状态分析方法基于经过训练的业务运行分析模型而执行,该方法包括:依据预先设置的多个数据提取维度,提取与多个数据提取维度对应的业务运行过程中产生的业务运行数据;按照逻辑映射规则,对业务运行数据进行预处理,得到业务运行状态特征向量;利用业务运行分析模型对业务运行状态特征向量进行分析,得到业务运行状态分析结果。根据本发明提供的技术方案,将业务运行数据预处理成业务运行状态特征向量,有效地减少了数据分析量,并且利用经过训练的业务运行分析模型能够快速地分析得到对应的业务运行状态分析结果,有效地提高了业务运行状态分析效率。

Description

业务运行状态分析方法、装置、计算设备及存储介质
技术领域
本发明涉及互联网技术领域,具体涉及一种业务运行状态分析方法、装置、计算设备及计算机存储介质。
背景技术
在业务运行过程中,经常会出现一些例如执行器处理能力不足或者数据倾斜等问题。现有技术中一般是通过业务运维人员对在业务运行过程中所产生的日志记录等进行分析,从而找到可能存在的问题并确定对应的解决方案。然而,在上述分析过程中,将耗费大量的人力成本和时间成本,分析效率较低,导致有的问题出现后,需要耗费很长时间才能够被发现和有效解决。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的业务运行状态分析方法、装置、计算设备及计算机存储介质。
根据本发明的一个方面,提供了一种业务运行状态分析方法,该方法基于经过训练的业务运行分析模型而执行,该方法包括:
依据预先设置的多个数据提取维度,提取与多个数据提取维度对应的业务运行过程中产生的业务运行数据;
按照逻辑映射规则,对业务运行数据进行预处理,得到业务运行状态特征向量;
利用业务运行分析模型对业务运行状态特征向量进行分析,得到业务运行状态分析结果。
根据本发明的另一方面,提供了一种业务运行状态分析装置,该装置基于经过训练的业务运行分析模型而运行,该装置包括:
提取模块,适于依据预先设置的多个数据提取维度,提取与多个数据提取维度对应的业务运行过程中产生的业务运行数据;
预处理模块,适于按照逻辑映射规则,对业务运行数据进行预处理,得到业务运行状态特征向量;
分析模块,适于利用业务运行分析模型对业务运行状态特征向量进行分析,得到业务运行状态分析结果。
根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
存储器用于存放至少一可执行指令,可执行指令使处理器执行上述业务运行状态分析方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述业务运行状态分析方法对应的操作。
根据本发明提供的技术方案,提取与多个数据提取维度对应的业务运行过程中产生的业务运行数据,以便全面、准确地进行业务运行状态分析;利用经过训练的业务运行分析模型能够快速地分析得到对应的业务运行状态分析结果,与现有技术相比,不仅有效地提高了业务运行状态分析效率,而且具有较高的分析准确率,极大地减少了业务运行状态分析所投入的人力成本和时间成本;并且在利用业务运行分析模型进行分析之前,还按照逻辑映射规则,将业务运行数据预处理成业务运行状态特征向量,与直接对业务运行数据进行分析相比,对预处理得到的业务运行状态特征向量进行分析能够有效地减少数据分析量,有助于进一步提高业务运行状态分析效率,优化了业务运行状态分析方式。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的业务运行状态分析方法的流程示意图;
图2示出了根据本发明另一个实施例的业务运行状态分析方法的流程示意图;
图3示出了根据本发明一个实施例的业务运行状态分析装置的结构框图;
图4示出了根据本发明实施例的一种计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的业务运行状态分析方法的流程示意图,如图1所示,该方法包括如下步骤:
步骤S100,依据预先设置的多个数据提取维度,提取与多个数据提取维度对应的业务运行过程中产生的业务运行数据。
在业务运行过程中会产生大量的业务运行数据,例如执行器延迟时间数据、业务数据处理成功总数量数据等,为了能够全面、准确地进行业务运行状态分析,预先设置了多个数据提取维度,在步骤S100中提取与多个数据提取维度对应的业务运行过程中产生的业务运行数据。本领域技术人员可根据实际需要对多个数据提取维度进行设置,此处不做限定。例如,多个数据提取维度可根据业务处理框架的具体特征来进行设置。
步骤S101,按照逻辑映射规则,对业务运行数据进行预处理,得到业务运行状态特征向量。
在提取到与多个数据提取维度对应的业务运行数据之后,可先对提取到的业务运行数据进行预处理。具体地,可按照逻辑映射规则,将业务运行数据预处理成对应的业务运行状态特征向量。其中,本领域技术人员可根据实际需要对逻辑映射规则进行设置,例如,可根据业务运行状态分析逻辑进行设置。与业务运行数据相比,业务运行状态特征向量的数据量要远远小于业务运行数据的数据量,从而有效地减少了数据分析量,有助于提高业务运行状态分析效率。
步骤S102,利用业务运行分析模型对业务运行状态特征向量进行分析,得到业务运行状态分析结果。
该方法基于经过训练的业务运行分析模型而执行。业务运行分析模型可采用梯度提升树算法等机器学习算法,依据大量的样本数据训练得到的。其中,业务运行分析模型的训练过程通过多次迭代完成。可选地,在一次迭代过程中,从大量的样本数据中提取一个样本数据,利用一个样本数据与该样本数据对应的标注结果对业务运行分析模型进行训练。
其中,将根据与多个数据提取维度对应的历史业务运行数据得到的历史业务运行状态特征向量作为样本数据。具体地,在准备样本数据的过程中,先提取与多个数据提取维度对应的历史业务运行数据,接着按照逻辑映射规则,对历史业务运行数据进行预处理,得到对应的历史业务运行状态特征向量,然后将历史业务运行状态特征向量作为样本数据,并根据历史业务运行状态对样本数据进行标注。
经过训练的业务运行分析模型能够很好地适用于任意业务运行状态特征向量,那么利用业务运行分析模型就能够快速地分析得到与业务运行状态特征向量对应的业务运行状态分析结果。
根据本实施例提供的业务运行状态分析方法,提取与多个数据提取维度对应的业务运行过程中产生的业务运行数据,以便全面、准确地进行业务运行状态分析;利用经过训练的业务运行分析模型能够快速地分析得到对应的业务运行状态分析结果,与现有技术相比,不仅有效地提高了业务运行状态分析效率,而且具有较高的分析准确率,极大地减少了业务运行状态分析所投入的人力成本和时间成本;并且在利用业务运行分析模型进行分析之前,还按照逻辑映射规则,将业务运行数据预处理成业务运行状态特征向量,与直接对业务运行数据进行分析相比,对预处理得到的业务运行状态特征向量进行分析能够有效地减少数据分析量,有助于进一步提高业务运行状态分析效率,优化了业务运行状态分析方式。
图2示出了根据本发明另一个实施例的业务运行状态分析方法的流程示意图,如图2所示,该方法包括如下步骤:
步骤S200,依据预先设置的多个数据提取维度,提取与多个数据提取维度对应的业务运行过程中产生的业务运行数据。
该方法适用于Storm等流式处理框架。以流式处理框架为Storm流式处理框架为例,Storm流式处理框架为分布式的、可靠的、高容错的流式处理框架,它把业务数据处理任务委托给不同类型的组件,每个组件负责处理一项简单特定的任务。具体地,在Storm流式处理框架中运行的是拓扑(Topology),一个Topology由一个spout组件和至少一个bolt组件组成,spout组件从数据库等中获取数据,并把数据传递给bolt组件,bolt组件将数据保存至存储器中或者将数据传递给其他bolt组件,其中,spout组件和bolt组件中具有多个执行器(executer),多个执行器用于处理数据。可根据Storm流式处理框架的上述特征对多个数据提取维度进行设置,然后提取与多个数据提取维度对应的业务运行过程中产生的业务运行数据,以便全面、准确地进行业务运行状态分析。
具体地,多个数据提取维度可包括:执行器延迟时间维度、执行器数据处理成功数量维度、执行器数据处理失败数量维度、执行器启动时间维度、执行器待处理数据数量维度、业务总延迟时间维度、业务数据处理成功总数量维度、业务数据处理失败总数量维度、业务启动时间维度和/或业务待处理数据总数量维度。其中,与执行器数据处理成功数量维度对应的业务运行数据为各个executer的ack方法的调用数量,与执行器数据处理失败数量维度对应的业务运行数据为各个executer的fail方法的调用数量,与执行器待处理数据数量维度对应的业务运行数据为各个executer的待处理数据列表(如pending list)中的数据数量,与业务数据处理成功总数量维度对应的业务运行数据为Topology的ack方法的总调用数量,与业务数据处理失败总数量维度对应的业务运行数据为Topology的fail方法的总调用数量,与业务待处理数据总数量维度对应的业务运行数据为Topology的待处理数据列表(如pending list)中的总数据数量。
可选地,为了便于真实地反映业务运行状态,所提取的业务运行数据为在对应的数据提取维度下单位时间内业务运行数据的平均数据。本领域技术人员可根据实际需要设置单位时间,此处不做限定。例如,单位时间可为10分钟。
步骤S201,针对业务运行状态特征向量的每个特征元素,获取与该特征元素对应的逻辑映射规则。
在提取到与多个数据提取维度对应的业务运行数据之后,还需按照逻辑映射规则,对业务运行数据进行预处理,得到业务运行状态特征向量。其中,业务运行状态特征向量包括多个特征元素,针对每个特征元素,获取与该特征元素对应的逻辑映射规则。
步骤S202,根据与该特征元素对应的逻辑映射规则,将相应的至少一个数据提取维度对应的业务运行数据进行映射处理,得到该特征元素的特征值。
其中,与该特征元素对应的逻辑映射规则涉及至少一个数据提取维度对应的业务运行数据,也就是说,与该特征元素对应的逻辑映射规则可能涉及到一个数据提取维度对应的业务运行数据,也可能涉及到多个数据提取维度对应的业务运行数据。
假设业务运行状态特征向量包括多个特征元素,其中,与第一个特征元素对应的逻辑映射规则规定了:若Topology的pending list中的总数据数量超过第一数量阈值,则第一个特征元素的特征值为1;若Topology的pending list中的总数据数量未超过第一数量阈值,则第一个特征元素的特征值为0。与第二个特征元素对应的逻辑映射规则规定了:若大部分的executer的fail方法的调用数量都超过第二数量阈值且所对应的executer的pending list中的数据数量都超过第三数量阈值,则第二个特征元素的特征值为1;若大部分的executer的fail方法的调用数量都未超过第二数量阈值且所对应的executer的pending list中的数据数量都未超过第三数量阈值,则第二个特征元素的特征值为0。那么针对第一个特征元素,根据与第一个特征元素对应的逻辑映射规则,将相应的与业务待处理数据总数量维度对应的业务运行数据进行映射处理,得到第一个特征元素的特征值;针对第二个特征元素,根据与第二个特征元素对应的逻辑映射规则,将相应的与执行器数据处理失败数量维度对应的业务运行数据以及与执行器待处理数据数量维度对应的业务运行数据进行映射处理,得到第二个特征元素的特征值。依次类推,得到业务运行状态特征向量中各个特征元素的特征值,从而便捷地得到业务运行状态特征向量。
步骤S203,将业务运行状态特征向量输入至业务运行分析模型中,得到业务运行状态分析结果。
其中,业务运行分析模型是依据大量的样本数据训练得到的,能够很好地适用于任意业务运行状态特征向量,在得到了业务运行状态特征向量之后,将业务运行状态特征向量输入至业务运行分析模型中,即可快速地得到业务运行状态分析结果。
业务运行分析模型的训练步骤可包括:将根据与多个数据提取维度对应的历史业务运行数据得到的历史业务运行状态特征向量作为样本数据,并根据历史业务运行状态对样本数据进行标注,然后利用样本数据和与样本数据对应的标注结果进行训练,得到业务运行分析模型。
具体地,业务运行分析模型的训练过程通过多次迭代完成。在一次迭代过程中,从大量的样本数据中提取一个样本数据,将一个样本数据作为输入,采用梯度提升树算法等机器学习算法进行训练,得到对应的输出结果,接着将输出结果和与该样本数据对应的标注结果进行比对,根据比对结果不断更新权重参数。迭代执行上述训练步骤,直至满足预设收敛条件,从而训练得到业务运行分析模型。
例如,预设收敛条件可包括:迭代次数达到预设迭代次数;和/或,比对结果符合预设结果。具体地,可以通过判断迭代次数是否达到预设迭代次数来判断是否满足预设收敛条件,也可以根据比对结果是否符合预设结果来判断是否满足预设收敛条件。
可选地,为了便于训练,预先设置了字典,字典中记录有编号与业务运行状态之间的对应关系,其中,编号与业务运行状态之间一一对应,不同的编号所对应的业务运行状态不同。例如,编号1对应的业务运行状态为执行器工作状态正常,编号2对应的业务运行状态为执行器工作状态异常,编号3对应的业务运行状态为执行器处理能力不足,编号4对应的业务运行状态为执行器数据倾斜等。在设置了字典之后,就可便捷地利用字典对样本数据进行标注,标注结果即为该样本数据对应的历史业务运行状态在字典中所匹配的编号。例如,根据某样本数据可知,少部分执行器的fail方法的调用数量和ack方法的调用数量都特别多,该样本数据对应的历史业务运行状态为执行器数据倾斜,那么将与该样本数据对应的标注结果标注为编号4。在完成对样本数据的标注之后,就可利用样本数据和与样本数据对应的标注结果进行训练,得到业务运行分析模型。那么在步骤S203中所得到的业务运行状态分析结果可为一个编号,以便根据编号在字典中查询相匹配的业务运行状态。
步骤S204,在字典中查询与业务运行状态分析结果相匹配的业务运行状态,并将相匹配的业务运行状态确定为目标业务运行状态。
具体地,根据业务运行状态分析结果,在字典中查询与业务运行状态分析结果相匹配的业务运行状态。以业务运行状态分析结果为一个编号为例,在字典中查询与该编号相匹配的业务运行状态,假设业务运行状态分析结果为编号4,根据字典所记录的编号与业务运行状态之间的对应关系可知,编号4对应的业务运行状态为执行器数据倾斜,那么将执行器数据倾斜确定为目标业务运行状态。
步骤S205,判断目标业务运行状态是否为异常状态;若是,则执行步骤S206;若否,则该方法结束。
在确定了目标业务运行状态之后,还可判断目标业务运行状态是否为异常状态。其中,异常状态可包括:数据流量上升、执行器处理能力不足、执行器工作异常和/或执行器数据倾斜等。异常状态还可包括其他的异常情况,此处不做限定。
如果判断得到目标业务运行状态为异常状态,说明当前的业务运行过程中存在问题,需要业务运维人员进行维护,则执行步骤S206;如果判断得到目标业务运行状态不为异常状态,说明当前业务运行正常,无需进行报警提醒,则该方法结束。
步骤S206,进行报警提醒。
在判断得到目标业务运行状态为异常状态的情况下,自动地进行报警提醒,以供业务运维人员能够及时了解到业务运行过程中所存在的异常状态,以便尽快对业务进行维护。本领域技术人员可根据实际需要设置报警提醒的方式,例如可通过向业务运维人员发送报警信息的方式进行报警提醒,此处不做限定。
根据本实施例提供的业务运行状态分析方法,将业务运行状态特征向量输入至经过训练的业务运行分析模型中能够方便、快速地得到对应的业务运行状态分析结果,有效地提高了业务运行状态分析效率;并且在对业务运行数据进行预处理的过程中,针对业务运行状态特征向量的每个特征元素,根据与该特征元素对应的逻辑映射规则,将相应的至少一个数据提取维度对应的业务运行数据进行映射处理,得到该特征元素的特征值,从而便捷地得到业务运行状态特征向量,具有较高的预处理效率;另外,还能够在业务运行状态为异常状态的情况下,自动地进行报警提醒,使得业务运维人员能够及时了解到业务运行过程中所存在的异常状态,以便尽快对业务进行维护。
图3示出了根据本发明一个实施例的业务运行状态分析装置的结构框图,该装置基于经过训练的业务运行分析模型而运行,如图3所示,该装置包括:提取模块310、预处理模块320和分析模块330。
提取模块310适于:依据预先设置的多个数据提取维度,提取与多个数据提取维度对应的业务运行过程中产生的业务运行数据。
该装置适用于流式处理框架。其中,多个数据提取维度包括:执行器延迟时间维度、执行器数据处理成功数量维度、执行器数据处理失败数量维度、执行器启动时间维度、执行器待处理数据数量维度、业务总延迟时间维度、业务数据处理成功总数量维度、业务数据处理失败总数量维度、业务启动时间维度和/或业务待处理数据总数量维度。
预处理模块320适于:按照逻辑映射规则,对业务运行数据进行预处理,得到业务运行状态特征向量。
可选地,预处理模块320进一步适于:针对业务运行状态特征向量的每个特征元素,获取与该特征元素对应的逻辑映射规则;根据与该特征元素对应的逻辑映射规则,将相应的至少一个数据提取维度对应的业务运行数据进行映射处理,得到该特征元素的特征值。
分析模块330适于:利用业务运行分析模型对业务运行状态特征向量进行分析,得到业务运行状态分析结果。
其中,分析模块330进一步适于:将业务运行状态特征向量输入至业务运行分析模型中,得到业务运行状态分析结果。
可选地,该装置还包括:模型训练模块340。在一个具体应用中,模型训练模块340包括:样本确定单元341和训练单元342。
其中,样本确定单元341适于:将根据与多个数据提取维度对应的历史业务运行数据得到的历史业务运行状态特征向量作为样本数据,并根据历史业务运行状态对样本数据进行标注。训练单元342适于:利用样本数据和与样本数据对应的标注结果进行训练,得到业务运行分析模型。
可选地,该装置还包括:匹配模块350。匹配模块350适于:在字典中查询与业务运行状态分析结果相匹配的业务运行状态,并将相匹配的业务运行状态确定为目标业务运行状态。
可选地,该装置还包括:判断模块360和报警模块370。
判断模块360适于:判断目标业务运行状态是否为异常状态。其中,异常状态包括:数据流量上升、执行器处理能力不足、执行器工作异常和/或执行器数据倾斜。
报警模块370适于:若判断模块360判断得到目标业务运行状态为异常状态,则进行报警提醒。
根据本实施例提供的业务运行状态分析装置,将业务运行状态特征向量输入至经过训练的业务运行分析模型中能够方便、快速地得到对应的业务运行状态分析结果,有效地提高了业务运行状态分析效率;并且在对业务运行数据进行预处理的过程中,针对业务运行状态特征向量的每个特征元素,根据与该特征元素对应的逻辑映射规则,将相应的至少一个数据提取维度对应的业务运行数据进行映射处理,得到该特征元素的特征值,从而便捷地得到业务运行状态特征向量,具有较高的预处理效率;另外,还能够在业务运行状态为异常状态的情况下,自动地进行报警提醒,使得业务运维人员能够及时了解到业务运行过程中所存在的异常状态,以便尽快对业务进行维护。
本发明还提供了一种非易失性计算机存储介质,计算机存储介质存储有至少一可执行指令,可执行指令可执行上述任意方法实施例中的业务运行状态分析方法。
图4示出了根据本发明实施例的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图4所示,该计算设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:
处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。
通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器402,用于执行程序410,具体可以执行上述业务运行状态分析方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序410具体可以用于使得处理器402执行上述任意方法实施例中的业务运行状态分析方法。程序410中各步骤的具体实现可以参见上述业务运行状态分析实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了:A1.一种业务运行状态分析方法,所述方法基于经过训练的业务运行分析模型而执行,所述方法包括:
依据预先设置的多个数据提取维度,提取与多个数据提取维度对应的业务运行过程中产生的业务运行数据;
按照逻辑映射规则,对所述业务运行数据进行预处理,得到业务运行状态特征向量;
利用所述业务运行分析模型对所述业务运行状态特征向量进行分析,得到业务运行状态分析结果。
A2.根据A1所述的方法,其中,所述按照逻辑映射规则,对所述业务运行数据进行预处理,得到业务运行状态特征向量进一步包括:
针对所述业务运行状态特征向量的每个特征元素,获取与该特征元素对应的逻辑映射规则;
根据与该特征元素对应的所述逻辑映射规则,将相应的至少一个数据提取维度对应的业务运行数据进行映射处理,得到该特征元素的特征值。
A3.根据A1或A2所述的方法,其中,所述利用所述业务运行分析模型对所述业务运行状态特征向量进行分析,得到业务运行状态分析结果进一步包括:
将所述业务运行状态特征向量输入至所述业务运行分析模型中,得到业务运行状态分析结果。
A4.根据A1-A3任一项所述的方法,其中,在所述利用所述业务运行分析模型对所述业务运行状态特征向量进行分析,得到业务运行状态分析结果之后,所述方法还包括:
在字典中查询与所述业务运行状态分析结果相匹配的业务运行状态,并将相匹配的业务运行状态确定为目标业务运行状态。
A5.根据A4所述的方法,其中,在所述在字典中查询与所述业务运行状态分析结果相匹配的业务运行状态,并将相匹配的业务运行状态确定为目标业务运行状态之后,所述方法还包括:
判断所述目标业务运行状态是否为异常状态;若是,则进行报警提醒。
A6.根据A5所述的方法,其中,所述异常状态包括:数据流量上升、执行器处理能力不足、执行器工作异常和/或执行器数据倾斜。
A7.根据A1-A6任一项所述的方法,其中,所述业务运行分析模型的训练步骤包括:
将根据与多个数据提取维度对应的历史业务运行数据得到的历史业务运行状态特征向量作为样本数据,并根据历史业务运行状态对所述样本数据进行标注;
利用所述样本数据和与所述样本数据对应的标注结果进行训练,得到业务运行分析模型。
A8.根据A1-A7任一项所述的方法,其中,所述多个数据提取维度包括:执行器延迟时间维度、执行器数据处理成功数量维度、执行器数据处理失败数量维度、执行器启动时间维度、执行器待处理数据数量维度、业务总延迟时间维度、业务数据处理成功总数量维度、业务数据处理失败总数量维度、业务启动时间维度和/或业务待处理数据总数量维度。
A9.根据A1-A8任一项所述的方法,其中,所述方法适用于流式处理框架。
本发明还公开了:B10.一种业务运行状态分析装置,所述装置基于经过训练的业务运行分析模型而运行,所述装置包括:
提取模块,适于依据预先设置的多个数据提取维度,提取与多个数据提取维度对应的业务运行过程中产生的业务运行数据;
预处理模块,适于按照逻辑映射规则,对所述业务运行数据进行预处理,得到业务运行状态特征向量;
分析模块,适于利用所述业务运行分析模型对所述业务运行状态特征向量进行分析,得到业务运行状态分析结果。
B11根据B10所述的装置,其中,所述预处理模块进一步适于:
针对所述业务运行状态特征向量的每个特征元素,获取与该特征元素对应的逻辑映射规则;
根据与该特征元素对应的所述逻辑映射规则,将相应的至少一个数据提取维度对应的业务运行数据进行映射处理,得到该特征元素的特征值。
B12.根据B10或B11所述的装置,其中,所述分析模块进一步适于:
将所述业务运行状态特征向量输入至所述业务运行分析模型中,得到业务运行状态分析结果。
B13.根据B10-B12任一项所述的装置,其中,所述装置还包括:
匹配模块,适于在字典中查询与所述业务运行状态分析结果相匹配的业务运行状态,并将相匹配的业务运行状态确定为目标业务运行状态。
B14.根据B13所述的装置,其中,所述装置还包括:
判断模块,适于判断所述目标业务运行状态是否为异常状态;
报警模块,适于若所述判断模块判断得到所述目标业务运行状态为异常状态,则进行报警提醒。
B15.根据B14所述的装置,其中,所述异常状态包括:数据流量上升、执行器处理能力不足、执行器工作异常和/或执行器数据倾斜。
B16.根据B10-B15任一项所述的装置,其中,所述装置还包括:模型训练模块;
所述模型训练模块包括:
样本确定单元,适于将根据与多个数据提取维度对应的历史业务运行数据得到的历史业务运行状态特征向量作为样本数据,并根据历史业务运行状态对所述样本数据进行标注;
训练单元,适于利用所述样本数据和与所述样本数据对应的标注结果进行训练,得到业务运行分析模型。
B17.根据B10-B16任一项所述的装置,其中,所述多个数据提取维度包括:执行器延迟时间维度、执行器数据处理成功数量维度、执行器数据处理失败数量维度、执行器启动时间维度、执行器待处理数据数量维度、业务总延迟时间维度、业务数据处理成功总数量维度、业务数据处理失败总数量维度、业务启动时间维度和/或业务待处理数据总数量维度。
B18.根据B10-B17任一项所述的装置,其中,所述装置适用于流式处理框架。
本发明还公开了:C19.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如A1-A9中任一项所述的业务运行状态分析方法对应的操作。
本发明还公开了:D20.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如A1-A9中任一项所述的业务运行状态分析方法对应的操作。

Claims (10)

1.一种业务运行状态分析方法,所述方法基于经过训练的业务运行分析模型而执行,所述方法包括:
依据预先设置的多个数据提取维度,提取与多个数据提取维度对应的业务运行过程中产生的业务运行数据;
按照逻辑映射规则,对所述业务运行数据进行预处理,得到业务运行状态特征向量;
利用所述业务运行分析模型对所述业务运行状态特征向量进行分析,得到业务运行状态分析结果。
2.根据权利要求1所述的方法,其中,所述按照逻辑映射规则,对所述业务运行数据进行预处理,得到业务运行状态特征向量进一步包括:
针对所述业务运行状态特征向量的每个特征元素,获取与该特征元素对应的逻辑映射规则;
根据与该特征元素对应的所述逻辑映射规则,将相应的至少一个数据提取维度对应的业务运行数据进行映射处理,得到该特征元素的特征值。
3.根据权利要求1或2所述的方法,其中,所述利用所述业务运行分析模型对所述业务运行状态特征向量进行分析,得到业务运行状态分析结果进一步包括:
将所述业务运行状态特征向量输入至所述业务运行分析模型中,得到业务运行状态分析结果。
4.根据权利要求1-3任一项所述的方法,其中,在所述利用所述业务运行分析模型对所述业务运行状态特征向量进行分析,得到业务运行状态分析结果之后,所述方法还包括:
在字典中查询与所述业务运行状态分析结果相匹配的业务运行状态,并将相匹配的业务运行状态确定为目标业务运行状态。
5.根据权利要求4所述的方法,其中,在所述在字典中查询与所述业务运行状态分析结果相匹配的业务运行状态,并将相匹配的业务运行状态确定为目标业务运行状态之后,所述方法还包括:
判断所述目标业务运行状态是否为异常状态;若是,则进行报警提醒。
6.根据权利要求5所述的方法,其中,所述异常状态包括:数据流量上升、执行器处理能力不足、执行器工作异常和/或执行器数据倾斜。
7.根据权利要求1-6任一项所述的方法,其中,所述业务运行分析模型的训练步骤包括:
将根据与多个数据提取维度对应的历史业务运行数据得到的历史业务运行状态特征向量作为样本数据,并根据历史业务运行状态对所述样本数据进行标注;
利用所述样本数据和与所述样本数据对应的标注结果进行训练,得到业务运行分析模型。
8.一种业务运行状态分析装置,所述装置基于经过训练的业务运行分析模型而运行,所述装置包括:
提取模块,适于依据预先设置的多个数据提取维度,提取与多个数据提取维度对应的业务运行过程中产生的业务运行数据;
预处理模块,适于按照逻辑映射规则,对所述业务运行数据进行预处理,得到业务运行状态特征向量;
分析模块,适于利用所述业务运行分析模型对所述业务运行状态特征向量进行分析,得到业务运行状态分析结果。
9.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的业务运行状态分析方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的业务运行状态分析方法对应的操作。
CN201810908458.5A 2018-08-10 2018-08-10 业务运行状态分析方法、装置、计算设备及存储介质 Active CN108960455B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810908458.5A CN108960455B (zh) 2018-08-10 2018-08-10 业务运行状态分析方法、装置、计算设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810908458.5A CN108960455B (zh) 2018-08-10 2018-08-10 业务运行状态分析方法、装置、计算设备及存储介质

Publications (2)

Publication Number Publication Date
CN108960455A true CN108960455A (zh) 2018-12-07
CN108960455B CN108960455B (zh) 2022-04-26

Family

ID=64469150

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810908458.5A Active CN108960455B (zh) 2018-08-10 2018-08-10 业务运行状态分析方法、装置、计算设备及存储介质

Country Status (1)

Country Link
CN (1) CN108960455B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109783324A (zh) * 2018-12-11 2019-05-21 平安科技(深圳)有限公司 系统运行预警方法及装置
CN111950641A (zh) * 2020-08-14 2020-11-17 中国工商银行股份有限公司 一种业务处理方法、模型训练方法、装置及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103870904A (zh) * 2012-12-12 2014-06-18 中国移动通信集团公司 一种PaaS平台健康状态管理方法和装置
US20160196514A1 (en) * 2015-01-05 2016-07-07 International Business Machines Corporation Detecting business anomalies utilizing information velocity and other parameters using statistical analysis
CN105975604A (zh) * 2016-05-12 2016-09-28 清华大学 一种分布迭代式数据处理程序异常检测与诊断方法
CN106844161A (zh) * 2017-02-20 2017-06-13 重庆邮电大学 一种带状态流计算系统中的异常监控及预测方法和系统
CN107526666A (zh) * 2017-07-17 2017-12-29 阿里巴巴集团控股有限公司 基于深度学习的报警方法、系统、装置以及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103870904A (zh) * 2012-12-12 2014-06-18 中国移动通信集团公司 一种PaaS平台健康状态管理方法和装置
US20160196514A1 (en) * 2015-01-05 2016-07-07 International Business Machines Corporation Detecting business anomalies utilizing information velocity and other parameters using statistical analysis
CN105975604A (zh) * 2016-05-12 2016-09-28 清华大学 一种分布迭代式数据处理程序异常检测与诊断方法
CN106844161A (zh) * 2017-02-20 2017-06-13 重庆邮电大学 一种带状态流计算系统中的异常监控及预测方法和系统
CN107526666A (zh) * 2017-07-17 2017-12-29 阿里巴巴集团控股有限公司 基于深度学习的报警方法、系统、装置以及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王欣等: "基于隐马尔科夫模型的spark作业异常分析", 《计算机电脑与技术》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109783324A (zh) * 2018-12-11 2019-05-21 平安科技(深圳)有限公司 系统运行预警方法及装置
CN111950641A (zh) * 2020-08-14 2020-11-17 中国工商银行股份有限公司 一种业务处理方法、模型训练方法、装置及设备

Also Published As

Publication number Publication date
CN108960455B (zh) 2022-04-26

Similar Documents

Publication Publication Date Title
Lee et al. A big data analytics platform for smart factories in small and medium-sized manufacturing enterprises: An empirical case study of a die casting factory
Hahn et al. Probabilistic reachability for parametric Markov models
CN109784391A (zh) 基于多模型的样本标注方法及装置
CN109324793A (zh) 支持算法组件化的处理系统及方法
CN107315961A (zh) 程序漏洞检测方法及装置、计算设备、存储介质
CN113687972B (zh) 业务系统异常数据的处理方法、装置、设备及存储介质
CN110378529B (zh) 一种数据生成的方法、装置、可读存储介质和电子设备
CN108960455A (zh) 业务运行状态分析方法、装置、计算设备及存储介质
CN109445774A (zh) 基于图元化操作的业务处理方法及装置
CN115981902A (zh) 一种细粒度分布式微服务系统异常根因定位方法及装置
CN108959929A (zh) 程序文件处理方法及装置
CN116186267A (zh) 政策数据处理方法、装置、计算机设备及存储介质
CN115484112A (zh) 支付大数据安全防护方法、系统及云平台
CN106648839A (zh) 数据处理的方法和装置
CN114926042A (zh) 网点物流监控方法、装置、设备及存储介质
WO2018182442A1 (en) Machine learning system and method for generating a decision stream and automonously operating device using the decision stream
CN109343856A (zh) 自定义算法组件的生成方法及装置
CN111062827B (zh) 一种基于人工智能模式的工程监理方法
CN108920295A (zh) 系统异常的处理方法、装置及系统
CN111193631B (zh) 信息处理方法、系统和计算机可读存储介质
CN106203753B (zh) 软件运营中运营问题的流转方法和系统
CN109684632A (zh) 一种自然语义理解的方法、装置、计算设备
US20190034458A1 (en) System and method for use of business intelligence for rule based manufacturing process design
CN115641176A (zh) 一种数据分析方法及ai系统
CN109298947A (zh) 分布式系统中的数据处理方法及装置、计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant