CN117632424A - 任务处理方法、装置、设备及存储介质 - Google Patents

任务处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117632424A
CN117632424A CN202311625930.1A CN202311625930A CN117632424A CN 117632424 A CN117632424 A CN 117632424A CN 202311625930 A CN202311625930 A CN 202311625930A CN 117632424 A CN117632424 A CN 117632424A
Authority
CN
China
Prior art keywords
processing
streaming
service data
batch processing
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311625930.1A
Other languages
English (en)
Inventor
张宏兵
吴成杰
郑凡奇
黄婷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202311625930.1A priority Critical patent/CN117632424A/zh
Publication of CN117632424A publication Critical patent/CN117632424A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种任务处理方法、装置、设备及存储介质,可以应用于大数据技术领域或金融技术领域。该方法包括:获取运维监测平台执行监测任务所需要的业务数据;根据用于流式处理的标识和用于批量式处理的标识对业务数据进行拆分,生成流式处理集和批量式处理集;对流式处理集中的业务数据进行实时计算得到流式处理结果,以及在批量式处理集的业务数据的数目达到预定数目的情况下,对批量式处理集中的业务数据进行批量化处理,得到批量式处理结果;将流式处理结果和批量式处理结果存储到目标数据库中;根据存储在目标数据库中的流式处理结果和批量式处理结果,生成与监测任务相关联的任务结果。

Description

任务处理方法、装置、设备及存储介质
技术领域
本公开涉及大数据技术领域或金融技术领域,尤其涉及一种任务处理方法、装置、设备、存储介质和程序产品。
背景技术
随着大数据技术的发展,大量的数据会存储到多个数据库中。而BI(BusinessIntelligent,商业智能)工具可以与多个数据库进行交互,以从多个数据库中读取数据,并对获取到的数据进行分析得到分析结果,从而可以为企业决策者的决策提供依据。因此,BI工具一般应用在各大企业中,可以用于对业务的运维处理。
在实现本公开发明构思的过程中,发明人发现相关技术中一般会存在以下问题:由于BI工具在对业务进行运维的过程中,会与多个数据库发生交互,这就导致了对业务的运维过程存在业务处理效率低以及资源消耗高的问题。
发明内容
鉴于上述问题,本公开提供了一种任务处理方法、装置、设备、介质和程序产品。
本公开的一个方面提供了一种任务处理方法,包括:获取运维监测平台执行监测任务所需要的业务数据,其中,上述业务数据中携带有获取过程中所采用的获取策略的标识,上述获取策略的标识包括用于流式处理的标识和用于批量式处理的标识;根据上述用于流式处理的标识和上述用于批量式处理的标识对上述业务数据进行拆分,并根据上述业务数据中携带有上述用于流式处理的标识的业务数据生成流式处理集,根据上述业务数据中携带有上述用于批量式处理标识的业务数据生成批量式处理集;对上述流式处理集中的业务数据进行实时计算得到流式处理结果,以及在上述批量式处理集的业务数据的数目达到预定数目的情况下,对上述批量式处理集中的业务数据进行批量化处理,得到批量式处理结果;将上述流式处理结果和上述批量式处理结果存储到目标数据库中;根据存储在上述目标数据库中的上述流式处理结果和上述批量式处理结果,生成与上述监测任务相关联的任务结果。
根据本公开的实施例,上述运维监测平台关联有用于执行业务的服务器;上述获取运维监测平台执行监测任务所需要的业务数据,包括:对上述服务器在执行业务过程中的服务器属性信息进行采集,得到属性信息子集;对上述运维监测平台通过响应用户的操作所产生的运行信息进行采集,得到操作运行信息子集;对上述运维监测平台所能接收到的辅助信息进行采集,得到辅助信息子集;基于上述属性信息子集、上述操作运行信息子集以及上述辅助信息子集,生成上述业务数据。
根据本公开的实施例,上述属性信息子集和上述操作运行信息子集中均携带有上述用于流式处理的标识,上述辅助信息子集中携带有上述用于批量式处理的标识;上述根据上述用于流式处理的标识和上述用于批量式处理的标识对上述业务数据进行拆分,并根据上述业务数据中携带有上述用于流式处理的标识的业务数据生成流式处理集,根据上述业务数据中携带有上述用于批量式处理标识的业务数据生成批量式处理集,包括:根据携带有用于流式处理的标识的属性信息子集和操作运行信息子集,生成流式处理集;根据携带有用于批量式处理的标识的辅助信息子集,得到批量式处理集。
根据本公开的实施例,上述对上述流式处理集中的业务数据进行实时计算得到流式处理结果,包括:对上述流式处理集中的业务数据的进行数据明细分析,得到数据明细分析结果;将上述数据明细分析结果上传到第一消息队列中;对上述第一消息队列中的上述数据明细分析结果进行汇总,输出上述流式处理结果。
根据本公开的实施例,上述方法还包括:从上述批量式处理集中提取出需要进行流式处理的业务数据,生成第一数据组;将上述第一数据组和上述流式处理集上传到第二消息队列中;对上述第二消息队列中的上述第一数据组和上述流式处理集进行实时计算,得到上述流式处理结果。
根据本公开的实施例,上述运维监测平台配置有与上述服务器属性信息相对应的阈值;上述方法还包括:将上述属性信息子集中的属性信息与上述阈值进行比较;在监测到上述属性信息子集中的属性信息有超过阈值的情况下,生成并向目标对象发送告警信息。
根据本公开的实施例,上述根据存储在上述目标数据库中的上述流式处理结果和上述批量式处理结果,生成与上述监测任务相关联的任务结果包括:基于上述流式处理结果和上述批量式处理结果,构建任务报告文件;向上述目标对象展示上述任务报告文件。
根据本公开的实施例,上述服务器属性信息包括以下至少之一:上述服务器的中央处理器参数值、上述服务器的内存参数值、上述服务器的程序参数值、上述服务器的磁盘空间参数值。
根据本公开的实施例,上述操作运行信息子集包括以下至少之一:上述用户的操作信息、运行上述用户操作所产生的组件执行信息、组件基本信息、接口运行信息、组件的血缘关系。
本公开的另一方面还提供了一种任务处理装置,包括:获取模块,用于获取运维监测平台执行监测任务所需要的业务数据,其中,上述业务数据中携带有获取过程中所采用的获取策略的标识,上述获取策略的标识包括用于流式处理的标识和用于批量式处理的标识;拆分模块,用于根据上述用于流式处理的标识和上述用于批量式处理的标识对上述业务数据进行拆分,并根据上述业务数据中携带有上述用于流式处理的标识的业务数据生成流式处理集,根据上述业务数据中携带有上述用于批量式处理标识的业务数据生成批量式处理集;处理模块,用于对上述流式处理集中的业务数据进行实时计算得到流式处理结果,以及在上述批量式处理集的业务数据的数目达到预定数目的情况下,对上述批量式处理集中的业务数据进行批量化处理,得到批量式处理结果;存储模块,用于将上述流式处理结果和上述批量式处理结果存储到目标数据库中;生成模块,用于根据存储在上述目标数据库中的上述流式处理结果和上述批量式处理结果,生成与上述监测任务相关联的任务结果。
本公开的另一方面还提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器执行上述的任务处理方法。
本公开的另一方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述的任务处理方法。
本公开的另一方面还提供了一种计算机程序产品,包括计算机程序,上述计算机程序被处理器执行时实现根据上述的任务处理方法。
根据本公开实施例提供的任务处理方法、装置、设备及存储介质,通过获取运维监测平台执行监测任务所需要的业务数据,根据业务数据携带的用于流式处理的标识和用于批量式处理的标识,将业务数据拆分为流式处理集和批量式处理集;对流式处理集中的业务数据进行实时计算得到流式处理结果,以及在批量式业务处理集中的业务数据的数目达到预定数目的情况下再进行批量式处理,从而得到批量式处理结果;将流式处理结果和所述批量式处理结果均存储到目标数据库中;基于目标数据库中的流式处理结果和批量式处理结果,生成任务结果。由于在任务处理过程中,BI工具可以与一个目标数据库进行交互,并根据目标数据库中的流式处理结果和批量式处理结果,生成任务结果至少部分地克服了相关技术中BI工具会与多个数据库发生交互的问题,进而达到了提高业务处理效率,以及降低资源消耗的技术效果。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的任务处理方法、装置、设备、介质和程序产品的应用场景图;
图2示意性示出了根据本公开实施例的任务处理方法的流程图;
图3示意性示出了根据本公开实施例的对业务数据进行处理的流程图;
图4示意性示出了根据本公开实施例的展示任务结果的流程图;
图5示意性示出了根据本公开实施例的实现任务处理方法的任处理系统的架构图;
图6示意性示出了根据本公开实施例的数据来源模块的架构图;
图7示意性示出了根据本公开实施例的流批一体计算模块的架构图;
图8示意性示出了根据本公开实施例的数据存储模块的架构图;
图9示意性示出了根据本公开实施例的BI报表展示模块的架构图;
图10示意性示出了根据本公开实施例的任务处理装置的结构框图;以及
图11示意性示出了根据本公开实施例的适于实现任务处理方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
在本发明的技术方案中,所涉及的用户信息(包括但不限于用户个人信息、用户图像信息、用户设备信息,例如位置信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、存储、使用、加工、传输、提供、公开和应用等处理,均遵守相关国家和地区的相关法律法规和标准,采取了必要保密措施,不违背公序良俗,并提供有相应的操作入口,供用户选择授权或者拒绝。
随着大数据技术的发展,各种数据库如clickhouse(Click Stream,DataWareHouse,一种列式分布式数据库)、mppdb(一种分布式并行数据库集群)、hive(一种数据仓库工具)等越来越受到用户的青睐。每种数据库都有各自的优势,例如读取速度快,或者存储范围广,又或者支持分布式存储等。业务系统中的各项功能数据以及执行运维监测任务得到数据会根据数据的性质存储到不同的数据库中。因此,现有技术的BI工具会在不同的数据库中执行运维监测任务,并对从数据库中获取到的数据进行处理得到任务结果。该任务结果可以为企业的决策者提供决策依据。
基于相关技术的方案,虽然BI工具的运维处理可以从不同的数据库中获取数据,发挥了这些数据库各自的优点,但会导致数据的时效性不一致。同时,在执行表关联操作的情况下,因为数据是来源于不同的数据库,而在不同源数据库之间的数据计算过程,一般是在内存中进行,难以下推到数据库,进而导致计算时间久,无法达到实时或准实时的运维处理目的。此外,在一些时序数据的处理中还需要连接一些静态指标进行计算,导致处理过程复杂;而且,现有的BI工具也难以关联机器学习模型进行行为预测。总体上,现有的BI工具存在业务处理效率低、资源消耗高的问题。
有鉴于此,本公开的实施例提供了一种任务处理方法、装置、设备、存储介质和程序产品,用于提高BI工具的业务处理效率,降低资源消耗,为1-5-10运维策略(1分钟发现问题,5分钟定位问题原因,10分钟解决问题)提供保障。具体地,该方法包括:获取运维监测平台执行监测任务所需要的业务数据,其中,业务数据中携带有获取过程中所采用的获取策略的标识,获取策略的标识包括用于流式处理的标识和用于批量式处理的标识;根据用于流式处理的标识和用于批量式处理的标识对业务数据进行拆分,并根据业务数据中携带有用于流式处理的标识的业务数据生成流式处理集,根据业务数据中携带有用于批量式处理标识的业务数据生成批量式处理集;对流式处理集中的业务数据进行实时计算得到流式处理结果,以及在批量式处理集的业务数据的数目达到预定数目的情况下,对批量式处理集中的业务数据进行批量化处理,得到批量式处理结果;将流式处理结果和批量式处理结果存储到目标数据库中;根据存储在目标数据库中的流式处理结果和批量式处理结果,生成与监测任务相关联的任务结果。
需要说明的是,本公开实施例确定的任务处理方法和装置可用于大数据技术领域或金融科技领域,也可用于除大数据技术领域或金融科技领域之外的任意领域,本公开实施例对确定的任务处理方法和装置的应用领域不做限定。
图1示意性示出了根据本公开实施例的任务处理方法、装置、设备、介质和程序产品的应用场景图。
如图1所示,根据该实施例的应用场景100可以包括第一终端设备101、第二终端设备102、第三终端设备103、网络104、运维监测平台105和服务器106。网络104用以在第一终端设备101、第二终端设备102、第三终端设备103和运维监测平台105之间、运维监测平台105与服务器106之间、服务器105与第一终端设备101、第二终端设备102、第三终端设备103之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用第一终端设备101、第二终端设备102、第三终端设备103中的至少一个通过网络104与运维监测平台105交互,以发送监测任务或接收任务结果等,其中,监测任务也可以是运维监测平台105根据定时任务执行的。第一终端设备101、第二终端设备102、第三终端设备103上可以安装有各种通讯客户端应用,例如执行监测任务的应用、运维应用、购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
第一终端设备101、第二终端设备102、第三终端设备103可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
运维监测平台105可以执行以下至少一种操作:接收监测任务、分配监测任务、执行监测任务、向终端设备反馈任务结果等。
服务器106可以是提供各种服务的服务器,例如对监测任务提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的监测任务等数据进行分析等处理,并将处理结果(例如根据监测任务获取或生成的任务结果、网页、信息、或数据等)反馈给运维监测平台。在另一实施例中,服务器106也可以直接将根据监测任务获取或生成的任务结果反馈给终端设备。
需要说明的是,本公开实施例所提供的任务处理方法一般可以由服务器106执行。相应地,本公开实施例所提供的任务处理装置一般可以设置于服务器106中。本公开实施例所提供的任务处理方法也可以由不同于服务器105且能够与运维监测平台105、第一终端设备101、第二终端设备102、第三终端设备103和/或服务器106通信的服务器或服务器集群执行。相应地,本公开实施例所提供的任务处理装置也可以设置于不同于服务器105且能够与运维监测平台105、第一终端设备101、第二终端设备102、第三终端设备103和/或服务器106通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络、运维监测平台和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络、运维监测平台和服务器。
以下将基于图1描述的场景,通过图2~图4对本公开实施例的任务处理方法进行详细描述。
图2示意性示出了根据本公开实施例的任务处理方法的流程图。
如图2所示,该实施例的任务处理方法的操作步骤可以包括操作S210~操作S250。
在操作S210,获取运维监测平台执行监测任务所需要的业务数据,其中,业务数据中携带有获取过程中所采用的获取策略的标识,获取策略的标识包括用于流式处理的标识和用于批量式处理的标识。
在操作S220,根据用于流式处理的标识和用于批量式处理的标识对业务数据进行拆分,并根据业务数据中携带有用于流式处理的标识的业务数据生成流式处理集,根据业务数据中携带有用于批量式处理标识的业务数据生成批量式处理集。
在操作S230,对流式处理集中的业务数据进行实时计算得到流式处理结果,以及在批量式处理集的业务数据的数目达到预定数目的情况下,对批量式处理集中的业务数据进行批量化处理,得到批量式处理结果。
在操作S240,将流式处理结果和批量式处理结果存储到目标数据库中。
在操作S250,根据存储在目标数据库中的流式处理结果和批量式处理结果,生成与监测任务相关联的任务结果。
根据本公开的实施例,运维监测平台可以用于接收以及分发监测任务,该监测任务可以是用户通过终端设备发送的,也可以是运维监测平台定时触发的监测任务。监测任务可以是用于监测业务运行情况的任务,例如监测业务处理过程中,服务器的运行情况,用户的操作情况等,以保障业务的正常运行。
根据本公开的实施例,获取策略可以分为实时获取和非实时获取。实时获取到的业务数据可以为动态数据,非实时获取到的数据可以为静态数据。由于实时获取到的业务数据可以是用于后续流式处理的,非实时获取到的业务数据可以是用于后续批量式处理的,所以,实时获取到的业务数据可以携带有用于流式处理的标识,非实时获取到的业务数据可以携带有用于批量式处理的标识。用于流式处理的标识可以是“流式”字段,用于批量式处理的标识可以是“批量式”字段。用于流式处理的标识以及用于批量式处理的标识均可以根据实际需要进行适应性设置。
根据本公开的实施例,业务数据可以包括服务器基本属性信息、运维监测平台通过响应用户的操作所产生的运行信息,以及运维监测平台所能接收到的辅助信息等。示例性的,服务器基本属性信息可以包括服务器中央处理器(Central Processing Unit,CPU)参数值等。运维监测平台通过响应用户的操作所产生的运行信息,可以包括运维监测响应于用户的搜索操作,与搜索操作相关联的数据集和报告的执行信息等。辅助信息可以包括运维监测平台所能接收到的机器学习模型结果等。
根据本公开的实施例,获取策略的选取,可以根据所要采集的业务数据的属性确定。具体地,对于服务器基本属性信息以及运维监测平台通过响应用户的操作所产生的运行信息,可以采用实时获取策略,通过脚本程序进行实时或每隔第一预设时间段进行实时采集。对于辅助信息等批量化的数据,可以采用非实时获取策略,例如通过脚本程序每隔第二预设时间段进行采集。可以理解的是,第二预设时间段可以大于第一预设时间段,而且非实时获取策略可以不抢占优先级,按照顺序进行采集;实时获取策略可以抢占优先级采集数据。可以理解的是,第一预设时间段以及第二预设时间段均可以根据实际需要进行适应性调整。
根据本公开的实施例,在上述获取策略下,业务数据中的服务器基本属性信息以及运维监测平台通过响应用户的操作所产生的运行信息由于是利用实时获取策略采集的,进而根据这些信息携带的用于流式处理的标识可以对这些信息进行汇总,以生成流式处理集;辅助信息等批量化的数据由于是利用非实时获取策略采集的,进而根据这些信息携带的用于批量式处理的标识可以对这些信息进行汇总,以生成批量式处理集。可选地,辅助信息中也可以存在一部分需要流式处理的业务数据,作为流式处理的辅助参考业务数据,例如由于占用空间大、资源消耗大,或者是非结构化数据等,难以实时采集,否则会降低监测任务的执行效率。因此,这部分的业务数据可以通过非实时获取策略先采集到辅助信息中,在需要进行流式计算的过程中,从辅助信息获取该部分的业务数据,以进行流式计算。
根据本公开的实施例,对流式处理集和批量式处理集进行的处理可以包括流式处理和批量式处理。具体地,对流式处理集中的业务数据可以采用流式处理。在流式处理中,数据是即时处理的,逐个记录或数据进入流式处理中会立即被处理。这种方式可以适用于需要实时响应和得到即时结果的场景,比如实时监控、实时分析等。流处理通常通过流水线的方式进行,数据在流水线中依次经过不同的处理阶段,每个阶段都对数据进行一些操作。对批量式处理集的业务数据可以采用批量式处理。具体地,批量式处理是将一批数据一起处理。数据可以先被收集到预定数目的批次中,然后在一个较长的时间窗口内进行处理。批处理通常用于离线分析、大规模数据处理等场景。预定数目可以根据实际需要进行适应性设置。
根据本公开的实施例,通过将这流式处理和批量式处理的方式结合起来,可以充分结合流处理和批量式处理的优势。流式处理和批量式处理同时进行,可以在一定程度上减少执行监测任务的延迟,提高业务处理的效率和时效性。
根据本公开的实施例,流式处理结果可以是对流式处理集中的业务数据进行处理得到的结果,例如根据流式处理集中的一业务接口在处理业务的一段时间内的响应时间,得到该接口在该段时间内的平均响应时间。又例如根据服务器的基本信息计算出的服务器CPU的平均性能、服务器CPU的最大性能;又例如,根据运维监测平台通过响应用户的操作所产生的运行信息,计算出的每个报告的执行时间段、报告的最大执行时间段、报告的运行时间段;又例如运行时间大于15s的sql语句等。批量式处理结果可以是对批量式处理集中的业务数据进行处理得到的结果,例如是批量的机器学习模型结果,上游应用的批量运行情况等。
根据本公开的实施例,为便于BI工具中的报表组件能够更快捷的获取数据并展示图表,可以将流式处理结果和批量式处理结果持久存储化到一个目标数据库中,至少部分地避免了BI工具中的报表组件与多个数据库进行交互。其中,目标数据库可以是用于存储流式处理结果和批量式处理结果的数据库,并能够与BI工具进行交互的工具库。在存储时流式处理结果和批量式处理结果时,可以通过OLAP(Online Analytical Processing联机分析处理)引擎或者数据服务的方式,将流式处理结果和批量式处理结果持久化到目标数据库中。
根据本公开的实施例,存储在目标数据库中的流式处理结果和批量式处理结果可以用于得到监测任务的任务结果。具体地,BI报表组件可以将服务器性能指标、运维监测平台报表运行情况、sql语句运行情况、用户操作行为情况、接口返回状态等数据,通过直方图、折线图、饼图、明细表等表格组件进行展示。在另一实施例中,BI报表组件还可以定时刷新并展示数据,以供决策人员了解整个BI工具的运行情况。
根据本公开实施例提供的任务处理方法、装置、设备及存储介质,通过获取运维监测平台执行监测任务所需要的业务数据,根据业务数据携带的用于流式处理的标识和用于批量式处理的标识,将业务数据拆分为流式处理集和批量式处理集;对流式处理集中的业务数据进行实时计算得到流式处理结果,以及在批量式业务处理集中的业务数据的数目达到预定数目的情况下再进行批量式处理,从而得到批量式处理结果;将流式处理结果和所述批量式处理结果均存储到目标数据库中;基于目标数据库中的流式处理结果和批量式处理结果,生成任务结果。由于在任务处理过程中,BI工具可以与一个目标数据库进行交互,并根据目标数据库中的流式处理结果和批量式处理结果,生成任务结果至少部分地克服了相关技术中BI工具会与多个数据库发生交互的问题,进而达到了提高业务处理效率,以及降低资源消耗的技术效果。
根据本公开的实施例,运维监测平台可以关联有用于执行业务的服务器。操作S210可以包括如下操作:对服务器在执行业务过程中的服务器属性信息进行采集,得到属性信息子集;对运维监测平台通过响应用户的操作所产生的运行信息进行采集,得到操作运行信息子集;对运维监测平台所能接收到的辅助信息进行采集,得到辅助信息子集,其中,运维监测平台还可以关联有用于执行业务的机器学习模型以及执行业务的上下游应用,辅助信息可以包括机器学习模型的结果以及上下游应用的运行情况数据;基于属性信息子集、操作运行信息子集以及辅助信息子集,生成业务数据。可选的,机器学习模型可以包括用于预测或评估金融相关的风险预测模型和风险评估模型等,机器学习模型的结果可以包括风险预测结果以及风险评估结果等。
根据本公开的实施例,服务器基本属性信息可以包括以下至少之一:服务器的CPU参数值、服务器的内存参数值、服务器的程序IVM(Java Virtual Machine,JAVA虚拟机)参数值、服务器的磁盘空间参数值等。示例性的,CPU参数值可以包括CPU的频率;内存参数值可以包括内存的容量;程序IVM参数值可以包括程序所占用的字节;磁盘空间参数值可以包括磁盘空间的容量等。对采集到的服务器基本属性信息进行汇总,可以得到属性信息子集。
根据本公开的实施例,对于服务器基本属性信息的采集,可以通过如下方式:通过预设脚本程序每隔第三预设时间段,将运维监测平台关联的各服务器的CPU、内存、程序JVM、磁盘空间等基本信息实时采集,并上传到消息队列(kafka)中。其中,第三预设时间段和预设脚本程序均可以根据实际需要进行适应性调整。
根据本公开的实施例,运维监测平台通过响应用户的操作所产生的运行信息可以包括以下至少之一:用户的操作信息(monitor_oper_user)、运行用户操作所产生的组件执行信息(monitor_run_sql、monitor_run_info)、组件基本信息(monitor_dashboard、monitor_qry_type)、接口运行信息(包括sqlcheck、灵活控权、restful等)、组件的血缘关系(monitor_qry_used)等。具体地,用户操作信息可以包括用户登录、在运维监测平台进行的打开、删除等操作,以及登录运维监测平台、执行打开、删除操作的时刻等;运行用户操作所产生的组件执行信息可以包括数据集和报告的执行信息,例如数据集和报告所对应sql(Structured Query Language,数据库语言)语句的执行信息、执行时刻,执行时间段等。组件基本信息可以包括数据集和报告的基本信息,例如sql语句的基本信息、报告和数据集的名称、路径等。接口运行信息可以包括接口的运行情况,例如是否手动打开运行接口、是否为定时自动打开运行接口等。组件的血缘关系可以包括组件与组件上下级的层级关系等。对采集到的运维监测平台通过响应用户的操作所产生的运行信息进行汇总,可以得到操作运行信息子集。
根据本公开的实施例,对运维监测平台通过响应用户的操作所产生的运行信息进行的采集,可以通过如下方式:用户操作信息、数据集和报告的执行信息、报告和数据集的基本信息、血缘关系、接口运行情况都可以是在用户登录到运维监测平台或者创建数据集、制作报表等情况下,实时产生的数据,这些数据可以先保存到日志文件中,通过fluent实时将数据上传到kafka中。
根据本公开的实施例,辅助信息可以包括机器学习模型的结果以及上下游应用的运行情况数据等。示例性的,机器学习模型的结果可以是业务风险分析结果等,上游应用的批量运行情况数据等。对采集到的辅助信息进行汇总,可以得到辅助信息子集。
根据本公开的实施例,对辅助信息的采集,可以通过如下方式:这些辅助信息可以以文件的形式落到服务器上,然后经过批量程序处理好后输出。辅助信息可以作为任务结果的辅助表,用于对监测任务的质量进行预测。辅助信息中的部分信息也可以作为流数据的源数据,与流式处理集一同进行流式处理。
根据本公开的实施例,通过对属性信息子集、操作运行信息子集以及辅助信息子集进行汇总处理,可以得到业务数据。
根据本公开的实施例,基于获取策略运维监测平台执行监测任务所需要的实时数据和非实时数据进行采集,可以将运维监测平台执行监测任务所需要的数据从不同源数据库中提取出来,从而便于后续的BI报表组件分析并展示任务结果,提高了业务处理效率,降低了资源消耗。
图3示意性示出了根据本公开实施例的对业务数据进行处理的流程图。
如图3所示,对流式处理集和批量式处理集的处理过程可以包括操作S310~操作S390。
在操作S310,确定业务数据中携带的获取策略的标识。在获取策略的标识是用于流式处理的标识的情况下,执行操作S320;在获取策略的标识是用于批量式处理的标识的情况下,执行操作S330。
对于获取策略的判断可以根据获取业务数据的获取特点实现。例如,根据获取业务数据的获取间隔时间段进行判断,在获取间隔时间段小于预设时间段阈值的情况下,可以确定为实时获取;在获取间隔时间段大于等于预设时间段阈值的情况下,可以确定为非实时获取。预设时间段阈值可以根据实际需要进行适应性调整。
在操作S320,根据携带有用于流式处理的标识的属性信息子集和操作运行信息子集,生成流式处理集。
在操作S330,根据携带有用于批量式处理的标识的辅助信息子集,得到批量式处理集。
根据本公开的实施例,通过将采集到的业务数据按照获取策略的标识划分为流式处理集和批量式处理集,进而可以同时利用流处理方式和批量处理方式,流处理方式用来保证结果的实时性,批量处理的方式可以保障结果的一致性。
根据本公开的实施例,对于流式处理集和批量式处理集进行处理,得到流式处理结果和批量式处理结果的过程可以包括操作S340~操作S390。
在操作S340,从批量式处理集中提取出需要进行流式处理的业务数据,生成第一数据组。
根据本公开的实施例,上文描述过批量式处理集中可能会存在一部分需要流式处理的业务数据,因此,需要将这部分需要流式处理的业务数据提取出,并进行流式处理。第一数据组中的业务数据,就可以是需要进行流式处理的业务数据。在提取该部分的业务数据时,可以根据业务类型标识进行提取。例如,对于在流式处理过程中要用到但要以非实时的方式获取的辅助参考业务数据,可以预先定义该辅助业务数据的数据类型,在从批量式处理集中提取需要进行流式处理的业务数据时,根据预先定义的数据类型进行提取,提取出符合该数据类型的业务数据,得到流式处理过程中的辅助参考业务数据。
在操作S350,将第一数据组和所述流式处理集上传到第二消息队列中。其中,第二消息队列(Kafka)可以是一种高吞吐量的分布式发布订阅消息系统,可以用于处理实时获取的数据。
对上传到第二消息队列中的第一数据组和流式处理集可以进行实时计算,得到流式处理结果。具体地,对上传到第二消息队列中的第一数据组和流式处理集进行实时计算的过程可以包括操作S360~操作S380。
在操作S360,对流式处理集中的业务数据的进行数据明细分析,得到数据明细分析结果。例如通过实时明细层对第一数据组和流式处理集进行分析处理,得到第一数据组和流式处理子集中的数据明细。
根据本公开的实施例,实时明细层对第二消息队列进行统一的加工,比如清洗、过滤、扩维等,为下游提供直接可用的实时数据明细,增加了数据易用性和复用性。其中,处理方法可以采用flinksql。
在操作S370,将数据明细分析结果上传到第一消息队列中。
根据本公开的实施例,经过实时明细层统一加工后的数据明细上传至第一消息队列。第一消息队列中的数据易于理解和使用,能使用户更好地分析和使用数据。可以理解的是,第二消息队列与第一消息队列的区别可以在于应用的场景不同,第二消息队列主要应用于传输需要流式处理的业务数据;第一消息队列主要应用于传输实时明细层加工后的业务数据。
在操作S380,对第一消息队列中的数据明细分析结果进行汇总,输出流式处理结果。例如通过轻度汇总层,根据第二消息队列中的数据明细,对第一数据组和流式处理子集进行汇总处理,输出流式处理结果。
根据本公开的实施例,轻度汇总层可以对流式处理子集中的业务数据进行汇总处理,例如根据服务器的基本信息计算出的服务器CPU的平均性能、服务器CPU的最大性能;又例如,根据运维监测平台通过响应用户的操作所产生的运行信息,计算出的每个报告的执行时间段、报告的最大执行时间段、报告的运行时间段;又例如运行时间段大于15s的sql语句等。通过流式数据进行明细和汇总处理,可以便于BI报表组件更高效的得到并展示任务结果,提高业务处理效率。
在操作S390,利用预设批量处理策略对批量式处理集的第二数据组进行批量处理,得到批量式处理结果。其中,第二数据组包括批量式处理集中除第一数据组以外的其余业务数据。
根据本公开的实施例,第二数据组中的数据可以为非实时获取的数据,例如机器学习模型结果、上游应用批量运行情况数据等数据。这些数据经过预设批量处理策略进行处理,可以得到批量式处理结果。批量处理与流式处理可以同步进行也可以不同步进行。预设批量处理策略,例如可以是批量汇总机器学习模型结果,对机器学习模型结果进行批量压缩存储等。预设批量处理策略可以根据实际需要进行适应性调整。
根据本公开的实施例,在对第一数据组和流式处理集中的业务数据进行流式处理时,通过采用数据分层处理操作,将数据分别输入到实时明细层、消息队列以及轻度汇总层,合理的分层结构可以减少重复计算的工作,使数据体系更加清晰,使复杂问题得以简化,提高流式处理的效率,进而提高了业务处理效率,降低了资源消耗。
根据本公开的实施例,通过采用流式和批量式一体处理的构思,至少部分的克服了现有技术中BI工具读取数据时存在的,时效性不一致的问题,并为1-5-10运维策略提供有效保障。
根据本公开的实施例,运维监测平台还可以配置有与服务器属性信息相对应的阈值。上述方法还可以包括如下操作:将属性信息子集中的属性信息与阈值进行比较;在监测到属性信息子集中的属性信息有超过阈值的情况下,生成并向目标对象发送告警信息。
根据本公开的实施例,阈值可以是预先设置的,与服务器各个属性(例如CPU频率、内存容量、程序JVM字节、磁盘空间容量等)相对应的阈值。目标对象可以是相关工作人员也可以是自动化监测机器。
示例性的:设置内存的容量阈值为30%,属性信息子集中对应的内存容量为31%时,即存在属性信息子集中的属性信息有超过阈值的情况,在该情况下,可以生成告警信息“内存容量过高”的告警信息,并发送给目标对象。
根据本公开的实施例,通过设置服务器属性阈值,对超过阈值的各种属性指标进行报警通知相关人员解决,可以保障整个运维监测平台的平稳运行。
图4示意性示出了根据本公开实施例的生成任务结果的流程图。
如图4所示,根据存储在目标数据库中的流式处理结果和批量式处理结果,生成与监测任务相关联的任务结果的过程可以包括操作S251~操作S252。
在操作S251,基于流式处理结果和批量式处理结果,构建任务报告文件。
在操作S252,向目标对象展示任务报告文件。
根据本公开的实施例,任务报告文件的形式可以包括图或表,例如直方图、折线图、饼图、明细表、曲线图等。示例性的,直方图可以用于展示在多天或多月或多季度下的业务数据;折线图以及曲线图可以展示数据的变化趋势;饼图可以用于展示业务数据中的占比情况;明细表可以用于展示在1个单位时间段内的业务数据明细情况等。对于图表种类的展示可以根据实际需要进行适应性调整。
根据本公开的实施例,任务报告文件可以用于展示流式处理结果或批量式处理结果中的数据分布特点。例如服务器性能指标的使用情况(示例性的,例如在一周内服务器的资源利用率的分布特点等)、运维监控平台报表运行情况、sql语句运行情况、用户操作行为情况、接口返回状态等数据。在另一实施例中,还可以定时刷新流式处理结果或批量式处理结果中的数据,并分析数据分布特点,以实时展示整个运维监测平台的运行情况。
根据本公开的实施例,通过向目标对象展示任务结果,可以为目标对象提供一种更好理解数据的方式,能够帮助目标对象在数据中发现隐藏的关联性和见解。通过可视化组件,目标对象可以更加灵活地探索数据,从而进行交互式数据分析,为业务的平稳运行提供保障。
图5示意性示出了根据本公开实施例的实现任务处理方法的任处理系统的架构图。
如图5所示,任务处理系统架构可以包括运维监控平台500、数据来源模块510、流批一体计算模块520、数据存储模块530以及BI报表展示模块540。
图6示意性示出了根据本公开实施例的数据来源模块的架构图。
如图6所示,数据来源模块510可以采集服务器属性信息、运维监测平台通过响应用户的操作所产生的运行信息以及辅助信息。数据来源模块510可以用于执行上述操作S210,在此不再赘述。
图7示意性示出了根据本公开实施例的流批一体计算模块的架构图。
如图7所示,流批一体计算模块520可以包括第二消息队列521、实时明细层522、第一消息队列523、轻度汇总层524、批量处理组件525、业务数据库526、访问日志527以及辅助信息库528。其中,业务数据库526存储的是数据采集模块510采集到的服务器属性信息;访问日志527存储的是数据采集模块510采集到的运维监测平台通过响应用户的操作所产生的运行信息;辅助信息库528存储的是510采集到的辅助信息。流批一体计算模块520用于执行上述操作S220~操作S230,在此不再赘述。
图8示意性示出了根据本公开实施例的数据存储模块的架构图。
如图8所示,数据存储模块530可以包括结果接收组件531、数据存储组件532以及目标数据库533。其中,结果接收组件531用于接收流批一体计算模块520输出的结果,例如流式处理结果以及批量式处理结果。存储组件532可以包括OLAP引擎组件或数据服务组件,将结果存储到目标数据库533中。数据存储模块530用于执行上述操作S240,在此不再赘述。
图9示意性示出了根据本公开实施例的BI报表展示模块的架构图。
如图9所示,BI报表展示模块540可以包括获取数据组件541、BI报表展示组件542、监控预警及邮件提醒组件543以及目标对象544。其中,获取数据组件541,可以用于从目标数据库533中获取与监测任务相关联的数据;BI报表展示组件542,可以用于对获取数据组件541进行图表展示,例如直方图、折线图、饼图、明细表、曲线图等;监控预警及邮件提醒组件543,可以用于对服务器的属性信息进行监测,并在又属性信息超过阈值的情况下通知目标对象544。BI报表展示模块540用于执行上述操作S250,以及操作S410~操作S420,在此不再赘述。
根据本公开的实施例,通过提出一种基于流批一体思想的运维监控平台,针对现有BI运维监控从不同的数据库中读取数据造成数据时效性不一致、在表关联的时候因为是不同源的数据库间进行计算只能在内存中进行无法下推到数据库导致运行时间久的问题,通过流批一体思想统一处理数据,可以提高数据的时效性,为1-5-10的运维策略的提供保障,提高业务处理效率以及降低资源消耗。
需要说明的是,本公开实施例中的流程图所示的操作除非明确说明不同操作之间存在执行的先后顺序,或者不同操作在技术实现上存在执行的先后顺序,否则,多个操作之间的执行顺序可以不分先后,多个操作也可以同时执行。
基于上述任务处理方法,本公开还提供了一种任务处理装置。以下将结合图10对该装置进行详细描述。
图10示意性示出了根据本公开实施例的任务处理装置的结构框图。
如图10所示,该实施例的任务处理装置1000包括获取模块1010、拆分模块1020、处理模块1030、存储模块1040和生成模块1050。
获取模块1010,用于获取运维监测平台执行监测任务所需要的业务数据,其中,业务数据中携带有获取过程中所采用的获取策略的标识,获取策略的标识包括用于流式处理的标识和用于批量式处理的标识。
拆分模块1020,用于根据用于流式处理的标识和用于批量式处理的标识对业务数据进行拆分,并根据业务数据中携带有用于流式处理的标识的业务数据生成流式处理集,根据业务数据中携带有用于批量式处理标识的业务数据生成批量式处理集。
处理模块1030,用于对流式处理集中的业务数据进行实时计算得到流式处理结果,以及在批量式处理集的业务数据的数目达到预定数目的情况下,对批量式处理集中的业务数据进行批量化处理,得到批量式处理结果。
存储模块1040,用于将流式处理结果和批量式处理结果存储到目标数据库中。
生成模块1050,用于根据存储在目标数据库中的流式处理结果和批量式处理结果,生成与监测任务相关联的任务结果。
根据本公开实施例提供的任务处理方法、装置、设备及存储介质,通过获取运维监测平台执行监测任务所需要的业务数据,根据业务数据携带的用于流式处理的标识和用于批量式处理的标识,将业务数据拆分为流式处理集和批量式处理集;对流式处理集中的业务数据进行实时计算得到流式处理结果,以及在批量式业务处理集中的业务数据的数目达到预定数目的情况下再进行批量式处理,从而得到批量式处理结果;将流式处理结果和批量式处理结果均存储到目标数据库中;基于目标数据库中的流式处理结果和批量式处理结果,生成任务结果。由于在任务处理过程中,BI工具可以与一个目标数据库进行交互,并根据目标数据库中的流式处理结果和批量式处理结果,生成任务结果至少部分地克服了相关技术中BI工具会与多个数据库发生交互的问题,进而达到了提高业务处理效率,以及降低资源消耗的技术效果。
根据本公开的实施例,获取模块可以包括第一采集子模块、第二采集子模块、第三采集子模块和生成子模块。
第一采集子模块,用于对服务器在执行业务过程中的服务器属性信息进行采集,得到属性信息子集。
第二采集子模块,用于对运维监测平台通过响应用户的操作所产生的运行信息进行采集,得到操作运行信息子集。
第三采集子模块,用于对运维监测平台所能接收到的辅助信息进行采集,得到辅助信息子集。
生成子模块,用于基于属性信息子集、操作运行信息子集以及辅助信息子集,生成业务数据。
根据本公开的实施例,拆分模块可以包括第一生成子模块和第二生成子模块。
第一生成子模块,用于根据携带有用于流式处理的标识的属性信息子集和操作运行信息子集,生成流式处理集。
第二生成子模块,用于根据携带有用于批量式处理的标识的辅助信息子集,得到批量式处理集。
根据本公开的实施例,处理模块可以包括分析单元、上传单元以及汇总单元。
分析单元,用于对流式处理集中的业务数据的进行数据明细分析,得到数据明细分析结果。
上传单元,用于将数据明细分析结果上传到第一消息队列中。
汇总单元,用于对第一消息队列中的数据明细分析结果进行汇总,输出流式处理结果。
根据本公开的实施例,任务处理装置还可以包括提取模块和上传模块。
提取模块,用于从批量式处理集中提取出需要进行流式处理的业务数据,生成第一数据组。
上传模块,用于将第一数据组和流式处理集上传到第二消息队列中。
处理模块,还用于对第二消息队列中的第一数据组和流式处理集进行实时计算,得到流式处理结果。
根据本公开的实施例,任务处理装置还可以包括比较模块和发送模块。
比较模块,用于将属性信息子集中的属性信息与阈值进行比较。
发送模块,用于在监测到属性信息子集中的属性信息有超过阈值的情况下,生成并向目标对象发送告警信息。
根据本公开的实施例,生成模块可以包括构建单元和展示单元。
构建单元,用于基于流式处理结果和批量式处理结果,构建任务报告文件。
展示模块,用于向目标对象展示任务报告文件。
根据本公开的实施例,获取模块1010、拆分模块1020、处理模块1030、存储模块1040和生成模块1050中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,获取模块1010、拆分模块1020、处理模块1030、存储模块1040和生成模块1050中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,获取模块1010、拆分模块1020、处理模块1 030、存储模块1040和生成模块1050中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
需要说明的是,本公开的实施例中任务处理装置部分与本公开的实施例中任务处理方法部分是相对应的,任务处理装置部分的描述具体参考任务处理方法部分,在此不再赘述。
图11示意性示出了根据本公开实施例的适于实现任务处理方法的电子设备的方框图。
如图11所示,根据本公开实施例的电子设备1100包括处理器1101,其可以根据存储在只读存储器(ROM)1102中的程序或者从存储部分1108加载到随机访问存储器(RAM)1103中的程序而执行各种适当的动作和处理。处理器1101例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器1101还可以包括用于缓存用途的板载存储器。处理器1101可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 1103中,存储有电子设备1100操作所需的各种程序和数据。处理器1101、ROM 1102以及RAM 1103通过总线1104彼此相连。处理器1101通过执行ROM 1102和/或RAM1103中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 1102和RAM 1103以外的一个或多个存储器中。处理器1101也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备1100还可以包括输入/输出(I/O)接口1105,输入/输出(I/O)接口1105也连接至总线1104。电子设备1100还可以包括连接至输入/输出(I/O)接口1105的以下部件中的一项或多项:包括键盘、鼠标等的输入部分1106;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1107;包括硬盘等的存储部分1108;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至输入/输出(I/O)接口1105。可拆卸介质1111,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1110上,以便于从其上读出的计算机程序根据需要被安装入存储部分1108。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 1102和/或RAM 1103和/或ROM 1102和RAM 1103以外的一个或多个存储器。
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本公开实施例所提供的任务处理方法。
在该计算机程序被处理器1101执行时执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分1109被下载和安装,和/或从可拆卸介质1111被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
在这样的实施例中,该计算机程序可以通过通信部分1109从网络上被下载和安装,和/或从可拆卸介质1111被安装。在该计算机程序被处理器1101执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (13)

1.一种任务处理方法,包括:
获取运维监测平台执行监测任务所需要的业务数据,其中,所述业务数据中携带有获取过程中所采用的获取策略的标识,所述获取策略的标识包括用于流式处理的标识和用于批量式处理的标识;
根据所述用于流式处理的标识和所述用于批量式处理的标识对所述业务数据进行拆分,并根据所述业务数据中携带有所述用于流式处理的标识的业务数据生成流式处理集,根据所述业务数据中携带有所述用于批量式处理标识的业务数据生成批量式处理集;
对所述流式处理集中的业务数据进行实时计算得到流式处理结果,以及在所述批量式处理集的业务数据的数目达到预定数目的情况下,对所述批量式处理集中的业务数据进行批量化处理,得到批量式处理结果;
将所述流式处理结果和所述批量式处理结果存储到目标数据库中;
根据存储在所述目标数据库中的所述流式处理结果和所述批量式处理结果,生成与所述监测任务相关联的任务结果。
2.根据权利要求1所述的方法,其中,所述运维监测平台关联有用于执行业务的服务器;
所述获取运维监测平台执行监测任务所需要的业务数据,包括:
对所述服务器在执行业务过程中的服务器属性信息进行采集,得到属性信息子集;
对所述运维监测平台通过响应用户的操作所产生的运行信息进行采集,得到操作运行信息子集;
对所述运维监测平台所能接收到的辅助信息进行采集,得到辅助信息子集;
基于所述属性信息子集、所述操作运行信息子集以及所述辅助信息子集,生成所述业务数据。
3.根据权利要求2所述的方法,其中,所述属性信息子集和所述操作运行信息子集中均携带有所述用于流式处理的标识,所述辅助信息子集中携带有所述用于批量式处理的标识;
所述根据所述用于流式处理的标识和所述用于批量式处理的标识对所述业务数据进行拆分,并根据所述业务数据中携带有所述用于流式处理的标识的业务数据生成流式处理集,根据所述业务数据中携带有所述用于批量式处理标识的业务数据生成批量式处理集,包括:
根据携带有所述用于流式处理的标识的所述属性信息子集和所述操作运行信息子集,生成所述流式处理集;
根据携带有所述用于批量式处理的标识的所述辅助信息子集,得到所述批量式处理集。
4.根据权利要求1所述的方法,其中,所述对所述流式处理集中的业务数据进行实时计算得到流式处理结果,包括:
对所述流式处理集中的业务数据的进行数据明细分析,得到数据明细分析结果;
将所述数据明细分析结果上传到第一消息队列中;
对所述第一消息队列中的所述数据明细分析结果进行汇总,输出所述流式处理结果。
5.根据权利要求1所述的方法,还包括:
从所述批量式处理集中提取出需要进行流式处理的业务数据,生成第一数据组;
将所述第一数据组和所述流式处理集上传到第二消息队列中;
对所述第二消息队列中的所述第一数据组和所述流式处理集进行实时计算,得到所述流式处理结果。
6.根据权利要求2所述的方法,其中,所述运维监测平台配置有与所述服务器属性信息相对应的阈值;
所述方法还包括:
将所述属性信息子集中的属性信息与所述阈值进行比较;
在监测到所述属性信息子集中的属性信息有超过阈值的情况下,生成并向目标对象发送告警信息。
7.根据权利要求6所述的方法,其中,所述根据存储在所述目标数据库中的所述流式处理结果和所述批量式处理结果,生成与所述监测任务相关联的任务结果包括:
基于所述流式处理结果和所述批量式处理结果,构建任务报告文件;
向所述目标对象展示所述任务报告文件。
8.根据权利要求2所述的方法,其中,所述服务器属性信息包括以下至少之一:
所述服务器的中央处理器参数值、所述服务器的内存参数值、所述服务器的程序参数值、所述服务器的磁盘空间参数值。
9.根据权利要求2所述的方法,其中,所述操作运行信息子集包括以下至少之一:
所述用户的操作信息、运行所述用户操作所产生的组件执行信息、组件基本信息、接口运行信息、组件的血缘关系。
10.一种任务处理装置,包括:
获取模块,用于获取运维监测平台执行监测任务所需要的业务数据,其中,所述业务数据中携带有获取过程中所采用的获取策略的标识,所述获取策略的标识包括用于流式处理的标识和用于批量式处理的标识;
拆分模块,用于根据所述用于流式处理的标识和所述用于批量式处理的标识对所述业务数据进行拆分,并根据所述业务数据中携带有所述用于流式处理的标识的业务数据生成流式处理集,根据所述业务数据中携带有所述用于批量式处理标识的业务数据生成批量式处理集;
处理模块,用于对所述流式处理集中的业务数据进行实时计算得到流式处理结果,以及在所述批量式处理集的业务数据的数目达到预定数目的情况下,对所述批量式处理集中的业务数据进行批量化处理,得到批量式处理结果;
存储模块,用于将所述流式处理结果和所述批量式处理结果存储到目标数据库中;
生成模块,用于根据存储在所述目标数据库中的所述流式处理结果和所述批量式处理结果,生成与所述监测任务相关联的任务结果。
11.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~9中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~9中任一项所述的方法。
13.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~9中任一项所述的方法。
CN202311625930.1A 2023-11-30 2023-11-30 任务处理方法、装置、设备及存储介质 Pending CN117632424A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311625930.1A CN117632424A (zh) 2023-11-30 2023-11-30 任务处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311625930.1A CN117632424A (zh) 2023-11-30 2023-11-30 任务处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN117632424A true CN117632424A (zh) 2024-03-01

Family

ID=90030062

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311625930.1A Pending CN117632424A (zh) 2023-11-30 2023-11-30 任务处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117632424A (zh)

Similar Documents

Publication Publication Date Title
US11288142B2 (en) Recovery strategy for a stream processing system
US11086687B2 (en) Managing resource allocation in a stream processing framework
US20180253335A1 (en) Maintaining throughput of a stream processing framework while increasing processing load
US10235430B2 (en) Systems, methods, and apparatuses for detecting activity patterns
US20140379879A1 (en) Providing configurable workflow capabilities
US9311617B2 (en) Processing event instance data in a client-server architecture
CN112580914A (zh) 汇集多源数据的企业级数据中台系统的实现方法及装置
US10713070B2 (en) Systems and methods for capturing and visualizing user interactions across devices
US20170286377A1 (en) Narrative generation using pattern recognition
CN114416512A (zh) 测试方法、装置、电子设备和计算机存储介质
CN111352903A (zh) 日志管理平台、日志管理方法、介质以及电子设备
CN111274256A (zh) 基于时序数据库的资源管控方法、装置、设备及存储介质
CN112286957A (zh) 基于结构化查询语言的bi系统的api应用方法及系统
US9659266B2 (en) Enterprise intelligence (‘EI’) management in an EI framework
US11627193B2 (en) Method and system for tracking application activity data from remote devices and generating a corrective action data structure for the remote devices
CN117632424A (zh) 任务处理方法、装置、设备及存储介质
CN114490130A (zh) 消息订阅方法、装置、电子设备及存储介质
CN115202973A (zh) 应用运行状态的确定方法、装置、电子设备和介质
CN113900905A (zh) 日志监控方法、装置、电子设备及存储介质
CN113449886A (zh) 数据处理方法、处理装置、设备及存储介质
US9836377B1 (en) Profiling application performance data
CN113032237B (zh) 数据处理方法及装置、电子设备和计算机可读存储介质
CN113987032A (zh) 用于确定云服务实施策略的方法、装置、设备和存储介质
CN117093609A (zh) 查询语句处理方法、装置、设备、介质及程序产品
CN113419922A (zh) 主机批量作业运行数据的处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination