WO2019095667A1

WO2019095667A1 - 数据库数据采集方法、应用服务器及计算机可读存储介质

Info

Publication number: WO2019095667A1
Application number: PCT/CN2018/089421
Authority: WO
Inventors: 王广博; 黄平根
Original assignee: 平安科技（深圳）有限公司
Priority date: 2017-11-15
Filing date: 2018-05-31
Publication date: 2019-05-23
Also published as: CN108021621A

Abstract

本申请公开了一种数据库数据采集方法，该方法包括：对用户上传的脚本进行自动归类，并导入文件系统中；制定采集任务和相应的备份任务，绑定执行脚本，并将所述采集任务和备份任务加入执行消息队列及备份消息队列；从所述执行消息队列中获取采集任务，解析、加载、执行所述采集任务；从所述备份消息队列中获取备份任务，解析、加载、执行所述备份任务。本申请还提供一种应用服务器及计算机可读存储介质。本申请提供的数据库数据采集方法、应用服务器及计算机可读存储介质能够极大减少人力成本，提升采集效率。

Description

数据库数据采集方法、应用服务器及计算机可读存储介质

优先权申明

本申请要求于2017年11月15日提交中国专利局、申请号为201711131296.0，发明名称为“数据库数据采集方法、应用服务器及计算机可读存储介质”的中国专利申请的优先权，其内容全部通过引用结合在本申请中。

技术领域

本申请涉及数据处理技术领域，尤其涉及一种数据库数据采集方法、应用服务器及计算机可读存储介质。

背景技术

目前，由于数据库数据采集需求细节点多，采集过程复杂且耗时较长，需要投入大量人力且难于管理。因此，需要一种自动化采集平台，以解决现有采集方式的采集任务混乱、成本高、移植性差等方面的问题。

发明内容

有鉴于此，本申请提出一种数据库数据采集方法、应用服务器及计算机可读存储介质，以解决至少一个上述技术问题。

首先，为实现上述目的，本申请提出一种数据库数据采集方法，该方法包括步骤：

对用户上传的脚本进行自动归类，并导入文件系统中；

制定采集任务和相应的备份任务，绑定执行脚本，并将所述采集任务和备份任务加入执行消息队列及备份消息队列；

从所述执行消息队列中获取采集任务，解析、加载、执行所述采集任务；及

从所述备份消息队列中获取备份任务，解析、加载、执行所述备份任务。

可选地，该方法还包括步骤：

维护所述采集任务和备份任务的状态，在执行所述采集任务和备份任务后，进行所述采集任务和备份任务的状态更新。

此外，为实现上述目的，本申请还提供一种应用服务器，包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的数据库数据采集系统，所述数据库数据采集系统被所述处理器执行时实现如下步骤：

对用户上传的脚本进行自动归类，并导入文件系统中；

进一步地，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质存储有数据库数据采集系统，所述数据库数据采集系统可被至少一个处理器执行，以使所述至少一个处理器执行如上述的数据库数据采集方法的步骤。

相较于现有技术，本申请所提出的数据库数据采集方法、应用服务器及计算机可读存储介质，可以针对数据库数据进行采集任务制定及管理，通过任务管理器、数据采集器、数据备份器之间的协同工作，实现采集任务定制化，任务执行、数据备份全程自动化的目标，极大减少人力成本，提升采集效率。

附图说明

图1是本申请应用服务器一可选的硬件架构的示意图；

图2是本申请数据库数据采集系统第一实施例和第二实施例的程序模块示意图；

图3是本申请数据库数据采集方法第一实施例的流程示意图；

图4是本申请数据库数据采集方法第二实施例的流程示意图。

附图标记：

应用服务器	2
存储器	11
处理器	12
网络接口	13
数据库数据采集系统	200
脚本管理器模块	201
任务管理器模块	202
数据采集器模块	203
数据备份器模块	204

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，在本申请中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本申请要求的保护范围之内。

参阅图1所示，是本申请应用服务器2一可选的硬件架构的示意图。本实施例中，所述应用服务器2可包括，但不仅限于，可通过系统总线相互通信连接存储器11、处理器12、网络接口13。需要指出的是，图1仅示出了具有组件11-13的应用服务器2，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

其中，所述应用服务器2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器等计算设备，该应用服务器2可以是独立的服务器，也可以是多个服务器所组成的服务器集群。

所述存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器11可以是所述应用服务器2的内部存储单元，例如该应用服务器2的硬盘或内存。在另一些实施例中，所述存储器11也可以是所述应用服务器2的外部存储设备，例如该应用服务器2上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器11还可以既包括所述应用服务器2的内部存储单元也包括其外部存储设备。本实施例中，所述存储器11通常用于存储安装于所述应用服务器2的操作系统和各类应用软件，例如数据库数据采集系统200的程序代码等。此外，所述存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器12在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述应用服务器2的总体操作。本实施例中，所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据，例如运行所述的数据库数据采集系统200等。

所述网络接口13可包括无线网络接口或有线网络接口，该网络接口13通常用于在所述应用服务器2与其他电子设备之间建立通信连接。

至此，己经详细介绍了本申请相关设备的硬件结构和功能。下面，将基于上述相关设备，提出本申请的各个实施例。

首先，本申请提出一种数据库数据采集系统200。

参阅图2所示，是本申请数据库数据采集系统200第一实施例和第二实施例的程序模块图。本实施例中，所述的数据库数据采集系统200包括一系列的存储于存储器11上的计算机程序指令，当该计算机程序指令被处理器12执行时，可以实现本申请各实施例的数据库数据采集操作。在一些实施例中，基于该计算机程序指令各部分所实现的特定的操作，数据库数据采集系统200可以被划分为一个或多个模块。例如，在图2中，所述数据库数据采集系统200可以被分割成脚本管理器模块201、任务管理器模块202、数据采集器模块203、数据备份器模块204。其中：

在第一实施例中，所述脚本管理器模块201，用于对用户上传的脚本进行自动归类，并导入文件系统中。

具体地，所述脚本为由用户用脚本语言编写的用于采集目标数据的脚本方法构成的文件。其中，脚本语言通常都有简单、易学、易用的特性，所以，只要明确采集任务的具体需求，即可利用完成脚本方法的配置，极大的降低了对专业性的要求。常见的脚本语言有javascript，vbscript，php等。

当用户上传脚本至脚本管理器模块201中后，首先根据所述脚本的命名借助智能字符识别(Intelligent Character Recognition，ICR)技术实现名称索引创建及归类，若自动归类不通过则进行手工归类。然后进行归类确认，通过后将脚本按所述归类存入hadoop中的文件系统中。所述脚本管理器模块201还用于提供文件绑定功能，以供任务管理器模块202绑定所述文件系统中的脚本。

所述任务管理器模块202，用于制定采集任务和相应的备份任务，绑定执行脚本，并加入执行消息队列及备份消息队列。

具体地，任务管理器模块202创建任务名，设置任务内容、备份策略，然后调用脚本管理器模块201绑定执行脚本，制定任务计划，并将所述采集任务和相应的备份任务分别加入执行消息队列及备份消息队列。每个所述采集任务分别对应一个采集配置文件，定义了所述采集任务所采集的目标数据的采集规则配置。其中，采集规则配置主要包括：目标数据类型以及采集该类目标数据对应的脚本方法名称与脚本语言。例如，若提取的目标数据类型为“标题”，则定义“标题”对应的数据采集的脚本方法名称是“parseTitle”，使用的脚本语言是javascript。

具体而言，所述任务管理器模块202包括采集任务管理子模块和备份任务管理子模块(图中未示出)。所述采集任务管理子模块用于创建采集任务名，设置任务内容，调用脚本管理器模块201绑定所述采集任务的执行脚本，制定任务计划，并将所述采集任务加入执行消息队列。所述备份任务管理子模块用于设置所述采集任务的备份策略，并将所述备份任务加入备份消息队列。

其中，所述备份任务管理子模块管理备份任务流程的具体步骤包括：接收用户发起的备份任务申请，所述备份任务申请中可以选择备份策略，或者由所述备份任务管理子模块自动配置备份策略。对新申请的备份任务进行可执行性校验，若校验通过，则对所述备份任务进行批复，反之，则作错误标记，通知该备份任务申请者。将已批复的备份任务加入所述备份消息队列。

所述数据采集器模块203，用于从执行消息队列中获取采集任务，解析、加载、执行所述采集任务。

具体地，数据采集器模块203持续从所述执行消息队列中获取所述采集任务的任务信息，解析所述任务信息，得到任务内容和采集配置文件，并获取所述采集任务绑定的脚本文件。初始化支持所述脚本文件对应的脚本语言的脚本引擎，并加载所述脚本文件，从而执行所述采集任务，根据所述采集规则配置采集出目标数据。

所述数据备份器模块204，用于从备份消息队列中获取备份任务，解析、加载、执行所述备份任务。

具体地，数据备份器模块204持续从所述备份消息队列中获取备份任务的任务信息，解析、加载、执行所述备份任务。数据备份器模块204进行数据备份的具体步骤包括：数据备份器模块204首先判断所述备份消息队列是否为空，若为空，则设置所述数据备份器模块204为等待状态，若不为空，则设置为就绪状态。数据备份器模块204在就绪状态下，依序获取所述备份消息队列中的备份任务的任务信息。解析所述任务信息，得到需要备份的数据地址、备份策略和所述备份任务绑定的脚本文件。验证所述地址的数据是否存在，若不存在，记录日志、通知所述备份任务管理子模块，并在所述备份消息队列中移除所述备份任务，获取下一个备份任务。所述数据若存在，则设置所述数据备份器模块204为下载状态，加载所述脚本文件，从而执行所述备份任务，对所述数据进行备份。当所述数据备份完成后，记录日志并通知所述备份任务管理子模块，将所述备份任务从所述备份消息队列中移除，设置所述数据备份器模块204为就绪状态。然后继续获取所述备份消息队列中的下一个备份任务，直至队列为空。

进一步地，第二实施例在第一实施例的基础上，所述数据采集器模块203和数据备份器模块204还用于维护所述采集任务和备份任务的状态。

具体地，数据采集器模块203和数据备份器模块204在执行所述采集任务和备份任务后，会调用任务管理器模块202进行状态更新。任务管理器模块202据此对所述采集任务和备份任务的状态进行维护，实时更新。

此外，本申请还提出一种数据库数据采集方法。

参阅图3所示，是本申请数据库数据采集方法第一实施例的流程示意图。在本实施例中，根据不同的需求，图3所示的流程图中的步骤的执行顺序可以改变，某些步骤可以省略。

步骤S400，对用户上传的脚本进行自动归类，并导入文件系统中。

当用户上传脚本至脚本管理器中后，首先根据所述脚本的命名借助ICR技术实现名称索引创建及归类，若自动归类不通过则进行手工归类。然后进行归类确认，通过后将脚本按所述归类存入hadoop中的文件系统中。所述脚本管理器还提供文件绑定功能，以供任务管理器绑定所述文件系统中的脚本。

步骤S402，制定采集任务和相应的备份任务，绑定执行脚本，并加入执行消息队列及备份消息队列。

具体地，任务管理器创建任务名，设置任务内容、备份策略，然后调用脚本管理器绑定执行脚本，制定任务计划，并将所述采集任务和相应的备份任务分别加入执行消息队列及备份消息队列。每个所述采集任务分别对应一个采集配置文件，定义了所述采集任务所采集的目标数据的采集规则配置。其中，采集规则配置主要包括：目标数据类型以及采集该类目标数据对应的脚本方法名称与脚本语言。例如，若提取的目标数据类型为“标题”，则定义“标题”对应的数据采集的脚本方法名称是“parseTitle”，使用的脚本语言是javascript。

具体而言，所述任务管理器包括采集任务管理子模块和备份任务管理子模块。所述采集任务管理子模块用于创建采集任务名，设置任务内容，调用脚本管理器绑定所述采集任务的执行脚本，制定任务计划，并将所述采集任务加入执行消息队列。所述备份任务管理子模块用于设置所述采集任务的备份策略，并将所述备份任务加入备份消息队列。

步骤S404，从执行消息队列中获取采集任务，解析、加载、执行所述采集任务。

具体地，数据采集器持续从所述执行消息队列中获取所述采集任务的任务信息，解析所述任务信息，得到任务内容和采集配置文件，并获取所述采集任务绑定的脚本文件。初始化支持所述脚本文件对应的脚本语言的脚本引擎，并加载所述脚本文件，从而执行所述采集任务，根据所述采集规则配置采集出目标数据。

步骤S406，从备份消息队列中获取备份任务，解析、加载、执行所述备份任务。

具体地，数据备份器持续从所述备份消息队列中获取备份任务的任务信息，解析、加载、执行所述备份任务。数据备份器进行数据备份的具体步骤包括：数据备份器首先判断所述备份消息队列是否为空，若为空，则设置所述数据备份器为等待状态，若不为空，则设置为就绪状态。数据备份器在就绪状态下，依序获取所述备份消息队列中的备份任务的任务信息。解析所述任务信息，得到需要备份的数据地址、备份策略和所述备份任务绑定的脚本文件。验证所述地址的数据是否存在，若不存在，记录日志、通知所述备份任务管理子模块，并在所述备份消息队列中移除所述备份任务，获取下一个备份任务。所述数据若存在，则设置所述数据备份器为下载状态，加载所述脚本文件，从而执行所述备份任务，对所述数据进行备份。当所述数据备份完成后，记录日志并通知所述备份任务管理子模块，将所述备份任务从所述备份消息队列中移除，设置所述数据备份器为就绪状态。然后继续获取所述备份消息队列中的下一个备份任务，直至队列为空。

如图4所示，是本申请数据库数据采集方法的第二实施例的流程示意图。本实施例中，所述数据库数据采集方法的步骤S500-S506与第一实施例的步骤S400-S406相类似，区别在于该方法还包括步骤S508。

该方法包括以下步骤：

步骤S500，对用户上传的脚本进行自动归类，并导入文件系统中。

步骤S502，制定采集任务和相应的备份任务，绑定执行脚本，并加入执行消息队列及备份消息队列。

步骤S504，从执行消息队列中获取采集任务，解析、加载、执行所述采集任务。

步骤S506，从备份消息队列中获取备份任务，解析、加载、执行所述备份任务。

步骤S508，维护所述采集任务和备份任务的状态。

具体地，数据采集器和数据备份器在执行所述采集任务和备份任务后，会调用任务管理器进行状态更新。任务管理器据此对所述采集任务和备份任务的状态进行维护，实时更新。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种数据库数据采集方法，应用于应用服务器，其特征在于，所述方法包括步骤：

对用户上传的脚本进行自动归类，并导入文件系统中；

制定采集任务和相应的备份任务，绑定执行脚本，并将所述采集任务和备份任务加入执行消息队列及备份消息队列；

从所述执行消息队列中获取采集任务，解析、加载、执行所述采集任务；及

从所述备份消息队列中获取备份任务，解析、加载、执行所述备份任务。
如权利要求1所述的数据库数据采集方法，其特征在于，该方法还包括步骤：

维护所述采集任务和备份任务的状态，在执行所述采集任务和备份任务后，进行所述采集任务和备份任务的状态更新。
如权利要求1或2所述的数据库数据采集方法，其特征在于，所述归类是根据所述脚本的命名借助智能字符识别ICR技术实现名称索引创建及归类。
如权利要求1所述的数据库数据采集方法，其特征在于，从所述执行消息队列中获取采集任务，解析、加载、执行所述采集任务的步骤具体包括：

持续从所述执行消息队列中获取所述采集任务的任务信息；

解析所述任务信息，得到任务内容和采集配置文件，并获取所述采集任务绑定的脚本文件；

初始化支持所述脚本文件对应的脚本语言的脚本引擎，并加载所述脚本文件，从而执行所述采集任务，根据所述采集规则配置采集出目标数据。
如权利要求2所述的数据库数据采集方法，其特征在于，从所述执行消息队列中获取采集任务，解析、加载、执行所述采集任务的步骤具体包括：

持续从所述执行消息队列中获取所述采集任务的任务信息；

解析所述任务信息，得到任务内容和采集配置文件，并获取所述采集任务绑定的脚本文件；

初始化支持所述脚本文件对应的脚本语言的脚本引擎，并加载所述脚本文件，从而执行所述采集任务，根据所述采集规则配置采集出目标数据。
如权利要求1所述的数据库数据采集方法，其特征在于，从所述备份消息队列中获取备份任务，解析、加载、执行所述备份任务的步骤具体包括：

判断所述备份消息队列是否为空，若不为空，则依序获取所述备份消息队列中的备份任务的任务信息；

解析所述任务信息，得到需要备份的数据地址、备份策略和所述备份任务绑定的脚本文件；

验证所述地址的数据是否存在，若不存在，记录日志，并在所述备份消息队列中移除所述备份任务，获取下一个备份任务；

所述地址的数据若存在，则加载所述脚本文件，从而执行所述备份任务，对所述数据进行备份；

当所述数据备份完成后，记录日志，将所述备份任务从所述备份消息队列中移除，然后继续获取所述备份消息队列中的下一个备份任务，直至队列为空。
如权利要求2所述的数据库数据采集方法，其特征在于，从所述备份消息队列中获取备份任务，解析、加载、执行所述备份任务的步骤具体包括：

判断所述备份消息队列是否为空，若不为空，则依序获取所述备份消息队列中的备份任务的任务信息；

解析所述任务信息，得到需要备份的数据地址、备份策略和所述备份任务绑定的脚本文件；

验证所述地址的数据是否存在，若不存在，记录日志，并在所述备份消息队列中移除所述备份任务，获取下一个备份任务；

所述地址的数据若存在，则加载所述脚本文件，从而执行所述备份任务，对所述数据进行备份；

当所述数据备份完成后，记录日志，将所述备份任务从所述备份消息队列中移除，然后继续获取所述备份消息队列中的下一个备份任务，直至队列为空。
一种应用服务器，其特征在于，所述应用服务器包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的数据库数据采集系统，所述数据库数据采集系统被所述处理器执行时实现如下步骤：

对用户上传的脚本进行自动归类，并导入文件系统中；

制定采集任务和相应的备份任务，绑定执行脚本，并将所述采集任务和备份任务加入执行消息队列及备份消息队列；

从所述执行消息队列中获取采集任务，解析、加载、执行所述采集任务；及

从所述备份消息队列中获取备份任务，解析、加载、执行所述备份任务。
如权利要求8所述的应用服务器，其特征在于，所述数据库数据采集系统被所述处理器执行时还实现步骤：

维护所述采集任务和备份任务的状态，在执行所述采集任务和备份任务后，进行所述采集任务和备份任务的状态更新。
如权利要求8或9所述的应用服务器，其特征在于，所述归类是根据所述脚本的命名借助智能字符识别ICR技术实现名称索引创建及归类。
如权利要求8所述的应用服务器，其特征在于，从所述执行消息队列中获取采集任务，解析、加载、执行所述采集任务的步骤具体包括：

持续从所述执行消息队列中获取所述采集任务的任务信息；

解析所述任务信息，得到任务内容和采集配置文件，并获取所述采集任务绑定的脚本文件；

初始化支持所述脚本文件对应的脚本语言的脚本引擎，并加载所述脚本文件，从而执行所述采集任务，根据所述采集规则配置采集出目标数据。
如权利要求9所述的应用服务器，其特征在于，从所述执行消息队列中获取采集任务，解析、加载、执行所述采集任务的步骤具体包括：

持续从所述执行消息队列中获取所述采集任务的任务信息；

解析所述任务信息，得到任务内容和采集配置文件，并获取所述采集任务绑定的脚本文件；

初始化支持所述脚本文件对应的脚本语言的脚本引擎，并加载所述脚本文件，从而执行所述采集任务，根据所述采集规则配置采集出目标数据。
如权利要求8所述的应用服务器，其特征在于，从所述备份消息队列中获取备份任务，解析、加载、执行所述备份任务的步骤具体包括：

判断所述备份消息队列是否为空，若不为空，则依序获取所述备份消息队列中的备份任务的任务信息；

解析所述任务信息，得到需要备份的数据地址、备份策略和所述备份任务绑定的脚本文件；

验证所述地址的数据是否存在，若不存在，记录日志，并在所述备份消息队列中移除所述备份任务，获取下一个备份任务；

所述地址的数据若存在，则加载所述脚本文件，从而执行所述备份任务，对所述数据进行备份；

当所述数据备份完成后，记录日志，将所述备份任务从所述备份消息队列中移除，然后继续获取所述备份消息队列中的下一个备份任务，直至队列为空。
如权利要求9所述的应用服务器，其特征在于，从所述备份消息队列中获取备份任务，解析、加载、执行所述备份任务的步骤具体包括：

判断所述备份消息队列是否为空，若不为空，则依序获取所述备份消息队列中的备份任务的任务信息；

解析所述任务信息，得到需要备份的数据地址、备份策略和所述备份任务绑定的脚本文件；

验证所述地址的数据是否存在，若不存在，记录日志，并在所述备份消息队列中移除所述备份任务，获取下一个备份任务；

所述地址的数据若存在，则加载所述脚本文件，从而执行所述备份任务，对所述数据进行备份；

当所述数据备份完成后，记录日志，将所述备份任务从所述备份消息队列中移除，然后继续获取所述备份消息队列中的下一个备份任务，直至队列为空。
一种计算机可读存储介质，所述计算机可读存储介质存储有数据库数据采集系统，所述数据库数据采集系统可被至少一个处理器执行，以使所述至少一个处理器执行如下步骤：

对用户上传的脚本进行自动归类，并导入文件系统中；

制定采集任务和相应的备份任务，绑定执行脚本，并将所述采集任务和备份任务加入执行消息队列及备份消息队列；

从所述执行消息队列中获取采集任务，解析、加载、执行所述采集任务；及

从所述备份消息队列中获取备份任务，解析、加载、执行所述备份任务。
如权利要求15所述的计算机可读存储介质，其特征在于，所述数据库数据采集系统被所述处理器执行时还实现步骤：

维护所述采集任务和备份任务的状态，在执行所述采集任务和备份任务后，进行所述采集任务和备份任务的状态更新。
如权利要求15或16所述的计算机可读存储介质，其特征在于，所述归类是根据所述脚本的命名借助智能字符识别ICR技术实现名称索引创建及归类。
如权利要求15所述的计算机可读存储介质，其特征在于，从所述执行消息队列中获取采集任务，解析、加载、执行所述采集任务的步骤具体包括：

持续从所述执行消息队列中获取所述采集任务的任务信息；

解析所述任务信息，得到任务内容和采集配置文件，并获取所述采集任务绑定的脚本文件；

初始化支持所述脚本文件对应的脚本语言的脚本引擎，并加载所述脚本文件，从而执行所述采集任务，根据所述采集规则配置采集出目标数据。
如权利要求16所述的计算机可读存储介质，其特征在于，从所述执行消息队列中获取采集任务，解析、加载、执行所述采集任务的步骤具体包括：

持续从所述执行消息队列中获取所述采集任务的任务信息；

解析所述任务信息，得到任务内容和采集配置文件，并获取所述采集任务绑定的脚本文件；

初始化支持所述脚本文件对应的脚本语言的脚本引擎，并加载所述脚本文件，从而执行所述采集任务，根据所述采集规则配置采集出目标数据。
如权利要求15或16所述的计算机可读存储介质，其特征在于，从所述备份消息队列中获取备份任务，解析、加载、执行所述备份任务的步骤具体包括：

判断所述备份消息队列是否为空，若不为空，则依序获取所述备份消息队列中的备份任务的任务信息；

解析所述任务信息，得到需要备份的数据地址、备份策略和所述备份任务绑定的脚本文件；

验证所述地址的数据是否存在，若不存在，记录日志，并在所述备份消息队列中移除所述备份任务，获取下一个备份任务；

所述地址的数据若存在，则加载所述脚本文件，从而执行所述备份任务，对所述数据进行备份；

当所述数据备份完成后，记录日志，将所述备份任务从所述备份消息队列中移除，然后继续获取所述备份消息队列中的下一个备份任务，直至队列为空。