CN111581170A - 分布式智能数据采集方法、装置、设备和存储介质 - Google Patents
分布式智能数据采集方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN111581170A CN111581170A CN202010303574.1A CN202010303574A CN111581170A CN 111581170 A CN111581170 A CN 111581170A CN 202010303574 A CN202010303574 A CN 202010303574A CN 111581170 A CN111581170 A CN 111581170A
- Authority
- CN
- China
- Prior art keywords
- data
- acquisition
- manager
- configuration
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000008859 change Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 5
- 238000007726 management method Methods 0.000 abstract description 10
- 238000013500 data storage Methods 0.000 abstract description 5
- 238000013480 data collection Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 8
- 238000012423 maintenance Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000306 component Substances 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/1805—Append-only file systems, e.g. using logs or journals to store data
- G06F16/1815—Journaling file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Stored Programmes (AREA)
Abstract
本发明涉及一种分布式智能数据采集方法、装置、设备和存储介质,该方法包括:获取采集参数,采集参数包括数据采集类型、采集的文件和数据来源;根据采集参数对数据采集器和数据散出器进行配置,确定策略配置参数,并将策略配置参数存储在配置中心的配置存储数据库;智能采集程序获取数据采集器的宿主机下的策略配置参数;各个管理器根据策略配置参数对应的策略类型创建相应的采集器类型,其中,各个管理器包括数据采集器的管理器、数据散出器的数据管理器和数据通道管理器;根据策略配置参数和采集器类型对原始数据进行采集和写入。实现了数据源和数据存储动态创建和配置、基于配置中心的采集器的配置管理和策略下发。
Description
技术领域
本发明涉及数据采集领域,具体涉及一种分布式智能数据采集方法、装置、设备和存储介质。
背景技术
随着生产应用服务器的大规模使用,传统的Linux上日志或数据的采集变得非常麻烦,常用的采集器有Flume-NG、Logstash等,Flume是Apache基金会旗下的一款常用开源数据收集工具,Logstash是目前数据收集方案ELK中常用的采集器。
这些常用的处理器应用广泛,在生产规模较小的情况下足够应付日常的生产使用,但面对大集群下的配置维护和管理则存在相应问题,例如:配置变更麻烦,无法全局生效;新增数据源采集或数据存储需要定制开发或配置;缺少全局采集器策略的维护和管理。
发明内容
有鉴于此,提供一种分布式智能数据采集方法、装置、设备和存储介质,以解决现有技术中大集群下配置维护和管理中存在的配置操作繁琐等问题。
本发明采用如下技术方案:
第一方面,本申请实施例提供了一种分布式智能数据采集方法,该方法包括:
获取采集参数,所述采集参数包括数据采集类型、采集的文件和数据来源;
根据所述采集参数对数据采集器和数据散出器进行配置,确定策略配置参数,并将所述策略配置参数存储在配置中心的配置存储数据库;
智能采集程序获取所述数据采集器的宿主机下的策略配置参数;
各个管理器根据所述策略配置参数对应的策略类型创建相应的采集器类型,其中,各个管理器包括数据采集器的管理器、数据散出器的数据管理器和数据通道管理器;
根据所述策略配置参数和所述采集器类型对原始数据进行采集和写入。
第二方面,本申请实施例提供了一种分布式智能数据采集装置,该装置包括:
参数采集模块,用于获取采集参数,所述采集参数包括数据采集类型、采集的文件和数据来源;
配置参数确定模块,用于根据所述采集参数对数据采集器和数据散出器进行配置,确定策略配置参数,并将所述策略配置参数存储在配置中心的配置存储数据库;
配置参数获取模块,用于智能采集程序获取所述数据采集器的宿主机下的策略配置参数;
采集器类型创建模块,用于各个管理器根据所述策略配置参数对应的策略类型创建相应的采集器类型,其中,各个管理器包括数据采集器的管理器、数据散出器的数据管理器和数据通道管理器;
数据采集模块,用于根据所述策略配置参数和所述采集器类型对原始数据进行采集和写入。
第三方面,本申请实施例提供了一种设备,该设备包括:
处理器,以及与所述处理器相连接的存储器;
所述存储器用于存储计算机程序,所述计算机程序至少用于执行本申请实施例第一方面所述的分布式智能数据采集方法;
所述处理器用于调用并执行所述存储器中的所述计算机程序。
第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现如第一方面所述的分布式智能数据采集方法中各个步骤。
本发明采用以上技术方案,抽象了通用业务数据采集器和数据散出器,当需要新增数据采集时,只需要在配置中心进行数据采集器和数据散出器的配置,智能数据采集程序会根据配置进行自动创建并启动采集任务;智能数据采集程序会监测配置中心的配置下发事件,根据下发的动作进行配置调整并立即生效,达到动态调整配置参数的目的。实现了数据源和数据存储动态创建和配置、基于配置中心的采集器的配置管理和策略下发。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是现有技术中的一种数据采集工作原理图;
图2是本申请实施例提供的一种分布式智能数据采集方法的流程图;
图3是本申请实施例中适用的一种分布式智能数据采集方法的功能模块图;
图4是本申请实施例提供的一种分布式智能数据采集装置的结构示意图;
图5是是本申请实施例中的一种设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
首先对相关现有技术进行说明,随着网络技术和数字经济的发展,数据采集的需求越来越多,同时也诞生了很多数据采集器的工具,最常用的采集器就有Apache基金会旗下的Flume。Flume是一个高可用、高可靠的、分布式的海量日志采集、聚合和传输的系统,支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接收方的能力。图1示出了一种现有技术中的数据采集工作原理图。具体的。Flume运行的核心是Agent,以Agent为最小的独立运行单位,一个Agent就是一个JVM(Java Virtual Machine,JAVA虚拟机)。它是一个完整的数据收集工具,含有三个核心组件,分别是Source、Channel、Sink。Source是数据的收集端,负责将数据捕获后进行特殊的格式化,将数据封装到事件里,然后将事件推入Channel中。Channel是连接Source和Sink的组件,可以将其看做一个数据的缓冲区,它可以将事件暂存到内存中也可以持久化到本地磁盘上,直到Sink处理完该事件。Sink从Channel中取出事件,然后将数据发到别处,可以向文件系统、数据库存数据,也可以是其他Agent的Source。Flume自身提供了常用的Source、Sink供使用,能够满足正常的学习或简单业务的使用,但在复杂场景下的支持则比较匮乏,往往不能满足真正复杂的业务场景的使用需求。
上述现有技术具有如下缺陷:一是在业务新增一种数据采集需求时,数据发送方和数据接收方都需要进行定制,这通常需要安排研发排期来进行定制开发,测试通过后再进行部署和使用;二是当数据采集器部署到各服务器上,由于采集参数需要调整时,常见的处理手段为运维人员进入各Linux服务器手工变更配置参数进行调整,然后重新启动采集器继续数据的采集工作。
其次,对本申请实施例中用到的概念进行说明,Source:数据采集器;Sink:数据散出器;Agent Start Loader:加载器;Smart Agent程序:智能采集程序;Source RunnerManager:数据采集器的管理器;Sink Runner Manager:数据散出器的管理器;ChannelManager:数据通道管理器;Source Runner:数据采集任务;Listener:监听器;ConfigCenter:配置中心。
实施例
图2为本发明实施例提供的一种分布式智能数据采集方法的流程图,该方法可以由本发明实施例提供的分布式智能数据采集装置来执行,该装置可采用软件和/或硬件的方式实现。参考图2,该方法具体可以包括如下步骤:
S201、获取采集参数,采集参数包括数据采集类型、采集的文件和数据来源。
具体的,首先根据需求获取用户需要在配置中心配置数据采集器和数据散出器的各种参数,该参数称为采集参数。在一个具体的例子中,该采集参数包括数据采集类型、采集的文件和数据来源等信息。
S202、根据采集参数对数据采集器和数据散出器进行配置,确定策略配置参数,并将策略配置参数存储在配置中心的配置存储数据库。
具体的,分别应用对应的采集参数对数据采集器和数据散出器进行配置,将配置完成的采集参数称为策略配置参数。另外,在用户配置完成后,将策略配置参数存储在配置中心的配置存储数据库中。
S203、智能采集程序获取数据采集器的宿主机下的策略配置参数。
具体的,在服务器上安装智能采集程序并启动,智能采集程序启动加载器,与配置中心建立连接,当成功建立连接后,通过加载器获取数据采集器的宿主机下的策略配置参数。在一个具体的例子中,校验策略配置参数的数据格式后将策略配置参数缓存在内存中关闭和配置中心的连接。
S204、各个管理器根据策略配置参数对应的策略类型创建相应的采集器类型,其中,各个管理器包括数据采集器的管理器、数据散出器的数据管理器和数据通道管理器。
具体的,数据采集器的管理器或数据散出器的管理器内置多种数据采集器或数据散出器,管理器将根据策略配置参数分析策略类型,然后依次创建相对应的采集器配型。可选的,不同的采集器类型用于满足不同的数据采集需求。
另外,各个管理器根据策略配置参数对应的策略类型创建相应的采集器类型之前,还包括:加载器对各个管理器进行初始化。具体的,智能采集程序在启动时能够获取配置管理中心的策略配置参数,加载器在启动后将初始化数据采集器的管理器、数据散出器的管理器和数据通道管理器。
S205、根据策略配置参数和采集器类型对原始数据进行采集和写入。
具体的,结合策略配置参数,确定数据采集中的策略;结合采集器类型,满足不同的数据采集需求,这样,实现了对原始数据的采集和写入。
本发明采用以上技术方案,抽象了通用业务数据采集器和数据散出器,当需要新增数据采集时,只需要在配置中心进行数据采集器和数据散出器的配置,智能数据采集程序会根据配置进行自动创建并启动采集任务;智能数据采集程序会监测配置中心的配置下发事件,根据下发的动作进行配置调整并立即生效,达到动态调整配置参数的目的。实现了数据源和数据存储动态创建和配置、基于配置中心的采集器的配置管理和策略下发。
示例性的,智能采集程序获取数据采集器的宿主机下的策略配置参数之后,还包括:加载器启动监听器线程任务;监听器将策略配置参数保存在本地磁盘文件进行缓存;监听器与配置中心建立长连接,以实时监听宿主机的策略配置参数变化;若策略配置参数发生变化,则监听器更新策略配置参数。
具体的,智能采集程序获取数据采集器的宿主机下的策略配置参数后,加载器启动监听器线程任务,监听器首先将策略配置参数保存在本地磁盘文件进行缓存,其次,同配置中心建立长连接请求实时监听对当前主机的策略配置参数变化,当配置修改后监听器立即获取最新版本的配置,经过数据校验后对内存策略缓存和本地磁盘文件缓存进行立即更新,保证应用程序能够获取到最新的配置参数。
在一个具体的例子中,根据策略配置参数和采集器类型对原始数据进行采集和写入之后,还包括:若检测到配置中心新增新的采集器,则监听器获取对应的变更事件,并将变更事件的通知发送给数据采集器的管理器或数据散出器的管理器;数据采集器的管理器或数据散出器的管理器根据新的采集器创建新的数据采集任务,并将数据采集任务添加至对应的管理器进行管理;新的数据采集器采集数据源的数据。
其中,当配置管理中心新增新的采集器时,监听器能够立即获取到发生的变更,并将变更事件通知给数据采集器的管理器和数据散出器的管理器,此时各个管理器根据新增配置,启动异步线程立即创建新的数据采集任务,在采集器创建完毕后将数据采集任务添加到各个管理器进行管理。
可选的,根据策略配置参数和采集器类型对原始数据进行采集和写入之后,还包括:若检测到停止数据采集任务的指令,则在配置中心暂停数据采集任务。其中,当需要停止当前数据采集任务时,在配置中心进行任务暂停,数据采集任务将在客户端继续执行,但不会进行业务数据的采集,处于空转状态以便随时恢复。若需要彻底清除采集任务,在配置中心将其禁用后,智能采集程序将在下一次启动后失效。
在一个具体的例子中,图3示出了一种分布式智能数据采集方法的功能模块图,参考图3。
图4是本发明是实施例提供的一种分布式智能数据采集装置的结构示意图,该装置适用于执行本发明实施例提供给的一种分布式智能数据采集方法。如图4所示,该装置具体可以包括参数采集模块401、配置参数确定模块402、配置参数获取模块403、采集器类型创建模块404和数据采集模块405。
其中,参数采集模块401,用于获取采集参数,采集参数包括数据采集类型、采集的文件和数据来源;配置参数确定模块402,用于根据采集参数对数据采集器和数据散出器进行配置,确定策略配置参数,并将策略配置参数存储在配置中心的配置存储数据库;配置参数获取模块403,用于智能采集程序获取数据采集器的宿主机下的策略配置参数;采集器类型创建模块404,用于各个管理器根据策略配置参数对应的策略类型创建相应的采集器类型,其中,各个管理器包括数据采集器的管理器、数据散出器的数据管理器和数据通道管理器;数据采集模块405,用于根据策略配置参数和采集器类型对原始数据进行采集和写入。
本发明采用以上技术方案,抽象了通用业务数据采集器和数据散出器,当需要新增数据采集时,只需要在配置中心进行数据采集器和数据散出器的配置,智能数据采集程序会根据配置进行自动创建并启动采集任务;智能数据采集程序会监测配置中心的配置下发事件,根据下发的动作进行配置调整并立即生效,达到动态调整配置参数的目的。实现了数据源和数据存储动态创建和配置、基于配置中心的采集器的配置管理和策略下发。
可选的,配置参数获取模块403具体用于:
智能采集程序启动加载器,与配置中心建立连接,以通过加载器获取数据采集器的宿主机下的策略配置参数。
可选的,还包括初始化模块,用于在各个管理器根据策略配置参数对应的策略类型创建相应的采集器类型之前,加载器对各个管理器进行初始化。
可选的,还包括配置策略更新模块,用于在智能采集程序获取数据采集器的宿主机下的策略配置参数之后,加载器启动监听器线程任务;监听器将策略配置参数保存在本地磁盘文件进行缓存;监听器与配置中心建立长连接,以实时监听宿主机的策略配置参数变化;若策略配置参数发生变化,则监听器更新策略配置参数。
可选的,还包括数据采集器更新模块,用于根据策略配置参数和采集器类型对原始数据进行采集和写入之后,若检测到配置中心新增新的采集器,则监听器获取对应的变更事件,并将变更事件的通知发送给数据采集器的管理器或数据散出器的管理器;数据采集器的管理器或数据散出器的管理器根据新的采集器创建新的数据采集任务,并将数据采集任务添加至对应的管理器进行管理;新的数据采集器采集数据源的数据。
可选的,还包括采集任务暂停模块,用于根据策略配置参数和采集器类型对原始数据进行采集和写入之后,若检测到停止数据采集任务的指令,则在配置中心暂停数据采集任务。
可选的,还包括数据校验模块,用于对策略配置参数缓存或者更新之前,校验策略配置参数的数据格式。
本发明实施例提供的分布式智能数据采集装置可执行本发明任意实施例提供的分布式智能数据采集方法,具备执行方法相应的功能模块和有益效果。
本发明实施例还提供一种设备,请参阅图5,图5为一种设备的结构示意图,如图5所示,该设备包括:处理器510,以及与处理器510相连接的存储器520;存储器520用于存储计算机程序,计算机程序至少用于执行本发明实施例中的分布式智能数据采集方法;处理器510用于调用并执行存储器中的计算机程序;上述分布式智能数据采集方法至少包括如下步骤:获取采集参数,采集参数包括数据采集类型、采集的文件和数据来源;根据采集参数对数据采集器和数据散出器进行配置,确定策略配置参数,并将策略配置参数存储在配置中心的配置存储数据库;智能采集程序获取数据采集器的宿主机下的策略配置参数;各个管理器根据策略配置参数对应的策略类型创建相应的采集器类型,其中,各个管理器包括数据采集器的管理器、数据散出器的数据管理器和数据通道管理器;根据策略配置参数和采集器类型对原始数据进行采集和写入。
本发明实施例还提供一种存储介质,存储介质存储有计算机程序,计算机程序被处理器执行时,实现如本发明实施例中的分布式智能数据采集方法中各个步骤:获取采集参数,采集参数包括数据采集类型、采集的文件和数据来源;根据采集参数对数据采集器和数据散出器进行配置,确定策略配置参数,并将策略配置参数存储在配置中心的配置存储数据库;智能采集程序获取数据采集器的宿主机下的策略配置参数;各个管理器根据策略配置参数对应的策略类型创建相应的采集器类型,其中,各个管理器包括数据采集器的管理器、数据散出器的数据管理器和数据通道管理器;根据策略配置参数和采集器类型对原始数据进行采集和写入。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种分布式智能数据采集方法,其特征在于,包括:
获取采集参数,所述采集参数包括数据采集类型、采集的文件和数据来源;
根据所述采集参数对数据采集器和数据散出器进行配置,确定策略配置参数,并将所述策略配置参数存储在配置中心的配置存储数据库;
智能采集程序获取所述数据采集器的宿主机下的策略配置参数;
各个管理器根据所述策略配置参数对应的策略类型创建相应的采集器类型,其中,各个管理器包括数据采集器的管理器、数据散出器的数据管理器和数据通道管理器;
根据所述策略配置参数和所述采集器类型对原始数据进行采集和写入。
2.根据权利要求1所述的方法,其特征在于,所述智能采集程序获取所述数据采集器的宿主机下的策略配置参数,包括:
所述智能采集程序启动加载器,与所述配置中心建立连接,以通过所述加载器获取所述数据采集器的宿主机下的策略配置参数。
3.根据权利要求1所述的方法,其特征在于,所述各个管理器根据所述策略配置参数对应的策略类型创建相应的采集器类型之前,还包括:
加载器对各个管理器进行初始化。
4.根据权利要求1所述的方法,其特征在于,所述智能采集程序获取所述数据采集器的宿主机下的策略配置参数之后,还包括:
加载器启动监听器线程任务;
监听器将所述策略配置参数保存在本地磁盘文件进行缓存;
所述监听器与所述配置中心建立长连接,以实时监听所述宿主机的策略配置参数变化;
若所述策略配置参数发生变化,则所述监听器更新所述策略配置参数。
5.根据权利要求1所述的方法,其特征在于,所述根据所述策略配置参数和所述采集器类型对原始数据进行采集和写入之后,还包括:
若检测到所述配置中心新增新的采集器,则监听器获取对应的变更事件,并将所述变更事件的通知发送给所述数据采集器的管理器或所述数据散出器的管理器;
所述数据采集器的管理器或所述数据散出器的管理器根据新的采集器创建新的数据采集任务,并将所述数据采集任务添加至对应的管理器进行管理;
新的数据采集器采集数据源的数据。
6.根据权利要求1所述的方法,其特征在于,所述根据所述策略配置参数和所述采集器类型对原始数据进行采集和写入之后,还包括:
若检测到停止数据采集任务的指令,则在所述配置中心暂停数据采集任务。
7.根据权利要求1-6任一项所述的方法,其特征在于,对所述策略配置参数缓存或者更新之前,校验所述策略配置参数的数据格式。
8.一种分布式智能数据采集装置,其特征在于,包括:
参数采集模块,用于获取采集参数,所述采集参数包括数据采集类型、采集的文件和数据来源;
配置参数确定模块,用于根据所述采集参数对数据采集器和数据散出器进行配置,确定策略配置参数,并将所述策略配置参数存储在配置中心的配置存储数据库;
配置参数获取模块,用于智能采集程序获取所述数据采集器的宿主机下的策略配置参数;
采集器类型创建模块,用于各个管理器根据所述策略配置参数对应的策略类型创建相应的采集器类型,其中,各个管理器包括数据采集器的管理器、数据散出器的数据管理器和数据通道管理器;
数据采集模块,用于根据所述策略配置参数和所述采集器类型对原始数据进行采集和写入。
9.一种设备,其特征在于,包括:
处理器,以及与所述处理器相连接的存储器;
所述存储器用于存储计算机程序,所述计算机程序至少用于执行权利要求1-7任一项所述的分布式智能数据采集方法;
所述处理器用于调用并执行所述存储器中的所述计算机程序。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1-7任一项所述的分布式智能数据采集方法中各个步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010303574.1A CN111581170B (zh) | 2020-04-17 | 2020-04-17 | 分布式智能数据采集方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010303574.1A CN111581170B (zh) | 2020-04-17 | 2020-04-17 | 分布式智能数据采集方法、装置、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111581170A true CN111581170A (zh) | 2020-08-25 |
CN111581170B CN111581170B (zh) | 2024-04-09 |
Family
ID=72111706
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010303574.1A Active CN111581170B (zh) | 2020-04-17 | 2020-04-17 | 分布式智能数据采集方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111581170B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112738137A (zh) * | 2021-03-30 | 2021-04-30 | 深圳红途创程科技有限公司 | 数据采集和链路处理方法、装置、计算机设备及存储介质 |
CN113064789A (zh) * | 2021-03-15 | 2021-07-02 | 上海浦东发展银行股份有限公司 | 一种基于配置中心的指标数据采集系统、方法及存储介质 |
CN113485747A (zh) * | 2021-07-08 | 2021-10-08 | 广州钛动科技有限公司 | 一种数据处理方法、数据处理器、目标源组件和系统 |
CN114253630A (zh) * | 2021-12-23 | 2022-03-29 | 上海新炬网络信息技术股份有限公司 | 基于Java切面修改Form表单变化信息实现日志保存的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090150328A1 (en) * | 2007-12-05 | 2009-06-11 | Microsoft Corporation | Image metadata harvester |
CN103731298A (zh) * | 2013-11-15 | 2014-04-16 | 中国航天科工集团第二研究院七〇六所 | 一种大规模分布式网络安全数据采集方法与系统 |
CN109815382A (zh) * | 2018-12-29 | 2019-05-28 | 中国科学院计算技术研究所 | 大规模网络数据的感知与获取方法和系统 |
-
2020
- 2020-04-17 CN CN202010303574.1A patent/CN111581170B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090150328A1 (en) * | 2007-12-05 | 2009-06-11 | Microsoft Corporation | Image metadata harvester |
CN103731298A (zh) * | 2013-11-15 | 2014-04-16 | 中国航天科工集团第二研究院七〇六所 | 一种大规模分布式网络安全数据采集方法与系统 |
CN109815382A (zh) * | 2018-12-29 | 2019-05-28 | 中国科学院计算技术研究所 | 大规模网络数据的感知与获取方法和系统 |
Non-Patent Citations (1)
Title |
---|
杜园园;吴章生;朱小杰;: "基于大数据的航道采集系统的架构设计" * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113064789A (zh) * | 2021-03-15 | 2021-07-02 | 上海浦东发展银行股份有限公司 | 一种基于配置中心的指标数据采集系统、方法及存储介质 |
CN112738137A (zh) * | 2021-03-30 | 2021-04-30 | 深圳红途创程科技有限公司 | 数据采集和链路处理方法、装置、计算机设备及存储介质 |
CN112738137B (zh) * | 2021-03-30 | 2021-06-11 | 深圳红途创程科技有限公司 | 数据采集和链路处理方法、装置、计算机设备及存储介质 |
CN113485747A (zh) * | 2021-07-08 | 2021-10-08 | 广州钛动科技有限公司 | 一种数据处理方法、数据处理器、目标源组件和系统 |
CN114253630A (zh) * | 2021-12-23 | 2022-03-29 | 上海新炬网络信息技术股份有限公司 | 基于Java切面修改Form表单变化信息实现日志保存的方法 |
CN114253630B (zh) * | 2021-12-23 | 2023-07-25 | 上海新炬网络信息技术股份有限公司 | 基于Java切面修改Form表单变化信息实现日志保存的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111581170B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111581170B (zh) | 分布式智能数据采集方法、装置、设备和存储介质 | |
CN110290189B (zh) | 一种容器集群管理方法、装置及系统 | |
CN105631026B (zh) | 一种安全数据分析系统 | |
CN109660397B (zh) | 用于采集日志的系统、方法和装置 | |
US9811443B2 (en) | Dynamic trace level control | |
US10007571B2 (en) | Policy based dynamic data collection for problem analysis | |
KR101683321B1 (ko) | 분산 애플리케이션들을 모니터링 하는 방법 | |
US20030005173A1 (en) | Methods and apparatus in distributed remote logging system for remote adhoc data analysis customized with multilevel hierarchical logger tree | |
CN113407421B (zh) | 微服务网关的动态日志记录管理方法及系统 | |
US20150378765A1 (en) | Methods and apparatus to scale application deployments in cloud computing environments using virtual machine pools | |
US20150381711A1 (en) | Methods and apparatus to scale application deployments in cloud computing environments | |
US10313441B2 (en) | Data processing system with machine learning engine to provide enterprise monitoring functions | |
US8266301B2 (en) | Deployment of asynchronous agentless agent functionality in clustered environments | |
CN112800017B (zh) | 分布式日志采集方法、装置、介质及电子设备 | |
US20140156830A1 (en) | Correlating computing network events | |
CN111221831A (zh) | 一种对广告效果数据实时处理的计算系统 | |
US10613922B2 (en) | Synchronously generating diagnostic data | |
CN110784377A (zh) | 一种多云环境下的云监控数据统一管理的方法 | |
US11579940B2 (en) | Techniques and architectures for managing global installations and configurations | |
CN113626869B (zh) | 数据处理方法、系统、电子设备以及存储介质 | |
CN114221997A (zh) | 基于微服务业务网关的接口监控系统 | |
CN113127057A (zh) | 多任务并行执行的方法和装置 | |
Higashino et al. | Cepaas: Complex event processing as a service | |
WO2023183704A1 (en) | Customized cross-premise resource selection for containerized applications | |
CN109828719A (zh) | 基于云监控的commitLog文件所在磁盘控制方法、装置及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |