CN113946489A - 数据采集方法、系统、设备及存储介质 - Google Patents

数据采集方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN113946489A
CN113946489A CN202111204046.1A CN202111204046A CN113946489A CN 113946489 A CN113946489 A CN 113946489A CN 202111204046 A CN202111204046 A CN 202111204046A CN 113946489 A CN113946489 A CN 113946489A
Authority
CN
China
Prior art keywords
acquisition
data acquisition
data
model
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111204046.1A
Other languages
English (en)
Inventor
杨伟康
陈天祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Ezviz Software Co Ltd
Original Assignee
Hangzhou Ezviz Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Ezviz Software Co Ltd filed Critical Hangzhou Ezviz Software Co Ltd
Priority to CN202111204046.1A priority Critical patent/CN113946489A/zh
Publication of CN113946489A publication Critical patent/CN113946489A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请实施例公开了一种数据采集方法、系统、设备及存储介质,用以解决现有技术中数据采集效率低的问题。所述方法包括:获取至少一个采集对象的属性信息和采集策略信息;属性信息包括采集对象的标识信息;根据属性信息和采集策略信息,创建采集对象对应的数据采集模型;数据采集模型包括各采集对象分别对应的标识信息和采集策略信息;将数据采集模型部署于采集对象对应的至少一个云处理器中;利用数据采集模型,对云处理器中的采集对象进行数据采集。该技术方案能够实现利用数据采集模型自动化地对云处理器中的采集对象进行数据采集的效果,提高了数据采集的灵活性,且提高了数据采集效率。

Description

数据采集方法、系统、设备及存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种数据采集方法、系统、设备及存储介质。
背景技术
目前,云计算技术快速发展,特别是公有云以及基于公有云的业务的快速发展,使得云计算数据中心的机器和业务规模不断扩大,如何快速高效采集全网机器及业务的监控数据并做出处理,是云监控领域一个非常重要的问题。在全网部署采集agent(代理),通过agent的方式采集监控数据,并结合任务分发服务器和收集装置,实现全网监控数据的灵活采集是现有技术中主流的方式。
现有技术中,监控数据采集系统包括采集装置、任务分发服务器和收集装置,在该监控数据采集系统中,采集装置用于采集数据,收集装置用于下发采集指令,任务分发服务器用于接收收集装置的采集指令并下发给采集装置,然后采集装置根据采集指令以固定的周期进行采集。采用这种技术,结合大规模业务场景下监控数据采集对象和监控策略的变化比较频繁,就需要频繁的通过收集装置给大规模的采集装置下发采集指令,而规模化的采集指令的配置下发效率会比较低,同时,任务分发服务器的性能也对采集指令的下发效率产生影响,进一步导致监控数据的采集效率也较低。
发明内容
本申请实施例的目的是提供一种数据采集方法、系统、设备及存储介质,用以解决现有技术中数据采集效率低的问题。
为解决上述技术问题,本申请实施例是这样实现的:
一方面,本申请实施例提供一种数据采集方法,包括:
获取至少一个采集对象的属性信息和采集策略信息;所述属性信息包括所述采集对象的标识信息;
根据所述属性信息和所述采集策略信息,创建所述采集对象对应的数据采集模型;所述数据采集模型包括各所述采集对象分别对应的标识信息和所述采集策略信息;
将所述数据采集模型部署于所述采集对象对应的至少一个云处理器中;
利用所述数据采集模型,对所述云处理器中的所述采集对象进行数据采集。
另一方面,本申请实施例提供一种数据采集系统,包括采集模型管理装置和至少一个数据采集装置;其中:
所述采集模型管理装置,用于获取至少一个采集对象的属性信息和采集策略信息;根据所述属性信息和所述采集策略信息,创建所述采集对象对应的数据采集模型,并将所述数据采集模型发送至所述数据采集装置;所述属性信息包括所述采集对象的标识信息;所述数据采集模型包括各所述采集对象分别对应的标识信息和所述采集策略信息;
所述数据采集装置,用于将所述数据采集模型部署于所述采集对象对应的至少一个云处理器中;并利用所述数据采集模型,对所述云处理器中的所述采集对象进行数据采集。
再一方面,本申请实施例提供一种数据采集设备,包括处理器和与所述处理器电连接的存储器,所述存储器存储有计算机程序,所述处理器用于从所述存储器调用并执行所述计算机程序以实现上述数据采集方法。
再一方面,本申请实施例提供一种存储介质,用于存储计算机程序,所述计算机程序能够被处理器执行以实现上述数据采集方法。
采用本申请实施例的技术方案,通过获取至少一个采集对象的属性信息和采集策略信息,根据属性信息和采集策略信息,创建采集对象对应的数据采集模型,并将数据采集模型部署于采集对象对应的至少一个云处理器中,从而利用数据采集模型,对云处理器中的采集对象进行数据采集。相较于现有技术中依赖于接收到的采集指令进行数据采集的方式而言,该技术方案通过创建数据采集模型,并将数据采集模型部署于采集对象对应的云处理器中,从而能够实现利用数据采集模型自动化地对云处理器中的采集对象进行数据采集的效果,提高了数据采集的灵活性,且由于数据采集模型部署于云处理器本地,在进行数据采集时无需等待接收数据采集模型,因此提高了数据采集效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请一实施例的一种数据采集系统的示意性框图;
图2是根据本申请一实施例的一种数据采集方法的示意性流程图;
图3是根据本申请另一实施例的一种数据采集方法的示意性流程图;
图4是根据本申请一实施例的一种数据采集模型的创建及下发方法的示意性流程图;
图5是根据本申请一实施例的一种数据采集装置的示意性框图;
图6是根据本申请一实施例的一种采集模型管理装置的示意性框图;
图7是根据本申请另一实施例的一种数据采集系统的示意性框图;
图8是根据本申请一实施例的一种数据采集设备的结构示意图。
具体实施方式
本申请实施例提供一种数据采集方法、系统、设备及存储介质,用以解决现有技术中数据采集效率低的问题。
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本申请一个或多个实施例提供的数据采集方法,可应用于数据采集系统,也即数据采集系统用于执行数据采集方法。图1是根据本申请一实施例的一种数据采集系统的示意性框图,如图1所示,该系统包括采集模型管理装置10和至少一个数据采集装置20。其中,采集模型管理装置10分别与各数据采集装置20相连接。
需要说明的是,根据实际应用中各数据采集场景,该数据采集系统可包含一个或多个数据采集装置20。如图1所示,示意性地展示包含2个数据采集装置20的数据采集系统。
本实施例中,采集模型管理装置10,用于获取至少一个采集对象的属性信息和采集策略信息,根据属性信息和采集策略信息,创建采集对象对应的数据采集模型,并将数据采集模型发送至数据采集装置20。其中,属性信息包括采集对象的标识信息。数据采集模型包括各采集对象分别对应的标识信息和采集策略信息。
本实施例中,数据采集装置20,用于将数据采集模型部署于采集对象对应的至少一个云处理器中,并利用数据采集模型,对云处理器中的采集对象进行数据采集。
可选地,数据采集装置是一种agent模式的监控数据采集装置,agent模式下数据采集装置是云处理器(即云主机)中的一部分,负责对云主机以及云主机上所部署的系统、容器和业务程序的监控数据进行采集。可选地,数据采集装置也可以是独立于云处理器的装置,各数据采集装置分别与一个云处理器相连接。从而基于数据采集装置和云处理器之间的连接关系,数据采集装置能够将数据采集模型部署于各自对应的云处理器中。
此外,数据采集系统还可包括任务分发装置,从而采集模型管理装置将数据采集模型发送至任务分发装置,任务分发装置将数据采集模型下发至数据采集装置。其中,采集模型管理装置与任务分发装置相连接,任务分发装置分别与各数据采集装置相连接,该连接关系未在图1中示出。
图2是根据本申请一实施例的一种数据采集方法的示意性流程图,应用于如图1所示的数据采集系统,如图2所示,该方法包括:
S202,获取至少一个采集对象的属性信息和采集策略信息。
其中,属性信息可包括采集对象的标识信息。本实施例中,可通过采集模型管理装置中的信息获取单元,从资产配置管理系统中获取资产数据,并对获取到的资产数据进行处理,得到采集对象集合和各采集对象之间的关联关系。可通过采集模型管理装置中的采集策略管理单元接收用户输入的采集策略信息。
其中,对于数据采集系统而言,资产配置管理系统是外部系统。资产配置管理系统可用于对云计算数据中心(即各云处理器)进行资产数据配置管理。资产数据中可包括云处理器的基础资产信息、应用资产信息、逻辑资产信息、同种类型资产之间的关联信息、以及不同类型资产之间的映射信息。基础资产信息中可包括云处理器的物理机信息、交换机信息、防火墙信息、服务器信息等,应用资产信息可包括部署在云处理器上的业务程序信息等,逻辑资产信息可包括云处理器的组织架构及其角色、职责等信息。
信息获取单元在对获取到的资产数据进行处理时,可根据用户预先配置的处理策略,自动执行处理过程。处理策略可包括清洗、格式转换、根据业务约定规则转换等策略。各采集对象之间的关联关系可包括同种类型资产之间的关联信息和不同类型资产之间的映射信息。
可选的,采集对象可为基础资产信息和应用资产信息。在采集对象为应用资产信息时,比如,采集对象为部署在云处理器上的业务程序信息,采集对象的标识信息可为该业务程序的程序包名、类名、方法名等。
S204,根据属性信息和采集策略信息,创建采集对象对应的数据采集模型。
其中,数据采集模型包括各采集对象分别对应的标识信息和采集策略信息。本实施例中,可将各采集对象分别对应的标识信息作为模型实体,将各采集对象之间的关联关系作为关联关系,将采集策略信息作为模型实体的属性,构建数据采集模型。
S206,将数据采集模型部署于采集对象对应的至少一个云处理器中。
本实施例中,通过将数据采集模型存储在各云处理器本地,无需每次都从任务分发装置或采集模型管理装置中获取数据采集模型,使得数据采集更加灵活,且能避免任务分发装置或采集模型管理装置的下发效率对数据采集效率的影响。
S208,利用数据采集模型,对云处理器中的采集对象进行数据采集。
采用本申请实施例的技术方案,通过获取至少一个采集对象的属性信息和采集策略信息,根据属性信息和采集策略信息,创建采集对象对应的数据采集模型,并将数据采集模型部署于采集对象对应的至少一个云处理器中,从而利用数据采集模型,对云处理器中的采集对象进行数据采集。相较于现有技术中依赖于接收到的采集指令进行数据采集的方式而言,该技术方案通过创建数据采集模型,并将数据采集模型部署于采集对象对应的云处理器中,从而能够实现利用数据采集模型自动化地对云处理器中的采集对象进行数据采集的效果,提高了数据采集的灵活性,且由于数据采集模型部署于云处理器本地,在进行数据采集时无需等待接收数据采集模型,因此提高了数据采集效率。
在一个实施例中,采集策略信息可包括各采集对象对应的扫描配置信息和采集配置信息。扫描配置信息可包括扫描频率和/或扫描方式。采集配置信息可包括采集频率和/或采集方式。
其中,采集方式可定义通过哪种接口来采集对应的采集对象,采集方式可包括通过tcp接口采集、通过http接口采集、直接探测采集、通过udp接口采集等。采集配置信息还可包括采集内容、采集到的数据对应的发送方式等。比如,在采集对象为物理机时,可配置采集配置信息中的采集内容包括CPU(Central Processing Unit,中央处理器)信息、内存信息、磁盘信息等。发送方式可定义通过哪种接口来将采集到的数据发送至数据处理系统(对于数据采集系统而言,数据处理系统是外部系统),发送方式可包括通过邮件发送、通过http发送、通过udp发送、通过短信发送等。
本实施例中,上述S208,利用数据采集模型,对云处理器中的采集对象进行数据采集,可具体执行为下述步骤A1-A3:
步骤A1,根据扫描配置信息,对云处理器中的采集对象进行扫描。
其中,可根据扫描配置信息中各采集对象的扫描频率和扫描方式,在每个扫描周期、分别按照相应的扫描方式扫描各采集对象。
步骤A2,当扫描到云处理器中包括第一采集对象时,创建第一采集对象对应的数据采集任务。
其中,数据采集任务包括第一采集对象对应的采集配置信息。本实施例中,能够在扫描到采集对象时,自动化地创建该采集对象对应的数据采集任务。若未扫描到采集对象,则不创建该采集对象对应的数据采集任务。
步骤A3,基于数据采集任务,对第一采集对象进行数据采集。
在本实施例中,通过部署于云处理器中的数据采集模型,能够自动化地对云处理器中的采集对象进行数据采集,提高了数据采集的灵活性,且提高了数据采集效率。
在一个实施例中,执行步骤A2,创建第一采集对象对应的数据采集任务之后,根据扫描配置信息,继续对云处理器中的采集对象进行扫描,根据扫描结果,判断第一采集对象是否存在于云处理器中;若否,则删除第一采集对象对应的数据采集任务;若是,则保留第一采集对象对应的数据采集任务。
在本实施例中,由于云处理器中的采集对象具有实时变化性,根据扫描配置信息中的扫描频率,在每个扫描周期内均对采集对象进行扫描,能够及时发现云处理器中有变动的采集对象,从而对相应采集对象的数据采集任务进行增删,实现了及时更新数据采集任务的效果,从而能够确保数据采集的准确性。
在一个实施例中,执行上述S204,创建采集对象对应的数据采集模型之后,可将数据采集模型发送至任务分发装置,从而当检测到至少一个云处理器中未部署数据采集模型时,通过任务分发装置将数据采集模型发送至未部署数据采集模型的至少一个云处理器。
其中,数据采集模型可携带版本标识。当任务分发装置接收到最新版本的数据采集模型时,可主动将数据采集模型发送至各云处理器。
在一个实施例中,云处理器可向任务分发装置上报指定信息。指定信息可包括注册请求、运行状态信息、数据采集模型的版本等。当任务分发装置接收到云处理器上报的注册请求时,可对该云处理器进行注册,然后将注册完成信息和数据采集模型发送至该云处理器。当任务分发装置接收到云处理器上报的运行状态信息为运行状态、且上报了数据采集模型时,对比云处理器上报的数据采集模型的版本是否低于任务分发装置中存储的数据采集模型的版本,在确定接收到的数据采集模型的版本低于任务分发装置中存储的数据采集模型的版本时,将数据采集模型发送至该云处理器。
在本实施例中,通过将数据采集模型发送至任务分发装置,从而通过任务分发装置将数据采集模型下发至未部署数据采集模型的云处理器,确保了各云处理器都能接收到数据采集模型,从而确保了数据采集的顺利执行,提高了数据采集效率。
在一个实施例中,属性信息还包括各采集对象之间的关联关系。数据采集模型包括第二采集对象对应的采集策略信息、以及第二采集对象和第三采集对象之间的关联关系。上述S208,利用数据采集模型,对云处理器中的采集对象进行数据采集,可具体执行为下述步骤B1-B2:
步骤B1,根据第二采集对象对应的采集策略信息,对第二采集对象进行数据采集,得到第二采集对象对应的第一目标数据。
步骤B2,根据第二采集对象和第三采集对象之间的关联关系以及第一目标数据,确定第三采集对象对应的第二目标数据。
例如,第三采集对象为部署在云处理器上的业务程序信息中的一个类,第二采集对象为该类中的多个方法,第二采集对象对应有采集策略信息,第三采集对象没有对应的采集策略信息(即第三采集对象对应的数据无法直接采集到),第二采集对象和第三采集对象之间的关联关系为包含关系。那么,在根据第二采集对象对应的采集策略信息,对第二采集对象进行数据采集,得到第二采集对象对应的第一目标数据之后,根据第二采集对象和第三采集对象之间的包含关系以及第一目标数据,可确定第三采集对象对应的第二目标数据。
在本实施例中,通过部署于云处理器中的数据采集模型,能够自动化地对云处理器中的采集对象进行数据采集,且实现了对无法直接采集到数据的采集对象的数据采集,不仅提高了数据采集效率,而且确保了采集到的数据的全面性。
图3是根据本申请另一实施例的一种数据采集方法的示意性流程图,应用于如图1所示的数据采集系统,如图3所示,该方法包括:
S301,数据采集装置根据数据采集模型中的扫描配置信息,对云处理器中的采集对象进行扫描。
其中,数据采集装置可接收任务分发装置下发的数据采集模型,并将数据采集模型部署于云处理器中。数据采集模型可包括各采集对象分别对应的标识信息和采集策略信息。采集策略信息包括各采集对象对应的扫描配置信息和采集配置信息。扫描配置信息包括扫描频率和/或扫描方式。采集配置信息包括采集频率和/或采集方式。
S302,当数据采集装置扫描到云处理器中包括第一采集对象时,创建第一采集对象对应的数据采集任务。
其中,数据采集任务包括第一采集对象对应的采集配置信息。在一个实施例中,创建第一采集对象对应的数据采集任务之后,可根据扫描配置信息,继续对云处理器中的采集对象进行扫描,根据扫描结果,判断第一采集对象是否存在于云处理器中;若否,则删除第一采集对象对应的数据采集任务;若是,则保留第一采集对象对应的数据采集任务。
S303,数据采集装置基于数据采集任务,对第一采集对象进行数据采集。
在一个实施例中,数据采集模型还可包括各采集对象之间的关联关系。在数据采集模型包括第二采集对象对应的采集策略信息、以及第二采集对象和第三采集对象之间的关联关系时,可根据第二采集对象对应的采集策略信息,对第二采集对象进行数据采集,得到第二采集对象对应的第一目标数据,从而根据第二采集对象和第三采集对象之间的关联关系以及第一目标数据,确定第三采集对象对应的第二目标数据。
上述S301-S303的具体过程在上述实施例中已进行详细说明,此处不再赘述。
在本实施例中,数据采集装置利用部署于云处理器中的数据采集模型,自动化地对云处理器中的采集对象进行数据采集,提高了数据采集的灵活性,且由于数据采集模型部署于云处理器本地,在进行数据采集时无需等待接收数据采集模型,因此提高了数据采集效率。
图4是根据本申请一实施例的一种数据采集模型的创建及下发的示意性流程图,应用于如图1中所示的采集模型管理装置,如图4所示,该方法包括:
S401,采集模型管理装置获取至少一个采集对象的属性信息,并获取至少一个采集对象对应的采集策略信息。
其中,属性信息可包括采集对象的标识信息和各采集对象之间的关联关系。
S402,采集模型管理装置根据属性信息和采集策略信息,创建采集对象对应的数据采集模型。
S403,采集模型管理装置将数据采集模型发送至任务分发装置,以使任务分发装置将数据采集模型下发至数据采集装置。
其中,任务分发装置在检测到至少一个云处理器中未部署数据采集模型时,将数据采集模型发送至未部署数据采集模型的至少一个云处理器。从而数据采集装置将接收到的数据采集模型部署于对应的云处理器中,并利用数据采集模型,对云处理器中的采集对象进行数据采集。
上述S401-S403的具体过程在上述实施例中已进行详细说明,此处不再赘述。
在本实施例中,采集模型管理装置能够自动化创建数据采集模型,并将数据采集模型发送至任务分发装置,从而通过任务分发装置将数据采集模型下发至数据采集装置,确保了各数据采集装置都能接收到数据采集模型,从而确保了数据采集的顺利执行,提高了数据采集效率。
以上为本申请实施例提供的数据采集方法和系统,下面结合附图对图1所示的数据采集系统进行详细说明。
在一个实施例中,数据采集系统还包括任务分发装置。本实施例中,采集模型管理装置10,还用于将数据采集模型发送至任务分发装置。任务分发装置,用于将数据采集模型下发至数据采集装置20。
其中,数据采集装置20还用于向任务分发装置上报指定信息。指定信息可包括数据采集装置20的注册请求、运行状态信息、数据采集模型的版本等。从而任务分发装置根据接收到的指定信息确定向数据采集装置20返回的信息。
例如,任务分发装置在接收到数据采集装置的注册请求时,确定向数据采集装置20返回注册完成信息、以及下发数据采集模型。任务分发装置在接收到运行状态信息为运行状态、且接收到的数据采集模型的版本低于任务分发装置中存储的数据采集模型的版本时,确定向数据采集装置20返回最新版本的数据采集模型。
在本实施例中,采集模型管理装置将数据采集模型发送至任务分发装置,从而通过任务分发装置将数据采集模型下发至数据采集装置,确保了各数据采集装置都能接收到数据采集模型,从而确保了数据采集的顺利执行,提高了数据采集效率。
在一个实施例中,采集策略信息包括各采集对象对应的扫描配置信息和采集配置信息。扫描配置信息包括扫描频率和/或扫描方式。采集配置信息包括采集频率和/或采集方式。图5是根据本申请一实施例的一种数据采集装置的示意性框图,如图5所示,数据采集装置20可包括扫描单元201、采集单元202、接收单元203和第一存储单元204。其中,接收单元203与扫描单元201相连接,扫描单元201与采集单元202相连接,扫描单元201、采集单元202和接收单元203分别与第一存储单元204相连接。
本实施例中,扫描单元201,用于根据扫描配置信息,对云处理器中的采集对象进行扫描,当扫描到云处理器中包括第一采集对象时,创建第一采集对象对应的数据采集任务。其中,数据采集任务包括第一采集对象对应的采集配置信息。
本实施例中,采集单元202,用于基于数据采集任务,对第一采集对象进行数据采集。接收单元203,用于接收任务分发装置下发的数据采集模型,并将数据采集模型发送至第一存储单元204。第一存储单元204,用于将数据采集模型部署于云处理器中。
此外,数据采集装置20还包括发送单元,用于将采集单元202采集到的数据发送至外部数据处理系统,以实现对采集到的数据的处理。发送单元可与采集单元202相连接,并与第一存储单元204相连接,该连接关系并未在图5中示出。
在本实施例中,数据采集装置利用部署于云处理器中的数据采集模型,自动化地对云处理器中的采集对象进行数据采集,提高了数据采集的灵活性,且提高了数据采集效率。
图6是根据本申请一实施例的一种采集模型管理装置的示意性框图,如图6所示,采集模型管理装置10可包括信息获取单元101、采集策略管理单元102、采集模型管理单元103和下发单元104。其中,信息获取单元101、采集策略管理单元102分别与采集模型管理单元103相连接,采集模型管理单元103与下发单元104相连接。
本实施例中,信息获取单元101,用于获取至少一个采集对象的属性信息,并将属性信息发送至采集模型管理单元103。采集策略管理单元102,用于获取至少一个采集对象对应的采集策略信息,并将采集策略信息发送至采集模型管理单元103。采集模型管理单元103,用于根据属性信息和采集策略信息,创建采集对象对应的数据采集模型,并将数据采集模型发送至下发单元104。下发单元104,用于将数据采集模型发送至任务分发装置。
此外,采集模型管理装置10还包括第二存储单元,用于持久化存储采集对象的属性信息、采集对象对应的采集策略信息和采集对象对应的数据采集模型。第二存储单元可分别与信息获取单元101、采集策略管理单元102和采集模型管理单元103相连接,并与下发单元104相连接,该连接关系并未在图6中示出。从而采集模型管理单元103将数据采集模型发送至第二存储单元,下发单元104从第二存储单元中获取数据采集模型后,将数据采集模型发送至任务分发装置。
在本实施例中,采集模型管理装置通过获取至少一个采集对象的属性信息和采集策略信息,根据属性信息和采集策略信息,创建采集对象对应的数据采集模型,并将数据采集模型发送至任务分发装置,实现了自动化生成数据采集模型的效果,为提高数据采集效率提供了模型基础。
图7是根据本申请另一实施例的一种数据采集系统的示意性框图,如图7所示,该系统包括采集模型管理装置10、任务分发装置30和至少一个数据采集装置20。本实施例对数据采集装置20和云处理器之间的连接关系不作限定,例如,各数据采集装置20分别为各云处理器的一部分,或者,各数据采集装置20分别与一个云处理器相连接(未在图7中示出)。图7示意性地展示包含2个数据采集装置20的数据采集系统。其中,采集模型管理装置10与任务分发装置30相连接,任务分发装置30分别与各数据采集装置20相连接。
本实施例中,采集模型管理装置10,用于获取至少一个采集对象的属性信息和采集策略信息,根据属性信息和采集策略信息,创建采集对象对应的数据采集模型,并将数据采集模型发送至任务分发装置30。其中,属性信息包括采集对象的标识信息。数据采集模型包括各采集对象分别对应的标识信息和采集策略信息。
本实施例中,任务分发装置30,用于将数据采集模型下发至数据采集装置20。数据采集装置20,用于将数据采集模型部署于采集对象对应的至少一个云处理器中,并利用数据采集模型,对云处理器中的采集对象进行数据采集。
其中,采集模型管理装置10、数据采集装置20分别对应的具体执行单元,请分别参见图5和图6所示的实施例,为避免重复,这里不再赘述。
采用本申请实施例的系统,采集模型管理装置通过获取至少一个采集对象的属性信息和采集策略信息,根据属性信息和采集策略信息,创建采集对象对应的数据采集模型,并将数据采集模型发送至任务分发装置,任务分发装置将数据采集模型下发至数据采集装置,数据采集装置将数据采集模型部署于采集对象对应的至少一个云处理器中,从而利用数据采集模型,对云处理器中的采集对象进行数据采集。相较于现有技术中数据采集装置依赖于接收到的采集指令进行数据采集的方式而言,该系统中数据采集装置能够实现利用数据采集模型自动化地对云处理器中的采集对象进行数据采集的效果,提高了数据采集的灵活性,且由于数据采集模型部署于云处理器本地,在进行数据采集时无需等待接收数据采集模型,因此提高了数据采集效率。
综上,已经对本主题的特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作可以按照不同的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序,以实现期望的结果。在某些实施方式中,多任务处理和并行处理可以是有利的。
本领域的技术人员应可理解,图1和图7中的数据采集系统能够用来实现前文所述的数据采集方法,其中的细节描述应与前文方法部分描述类似,为避免繁琐,此处不另赘述。
基于同样的思路,本申请实施例还提供一种数据采集设备,如图8所示。数据采集设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器801和存储器802,存储器802中可以存储有一个或一个以上存储应用程序或数据。其中,存储器802可以是短暂存储或持久存储。存储在存储器802的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对数据采集设备中的一系列计算机可执行指令。更进一步地,处理器801可以设置为与存储器802通信,在数据采集设备上执行存储器802中的一系列计算机可执行指令。数据采集设备还可以包括一个或一个以上电源803,一个或一个以上有线或无线网络接口804,一个或一个以上输入输出接口805,一个或一个以上键盘806。
具体在本实施例中,数据采集设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对数据采集设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取至少一个采集对象的属性信息和采集策略信息;属性信息包括采集对象的标识信息;
根据属性信息和采集策略信息,创建采集对象对应的数据采集模型;数据采集模型包括各采集对象分别对应的标识信息和采集策略信息;
将数据采集模型部署于采集对象对应的至少一个云处理器中;
利用数据采集模型,对云处理器中的采集对象进行数据采集。
采用本申请实施例的设备,通过获取至少一个采集对象的属性信息和采集策略信息,根据属性信息和采集策略信息,创建采集对象对应的数据采集模型,并将数据采集模型部署于采集对象对应的至少一个云处理器中,从而利用数据采集模型,对云处理器中的采集对象进行数据采集。相较于现有技术中依赖于接收到的采集指令进行数据采集的方式而言,该设备通过创建数据采集模型,并将数据采集模型部署于采集对象对应的云处理器中,从而能够实现利用数据采集模型自动化地对云处理器中的采集对象进行数据采集的效果,提高了数据采集的灵活性,且由于数据采集模型部署于云处理器本地,在进行数据采集时无需等待接收数据采集模型,因此提高了数据采集效率。
本申请实施例还提出了一种存储介质,该存储介质存储一个或多个计算机程序,该一个或多个计算机程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行上述数据采集方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (12)

1.一种数据采集方法,其特征在于,包括:
获取至少一个采集对象的属性信息和采集策略信息;所述属性信息包括所述采集对象的标识信息;
根据所述属性信息和所述采集策略信息,创建所述采集对象对应的数据采集模型;所述数据采集模型包括各所述采集对象分别对应的标识信息和所述采集策略信息;
将所述数据采集模型部署于所述采集对象对应的至少一个云处理器中;
利用所述数据采集模型,对所述云处理器中的所述采集对象进行数据采集。
2.根据权利要求1所述的方法,其特征在于,所述采集策略信息包括各所述采集对象对应的扫描配置信息和采集配置信息;所述扫描配置信息包括扫描频率和/或扫描方式;所述采集配置信息包括采集频率和/或采集方式;
所述利用所述数据采集模型,对所述云处理器中的所述采集对象进行数据采集,包括:
根据所述扫描配置信息,对所述云处理器中的所述采集对象进行扫描;
当扫描到所述云处理器中包括第一采集对象时,创建所述第一采集对象对应的数据采集任务;所述数据采集任务包括所述第一采集对象对应的所述采集配置信息;
基于所述数据采集任务,对所述第一采集对象进行数据采集。
3.根据权利要求2所述的方法,其特征在于,所述创建所述第一采集对象对应的数据采集任务之后,还包括:
根据所述扫描配置信息,继续对所述云处理器中的所述采集对象进行扫描;
根据扫描结果,判断所述第一采集对象是否存在于所述云处理器中;
若否,则删除所述第一采集对象对应的所述数据采集任务。
4.根据权利要求1所述的方法,其特征在于,所述创建所述采集对象对应的数据采集模型之后,还包括:
将所述数据采集模型发送至任务分发装置;
当检测到至少一个所述云处理器中未部署所述数据采集模型时,通过所述任务分发装置将所述数据采集模型发送至未部署所述数据采集模型的至少一个所述云处理器。
5.根据权利要求1所述的方法,其特征在于,所述属性信息还包括各所述采集对象之间的关联关系;所述数据采集模型包括第二采集对象对应的所述采集策略信息、以及所述第二采集对象和第三采集对象之间的所述关联关系;
所述利用所述数据采集模型,对所述云处理器中的所述采集对象进行数据采集,包括:
根据所述第二采集对象对应的所述采集策略信息,对所述第二采集对象进行数据采集,得到所述第二采集对象对应的第一目标数据;
根据所述第二采集对象和所述第三采集对象之间的所述关联关系以及所述第一目标数据,确定所述第三采集对象对应的第二目标数据。
6.一种数据采集系统,其特征在于,包括采集模型管理装置和至少一个数据采集装置;其中:
所述采集模型管理装置,用于获取至少一个采集对象的属性信息和采集策略信息;根据所述属性信息和所述采集策略信息,创建所述采集对象对应的数据采集模型,并将所述数据采集模型发送至所述数据采集装置;所述属性信息包括所述采集对象的标识信息;所述数据采集模型包括各所述采集对象分别对应的标识信息和所述采集策略信息;
所述数据采集装置,用于将所述数据采集模型部署于所述采集对象对应的至少一个云处理器中;并利用所述数据采集模型,对所述云处理器中的所述采集对象进行数据采集。
7.根据权利要求6所述的系统,其特征在于,所述系统还包括任务分发装置;
所述采集模型管理装置,还用于将所述数据采集模型发送至所述任务分发装置;
所述任务分发装置,用于将所述数据采集模型下发至所述数据采集装置。
8.根据权利要求7所述的系统,其特征在于,所述采集策略信息包括各所述采集对象对应的扫描配置信息和采集配置信息;所述扫描配置信息包括扫描频率和/或扫描方式;所述采集配置信息包括采集频率和/或采集方式;
所述数据采集装置包括:
扫描单元,用于根据所述扫描配置信息,对所述云处理器中的所述采集对象进行扫描;当扫描到所述云处理器中包括第一采集对象时,创建所述第一采集对象对应的数据采集任务;所述数据采集任务包括所述第一采集对象对应的所述采集配置信息;
采集单元,用于基于所述数据采集任务,对所述第一采集对象进行数据采集。
9.根据权利要求8所述的系统,其特征在于,所述数据采集装置还包括:
接收单元,用于接收所述任务分发装置下发的所述数据采集模型,并将所述数据采集模型发送至第一存储单元;
所述第一存储单元,用于将所述数据采集模型部署于所述云处理器中。
10.根据权利要求7所述的系统,其特征在于,所述采集模型管理装置包括:
信息获取单元,用于获取所述至少一个采集对象的所述属性信息,并将所述属性信息发送至采集模型管理单元;
采集策略管理单元,用于获取所述至少一个采集对象对应的所述采集策略信息,并将所述采集策略信息发送至所述采集模型管理单元;
所述采集模型管理单元,用于根据所述属性信息和所述采集策略信息,创建所述采集对象对应的数据采集模型,并将所述数据采集模型发送至下发单元;
所述下发单元,用于将所述数据采集模型发送至所述任务分发装置。
11.一种数据采集设备,其特征在于,包括处理器和与所述处理器电连接的存储器,所述存储器存储有计算机程序,所述处理器用于从所述存储器调用并执行所述计算机程序以实现权利要求1-5任一项所述的数据采集方法。
12.一种存储介质,其特征在于,所述存储介质用于存储计算机程序,所述计算机程序被处理器执行以实现权利要求1-5任一项所述的数据采集方法。
CN202111204046.1A 2021-10-15 2021-10-15 数据采集方法、系统、设备及存储介质 Pending CN113946489A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111204046.1A CN113946489A (zh) 2021-10-15 2021-10-15 数据采集方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111204046.1A CN113946489A (zh) 2021-10-15 2021-10-15 数据采集方法、系统、设备及存储介质

Publications (1)

Publication Number Publication Date
CN113946489A true CN113946489A (zh) 2022-01-18

Family

ID=79330617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111204046.1A Pending CN113946489A (zh) 2021-10-15 2021-10-15 数据采集方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113946489A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116467151A (zh) * 2023-06-19 2023-07-21 浙江无端科技股份有限公司 一种程序性能信息采集方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116467151A (zh) * 2023-06-19 2023-07-21 浙江无端科技股份有限公司 一种程序性能信息采集方法、装置、设备及存储介质
CN116467151B (zh) * 2023-06-19 2023-08-25 浙江无端科技股份有限公司 一种程序性能信息采集方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US20200379812A1 (en) Unified container orchestration controller
EP3975474A1 (en) Methods and apparatuses for chaining service data
CN106371889B (zh) 一种调度镜像的高性能集群系统实现方法及装置
CN110060153B (zh) 一种基于多个区块链网络的数据存证方法及系统
CN112181378B (zh) 业务流程的实现方法及装置
US20130007184A1 (en) Message oriented middleware with integrated rules engine
CN109828830B (zh) 用于管理容器的方法和装置
CN113946489A (zh) 数据采集方法、系统、设备及存储介质
CN111984259A (zh) 界面创建方法、装置、设备及存储介质
CN104054308B (zh) 应用层资源选择的方法、装置和系统
CN106648567B (zh) 数据获取方法及装置
CN108647102B (zh) 异构系统的服务请求处理方法、装置和电子设备
CN110764930B (zh) 基于消息模式的请求或应答处理方法及装置
CN111949297B (zh) 一种区块链智能合约升级方法、装置及电子设备
CN107395663B (zh) 数据获取方法及装置
CN112035156A (zh) 一种电商平台对接装置、方法、设备及介质
CN112491943A (zh) 数据请求方法、装置、存储介质和电子设备
CN112579066A (zh) 图表展示方法、装置、存储介质及设备
WO2018121652A1 (zh) 通过用户设备中的应用连接无线接入点的方法与设备
CN115203050A (zh) 一种服务的依赖关系的确定方法及装置
CN113949637A (zh) 一种交换机资源智能分配部署方法及装置
CN109656805B (zh) 用于业务分析的代码链路的生成方法、装置及业务服务器
CN111435320B (zh) 一种数据处理方法及其装置
CN110060152B (zh) 一种基于多个区块链网络的数据读取方法及系统
CN112509164A (zh) 一种出勤打卡方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination