CN107741879A

CN107741879A - 一种大数据处理方法及其装置

Info

Publication number: CN107741879A
Application number: CN201710996794.5A
Authority: CN
Inventors: 杨吉东
Original assignee: Zhengzhou Yunhai Information Technology Co Ltd
Current assignee: Zhengzhou Yunhai Information Technology Co Ltd
Priority date: 2017-10-19
Filing date: 2017-10-19
Publication date: 2018-02-27

Abstract

本发明公开了一种大数据处理方法及其装置。该方法，包括：获取至少一个第一大数据；采用分布式处理将所述至少一个第一大数据通过数据处理器进行处理，获得数据处理结果，所述数据处理器用于根据所述第一大数据的参数信息，确定所述第一大数据特性，并根据所述第一大数据特性对所述第一大数据进行数据处理的处理器。通过对至少一个第一大数据的分布式处理，实现了对数据量庞大的数据进行处理，进一步的，通过数据处理器对第一大数据进行处理，实现了对大数据的精准处理。

Description

一种大数据处理方法及其装置

技术领域

本发明涉及计算机技术，尤指一种大数据处理方法及其装置。

背景技术

随着现在科技的发展，各行各业都会产生大量数据，进一步，随着各行各业规模的蓬勃发展，产生的数据以几何倍数爆炸式增长，从而产生人们常说的大数据。

通常，获取的大数据具有数据规模大、流转速度高、类型多种多样和价值密度比较低的特点，也就是说，该些数据不仅数据量大，而且数据之间无序，非关系型，导致现有技术无法在一时间范围内完成对大数据的处理。

发明内容

为了解决上述技术问题，本发明提供了一种大数据处理方法及其装置，用以解决无法在一时间范围内完成对大数据的处理的问题。

为了达到本发明目的，本发明提供了一种大数据处理理方法，包括：

获取至少一个第一大数据；

采用分布式处理将所述至少一个第一大数据通过数据处理器进行处理，获得数据处理结果，所述数据处理器用于根据所述第一大数据的参数信息，确定所述第一大数据特性，并根据所述第一大数据特性对所述第一大数据进行数据处理的处理器。

进一步的，所述获取至少一个第一大数据之前，还包括：

获取至少一个第二大数据；

根据所述至少一个第二大数据的各维度参数，确定所述数据处理器。

进一步的，所述获取至少一个第一大数据之后，还包括：

将所述至少一个第一大数据进行分布式存储。

进一步的，所述将所述至少一个第一大数据进行分布式存储，包括：

将所述至少一个第一大数据存储在分布式数据库。

进一步的，所述采用分布式处理将所述至少一个第一大数据通过数据处理器进行处理，获得数据处理结果之后，还包括：

将所述数据处理结果进行优化处理，获得优化结果。

本发明还提供了一种大数据处理装置，包括：

获取模块，用于获取至少一个第一大数据；

处理模块，用于采用分布式处理将所述至少一个第一大数据通过数据处理器进行处理，获得数据处理结果，所述数据处理器用于根据所述第一大数据的参数信息，确定所述第一大数据特性，并根据所述第一大数据特性对所述第一大数据进行数据处理的处理器。

进一步的，所述获取模块，还用于获取至少一个第二大数据；

所述处理模块，还用于根据所述至少一个第二大数据的各维度参数，确定所述数据处理器。

进一步的，所述处理模块，还用于将所述至少一个第一大数据进行分布式存储。

进一步的，所述处理模块，还用于将所述至少一个第一大数据存储在分布式数据库。

进一步的，所述处理模块，还用于将所述数据处理结果进行优化处理，获得优化结果。

本发明提供的一种云平台管理方法及其装置，通过获取至少一个第一大数据；采用分布式处理将所述至少一个第一大数据通过数据处理器进行处理，获得数据处理结果，所述数据处理器用于根据所述第一大数据的参数信息，确定所述第一大数据特性，并根据所述第一大数据特性对所述第一大数据进行数据处理的处理器。通过对至少一个第一大数据的分布式处理，实现了对数据量庞大的数据进行处理，进一步的，通过数据处理器对第一大数据进行处理，实现了对大数据的精准处理。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明技术方案的进一步理解，并且构成说明书的一部分，与本申请的实施例一起用于解释本发明的技术方案，并不构成对本发明技术方案的限制。

图1为本发明大数据处理方法一实施例的流程示意图；

图2为本发明大数据处理装置一实施例的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下文中将结合附图对本发明的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

本发明实施例提供的大数据处理方法具体可以应用于对大数据处理进行处理时。本实施例提供的大数据处理方法可以通过大数据处理装置来执行，该大数据处理装置可以集成在大数据处理装置，或者单独设置，其中，该大数据处理装置可以采用软件和/或硬件的方式来实现。以下对本实施例提供的大数据处理方法及装置进行详细地说明。

图1为本发明大数据处理方法一实施例的流程示意图；如图1所示，本实施例的执行主体可以是大数据处理装置，本发明提供的大数据处理方法，包括：

步骤101、获取至少一个第一大数据。

具体的，可以通过搜索引擎、电商收集获取至少一个第一大数据，举例来讲，该第一大数据，可以包括多个用户分别通过搜索引擎搜索的关键字，以及通过搜索引擎阅览的网页。

步骤102、采用分布式处理将所述至少一个第一大数据通过数据处理器进行处理，获得数据处理结果。

在本实施例中，所述数据处理器用于根据所述第一大数据的参数信息，确定所述第一大数据特性，并根据所述第一大数据特性对所述第一大数据进行数据处理的处理器。

举例来讲，根据第一大数据中参数信息，确定用户的地域属性，并根据该用户的地域属性确定该用户的喜好特性，从而根据用户的喜好特性给该用户推送喜好的产品或网页。

具体的，本实施例采用分布式处理将所述至少一个第一大数据通过数据处理器进行处理，获得数据处理结果，可以包括：将至少一个第一大数据进行分布式处理，其中，每个分布式处理的节点均设置有一个数据处理器。

在本实施例中，获取至少一个第一大数据；采用分布式处理将所述至少一个第一大数据通过数据处理器进行处理，获得数据处理结果，所述数据处理器用于根据所述第一大数据的参数信息，确定所述第一大数据特性，并根据所述第一大数据特性对所述第一大数据进行数据处理的处理器。通过对至少一个第一大数据的分布式处理，实现了对数据量庞大的数据进行处理，进一步的，通过数据处理器对第一大数据进行处理，实现了对大数据的精准处理。

进一步的，所述获取至少一个第一大数据之前，还包括：

获取至少一个第二大数据；

具体的，通过对第二大数据中各维度参数可以包括：用户年龄，用户兴趣，用户所在地域等信息。

进一步的，在上述实施例的基础上，所述获取至少一个第一大数据之后，还包括：

将所述至少一个第一大数据进行分布式存储。

优选的，所述将所述至少一个第一大数据进行分布式存储，包括：

将所述至少一个第一大数据存储在分布式数据库。

进一步的，在上述实施例的基础上，所述采用分布式处理将所述至少一个第一大数据通过数据处理器进行处理，获得数据处理结果之后，还包括：

将所述数据处理结果进行优化处理，获得优化结果。

图2为本发明大数据处理装置一实施例的结构示意图；如图2所示，本发明提供的大数据处理装置，包括：获取模块21和处理模块22，其中，

获取模块21，用于获取至少一个第一大数据；

处理模块22，用于采用分布式处理将所述至少一个第一大数据通过数据处理器进行处理，获得数据处理结果，所述数据处理器用于根据所述第一大数据的参数信息，确定所述第一大数据特性，并根据所述第一大数据特性对所述第一大数据进行数据处理的处理器。

在上述实施例的基础上，所述获取模块21，还用于获取至少一个第二大数据；

所述处理模块22，还用于根据所述至少一个第二大数据的各维度参数，确定所述数据处理器。

进一步的，在上述实施例的基础上，所述处理模块22，还用于将所述至少一个第一大数据进行分布式存储。

进一步的，在上述实施例的基础上，所述处理模块22，还用于将所述至少一个第一大数据存储在分布式数据库。

进一步的，在上述实施例的基础上，所述处理模块22，还用于将所述数据处理结果进行优化处理，获得优化结果。

在本实施例中，实现了对数据量庞大的数据进行处理，进一步的，通过数据处理器对第一大数据进行处理，实现了对大数据的精准处理。

虽然本发明所揭露的实施方式如上，但所述的内容仅为便于理解本发明而采用的实施方式，并非用以限定本发明。任何本发明所属领域内的技术人员，在不脱离本发明所揭露的精神和范围的前提下，可以在实施的形式及细节上进行任何的修改与变化，但本发明的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

1.一种大数据处理方法，其特征在于，包括：

获取至少一个第一大数据；

2.根据权利要求1所述的方法，其特征在于，所述获取至少一个第一大数据之前，还包括：

获取至少一个第二大数据；

3.根据权利要求2所述的方法，其特征在于，所述获取至少一个第一大数据之后，还包括：

将所述至少一个第一大数据进行分布式存储。

4.根据权利要求3所述的方法，其特征在于，所述将所述至少一个第一大数据进行分布式存储，包括：

将所述至少一个第一大数据存储在分布式数据库。

5.根据权利要求1-4任一项所述的方法，其特征在于，所述采用分布式处理将所述至少一个第一大数据通过数据处理器进行处理，获得数据处理结果之后，还包括：

将所述数据处理结果进行优化处理，获得优化结果。

6.一种大数据处理装置，其特征在于，包括：

获取模块，用于获取至少一个第一大数据；

7.根据权利要求6所述的装置，其特征在于，所述获取模块，还用于获取至少一个第二大数据；

8.根据权利要求7所述的装置，其特征在于，所述处理模块，还用于将所述至少一个第一大数据进行分布式存储。

9.根据权利要求8所述的装置，其特征在于，所述处理模块，还用于将所述至少一个第一大数据存储在分布式数据库。

10.根据权利要求6-9任一项所述的装置，其特征在于，所述处理模块，还用于将所述数据处理结果进行优化处理，获得优化结果。