CN106446255A

CN106446255A - 一种基于云服务器的数据处理方法

Info

Publication number: CN106446255A
Application number: CN201610901600.4A
Authority: CN
Inventors: 李让剑
Original assignee: Anhui Tianda Network Technology Co Ltd
Current assignee: Anhui Tianda Network Technology Co Ltd
Priority date: 2016-10-18
Filing date: 2016-10-18
Publication date: 2017-02-22

Abstract

本发明提供了一种基于云服务器的数据处理方法，其包括以下步骤：初始化数据：将分布在不同网络空间的数据进行合并，将数据中的缺省项进行补充完整并清洗脏数据；数据选择：从所述初始化处理的数据中将不同格式的数据转化为统一格式；数据预处理：检查所述统一格式的数据，将含有噪声数据、冗余的数据剔除，对缺省数据进行补充，同时对数据通过编码进行标识；数据挖掘，具体包括以下步骤：确定挖掘目标，选择算法，采用所述挖掘算法对数据进行处理，将挖掘出的数据附加上标识后导出并存储。本发明在数据搜索时的速率提高，且搜索精度得到很大的提高。

Description

一种基于云服务器的数据处理方法

技术领域

本发明涉及到云服务器技术领域，特别是一种基于云服务器的数据处理方法。

背景技术

目前，随着计算机和网络应用的日益广泛以及不同领域的业务种类的日益丰富，从与特定的对象相关的海量数据记录中有效地挖掘出不同类别的对象以便针对不同类别的对象实施不同的处理方案变的越来越重要。

在现有的技术方案中，通常根据与目标对象相关联的一个或多个属性数据来对目标对象进行分类，即基于每个目标对象的某个或某些特定的属性数据的值对目标对象进行分类。

而，现有的技术方案存在如下问题：由于仅仅基于单一或数个属性数据对目标对象进行分类，故分类结果的精确度较低，并且由于需要对每个目标对象的属性数据进行相同的评估操作，故数据挖掘的效率较低。

因此，存在如下需求：提供能够根据目标对象的综合特征来挖掘和分类目标对象的基于云服务器的数据挖掘方法。

发明内容

为解决上述技术问题，本发明提供了一种基于云服务器的数据处理方法，其包括以下步骤：

S1：初始化数据：将分布在不同网络空间的数据进行合并，将数据中的缺省项进行补充完整并清洗脏数据；

S2：数据选择：从所述初始化处理的数据中将不同格式的数据转化为统一格式；

S3：数据预处理：检查所述统一格式的数据，将含有噪声数据、冗余的数据剔除，对缺省数据进行补充，同时对数据通过编码进行标识，将数据转化为0和1区分的数值型数据；

S4:数据挖掘，具体包括以下步骤：

S41:确定挖掘目标：确定要发现的数据关键词、数据类型、数据名称、存储日期作为目标数据的特征值；

S42：选择算法：根据目标数据的具体特征值类型选择相应的数据挖掘算法；

S43：数据挖掘：采用所述挖掘算法对数据进行处理，将挖掘出的数据附加上标识后导出并存储。

较佳地，所述不同网络空间包括多个不同的网络云端服务器。

较佳地，所述挖掘算法为k—means聚类算法或者基于层次的聚类分析算法。

较佳地，所述缺省数据的补充内容包括数据扩展名与系统存储路径。

较佳地，所述脏数据是指源系统中的数据不在给定的范围内或对于实际业务毫无意义，或是数据格式非法，以及在源系统中存在不规范的编码和含糊的业务逻辑的数据。

本发明具有以下有益效果：

本发明提供的基于云服务器的数据处理方法通过对不同的存储空间内存储的数据进行处理优化，根据目标数据的特征值通过挖掘算法进行找寻，本发明在数据搜索时的速率提高，且搜索精度得到很大的保障。

当然，实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。

具体实施方式

下面将结合本发明实施例对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

本发明实施例提供了一种基于云服务器的数据处理方法，其包括以下步骤：

S4:数据挖掘，具体包括以下步骤：

本实施例中所述不同网络空间包括多个不同的网络云端服务器。

其中所述挖掘算法为k—means聚类算法或者基于层次的聚类分析算法。

所述缺省数据的补充内容包括数据扩展名与系统存储路径。

所述脏数据是指源系统中的数据不在给定的范围内或对于实际业务毫无意义，或是数据格式非法，以及在源系统中存在不规范的编码和含糊的业务逻辑的数据。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。显然，根据本说明书的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本发明的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种基于云服务器的数据处理方法，其特征在于，包括以下步骤：

S4:数据挖掘，具体包括以下步骤：

2.如权利要求1所述的基于云服务器的数据处理方法，其特征在于，所述不同网络空间包括多个不同的网络云端服务器。

3.如权利要求1所述的基于云服务器的数据处理方法，其特征在于，所述挖掘算法为k—means聚类算法或者基于层次的聚类分析算法。

4.如权利要求1所述的基于云服务器的的数据处理方法，其特征在于，所述缺省数据的补充内容包括数据扩展名与系统存储路径。

5.如权利要求1所述的基于云服务器的的数据处理方法，其特征在于，所述脏数据是指源系统中的数据不在给定的范围内或对于实际业务毫无意义，或是数据格式非法，以及在源系统中存在不规范的编码和含糊的业务逻辑的数据。