CN109284290A

CN109284290A - 一种基于分布式储存空间的数据读取方法

Info

Publication number: CN109284290A
Application number: CN201811100112.9A
Authority: CN
Inventors: 张彩霞; 郭静; 王向东; 王新东; 胡绍林
Original assignee: Foshan University
Current assignee: China Southern Power Grid Internet Service Co ltd; Ourchem Information Consulting Co ltd
Priority date: 2018-09-20
Filing date: 2018-09-20
Publication date: 2019-01-29
Anticipated expiration: 2038-09-20
Also published as: CN109284290B

Abstract

本发明公开了一种基于分布式储存空间的数据读取方法，包括：步骤1、获取用户输入的标记符和分布式储存空间地址；步骤2、根据所述地址找到设有第一储存仓、第二储存仓和第三储存仓的分布式储存空间；步骤3、根据所述标记符与第一储存仓存放的标记符进行匹配；步骤4、从匹配正确的分布式储存空间中找到第二储存仓和第三储存仓；步骤5、从所述第三储存仓中下载映射表；步骤6、根据所述映射表得到存放地址与组数据编号的映射关系；步骤7、根据所述映射关系，以组数据编号为序，根据对应的存放地址，从所述第二储存仓中下载数据。本发明根据映射表，反向得到组数据，相对于现有的读取方法，更加简单、容易。可用于计算机数据读取领域。

Description

一种基于分布式储存空间的数据读取方法

技术领域

本发明创造涉及数据读取技术领域，特别涉及一种基于分布式储存空间的数据读取方法。

背景技术

随着行业应用系统的发展，各种信息系统应用数据快速增长，企业的信息化建设已逐步进入了大数据时代。

大数据的存储一般会将数据上传至互联网，通过互联网的分布式储存空间对数据进行存储，现有的存储方法一般会直接将大数据存储在分布式储存空间中，容易造成存储混乱，不利于后续整理，同时，由于这种混乱的存储方式，也造成数据读取的困难。

发明内容

本发明的目的是提供一种简单、容易的数据读取方法。

本发明解决其技术问题的解决方案是：一种基于分布式储存空间的数据读取方法，包括：

步骤1、获取用户输入的标记符和分布式储存空间地址；

步骤2、根据所述地址找到设有第一储存仓、第二储存仓和第三储存仓的分布式储存空间；

步骤3、根据所述标记符与第一储存仓存放的标记符进行匹配；

步骤4、从匹配正确的分布式储存空间中找到第二储存仓和第三储存仓；

步骤5、从所述第三储存仓中下载映射表；

步骤6、根据所述映射表得到存放地址与组数据编号的映射关系；

步骤7、根据所述映射关系，以组数据编号为序，根据对应的存放地址，从所述第二储存仓中下载数据。

进一步，所述分布式储存空间包括数据库。

进一步，所述数据库为SQL数据库。

本发明的有益效果是：本发明根据映射表，反向得到组数据，相对于现有的读取方法，更加简单、容易。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单说明。显然，所描述的附图只是本发明的一部分实施例，而不是全部实施例，本领域的技术人员在不付出创造性劳动的前提下，还可以根据这些附图获得其他设计方案和附图。

图1是本发明的数据读取方法的步骤流程图；

图2是分布式储存空间的存储方法的步骤流程图；

图3是在分布式储存空间的存储方法中步骤D1的具体步骤流程图。

具体实施方式

以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整地描述，以充分地理解本发明的目的、特征和效果。显然，所描述的实施例只是本发明的一部分实施例，而不是全部实施例，基于本发明的实施例，本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例，均属于本发明保护的范围。另外，文中所提到的所有联接/连接关系，并非单指构件直接相接，而是指可根据具体实施情况，通过添加或减少联接辅件，来组成更优的联接结构。本发明创造中的各个技术特征，在不互相矛盾冲突的前提下可以交互组合。

实施例1，参考图2和图3，在对本发明的读取方法说明之前，需要对分布式储存空间的存储方法进行说明，其中，所述分布式储存空间的存储方法包括：

步骤D1、获取组数据和标记列表；

步骤D2、将获取得到的组数据和标记列表存储在暂存空间中；利用暂存空间作为存储的缓冲。

步骤D3、根据标记列表中的标记符划分出若干个分布式储存空间；

步骤D4、复制标记列表中的标记符；

步骤D5、在所述分布式储存空间中分成三个储存仓，分别为第一储存仓、第二储存仓和第三储存仓；

步骤D6、将复制得到的标记符存储到第一储存仓中；

步骤D7、根据所述第一储存仓中的标记符，从所述暂存空间中寻找具有相同标记符的组数据，将寻找得到的组数据存储到第二储存仓中；

步骤D8、建立存储地址与组数据编号之间的映射关系，并将所述映射关系制成映射表存储在第三储存仓中。

步骤D9、删除所述暂存空间中的组数据和标记列表。

其中，在步骤D1中，所述组数据和标记列表的获取方法具体包括：

步骤D1.1、从工业场景中采集数据，并对采集得到的数据按照采集源头进行分类，分类后的数据记为准类数据；

其中，所述采集源头可以为不同的设备，可以对采集得到的数据按照不同设备进行分类，比如，将从A设备采集的数据为一类，从B设备采集的数据为另一类。

步骤D1.2、设立描述不同采集源头的标记符；例如，从A设备采集的数据，则可设立标记符a，从B设备采集的数据则可设立标记符b。

步骤D1.3、将标记符对应的加载到所述准类数据中，加载标记符后的准类数据记为类数据。

步骤D1.4、将类数据中的标记符分离出来；

步骤D1.5、将类数据按照顺序划分出若干个等数据量大小的子数据；具体的，将类数据按照数据量的大小划分出若干个等数据量大小的子数据，例如类数据的数据量为100KB，那么可以划分出5个子数据，每一个子数据的数据量为20KB。

步骤D1.6、给所述子数据分配描述子数据之间顺序关系的编号；

步骤D1.7、复制两次所述标记符；

步骤D1.8、将所述编号与第一次复制得到的标记符对应地附着在子数据中，附着标记符和编号的子数据记为组数据；

步骤D1.9、将第二次复制得到的标记符汇集在表格文件中，得到标记列表；

步骤D1.10、将所述组数据和标记列表上传至互联网；

步骤D1.11、从互联网中获取得到组数据和标记列表。

本发明的读取方法用于读取上述存储方法存储的组数据，参考图1，一种基于分布式储存空间的数据读取方法，包括：

步骤S1、获取用户输入的标记符和分布式储存空间地址；根据所述标记符可知道用户需要读取的是何种设备的数据，通过分布式储存空间地址可知道用户需要访问的是哪一个分布式存储空间。

步骤S2、根据所述地址找到设有第一储存仓、第二储存仓和第三储存仓的分布式储存空间；

步骤S3、根据所述标记符与第一储存仓存放的标记符进行匹配；通过匹配进一步判断所述分布式储存空间是否是要访问的目标分布式储存空间。

步骤S4、从匹配正确的分布式储存空间中找到第二储存仓和第三储存仓；当确认所述分布式储存空间是需要访问的目标分布式储存空间是，则可找到对应的第二储存仓和第三储存仓。

步骤S5、从所述第三储存仓中下载映射表；

步骤S6、根据所述映射表得到存放地址与组数据编号的映射关系；

步骤S7、根据所述映射关系，以组数据编号为序，根据对应的存放地址，从所述第二储存仓中下载数据。

本发明根据映射表，反向得到组数据，相对于现有的读取方法，更加简单、容易。

作为优化，所述分布式储存空间包括数据库。

作为优化，所述数据库为SQL数据库。

以上对本发明的较佳实施方式进行了具体说明，但本发明创造并不限于所述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变型或替换，这些等同的变型或替换均包含在本申请权利要求所限定的范围内。

Claims

1.一种基于分布式储存空间的数据读取方法，其特征在于，包括：

步骤1、获取用户输入的标记符和分布式储存空间地址；

步骤5、从所述第三储存仓中下载映射表；

2.根据权利要求1所述的一种基于分布式储存空间的数据读取方法，其特征在于，所述分布式储存空间包括数据库。

3.根据权利要求2所述的一种基于分布式储存空间的数据读取方法，其特征在于，所述数据库为SQL数据库。