CN103365972A - 一种海量数据智能处理系统 - Google Patents

一种海量数据智能处理系统 Download PDF

Info

Publication number
CN103365972A
CN103365972A CN2013102615720A CN201310261572A CN103365972A CN 103365972 A CN103365972 A CN 103365972A CN 2013102615720 A CN2013102615720 A CN 2013102615720A CN 201310261572 A CN201310261572 A CN 201310261572A CN 103365972 A CN103365972 A CN 103365972A
Authority
CN
China
Prior art keywords
mass data
storage
data
unit
processing system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013102615720A
Other languages
English (en)
Inventor
姜啸宇
朱烨东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING SINODATA TECHNOLOGY Co Ltd
Original Assignee
BEIJING SINODATA TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING SINODATA TECHNOLOGY Co Ltd filed Critical BEIJING SINODATA TECHNOLOGY Co Ltd
Priority to CN2013102615720A priority Critical patent/CN103365972A/zh
Publication of CN103365972A publication Critical patent/CN103365972A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明提出了一种海量数据智能处理系统,解决了现有技术中无法对海量数据进行有效处理的问题。该系统包括存储装置,与存储装置连接;数据存储应用装置,用于存储系统海量数据应用服务,与存储装置连接;数据集群装置,用于管理存储的海量数据,并对存储的海量数据进行转储或清除操作,与存储装置连接;公共管理应用集群装置,用于与外部用户进行信息交换、控制海量数据中转,并为海量数据的传输提供接口,与存储装置连接。本发明所述的海量数据智能处理系统,能够有效的实现外部用户与系统的交流,并且在有效交流的同时进行有效的数据处理。

Description

一种海量数据智能处理系统
技术领域
本发明涉及数据处理领域,特别是指一种海量数据智能处理系统。
背景技术
随着信息技术的不断发展,信息量与日俱增,信息形式变得多种多样,单一数据库的数据存储能力逐渐变得力不从心,众多领域中对数据存储的要求也随着信息信息量的要求不断增加;
现有技术中,对海量数据的处理一般还停留在原始的单一数据库处理,即便已经出现了少量的多数据库集成处理的方式,但由于技术的限制或者操作方式的局限性依然不能够有效的对数据进行处理,为日常的数据存储、调用等增加了麻烦;
综上,一种结构简单,易操作上手的海量数据处理系统迫切需要。
发明内容
本发明提出一种海量数据智能处理系统,解决了现有技术中无法对海量数据进行有效处理的问题。
本发明的技术方案是这样实现的:
一种海量数据智能处理系统,包括:
存储装置,用于进行海量数据存储;
管理集群装置,用于控制海量数据的归档、备份、恢复、迁移和回迁,与存储装置连接;
数据存储应用装置,用于存储系统海量数据应用服务,与存储装置连接;
数据集群装置,用于管理存储的海量数据,并对存储的海量数据进行转储或清除操作,与存储装置连接;
公共管理应用集群装置,用于与外部用户进行信息交换、控制海量数据中转,并为海量数据的传输提供接口,与存储装置连接。
作为进一步的技术方案,还包括:
中转装置,用于进行存储装置与管理集群装置、数据存储应用装置、数据集群装置和公共管理应用集群装置之间的数据传输转换,设置在存储装置与管理集群装置、数据存储应用装置、数据集群装置和公共管理应用集群装置之间。
作为进一步的技术方案,存储装置包括:
在线存储单元,用于海量数据的在线存储;
近线存储单元,用于数据近线存储;
离线存储单元,用于在海量数据备份或归档后进行存储。
优选的,在线存储单元包括4台磁盘阵列;近线存储单元包括3台磁盘阵列;离线存储单元包括2台磁带库。
作为进一步的技术方案,存储装置还包括:
虚拟存储单元,用于缓解离线存储单元备份时的压力,减小备份时间。
优选的,虚拟存储单元包括1台磁盘阵列。
作为进一步的技术方案,管理集群装置包括第一操作单元和第一应用单元,其中,第一操作单元控制第一应用单元进行海量数据的规定、备份、恢复、迁移和回迁操作。
作为进一步的技术方案,数据存储应用装置包括:第二操作单元和第二应用单元,其中第二操作单元控制第二应用单元进行海量数据的入库或提取操作。
作为进一步的技术方案,数据集群装置包括:第三操作单元和第三应用单元,其中第三操作单元控制第三应用单元对存储装置存储的海量数据进行结构化管理或监控操作。
作为进一步的技术方案,公共管理应用集群装置包括:第四操作单元和第四应用单元,其中,第四操作单元控制第四应用单元与外部用户进行数据信息交换或对存储装置中存储的海量数据进行中转操作。
本发明技术方案通过存储装置对海量数据进行存储,并在管理集群装置、数据存储应用装置、数据集群装置和公共管理应用集群装置的控制下,可实现对存储装置中数据的固定,备份、入库、提取、结构化管理等操作,并且能够在保证数据有效处理的前提下,有效的实现与外部用户的数据信息交换。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种海量数据智能处理系统一个实施例的结构框图;
图2为本发明一种海量数据智能处理系统另一个实施例的结构框图;
图3为本发明一种海量数据智能处理系统再一个实施例的结构框图。
图中:
1、存储装置;101、在线存储单元;102、近线存储单元;103、离线存储单元;104、虚拟存储单元;2、管理集群装置;3、数据存储应用装置;4、数据集群装置;5、公共管理应用集群装置;6、中转装置。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1~图3所示,本发明提出的一种海量数据智能处理系统,包括:
存储装置1,用于进行海量数据存储;
管理集群装置2,用于控制海量数据的归档、备份、恢复、迁移和回迁,与存储装置1连接;
数据存储应用装置3,用于存储系统海量数据应用服务,与存储装置1连接;
数据集群装置4,用于管理存储的海量数据,并对存储的海量数据进行转储或清除操作,与存储装置1连接;
公共管理应用集群装置5,用于与外部用户进行信息交换、控制海量数据中转,并为海量数据的传输提供接口,与存储装置1连接。
通过存储装置1对海量数据进行存储,并在管理集群装置2、数据存储应用装置3、数据集群装置4和公共管理应用集群装置5的控制下,可实现对存储装置1中数据的固定,备份、入库、提取、结构化管理等操作,并且能够在保证数据有效处理的前提下,有效的实现与外部用户的数据信息交换。
本发明的一个实施例中,通过存储装置1进行海量数据的存储,其中,管理集群装置2、数据存储应用装置3,数据几圈装置和公共管理应用集群装置5分别与存储装置1连接,通过上述四种装置,实现对存储装置1中的海量数据的多种操作;如,在海量数据已经存储到存储装置1中后,能够通过管理集群装置2对海量数据按照设定好的规则进行归档或备份;当存储装置1中的海量数据出现问题,通过管理集群装置2还能够进行数据的恢复,或者,当存储的海量数据达到一定量通过管理集群装置2进行海量数据的迁移,或在存储装置1中有足够的存储空间时,通过管理集群装置2进行海量数据的回迁操作,其中,管理集群装置2包括第一操作单元和第一应用单元,在第一操作单元控制第一应用单元进行海量数据的规定、备份、恢复、迁移和回迁等操作;另外如,数据存储应用装置3,在获得外部用户的请求后,对该请求进行判断,判断该请求是否为海量数据入库请求或者海量数据提取请求等,判断结果后,执行海量数据入库或海量数据提取等相应操作,其中,数据存储应用装置3包括第二操作单元和第二应用单元,在第二操作单元控制第二应用单元进行海量数据的入库或提取等操作;再者如,数据集群装置4,包括第三操作单元和第三应用单元,在第三操作单元控制第三应用单元对存储装置1存储的海量数据进行结构化管理或监控操作,即监控存储装置1中海量数据的信息,比如是否达到存储限定的最高值,或者某个区域已经达到最高值等,通过监控结果执行海量数据的转储或清除等相应操作;再者如,公共管理应用集群装置5,包括第四操作单元和第四应用单元,在第四操作单元控制第四应用单元与外部用户进行数据信息交换或对存储装置1中存储的海量数据进行中转等操作;另外,在外部用户发出请求后公共管理应用集群装置5还进行与外部用于的信息交换,实现获取外部用于的需求的同时将外部用户需求的答案反馈到外部用户。通过上述的设计,能够有效的实现外部用户与系统的交流,并且在有效交流的同时进行有效的数据处理。
本发明的另一个实施例中,作为进一步的技术方案,还包括:
中转装置6,用于进行存储装置1与管理集群装置2、数据存储应用装置3、数据集群装置4和公共管理应用集群装置5之间的数据传输转换,设置在存储装置1与管理集群装置2、数据存储应用装置3、数据集群装置4和公共管理应用集群装置5之间。
本实施例中,优选的在述存储装置1与管理集群装置2、数据存储应用装置3、数据集群装置4和公共管理应用集群装置5之间设置中转装置6,通过该中转装置6实现上述各不符之间的数据传输转换,避免在传输海量数据的过程中由于数据类型不符合等问题出现传输错误等问题的出现。
本发明的再一个实施例中,
作为进一步的技术方案,存储装置1包括:
在线存储单元101,用于海量数据的在线存储;
近线存储单元102,用于数据近线存储;
离线存储单元103,用于在海量数据备份或归档后进行存储。
优选的,在线存储单元101包括4台磁盘阵列;近线存储单元102包括3台磁盘阵列;离线存储单元103包括2台磁带库。
本实施例中,存储装置1包括在线存储单元101、近线存储单元102和离线存储单元103,其中,在线存储单元101包括4台磁盘阵列,在局域云计算的基础上通过线存储单元实海量数据的高效、高速存储;近线存储单元102包括3台磁盘阵列,通过该近线存储单元102实现海量数据次级高效、高速存储,即判断该海量数据的类型等后进行海量数据的存储,进而提高海量数据的存储速度;离线存储单元103包括2台磁带库,通过离线存储单元103,在各种海量数据经过备份或归档后,进行存储,这样实现海量数据的多重保护,并且保证备份或归档后的海量数据不会遗失等问题的出现。
本发明的再一个实施例中,作为进一步的技术方案,存储装置1还包括:
虚拟存储单元104,用于缓解离线存储单元103备份时的压力,减小备份时间。
优选的,虚拟存储单元104包括1台磁盘阵列。
本实施例中,存储装置1还包括虚拟存储单元104,通过设置虚拟存储单元104,能够在海量数据离线存储的过程中,缓解离线存储单元103的备份压力,进而能够减小备份的时间,提高存储效率的同时,减少海量数据的存储时间。
作为进一步的技术方案,管理集群装置2包括第一操作单元和第一应用单元,其中,第一操作单元控制第一应用单元进行海量数据的规定、备份、恢复、迁移和回迁操作。
作为进一步的技术方案,数据存储应用装置3包括:第二操作单元和第二应用单元,其中第二操作单元控制第二应用单元进行海量数据的入库或提取操作。
作为进一步的技术方案,数据集群装置4包括:第三操作单元和第三应用单元,其中第三操作单元控制第三应用单元对存储装置1存储的海量数据进行结构化管理或监控操作。
作为进一步的技术方案,公共管理应用集群装置5包括:第四操作单元和第四应用单元,其中,第四操作单元控制第四应用单元与外部用户进行数据信息交换或对存储装置1中存储的海量数据进行中转操作。
通过以上结构及方法,能够实现:
1、数据处理能力处理文件300万/日;数据量600GB/日;在8小时内完成数据备份量100TB;数据回迁速度在720MB/秒;
2、数据检索能力:检索300万文件时间不超过1秒,检索600GB不超过1秒。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种海量数据智能处理系统,其特征在于,包括:
存储装置(1),用于进行海量数据存储;
管理集群装置(2),用于控制海量数据的归档、备份、恢复、迁移和回迁,与所述存储装置(1)连接;
数据存储应用装置(3),用于存储系统海量数据应用服务,与所述存储装置(1)连接;
数据集群装置(4),用于管理存储的海量数据,并对存储的海量数据进行转储或清除操作,与所述存储装置(1)连接;
公共管理应用集群装置(5),用于与外部用户进行信息交换、控制海量数据中转,并为海量数据的传输提供接口,与所述存储装置(1)连接。
2.如权利要求1所述的海量数据智能处理系统,其特征在于,还包括:
中转装置(6),用于进行所述存储装置(1)与所述管理集群装置(2)、所述数据存储应用装置(3)、所述数据集群装置(4)和所述公共管理应用集群装置(5)之间的数据传输转换,设置在所述存储装置(1)与所述管理集群装置(2)、所述数据存储应用装置(3)、所述数据集群装置(4)和公共管理应用集群装置(5)之间。
3.如权利要求1或2所述的海量数据智能处理系统,其特征在于,所述存储装置(1)包括:
在线存储单元(101),用于海量数据的在线存储;
近线存储单元(102),用于数据近线存储;
离线存储单元(103),用于在海量数据备份或归档后进行存储。
4.如权利要求3所述的海量数据智能处理系统,其特征在于,
所述在线存储单元(101)包括4台磁盘阵列;
所述近线存储单元(102)包括3台磁盘阵列;
所述离线存储单元(103)包括2台磁带库。
5.如权利要求4所述的海量数据智能处理系统,其特征在于,所述存储装置(1)还包括:
虚拟存储单元(104),用于缓解离线所述存储单元(103)备份时的压力,减小备份时间。
6.如权利要求5所述的海量数据智能处理系统,其特征在于,所述虚拟存储单元(104)包括1台磁盘阵列。
7.如权利要求1所述的海量数据智能处理系统,其特征在于,所述管理集群装置(2)包括第一操作单元和第一应用单元,其中,所述第一操作单元控制所述第一应用单元进行海量数据的规定、备份、恢复、迁移和回迁操作。
8.如权利要求1所述的海量数据智能处理系统,其特征在于,数据存储应用装置(3)包括:第二操作单元和第二应用单元,其中所述第二操作单元控制所述第二应用单元进行海量数据的入库或提取操作。
9.如权利要求1所述的海量数据智能处理系统,其特征在于,所述数据集群装置(4)包括:第三操作单元和第三应用单元,其中所述第三操作单元控制所述第三应用单元对所述存储装置(1)存储的海量数据进行结构化管理或监控操作。
10.如权利要求1所述的海量数据智能处理系统,其特征在于,所述公共管理应用集群装置(5)包括:第四操作单元和第四应用单元,其中,所述第四操作单元控制所述第四应用单元与外部用户进行数据信息交换或对所述存储装置(1)中存储的海量数据进行中转操作。
CN2013102615720A 2013-06-27 2013-06-27 一种海量数据智能处理系统 Pending CN103365972A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013102615720A CN103365972A (zh) 2013-06-27 2013-06-27 一种海量数据智能处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013102615720A CN103365972A (zh) 2013-06-27 2013-06-27 一种海量数据智能处理系统

Publications (1)

Publication Number Publication Date
CN103365972A true CN103365972A (zh) 2013-10-23

Family

ID=49367313

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013102615720A Pending CN103365972A (zh) 2013-06-27 2013-06-27 一种海量数据智能处理系统

Country Status (1)

Country Link
CN (1) CN103365972A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678701A (zh) * 2013-12-31 2014-03-26 福建四创软件有限公司 基于WebService的防灾减灾信息处理系统及方法
CN107993681A (zh) * 2017-11-22 2018-05-04 苏州互盟信息存储技术有限公司 一种近线磁盘阵列库
CN108022607A (zh) * 2017-11-22 2018-05-11 苏州互盟信息存储技术有限公司 一种具有接触点的近线磁盘阵列库
CN108022606A (zh) * 2017-11-22 2018-05-11 苏州互盟信息存储技术有限公司 近线光盘库、数据分级存储方法及系统
CN108053843A (zh) * 2017-11-22 2018-05-18 苏州互盟信息存储技术有限公司 一种具有一维运动机械手的近线磁盘阵列库
CN108198578A (zh) * 2017-11-22 2018-06-22 苏州互盟信息存储技术有限公司 一种具有二维运动机械手的近线磁盘阵列库
CN108538323A (zh) * 2018-04-04 2018-09-14 北京蓝杞数据科技有限公司天津分公司 一种数据传送方法、系统、电子设备及可读存储介质
CN110019233A (zh) * 2017-12-27 2019-07-16 浙江宇视科技有限公司 数据存储方法及系统
CN111382132A (zh) * 2018-12-28 2020-07-07 上海联影医疗科技有限公司 医学影像数据云存储系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254024A (zh) * 2011-07-27 2011-11-23 国网信息通信有限公司 海量数据处理系统及方法
CN102456048A (zh) * 2010-10-28 2012-05-16 无锡江南计算技术研究所 海量数据处理方法及系统
CN102523251A (zh) * 2011-11-25 2012-06-27 北京开拓天际科技有限公司 对海量数据处理的云存储架构及应用该架构的云存储平台

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102456048A (zh) * 2010-10-28 2012-05-16 无锡江南计算技术研究所 海量数据处理方法及系统
CN102254024A (zh) * 2011-07-27 2011-11-23 国网信息通信有限公司 海量数据处理系统及方法
CN102523251A (zh) * 2011-11-25 2012-06-27 北京开拓天际科技有限公司 对海量数据处理的云存储架构及应用该架构的云存储平台

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
姚书怀等: "大型数据中心海量数据存储解决方案的设计", 《四川工业学院学报》 *
崔杰等: "基于Hadoop的海量数据存储平台设计与开发", 《计算机研究与发展》 *
李曼: "海量数据存储系统的高效数据分级机制", 《淮海工学院学报(自然科学版)》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678701A (zh) * 2013-12-31 2014-03-26 福建四创软件有限公司 基于WebService的防灾减灾信息处理系统及方法
CN108022607B (zh) * 2017-11-22 2019-08-27 苏州互盟信息存储技术有限公司 一种具有接触点的近线磁盘阵列库
CN108022607A (zh) * 2017-11-22 2018-05-11 苏州互盟信息存储技术有限公司 一种具有接触点的近线磁盘阵列库
CN108022606A (zh) * 2017-11-22 2018-05-11 苏州互盟信息存储技术有限公司 近线光盘库、数据分级存储方法及系统
CN108053843A (zh) * 2017-11-22 2018-05-18 苏州互盟信息存储技术有限公司 一种具有一维运动机械手的近线磁盘阵列库
CN108198578A (zh) * 2017-11-22 2018-06-22 苏州互盟信息存储技术有限公司 一种具有二维运动机械手的近线磁盘阵列库
CN108053843B (zh) * 2017-11-22 2019-08-27 苏州互盟信息存储技术有限公司 一种具有一维运动机械手的近线磁盘阵列库
CN107993681A (zh) * 2017-11-22 2018-05-04 苏州互盟信息存储技术有限公司 一种近线磁盘阵列库
CN107993681B (zh) * 2017-11-22 2019-10-15 苏州互盟信息存储技术有限公司 一种近线磁盘阵列库
CN110019233A (zh) * 2017-12-27 2019-07-16 浙江宇视科技有限公司 数据存储方法及系统
CN110019233B (zh) * 2017-12-27 2021-07-20 浙江宇视科技有限公司 数据存储方法及系统
CN108538323A (zh) * 2018-04-04 2018-09-14 北京蓝杞数据科技有限公司天津分公司 一种数据传送方法、系统、电子设备及可读存储介质
CN111382132A (zh) * 2018-12-28 2020-07-07 上海联影医疗科技有限公司 医学影像数据云存储系统

Similar Documents

Publication Publication Date Title
CN103365972A (zh) 一种海量数据智能处理系统
US10394611B2 (en) Scaling computing clusters in a distributed computing system
CN102859499B (zh) 计算机系统及其存储控制方法
CN104461685B (zh) 虚拟机处理方法和虚拟计算机系统
CN101796514B (zh) 对象存储系统的管理方法
CN104317742A (zh) 一种优化空间管理的自动精简配置方法
CN103440244A (zh) 一种大数据存储优化方法
CN107291889A (zh) 一种数据存储方法及系统
CN103064927A (zh) 分布式文件系统的数据访问方法和装置
CN104834484B (zh) 基于嵌入式可编程逻辑阵列的数据处理系统及处理方法
CN205620984U (zh) 一种数据分层存储设备
CN111339192A (zh) 一种分布式边缘计算数据存储系统
CN102982182B (zh) 一种数据存储规划方法及装置
CN104205780B (zh) 一种存储数据的方法和装置
CN108776690B (zh) 基于分层治理的hdfs分布式与集中式混合数据存储系统的方法
CN104202424A (zh) 一种使用软件架构扩展缓存的方法
CN103414764A (zh) 一种云平台弹性存储系统及其弹性存储实现方法
CN103778149A (zh) 文件系统及其对文件进行存储管理的方法
CN101827120A (zh) 一种集群存储方法及系统
CN104167817A (zh) 一种电力设备实时信息集成的系统及方法
CN107480283A (zh) 实现大数据快速存储的方法、装置以及存储系统
CN108132759A (zh) 一种文件系统中管理数据的方法和装置
CN103092952A (zh) 一种海量非结构化数据的存储系统和管理方法
CN107908713A (zh) 一种基于Redis集群的分布式动态杜鹃过滤系统及其过滤方法
CN105187489A (zh) 可集群并支持多用户同时上传的文件传输方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20131023