CN104573068A - 一种基于大数据的信息处理方法 - Google Patents

一种基于大数据的信息处理方法 Download PDF

Info

Publication number
CN104573068A
CN104573068A CN201510037200.9A CN201510037200A CN104573068A CN 104573068 A CN104573068 A CN 104573068A CN 201510037200 A CN201510037200 A CN 201510037200A CN 104573068 A CN104573068 A CN 104573068A
Authority
CN
China
Prior art keywords
data
file
nosql
database
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510037200.9A
Other languages
English (en)
Inventor
谢叔阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SICHUAN ZHONGKE TENGXIN TECHNOLOGY Co Ltd
Original Assignee
SICHUAN ZHONGKE TENGXIN TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SICHUAN ZHONGKE TENGXIN TECHNOLOGY Co Ltd filed Critical SICHUAN ZHONGKE TENGXIN TECHNOLOGY Co Ltd
Priority to CN201510037200.9A priority Critical patent/CN104573068A/zh
Publication of CN104573068A publication Critical patent/CN104573068A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于大数据的信息处理方法,该方法包括:利用Nosql数据库作为数据存储层存储多用户上传的文件数据,分别创建集合来实现不同类型数据的存储,并使用分布式文件系统存储并行计算过程中的中间数据;采用HTML5构建B/S架构作为表现层,实现了用户页面与存储层之间的交互;在存储层与表现层之间设置事务层,对数据库进行访问,将API进行封装,为用户提供应用功能。发明针对大数据存储、查询、检索与并行处理,利用Nosql数据库特性,以及与集群平台的交互能力,适合于大数据的处理,以满足用户对异构数据存储与网络服务的需求。

Description

一种基于大数据的信息处理方法
技术领域
本发明涉及数据存储,特别涉及一种基于大数据的处理方法。
背景技术
大数据存储与处理日益成为数据存储领域的研究热点。其中,大数据具有较高的复杂性。传统关系型数据库在数据管理方面解决了数据一致性和完整性问题,但是,在大数据存储、访问与维护,非结构化和半结构化数据管理,以及数据库易用性和扩展性等方面,关系型数据库存在难以克服的问题。其读取性能和数据处理性能不适用于海量大数据的存储和访问。
因此,针对相关技术中所存在的上述问题,目前尚未提出有效的解决方案。
发明内容
为解决上述现有技术所存在的问题,本发明提出了一种基于大数据的信息处理方法,用于在存储平台中处理大数据文件,其特征在于,包括:利用Nosql数据库作为数据存储层存储多用户上传的文件数据,分别创建集合来实现不同类型数据的存储,并使用分布式文件系统存储并行计算过程中的中间数据;采用HTML5构建B/S架构作为表现层,实现了用户页面与存储层之间的交互;在存储层与表现层之间设置事务层,对数据库进行访问,将API进行封装,为用户提供应用功能。
优选地,所述事务层包括输入模块、下载模块、检索模块、更新模块、删除模块和数据处理模块;其中,输入模块、下载模块、检索模块、更新模块、删除模块利用Nosql驱动程序与Nosql数据库进行交互;数据处理模块将数据库适配器作为与Nosql之间的数据操作中间件,并结合预设算法库支持大数据文件分析与挖掘。
优选地,该方法包括:创建文件数据集用于存放文件数据,并创建元数据集用于存储文件数据的元数据项,所述存储平台面向多用户提供数据存储服务,将数据分为共享数据和私有数据,针对共享数据,所述文件数据集存储在统一的数据库中,并采用过滤器的安全模式;针对私有数据,每个用户拥有单独的数据库,并采用权限控制的安全模式;所述文件数据集可由用户选择已存在的数据集,或新建数据集存储上传的数据,每一个文件对象存储为一个json对象,文件对象在存储过程中,增加文件属性,用于表示该文件对象所属的资源及属性;元数据集用于记录文件的元数据信息、上传者对数据的描述,以及文件与数据库中集合的对应关系;所述存储平台在Nosql集群架构设计上采用分片副本集架构;如果用户需要新的字段,在上传文档之前直接添加元数据集,表示资源与数据库中集合的对应关系的元数据信息在存储过程中自动生成。
优选地,该方法还包括:为不同的数据格式提供不同的数据转换与存储接口,主要是实现数据文件的在线导入、导出功能,用户上传数据时,通过浏览器页面以FTP协议上传到服务器,并根据数据格式选择接口读取大数据并写入到数据库中,而下载数据过程中,接收用户选择的不同输出数据格式;所述数据处理模块使用数据适配器完成与Nosql数据库的连接与交互,所述将Nosql分布式存储与集群构建在同一计算机集群,并通过Nosql的分片机制支持并行计算。
优选地,该方法利用预设算法库分析和挖掘大数据文件,包括文件统计分析、关联规则挖掘、聚类分析,所述存储平台直接从Nosql的配置服务器中获取块相关参数,并将数据分片作为数据块提交给映射器处理;在读取过程中定义查询语言,并与索引过滤相结合过滤输出数据;首先检测Nosql数据集,并计算数据分割;每一个数据分割分配到集群的一个计算节点;集群计算节点根据数据分割的分配情况从Nosql中获取数据,并通过映射器进行本地计算;集群合并计算结果,将结果输出到Nosql中;
当使用数据处理模块在指定范围内文件对象统计、文件聚类、关联规则挖掘功能时,通过客户端选择数据源、数据项、处理算法,以及相应的参数、输出位置,将处理结果统一存储到Nosql中,并将计算进度、预计结束时间和存储位置发送给客户端。
本发明相比现有技术,具有以下优点:
本发明针对大数据存储、查询、检索与并行处理,利用Nosql数据库特性,以及与集群平台的交互能力,适合于大数据的处理,以满足用户对异构数据存储与网络服务的需求。
附图说明
图1是根据本发明实施例的基于大数据的信息处理方法的流程图。
具体实施方式
下文与图示本发明原理的附图一起提供对本发明一个或者多个实施例的详细描述。结合这样的实施例描述本发明,但是本发明不限于任何实施例。本发明的范围仅由权利要求书限定,并且本发明涵盖诸多替代、修改和等同物。在下文描述中阐述诸多具体细节以便提供对本发明的透彻理解。出于示例的目的而提供这些细节,并且无这些具体细节中的一些或者所有细节也可以根据权利要求书实现本发明。
本文针对大数据存储、查询、检索与并行处理等问题,利用Nosql数据库特性,以及与集群平台的交互能力,提出适合于大数据的存储与处理方法,以满足用户对异构大数据存储与网络服务的需求。
本发明的一方面提供了一种基于大数据的信息处理方法。图1是根据本发明实施例的基于大数据的信息处理方法流程图。
本发明的基于大数据的信息处理方法运行于存储平台,该存储平台由3个层次组成,包括数据存储层、事务层和表现层。
(1)数据存储层用于存储多用户上传的文件数据。存储平台主要利用Nosql数据库存储数据,并使用分布式文件系统存储并行计算过程中的中间数据。
(2)事务层构建在存储层之上,用于对数据库进行访问。事务层将相关的API进行封装,为用户提供常用的应用功能,隐藏了数据存储层内部的复杂处理逻辑,简化了用户对数据的读写和管理流程。事务层主要包括6个模块:输入模块、下载模块、检索模块、更新模块、删除模块和数据处理模块。其中,输入模块、下载模块、检索模块、更新模块、删除模块利用Nosql驱动程序与Nosql数据库进行交互;数据处理模块将数据库适配器作为与Nosql之间的数据操作中间件,并结合预设算法库支持大数据文件分析与挖掘。
(3)表现层:是整个存储平台的功能体现。存储平台整体采用B/S架构,使用浏览器作为上传、下载、检索、更新、删除和数据处理等功能的客户端。表现层采用HTML5等技术构建,实现了用户页面与存储层之间的交互。
针对大数据在类型、结构上不同的特点,本发明创建2类不同的集合来满足数据的存储:一类是文件数据集,用于存放文件数据;一类是元数据集,用于存储文件数据的元数据项。存储平台面向多用户提供数据存储服务,将数据分为共享数据和私有数据。针对共享数据,文件数据集存储在统一的数据库中,并采用过滤器的安全模式;针对私有数据,每个用户拥有单独的数据库,并采用权限控制的安全模式。
文件数据集用于存储数据。用户可选择已存在的数据集,或新建数据集存储上传的数据。每一个文件对象存储为一个json对象,文件对象在存储过程中,增加文件属性,用于表示该文件对象所属的资源及相应属性。元数据集主要用于记录文件的元数据信息、上传者对数据的描述,以及文件与数据库中集合的对应关系等信息。存储平台对默认元数据集进行了设计,满足用户对数据进行描述的需求。如果需要新的字段,可在上传文档之前直接添加,无需事先设计完整的元数据集。这种方式可以弱化初始的数据结构设计,无需存储无用的字段,降低数据存储冗余,避免产生大量的稀疏数据集,适合多用户条件下不同格式、不同属性数据的存储。部分元数据信息在存储过程中自动生成,例如资源与数据库中集合的对应关系信息。在Nosql集群架构设计上,采用分片副本集架构。
针对不同的数据格式,存储平台提供不同的数据转换与存储接口。转换接口主要是实现数据文件的在线导入、导出功能。用户上传数据时,通过浏览器页面以FTP协议上传到服务器,并根据数据格式选择接口读取大数据并写入到数据库中。下载数据是上传数据的逆过程,用户可以根据需要选择不同输出数据格式。
以矢量图层格式为例,存储过程如下:(1)注册驱动;(2)获取图层数和图层名,将图层名写入元数据集中,并遍历每一个图层;(3)读取图层属性表的表头信息,并将结果存储到文件数据集中;(4)遍历图层中的要素,按照Nosql输入接口规范输出内容,并写入到文件数据集合中。重复(3)、(4)步,直至图层遍历结束。
连接表现层和数据库的是访问接口,是一个中间层的程序。在面向客户端方面,它作为一个接口模块,必需提供适用的接口函数。客户端调用接口函数时,应准备好需要存储的数据或查询的条件,服务程序在服务器上运行,做增加、删除、修改、查找的数据库操作,此后服务器将操作的结果发送给客户端。
数据库操作接口包括检索接口、更新接口、删除接口、新增数据接口、读取接口。检索接口包括根据坐标查询、根据属性查询,以及混合查询3种。更新接口只更新单一文件对象,删除接口包括删除文件对象、删除数据集(对应于上传的文件)和清空数据库(只针对私有数据,包含多个数据集)3种不同的接口。新增数据接口只包含新增单个对象接口和新增文件接口,新增文件接口由转换接口实现。读取接口包括读取整个数据集和读取单个文件对象2个接口。访问接口主要利用Nosql的Java驱动包实现功能扩展。
数据处理模块使用数据适配器,完成与Nosql数据库的连接与交互。该模块利用云端处理能力对海量数据进行高效处理与知识发现,当用户需要对云端数据进行分析时,可同时使用云端的存储资源和计算资源,在云端完成计算任务,避免大规模数据传输,可有效缓解网络带宽对用户使用云端数据的限制,同时减轻客户端的处理压力。为了降低存储和云计算之间带宽的影响,该存储平台将Nosql分布式存储与集群构建在同一计算机集群,并通过Nosql的分片机制支持的并行计算。
而在数据处理内容方面,主要利用预设算法库分析和挖掘大数据文件,包括文件统计分析、关联规则挖掘、聚类分析等功能。存储平台直接从Nosql的配置服务器中获取块相关参数,并将数据分片直接作为数据块提交给映射器处理。这就意味着,Nosql将完成大部分的预配置工作。在读取过程中,可定义查询语言,并与索引过滤相结合过滤输出数据。批量计算的工作流程为:(1)首先检测Nosql数据集,并计算数据分割;(2)每一个数据分割分配到集群的一个计算节点;(3)集群计算节点根据数据分割的分配情况从Nosql中获取数据,并通过映射器进行本地计算;(4)集群合并计算结果,将结果输出到Nosql中。在功能方面,数据处理模块包括指定范围内文件对象统计、文件聚类、关联规则挖掘等多种处理功能,对集群下的并行计算算法进行封装。使用这些功能模块时,用户通过客户端选择数据源、数据项、处理算法,以及相应的参数、输出位置等。由于海量数据处理本身计算时间较长,无法在短时间内将结果返回给客户端,因此,处理结果统一存储到Nosql中,并将计算进度、预计结束时间和存储位置发送给客户端。
综上所述,本发明提出了一种针对大数据存储、查询、检索与并行处理的方法,利用Nosql数据库特性,以及与集群平台的交互能力,适合于大数据的处理,以满足用户对异构数据存储与网络服务的需求。
显然,本领域的技术人员应该理解,上述的本发明的各模块或各步骤可以用通用的计算系统来实现,它们可以集中在单个的计算系统上,或者分布在多个计算系统所组成的网络上,可选地,它们可以用计算系统可执行的程序代码来实现,从而,可以将它们存储在存储平台中由计算系统来执行。这样,本发明不限制于任何特定的硬件和软件结合。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (5)

1.一种基于大数据的信息处理方法,用于在存储平台中处理大数据文件,其特征在于,包括:
利用Nosql数据库作为数据存储层存储多用户上传的文件数据,分别创建集合来实现不同类型数据的存储,并使用分布式文件系统存储并行计算过程中的中间数据;
采用HTML5构建B/S架构作为表现层,实现了用户页面与存储层之间的交互;
在存储层与表现层之间设置事务层,对数据库进行访问,将API进行封装,为用户提供应用功能。
2.根据权利要求1所述的方法,其特征在于,所述事务层包括输入模块、下载模块、检索模块、更新模块、删除模块和数据处理模块;其中,输入模块、下载模块、检索模块、更新模块、删除模块利用Nosql驱动程序与Nosql数据库进行交互;数据处理模块将数据库适配器作为与Nosql之间的数据操作中间件,并结合预设算法库支持大数据文件分析与挖掘。
3.根据权利要求2所述的方法,其特征在于,所述分别创建集合来实现不同类型数据的存储,进一步包括:
创建文件数据集用于存放文件数据,并创建元数据集用于存储文件数据的元数据项,所述存储平台面向多用户提供数据存储服务,将数据分为共享数据和私有数据,针对共享数据,所述文件数据集存储在统一的数据库中,并采用过滤器的安全模式;针对私有数据,每个用户拥有单独的数据库,并采用权限控制的安全模式;所述文件数据集可由用户选择已存在的数据集,或新建数据集存储上传的数据,每一个文件对象存储为一个json对象,文件对象在存储过程中,增加文件属性,用于表示该文件对象所属的资源及属性;元数据集用于记录文件的元数据信息、上传者对数据的描述,以及文件与数据库中集合的对应关系;
所述存储平台在Nosql集群架构设计上采用分片副本集架构;如果用户需要新的字段,在上传文档之前直接添加元数据集,表示资源与数据库中集合的对应关系的元数据信息在存储过程中自动生成。
4.根据权利要求3所述的方法,其特征在于,该方法还包括:
为不同的数据格式提供不同的数据转换与存储接口,主要是实现数据文件的在线导入、导出功能,用户上传数据时,通过浏览器页面以FTP协议上传到服务器,并根据数据格式选择接口读取大数据并写入到数据库中,而下载数据过程中,接收用户选择的不同输出数据格式;所述数据处理模块使用数据适配器完成与Nosql数据库的连接与交互,所述将Nosql分布式存储与集群构建在同一计算机集群,并通过Nosql的分片机制支持并行计算。
5.根据权利要求4所述的方法,其特征在于,所述数据处理模块结合预设算法库支持大数据文件分析与挖掘,进一步包括:
利用预设算法库分析和挖掘大数据文件,包括文件统计分析、关联规则挖掘、聚类分析,所述存储平台直接从Nosql的配置服务器中获取块相关参数,并将数据分片作为数据块提交给映射器处理;在读取过程中定义查询语言,并与索引过滤相结合过滤输出数据;首先检测Nosql数据集,并计算数据分割;每一个数据分割分配到集群的一个计算节点;集群计算节点根据数据分割的分配情况从Nosql中获取数据,并通过映射器进行本地计算;集群合并计算结果,将结果输出到Nosql中;
当使用数据处理模块在指定范围内文件对象统计、文件聚类、关联规则挖掘功能时,通过客户端选择数据源、数据项、处理算法,以及相应的参数、输出位置,将处理结果统一存储到Nosql中,并将计算进度、预计结束时间和存储位置发送给客户端。3 -->
CN201510037200.9A 2015-01-23 2015-01-23 一种基于大数据的信息处理方法 Pending CN104573068A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510037200.9A CN104573068A (zh) 2015-01-23 2015-01-23 一种基于大数据的信息处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510037200.9A CN104573068A (zh) 2015-01-23 2015-01-23 一种基于大数据的信息处理方法

Publications (1)

Publication Number Publication Date
CN104573068A true CN104573068A (zh) 2015-04-29

Family

ID=53089130

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510037200.9A Pending CN104573068A (zh) 2015-01-23 2015-01-23 一种基于大数据的信息处理方法

Country Status (1)

Country Link
CN (1) CN104573068A (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104881466A (zh) * 2015-05-25 2015-09-02 百度在线网络技术(北京)有限公司 数据分片的处理以及垃圾文件的删除方法和装置
CN104915769A (zh) * 2015-06-01 2015-09-16 北京圆通慧达管理软件开发有限公司 业务协作方法和系统
CN105631012A (zh) * 2015-12-29 2016-06-01 湖北睛彩视讯科技有限公司 一种新媒体大数据智能分析系统
CN105808705A (zh) * 2016-03-04 2016-07-27 江苏物联网研究发展中心 面向大数据存储中心的数据集成系统及方法
CN106372047A (zh) * 2016-08-30 2017-02-01 东软集团股份有限公司 大数据报表导出方法和装置
CN106921682A (zh) * 2015-12-24 2017-07-04 百度在线网络技术(北京)有限公司 文件上传方法和装置
CN106933555A (zh) * 2015-12-30 2017-07-07 中国科学院上海高等研究院 一种数据框架系统
CN106933828A (zh) * 2015-12-29 2017-07-07 北京国双科技有限公司 数据插入方法和装置
CN107016128A (zh) * 2017-05-16 2017-08-04 郑州云海信息技术有限公司 一种数据处理方法及装置
CN107229695A (zh) * 2017-05-23 2017-10-03 深圳大学 多平台航空电子大数据系统及方法
CN107818112A (zh) * 2016-09-13 2018-03-20 腾讯科技(深圳)有限公司 一种大数据分析作业系统及任务提交方法
CN107945086A (zh) * 2017-11-17 2018-04-20 广州葵翼信息科技有限公司 一种应用于智慧城市的大数据资源管理系统
CN108881415A (zh) * 2018-05-31 2018-11-23 广州亿程交通信息集团有限公司 分布式实时大数据分析系统
CN109284097A (zh) * 2018-09-07 2019-01-29 武汉轻工大学 实现复杂数据分析的方法、设备、系统及存储介质
CN109492004A (zh) * 2018-10-29 2019-03-19 广东开放大学(广东理工职业学院) 一种数字渔业异构数据存储方法、系统及装置
CN109933587A (zh) * 2019-02-26 2019-06-25 厦门市美亚柏科信息股份有限公司 基于目录注册的数据处理方法、装置、系统及存储介质
CN110389939A (zh) * 2019-02-18 2019-10-29 华南理工大学 一种基于NoSQL和分布式文件系统的物联网存储系统
CN110489403A (zh) * 2019-08-27 2019-11-22 江苏华库数据技术有限公司 一种大批量数据的预处理及入库的方法
WO2019228031A1 (zh) * 2018-05-30 2019-12-05 百富计算机技术(深圳)有限公司 Html5文件安全保护方法、系统及终端设备
CN110730201A (zh) * 2019-08-27 2020-01-24 北京市农林科学院 一种基于元数据的数据共享方法及系统
CN111177156A (zh) * 2019-12-31 2020-05-19 广东科学技术职业学院 一种大数据存储方法及系统
CN111177238A (zh) * 2019-12-13 2020-05-19 北京航天云路有限公司 一种基于用户自定义的数据集生成方法
CN111427845A (zh) * 2020-02-28 2020-07-17 中国电子科技集团公司第十五研究所 一种交互式建模分析算子数据交换方法
CN111492354A (zh) * 2017-11-14 2020-08-04 斯诺弗雷克公司 不可变存储装置中的数据库元数据
CN112199544A (zh) * 2020-11-05 2021-01-08 北京明略软件系统有限公司 全图挖掘预警方法、系统、电子设备及计算机可读存储介质
CN115510121A (zh) * 2022-10-08 2022-12-23 上海数禾信息科技有限公司 一种名单数据管理方法、装置、设备及可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120226658A1 (en) * 2011-03-04 2012-09-06 Red Hat, Inc. Data model versioning for document databases
CN103491187A (zh) * 2013-09-30 2014-01-01 华南理工大学 一种基于云计算的大数据统一分析处理方法
CN104021194A (zh) * 2014-06-13 2014-09-03 浪潮(北京)电子信息产业有限公司 一种面向行业大数据多样性应用的混合型处理系统及处理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120226658A1 (en) * 2011-03-04 2012-09-06 Red Hat, Inc. Data model versioning for document databases
CN103491187A (zh) * 2013-09-30 2014-01-01 华南理工大学 一种基于云计算的大数据统一分析处理方法
CN104021194A (zh) * 2014-06-13 2014-09-03 浪潮(北京)电子信息产业有限公司 一种面向行业大数据多样性应用的混合型处理系统及处理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
雷德龙 等: "基于MongoDB的矢量空间数据云存储与处理系统", 《地球信息科学》 *

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104881466A (zh) * 2015-05-25 2015-09-02 百度在线网络技术(北京)有限公司 数据分片的处理以及垃圾文件的删除方法和装置
CN104915769B (zh) * 2015-06-01 2018-10-19 明算科技(北京)股份有限公司 业务协作方法和系统
CN104915769A (zh) * 2015-06-01 2015-09-16 北京圆通慧达管理软件开发有限公司 业务协作方法和系统
CN106921682A (zh) * 2015-12-24 2017-07-04 百度在线网络技术(北京)有限公司 文件上传方法和装置
CN105631012A (zh) * 2015-12-29 2016-06-01 湖北睛彩视讯科技有限公司 一种新媒体大数据智能分析系统
CN106933828A (zh) * 2015-12-29 2017-07-07 北京国双科技有限公司 数据插入方法和装置
CN106933555B (zh) * 2015-12-30 2020-06-16 中国科学院上海高等研究院 一种数据框架系统
CN106933555A (zh) * 2015-12-30 2017-07-07 中国科学院上海高等研究院 一种数据框架系统
CN105808705A (zh) * 2016-03-04 2016-07-27 江苏物联网研究发展中心 面向大数据存储中心的数据集成系统及方法
CN106372047A (zh) * 2016-08-30 2017-02-01 东软集团股份有限公司 大数据报表导出方法和装置
CN106372047B (zh) * 2016-08-30 2020-08-11 东软集团股份有限公司 大数据报表导出方法和装置
CN107818112A (zh) * 2016-09-13 2018-03-20 腾讯科技(深圳)有限公司 一种大数据分析作业系统及任务提交方法
CN107818112B (zh) * 2016-09-13 2021-12-14 腾讯科技(深圳)有限公司 一种大数据分析作业系统及任务提交方法
CN107016128A (zh) * 2017-05-16 2017-08-04 郑州云海信息技术有限公司 一种数据处理方法及装置
CN107229695A (zh) * 2017-05-23 2017-10-03 深圳大学 多平台航空电子大数据系统及方法
CN111492354A (zh) * 2017-11-14 2020-08-04 斯诺弗雷克公司 不可变存储装置中的数据库元数据
CN107945086A (zh) * 2017-11-17 2018-04-20 广州葵翼信息科技有限公司 一种应用于智慧城市的大数据资源管理系统
WO2019228031A1 (zh) * 2018-05-30 2019-12-05 百富计算机技术(深圳)有限公司 Html5文件安全保护方法、系统及终端设备
CN108881415B (zh) * 2018-05-31 2020-11-17 广州亿程交通信息集团有限公司 分布式实时大数据分析系统
CN108881415A (zh) * 2018-05-31 2018-11-23 广州亿程交通信息集团有限公司 分布式实时大数据分析系统
CN109284097B (zh) * 2018-09-07 2022-02-15 武汉轻工大学 实现复杂数据分析的方法、设备、系统及存储介质
CN109284097A (zh) * 2018-09-07 2019-01-29 武汉轻工大学 实现复杂数据分析的方法、设备、系统及存储介质
CN109492004A (zh) * 2018-10-29 2019-03-19 广东开放大学(广东理工职业学院) 一种数字渔业异构数据存储方法、系统及装置
CN110389939A (zh) * 2019-02-18 2019-10-29 华南理工大学 一种基于NoSQL和分布式文件系统的物联网存储系统
CN109933587A (zh) * 2019-02-26 2019-06-25 厦门市美亚柏科信息股份有限公司 基于目录注册的数据处理方法、装置、系统及存储介质
CN109933587B (zh) * 2019-02-26 2023-04-11 厦门市美亚柏科信息股份有限公司 基于目录注册的数据处理方法、装置、系统及存储介质
CN110730201A (zh) * 2019-08-27 2020-01-24 北京市农林科学院 一种基于元数据的数据共享方法及系统
CN110489403A (zh) * 2019-08-27 2019-11-22 江苏华库数据技术有限公司 一种大批量数据的预处理及入库的方法
CN111177238A (zh) * 2019-12-13 2020-05-19 北京航天云路有限公司 一种基于用户自定义的数据集生成方法
CN111177238B (zh) * 2019-12-13 2023-12-08 北京航天云路有限公司 一种基于用户自定义的数据集生成方法
CN111177156A (zh) * 2019-12-31 2020-05-19 广东科学技术职业学院 一种大数据存储方法及系统
CN111177156B (zh) * 2019-12-31 2023-10-03 广东科学技术职业学院 一种大数据存储方法及系统
CN111427845A (zh) * 2020-02-28 2020-07-17 中国电子科技集团公司第十五研究所 一种交互式建模分析算子数据交换方法
CN112199544A (zh) * 2020-11-05 2021-01-08 北京明略软件系统有限公司 全图挖掘预警方法、系统、电子设备及计算机可读存储介质
CN112199544B (zh) * 2020-11-05 2024-02-27 北京明略软件系统有限公司 全图挖掘预警方法、系统、电子设备及计算机可读存储介质
CN115510121A (zh) * 2022-10-08 2022-12-23 上海数禾信息科技有限公司 一种名单数据管理方法、装置、设备及可读存储介质
CN115510121B (zh) * 2022-10-08 2024-01-05 上海数禾信息科技有限公司 一种名单数据管理方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN104573068A (zh) 一种基于大数据的信息处理方法
US11163739B2 (en) Database table format conversion based on user data access patterns in a networked computing environment
JP5253172B2 (ja) シンクライアント上にデータを表示するためのシステムおよび方法
CN100518131C (zh) 网格数据副本管理系统
RU2507567C2 (ru) Многопользовательское сетевое сотрудничество
US10970300B2 (en) Supporting multi-tenancy in a federated data management system
JP2006114045A (ja) スキーマデータ(schemadata)からデータ構造へのマッピング
US20140074771A1 (en) Query optimization
CN102663117A (zh) 面向数据库与Hadoop混合平台的OLAP查询处理方法
CN103078898B (zh) 文件系统、接口服务装置和数据存储服务提供方法
US20210056104A1 (en) Supporting Synergistic and Retrofittable Graph Queries Inside a Relational Database
US11977546B1 (en) System and method for integrating disparate information sources
US20240004853A1 (en) Virtual data source manager of data virtualization-based architecture
CN106547911A (zh) 一种海量小文件的存取方法和系统
CN105407044B (zh) 一种基于nfs的云存储网关系统的实现方法
WO2023056946A1 (zh) 一种数据缓存方法、装置和电子设备
US11500931B1 (en) Using a graph representation of join history to distribute database data
CN103501341A (zh) 一种Web服务的创建方法及装置
JP6754696B2 (ja) ヘテロジニアスコンピューティング環境におけるデータタイプ変換をサポートするためのシステムおよび方法
US11263026B2 (en) Software plugins of data virtualization-based architecture
US11960616B2 (en) Virtual data sources of data virtualization-based architecture
US20100088685A1 (en) System and method for mapping a domain modeling language to a relational store
Kim et al. Comprehensive Knowledge Archive Network harvester improvement for efficient open‐data collection and management
Ye Research on the key technology of big data service in university library
CN113095778A (zh) 通过多个邮箱在通信应用中进行海量数据管理的架构

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150429

RJ01 Rejection of invention patent application after publication