CN103631907A - 一种将关系型数据迁移至HBase的方法及系统 - Google Patents

一种将关系型数据迁移至HBase的方法及系统 Download PDF

Info

Publication number
CN103631907A
CN103631907A CN201310612192.7A CN201310612192A CN103631907A CN 103631907 A CN103631907 A CN 103631907A CN 201310612192 A CN201310612192 A CN 201310612192A CN 103631907 A CN103631907 A CN 103631907A
Authority
CN
China
Prior art keywords
data
hbase
mapping
database
relational
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310612192.7A
Other languages
English (en)
Other versions
CN103631907B (zh
Inventor
戴娇
文杰
韩冀中
周薇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Information Engineering of CAS
Original Assignee
Institute of Information Engineering of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Information Engineering of CAS filed Critical Institute of Information Engineering of CAS
Priority to CN201310612192.7A priority Critical patent/CN103631907B/zh
Publication of CN103631907A publication Critical patent/CN103631907A/zh
Application granted granted Critical
Publication of CN103631907B publication Critical patent/CN103631907B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/214Database migration support

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种将关系型数据迁移至HBase的方法及系统,包括关系数据库、HBase数据库、SQL解析模块、查询转换模块和数据模式管理模块;通过在HBase数据库中设计映射关系表,存储原关系数据库中模式信息与HBase数据库中模式信息的映射关系,完整保留了原关系数据库中数据表格的模式信息,且可灵活配置映射方式,为用户提供了更多的选择,且HBase的高效数据组织方式,大大提高了访问性能,节省了存储空间,同时提供数据导出功能,实现与其他子系统的数据交互,另外,数据查询功能支持SQL查询,将SQL查询语句转换成HBase数据库的查询语句,使用户更平滑地过渡到HBase数据库。

Description

一种将关系型数据迁移至HBase的方法及系统
技术领域
本发明涉及数据存储与管理领域,尤其涉及一种将传统关系型数据库中的关系型数据迁移至HBase数据库的方法及系统。
背景技术
随着数据生成方式的多元化与数据接入方式的多样化及便捷化,各种业务系统中的数据都急剧膨胀。相应地,传统方式下,使用关系型数据库管理的数据,在存储容量与访问量上不断发生量级上的增加。传统关系库面临严峻的挑战。
近年来,NoSQL数据库在工业界和研究领域蓬勃发展。NoSQL数据库天然的分布式架构,自动完成数据的水平划分与访问的并发,在数据存储量及读写性能较传统关系型数据库有了极大的提升。工业界与研究机构都纷纷推出相关软件,HBase即为其中的一员。HBase是一个分布式的、面向列存储的数据库,具有高可靠性、高可扩展性,能在普通硬件环境基础上支撑十亿量级行,百万量级列的“大表”,并支持在这样规模数据上的随机、实时读写操作。HBase提供类似于表格的存储视图,与普通二维表格不同的是,表的属性列可以按需动态调整,表的记录按照列方向而非行方向进行组织。一行数据有行键与若干列簇组成,行键与列簇组成该表的schema,在表格创建后保持不变。而列簇则由若干列组成,可以在数据更新时动态增减列簇中的列。
参照Google的BigTable实现的HBase,目前是Apache的顶级项目,该开源社区蓬勃发展的同时,HBase的应用也越来越广泛,已经在Yahoo!,Facebook等多家公司成功应用。应用过程中,不可避免地涉及到数据迁移,即从从原有数据平台迁移至HBase,如:从Mysql、Oracle等关系型数据库移出。
Apache出品的Sqoop系统即提供从关系数据库读取整库的数据,并指定列为行键,将数据记录作为值存入HBase某一行的列簇中。这种迁移存在以下问题:1)丢失数据模式信息与数据唯一性保证,如数据类型、是否允许非空。2)列过多,对读写性能造成一定的影响。3)不恰当的行键的设计,可能会造成空间的浪费。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种将关系型数据迁移至HBase的方法及系统,完整保留了原关系数据库中数据表格的模式信息,可灵活配置映射方式,提高了访问性能,节省了存储空间。
本发明解决上述技术问题的技术方案如下:一种将关系型数据迁移至HBase的方法,包括如下步骤:
步骤1:建立HBase数据库,并建立用于存储关系数据库中数据表与HBase中相应的数据存储表间映射关系的映射关系表;
步骤2:选定一个或一个以上的关系型数据表,并为选定的每个关系型数据表定义映射方式,记录在映射关系表中;
步骤3:导入数据时,查询映射关系表中的映射方式,并根据映射方式建立相应的数据存储表;
步骤4:将步骤2中所述一个或一个以上的关系型数据表中的数据按照步骤3中所述的映射关系迁移至建立的数据存储表中;
步骤5:判断是否还有关系型数据要迁移到HBase数据库中,如果有返回步骤2,否则结束。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,上述技术方案还包括当要从HBase数据库中导出数据时,具体实现如下:首先,根据用户提供的导出配置文件获取待导出数据在原关系型数据表中的位置信息;其次,根据待导出数据在原关系型数据表中的位置信息,在映射关系表中查找出待导出数据在HBase数据库的数据存储表中相应的位置信息;最后,按照关系映射表中定义的数据类型将待导出数据导出。
进一步,上述技术方案还包括当要从HBase数据库中查询数据时,具体实现如下:首先,解析所述查询语句,提取出查询信息,并转换成HBase数据库的查询语句;其次,根据已转换的查询语句在映射关系表中查找待查询数据在数据存储表中的位置信息;最后,根据查询到的位置信息,查询数据存储表中的相应数据。
进一步,步骤2中所述映射方式为包括表映射方式和列映射方式,
所述表映射方式包括一对一映射和多对一映射,具体体现在表名的映射,所述表名的映射为根据表名转换运算进行映射,表名转换运算包括一对一哈希运算和多对一哈希运算;
所述列映射方式包括默认方式、时序方式和用户自定义方式,所述默认方式即关系数据库中表格内所有列与HBase的数据存储表格的一个列簇内的所有列一一对应;所述时序方式即将关系数据库中表格内所有时间值属性列在HBase的数据存储表中单独定义一个列簇,该列簇包含一个列,将迁移的数据按照不同时间点对应于该列不同的时间戳上;所述用户自定义映射即根据用户的需要进行自定义。
进一步,步骤3中根据映射方式建立相应的数据存储表,所述数据存储表中包括一个特殊的列即为行键列,所述行键列的映射方式包括单关键字型和多关键字型,所述单关键字型是以原关系数据库中表格的一个列属性直接作为行键,多关键字型是将原关系数据库中表格的多个列属性拼接为一个行键,所选列属性、用于拼接各列属性的连接字符或字符串,以及行键的排列顺序由用户自定义。
进一步,步骤4的具体实现包括数据读取和数据写入,其中数据读取包括两种方式,一是通过JDBC从关系数据库中读取数据,二是通过中间文件从关系数据库中读取数据;导入数据时,首先在映射关系表中查找相关的映射关系,将读取的数据转换成二进制串,根据映射关系将写入到相应的数据存储表中。
本发明解决上述技术问题的另一技术方案如下:一种将关系型数据迁移至HBase的系统,包括一个或一个以上的关系数据库、HBase数据库、SQL解析模块、查询转换模块和数据模式管理模块;
所述每个关系数据库,其用于存储关系型数据,作为数据迁移的源端;
所述HBase数据库,其用于建立映射关系表来存储关系数据库中数据表与HBase中相应的数据存储表间的映射关系,并将从关系型数据库中迁移来的数据按照预定的映射关系存储在相应的数据存储表中;
所述SQL解析模块,其用于提供SQL查询功能,对SQL查询语句进行解析,并将解析出的查询信息传送给查询转换模块;
所述查询转换模块,其用于将接收的查询信息转换成HBase数据库的查询语句,并传送给数据模式管理模块;
所述数据模式管理模块,其用于在向HBase导入、导出和查询数据时,调取相应接口,在HBase的映射关系表中查询映射关系,为数据导入、导出和查询提供查询依据。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述预定的映射关系包括表映射方式和列映射方式,
所述表映射方式包括一对一映射和多对一映射,具体体现在表名的映射,所述表名的映射为根据表名转换运算进行映射,表名转换运算包括一对一哈希运算和多对一哈希运算;
所述列映射方式包括默认方式、时序方式和用户自定义方式,所述默认方式即关系数据库中表格内所有列与HBase的数据存储表格的一个列簇内的所有列一一对应;所述时序方式即将关系数据库中表格内所有时间值属性列在HBase的数据存储表中单独定义一个列簇,该列簇包含一个列,将迁移的数据按照不同时间点对应于该列不同的时间戳上;所述用户自定义映射即根据用户的需要进行自定义。
进一步,所述关系数据库提供JDBC接口以实现关系数据库中表格模式的获取及待迁移数据的读取;所述HBase数据库提供接口以实现数据的读写。
进一步,所述SQL解析模块包括语法解析单元和语义解析单元;
所述语法解析单元,其用于通过正则表达式判断SQL查询语句的合法性;
所述语义查询单元,其用于提取具体的查询信息。
进一步,所述映射关系表包括行键和一个列簇,所述列簇中包括若干列,分别为tOc、TN、aNULL、DT、DL、isK、CFN、CN、TS;其中,tOc标识所填内容为表信息还是列信息,TN中所填内容为表名,aNULL标识能否允许为空,DT标识数据类型,DL标识数据长度,isK标识是否主键,CFN标识是否为时序映射、CN为主键名,TS为时间戳方式。
本发明的有益效果是:本发明通过在HBase数据库中设计映射关系表,存储原关系数据库中模式信息与HBase数据库中模式信息的映射关系,完整保留了原关系数据库中数据表格的模式信息,且可灵活配置映射方式,为用户提供了更多的选择,且HBase的高效数据组织方式,大大提高了访问性能,节省了存储空间,同时提供数据导出功能,实现与其他子系统的数据交互,另外,数据查询功能支持SQL查询,将SQL查询语句转换成HBase数据库的查询语句,使用户更平滑地过渡到HBase数据库。
附图说明
图1为本发明所述一种将关系型数据迁移至HBase的方法流程图;
图2为本发明所述一种将关系型数据迁移至HBase的系统框图;
图3为按关键字查询关系数据库与HBase数据库时的查询性能对比图;
图4为按条件查询关系数据库与HBase数据库时的查询性能对比图。
附图中,各标号所代表的部件列表如下:
1、关系数据库,2、HBase数据库,3、SQL解析模块,4、查询转换模块,5、数据模式管理模块。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,一种将关系型数据迁移至HBase的方法,包括如下步骤:
步骤1:建立HBase数据库,并建立用于存储关系数据库中数据表与HBase中相应的数据存储表间映射关系的映射关系表;
步骤2:选定一个或一个以上的关系型数据表,并为选定的每个关系型数据表定义映射方式,记录在映射关系表中;
步骤3:导入数据时,查询映射关系表中的映射方式,并根据映射方式建立相应的数据存储表;
步骤4:将步骤2中所述一个或一个以上的关系型数据表中的数据按照步骤3中所述的映射关系迁移至建立的数据存储表中;
步骤5:判断是否还有关系型数据要迁移到HBase数据库中,如果有返回步骤2,否则结束。
其中,上述技术方案还包括当要从HBase数据库中导出数据时,具体实现如下:首先,根据用户提供的导出配置文件获取待导出数据在原关系型数据表中的位置信息;其次,根据待导出数据在原关系型数据表中的位置信息,在映射关系表中查找出待导出数据在HBase数据库的数据存储表中相应的位置信息;最后,按照关系映射表中定义的数据类型将待导出数据导出。
其中,上述技术方案还包括当要从HBase数据库中查询数据时,具体实现如下:首先,解析所述查询语句,提取出查询信息,并转换成HBase数据库的查询语句;其次,根据已转换的查询语句在映射关系表中查找待查询数据在数据存储表中的位置信息;最后,根据查询到的位置信息,查询数据存储表中的相应数据。
映射关系表逻辑上包括表名映射和列映射表。关系数据库中通常包含库、模式、表格或类似的三层视图;而HBase数据库中的表格是平坦化组织的,表格之上没有模式、库之类的概念。因此需要将关系数据库的树状名字空间映射为平坦的名字空间,表名映射表中存储的即是以上映射关系。关系数据库与HBase更大的不同在于,关系数据库的表格属性是行、列二维的,而HBase是多维的,行方向为行键维,列方向有列簇和列。为了提高访问性能,Hbase中的数据存储表的模式设计应充分利用其特性进行数据组织和存储。
所述原关系数据库中的数据表与HBase中数据存储表的映射关系包括表映射方式和列映射方式,
所述表映射方式包括一对一映射和多对一映射,具体体现在表名的映射,所述表名的映射为根据表名转换运算进行映射,表名转换运算包括一对一哈希运算和多对一哈希运算。
其中,一对一映射;将关系型数据库中一个数据表映射到HBase数据库中的一个数据存储表中,原关系型数据库中的数据表的表名经过一致的hash计算得到映射后的表名,即为HBase中对应的表名,此种一对一映射为本系统提供的默认的表映射方式。
而表的多对一的表映射方式,即对于表达相同业务且表格模式一致的多张表(来自同一关系型数据库或多个关系型数据库),允许用户将其映射到HBase的一个数据存储表中,原关系型数据库中的多个数据表的表名经过一致的hash计算得到映射后的表名,即为HBase中对应的表名,此种多对一映射为本系统提供的多对一表映射方式。
所述列映射方式包括默认方式、时序方式和用户自定义方式,所述默认方式即关系数据库中表格内所有列与HBase的数据存储表格的一个列簇内的所有列一一对应;所述时序方式即将关系数据库中表格内所有时间值属性列在HBase的数据存储表中单独定义一个列簇,该列簇包含一个列,将迁移的数据按照不同时间点对应于该列不同的时间戳上;所述用户自定义映射即根据用户的需要进行自定义。
所述数据存储表中包括一个特殊的列即为行键列,所述行键列的映射方式包括单关键字型和多关键字型,所述单关键字型是以原关系数据库中表格的一个列属性直接作为行键,多关键字型是将原关系数据库中表格的多个列属性拼接为一个行键,所选列属性、用于拼接各列属性的连接字符或字符串,以及行键的排列顺序由用户自定义。
实施例1中,表映射采用一对一映射,列映射采用默认方式,行键为多关键字型。如表1为关系数据库中表名为t1的模式定义,表2、表3分别为映射到HBase中相应的表名为hash(t1)的模式定义及数据存储表格模式。
表1
Figure BDA0000422792980000081
表2
Figure BDA0000422792980000082
表3
Figure BDA0000422792980000091
实施例2中,表映射采用多对一映射,列映射采用时序方式,行键为单关键字型。如表4所示,为关系数据库中存储的一张采样表,该采样表的生成时间为2013年11月12日,表5为关系数据库中存储的另一张采样表,该采样表的生成时间为2013年11月13日,由于表4和和表5表达的业务相同,且表格模式相同,为控制单表的数据量,进而提高局部访问性能,按日生成的年度日志信息表,可以将日期信息存储在列的时间戳上,从而将多天的表格合并存储为一张表。因此,可以将表4和表5合并存储为表6,其中表6为HBase中的一张数据存储表。
表4
ID 采样值
123 12.1
... ...
表5
ID 采样值
123 11.1
... ...
表6
Figure BDA0000422792980000101
实施例3中,表映射采用一对一映射,列映射采用时序方式,行键为单关键字型。表7为关系数据库中的一张数据表,表8为映射到HBase中相应的数据存储表。
表7
ID 0点0分 0点15分 0点30分 ... 23点45分
123 12.1 15.1 13.1 ... 1.1
124 11.1 16.1 18.1 ... 8.1
... ... ... ... ... ...
表8
Figure BDA0000422792980000102
上述按时序方式进行列映射,即将关系数据库中表格内所有时间值属性列在HBase的数据存储表中单独定义一个列簇,该列簇包含一个列,将迁移的数据按照不同时间点对应于该列不同的时间戳上。
批量数据导入分为数据读取与数据写入两部分,其中读取方式可分为两种:1)通过JDBC从关系数据库读取数据;2)通过中间文件读取数据,业务系统一般都会约定数据库的导出文件格式以实现与其它系统的交互,典型的如:通用的XML文件格式,电力系统中基于CIM提出的CIME交换文件格式。这些文件都可以作为本系统的输入。导入数据时,首先读取关系数据表格的元数据信息,即表格的模式信息,为每张表格定义映射关系,将定义的映射关系存储在映射关系表中,供数据导出与查询使用。
HBase数据库数据导出功能。如前所述,原有的业务系统为了与其它子系统进行数据交换,会约定数据库导出数据的格式,因此本系统提供了相应的数据导出功能。与导入功能类似,亦支持通用的XML、CIM/E及用户自定义的各种导出格式。导出数据时,查询映射关系表,得到相应的映射关系,根据映射关系在数据存储表中找到所需数据,并按照映射关系表中定义的数据类型返回给用户。
SQL查询功能。为了使用户更平滑地过渡到HBase数据库,本系统提供类SQL查询功能,支持基本的SQL语法。特别的,对于前文所述时序方式导入的表格,支持timestamp关键字,以提供更高效的查询性能。
如图2所示,一种将关系型数据迁移至HBase的系统,包括一个或一个以上的关系数据库1、HBase数据库2、SQL解析模块3、查询转换模块4和数据模式管理模块5;
所述每个关系数据库1,其用于存储关系型数据,作为数据迁移的源端;
所述HBase数据库2,其用于建立映射关系表来存储关系数据库中数据表与HBase中相应的数据存储表间的映射关系,并将从关系型数据库中迁移来的数据按照预定的映射关系存储在相应的数据存储表中;
所述SQL解析模块3,其用于提供SQL查询功能,对SQL查询语句进行解析,并将解析出的查询信息传送给查询转换模块4;
所述查询转换模块4,其用于将接收的查询信息转换成HBase数据库的查询语句,并传送给数据模式管理模块5;
所述数据模式管理模块5,其用于在向HBase导入、导出和查询数据时,调取相应接口,在HBase的映射关系表中查询映射关系,为数据导入、导出和查询提供查询依据。
迁移的数据源端与数据目的端,即分别为关系数据库和HBase,二者提供基本的存储支撑,提供表格视图。关系数据库提供通用的JDBC接口以实现数据库表格模式的获取及数据的读取;HBase提供put、get等接口实现数据的读写。
SQL解析模块,SQL解析模块主要分为语法解析和语义解析,语法解析主要通过正则表达式判断查询语句的合法性;语义解析将提取出关键字、操作对象、查询操作类型、查询条件等信息,如“update”、“student_table”、“where”、“count”等查询信息,并将解析出的查询信息发送给查询转换模块。
查询转化模块,将接收的查询信息转换成HBase的查询语句,并在数据模式管理模块的协助下,完成操作对象、查询条件等的转换,如表名的转化、timestamp查询条件的转化。
数据模式管理模块,数据模式的映射关系以表格形式存储于Hbase映射关系表中,支撑表格的创建及查询转化。
如表9所示,HBbase中的映射关系表简称为:SchMngTable,其行键为表名或者表名与列名的联接,具有一个名为CF的列簇,当行键为表名时,列信息为映射后的HBase中的表名;当行键为表名与列名的联接时,列信息中包含列的属性。因此CF下包含以下列:tOc(table or column,表信息还是列信息)、TN(table name,表名)、aNULL(allow null,能否允许为空)、DT(data type,数据类型、DL(data length,数据长度)、isK(是否主键)以及表达时序映射的CFN(column family name)、CN(column name)与TS(timestamp,时间戳方式)。
表9
Figure BDA0000422792980000131
下面结合实际的表格数据的具体对本发明进行说明:
1.数据库初始化
在HBase中创建映射关系表,包含行键、一个列簇与以下列:tOc、TN、aNULL、DT、DL、isK、CFN、CN与TS。这些列簇的含义分别为:表格还是列、表名、是否允许为空、数据类型、数据长度、是否为主键、列簇名、列名、时间戳。
2.历史数据导入
指定待迁移数据的关系型数据库,并为待迁移数据的每张表格定义相应的表映射方式和列映射方式。为更加清晰的表达时序方式,假定数据库中存在一张周期性生成的数据表格,除行键外的其它列表达的是时刻信息,如3600列表达一小时内的每一秒钟、或者96列表达一天的每一刻钟。此时建议用户使用时序方式进行列映射。
创建一个数据存储表之前,将在映射关系表中写入两记录:第一条记录标示要建立的所述数据存储表该表,其行键为:数据库名.模式名.表名,列值为t(table or column,表信息)、TN(table name,表名),其它列为NULL;第二条记录标示要建立的数据存储表各列的属性,各列的值分别为:c(table or column,列信息)、N(allow null,不允许为空)、int(datatype,数据类型)、8(data length,数据长度)、Y(是主键)以及表达时序映射的CF1(column family name)、C(column name)与TS1(timestamp,时间戳方式为时序方式)。
读取被迁移数据,写入HBase,即完成数据导入。如前所述,数据的读取分为传统的JDBC接口方式与用户自定义的文件格式。在此以JDBC接口方式为例说明本方法的实施。首先通过JDBC接口读取数据库的元数据信息,得到数据库的所有表名,根据映射关系表,为每张表在HBase中创建数据存储表。创建完成后,通过JDBC接口完成每张表格的数据读取,将读取到的数据转化为二进制串存入相应的数据存储表。
3.HBase中数据导出。
本节以从HBase数据库数据中导出CIME文件为例说明数据记录导出的功能。首先,从用户提供的导出配置中读出待导出的表以及列信息,然后在映射关系表中查询对应HBase中的表名、列簇、列名,以及可能由映射得到的时间戳信息,最后读取HBase中相应的数据存储表中的记录,并按照映射关系表中约定的数据类型,将存储的数据导出至CIME文件。
4.HBase中数据查询。
本系统提供SQL查询功能,兼容关系数据库的语法,同时提供timestamp关键字以提供更高效的查询性能。
在某生产系统中选取了1张具有时序特征的典型表格,通过测试迁移(使用时序方式进行列映射)前后的查询性能验证本系统的有效性;查询语句选取了关键字查询和条件查询。
图3与图4分别展示了关键字查询与条件查询下关系数据库与HBase(单机、多机分别指1个数据节点和2个数据节点)的查询性能对比,其中横轴代表数据表格的记录数,即查询规模从1000变化至1,000,000;纵轴代表首记录返回时间。从图3与图4的对比结果可知,按关键字查询时,HBase的性能提升为3-5倍;按条件查询时,数据规模越大HBase的性能优势越明显。同时,随着数据规模的增加关系数据库上的两种查询性能都不断下降,而HBase则表现稳定,访问时间基本不变。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种将关系型数据迁移至HBase的方法,其特征在于,包括如下步骤:
步骤1:建立HBase数据库,并建立用于存储关系数据库中数据表与HBase中相应的数据存储表间映射关系的映射关系表;
步骤2:选定一个或一个以上的关系型数据表,并为选定的每个关系型数据表定义映射方式,记录在映射关系表中;
步骤3:导入数据时,查询映射关系表中的映射方式,并根据映射方式建立相应的数据存储表;
步骤4:将步骤2中所述一个或一个以上的关系型数据表中的数据按照步骤3中所述的映射关系迁移至建立的数据存储表中;
步骤5:判断是否还有关系型数据要迁移到HBase数据库中,如果有返回步骤2,否则结束。
2.根据权利要求1所述一种将关系型数据迁移至HBase的方法,其特征在于,还包括当要从HBase数据库中导出数据时,具体实现如下:首先,根据用户提供的导出配置文件获取待导出数据在原关系型数据表中的位置信息;其次,根据待导出数据在原关系型数据表中的位置信息,在映射关系表中查找出待导出数据在HBase数据库的数据存储表中相应的位置信息;最后,按照关系映射表中定义的数据类型将待导出数据导出。
3.根据权利要求1所述一种将关系型数据迁移至HBase的方法,其特征在于,还包括当要从HBase数据库中查询数据时,具体实现如下:首先,解析所述查询语句,提取出查询信息,并转换成HBase数据库的查询语句;其次,根据已转换的查询语句在映射关系表中查找待查询数据在数据存储表中的位置信息;最后,根据查询到的位置信息,查询数据存储表中的相应数据。
4.根据权利要求1所述一种将关系型数据迁移至HBase的方法,其特征在于,步骤2中所述映射方式为包括表映射方式和列映射方式,
所述表映射方式包括一对一映射和多对一映射,具体体现在表名的映射,所述表名的映射为根据表名转换运算进行映射,表名转换运算包括一对一哈希运算和多对一哈希运算;
所述列映射方式包括默认方式、时序方式和用户自定义方式,所述默认方式即关系数据库中表格内所有列与HBase的数据存储表格的一个列簇内的所有列一一对应;所述时序方式即将关系数据库中表格内所有时间值属性列在HBase的数据存储表中单独定义一个列簇,该列簇包含一个列,将迁移的数据按照不同时间点对应于该列不同的时间戳上;所述用户自定义映射即根据用户的需要进行自定义。
5.根据权利要求4所述一种将关系型数据迁移至HBase的方法,其特征在于,步骤3中根据映射方式建立相应的数据存储表,所述数据存储表中包括一个特殊的列即为行键列,所述行键列的映射方式包括单关键字型和多关键字型,所述单关键字型是以原关系数据库中表格的一个列属性直接作为行键,多关键字型是将原关系数据库中表格的多个列属性拼接为一个行键,所选列属性、用于拼接各列属性的连接字符或字符串,以及行键的排列顺序由用户自定义。
6.根据权利要求1所述一种将关系型数据迁移至HBase的方法,其特征在于,步骤4的具体实现包括数据读取和数据写入,其中数据读取包括两种方式,一是通过JDBC从关系数据库中读取数据,二是通过中间文件从关系数据库中读取数据;导入数据时,首先在映射关系表中查找相关的映射关系,将读取的数据转换成二进制串,根据映射关系将其写入到相应的数据存储表中。
7.一种将关系型数据迁移至HBase的系统,其特征在于,包括一个或一个以上的关系数据库、HBase数据库、SQL解析模块、查询转换模块和数据模式管理模块;
所述每个关系数据库,其用于存储关系型数据,作为数据迁移的源端;
所述HBase数据库,其用于建立映射关系表来存储关系数据库中数据表与HBase中相应的数据存储表间的映射关系,并将从关系型数据库中迁移来的数据按照预定的映射关系存储在相应的数据存储表中;
所述SQL解析模块,其用于提供SQL查询功能,对SQL查询语句进行解析,并将解析出的查询信息传送给查询转换模块;
所述查询转换模块,其用于将接收的查询信息转换成HBase数据库的查询语句,并传送给数据模式管理模块;
所述数据模式管理模块,其用于在向HBase导入、导出和查询数据时,调取相应接口,在HBase的映射关系表中查询映射关系,为数据导入、导出和查询提供查询依据。
8.根据权利要求7所述一种将关系型数据迁移至HBase的系统,其特征在于,所述预定的映射关系包括表映射方式和列映射方式,
所述表映射方式包括一对一映射和多对一映射,具体体现在表名的映射,所述表名的映射为根据表名转换运算进行映射,表名转换运算包括一对一哈希运算和多对一哈希运算;
所述列映射方式包括默认方式、时序方式和用户自定义方式,所述默认方式即关系数据库中表格内所有列与HBase的数据存储表格的一个列簇内的所有列一一对应;所述时序方式即将关系数据库中表格内所有时间值属性列在HBase的数据存储表中单独定义一个列簇,该列簇包含一个列,将迁移的数据按照不同时间点对应于该列不同的时间戳上;用户自定义映射即根据用户的需要进行自定义。
9.根据权利要求7所述一种将关系型数据迁移至HBase的系统,其特征在于,所述关系数据库提供JDBC接口以实现关系数据库中表格模式的获取及待迁移数据的读取;所述HBase数据库提供接口以实现数据的读写。
10.根据权利要求7所述一种数据迁移的方法,其特征在于,所述SQL解析模块包括语法解析单元和语义解析单元;
所述语法解析单元,其用于通过正则表达式判断SQL查询语句的合法性;
所述语义查询单元,其用于提取具体的查询信息。
11.根据权利要求7所述一种将关系型数据迁移至HBase的系统,其特征在于,所述映射关系表包括行键和一个列簇,所述列簇中包括若干列,分别为tOc、TN、aNULL、DT、DL、isK、CFN、CN、TS;其中,tOc标识所填内容为表信息还是列信息,TN中所填内容为表名,aNULL标识能否允许为空,DT标识数据类型,DL标识数据长度,isK标识是否主键,CFN标识是否为时序映射、CN为主键名,TS为时间戳方式。
CN201310612192.7A 2013-11-26 2013-11-26 一种将关系型数据迁移至HBase的方法及系统 Active CN103631907B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310612192.7A CN103631907B (zh) 2013-11-26 2013-11-26 一种将关系型数据迁移至HBase的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310612192.7A CN103631907B (zh) 2013-11-26 2013-11-26 一种将关系型数据迁移至HBase的方法及系统

Publications (2)

Publication Number Publication Date
CN103631907A true CN103631907A (zh) 2014-03-12
CN103631907B CN103631907B (zh) 2016-09-07

Family

ID=50212948

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310612192.7A Active CN103631907B (zh) 2013-11-26 2013-11-26 一种将关系型数据迁移至HBase的方法及系统

Country Status (1)

Country Link
CN (1) CN103631907B (zh)

Cited By (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902698A (zh) * 2014-03-31 2014-07-02 北京车商汇软件有限公司 一种数据存储系统和存储方法
CN103902701A (zh) * 2014-03-31 2014-07-02 北京车商汇软件有限公司 一种数据存储系统和存储方法
CN104036006A (zh) * 2014-06-20 2014-09-10 浪潮(北京)电子信息产业有限公司 一种实现Windows下连接控制Hbase的方法及装置
CN104077420A (zh) * 2014-07-21 2014-10-01 北京京东尚科信息技术有限公司 一种数据导入HBase数据库的方法和装置
CN104123392A (zh) * 2014-08-11 2014-10-29 吉林禹硕动漫游戏科技股份有限公司 一种关系型数据库迁移到HBase数据库的工具和方法
CN104391891A (zh) * 2014-11-11 2015-03-04 上海新炬网络信息技术有限公司 一种数据库异构复制方法
CN104504008A (zh) * 2014-12-10 2015-04-08 华南师范大学 一种基于嵌套的SQL到HBase的数据迁移算法
CN104598587A (zh) * 2015-01-19 2015-05-06 深圳市华成峰数据技术有限公司 发票真伪查询方法和系统
CN104809212A (zh) * 2015-04-29 2015-07-29 苏州星熙数据科技有限公司 一种基于低延迟的HBase枚举系统设计方法
CN104915450A (zh) * 2015-07-01 2015-09-16 武汉大学 一种基于HBase的大数据存储与检索方法及系统
CN105005572A (zh) * 2014-04-24 2015-10-28 中国移动通信集团云南有限公司 一种数据库映射方法及装置
CN105243067A (zh) * 2014-07-07 2016-01-13 北京明略软件系统有限公司 一种实现实时增量同步数据的方法及装置
CN105354314A (zh) * 2015-11-10 2016-02-24 中国建设银行股份有限公司 数据迁移方法及装置
CN105447052A (zh) * 2014-09-24 2016-03-30 阿里巴巴集团控股有限公司 数据处理方法及系统
CN106021344A (zh) * 2016-05-09 2016-10-12 国电南瑞科技股份有限公司 一种多适应性cime电网模型共享方法
CN106227803A (zh) * 2016-07-21 2016-12-14 浪潮电子信息产业股份有限公司 一种基于Hbase的海量数据导入方法及装置
CN106326222A (zh) * 2015-06-16 2017-01-11 阿里巴巴集团控股有限公司 一种数据处理方法和装置
CN106445727A (zh) * 2015-08-07 2017-02-22 中国移动通信集团重庆有限公司 数据备份和恢复方法及系统
CN106528786A (zh) * 2016-11-08 2017-03-22 国网山东省电力公司电力科学研究院 快速迁移多源异构电网大数据到HBase的方法及系统
WO2017071135A1 (zh) * 2015-10-28 2017-05-04 北京汇商融通信息技术有限公司 基于多种数据存储平台的数据迁移系统
CN106777108A (zh) * 2016-12-15 2017-05-31 贵州电网有限责任公司电力科学研究院 一种基于混合存储架构的数据查询方法和装置
CN106909595A (zh) * 2016-06-20 2017-06-30 阿里巴巴集团控股有限公司 一种数据迁移方法及装置
CN106933859A (zh) * 2015-12-30 2017-07-07 中国移动通信集团公司 一种医疗数据的迁移方法和装置
CN107038179A (zh) * 2016-08-23 2017-08-11 平安科技(深圳)有限公司 信息项存储方法和系统
CN107045534A (zh) * 2017-01-20 2017-08-15 中国航天系统科学与工程研究院 大数据环境下基于HBase的异构数据库在线交换与共享系统
US9798752B1 (en) * 2015-05-22 2017-10-24 State Farm Mutual Automobile Insurance Company Systems and methods for ingesting relational data into a delimited column qualifier NoSQL database
CN107992559A (zh) * 2017-11-28 2018-05-04 江苏中威科技软件系统有限公司 多数据源的数据迁移方法
CN108009195A (zh) * 2017-10-23 2018-05-08 苏州市环亚数据技术有限公司 一种基于大数据的降维转换方法、电子设备、存储介质
CN108090106A (zh) * 2016-11-22 2018-05-29 财团法人资讯工业策进会 数据库转换服务器及其数据库转换方法
CN108256001A (zh) * 2017-12-31 2018-07-06 安徽中凯信息产业股份有限公司 一种人工智能通信数据监测系统
CN108255966A (zh) * 2017-12-25 2018-07-06 太极计算机股份有限公司 一种数据迁移方法及存储介质
CN108319645A (zh) * 2017-12-25 2018-07-24 中国科学院信息工程研究所 一种异构存储环境下多版本文件视图管理方法和装置
CN108647270A (zh) * 2018-04-28 2018-10-12 尚谷科技(天津)有限公司 一种基于容错时间日志的数据迁移的方法
CN108804606A (zh) * 2018-05-29 2018-11-13 上海欣能信息科技发展有限公司 一种电力量测类数据迁移到HBase的方法及系统
CN108829884A (zh) * 2018-06-27 2018-11-16 中国建设银行股份有限公司 数据映射方法及装置
CN108959205A (zh) * 2018-06-27 2018-12-07 成都泰盟软件有限公司 一种erp系统导出数据快速迁移的方法
CN109299068A (zh) * 2018-08-31 2019-02-01 安徽四创电子股份有限公司 从关系型数据库到HBase数据库的数据流迁移方法
CN110019135A (zh) * 2017-12-27 2019-07-16 航天信息股份有限公司 一种将关系型数据迁移至HBase数据库的方法及装置
CN110019448A (zh) * 2017-09-26 2019-07-16 大唐移动通信设备有限公司 一种数据交互方法及装置
CN110134706A (zh) * 2019-04-01 2019-08-16 平安科技(深圳)有限公司 Sql语句自动优化方法、装置、计算机设备以及存储介质
CN110245148A (zh) * 2019-06-25 2019-09-17 河南中原消费金融股份有限公司 一种数据存储方法、装置、系统及介质
CN110362582A (zh) * 2018-04-03 2019-10-22 北京京东尚科信息技术有限公司 一种实现零停机升级的方法和装置
WO2019219010A1 (zh) * 2018-05-14 2019-11-21 杭州海康威视数字技术股份有限公司 数据迁移方法、装置及计算机可读存储介质
CN110569243A (zh) * 2019-08-22 2019-12-13 厦门网宿有限公司 一种数据查询方法、数据查询插件和数据查询服务器
CN110784532A (zh) * 2019-10-25 2020-02-11 北京天润融通科技股份有限公司 双向数据同步方法及系统
CN111078753A (zh) * 2019-12-17 2020-04-28 联想(北京)有限公司 基于HBase数据库的时序数据的存储方法及装置
CN111104396A (zh) * 2019-12-31 2020-05-05 紫光云(南京)数字技术有限公司 一种跨数据库的数据迁移方法、数据访问方法
CN111382209A (zh) * 2020-04-02 2020-07-07 北京思特奇信息技术股份有限公司 分布式内存数据库的数据转存和操作方法
CN111752928A (zh) * 2020-06-30 2020-10-09 武汉虹信技术服务有限责任公司 一种数据库对象迁移方法及系统
CN112035432A (zh) * 2020-07-22 2020-12-04 大箴(杭州)科技有限公司 数据的置换迁移方法、装置计算机设备
CN112632015A (zh) * 2020-12-18 2021-04-09 上海明略人工智能(集团)有限公司 数据格式的转换方法及装置、存储介质、电子设备
CN112650736A (zh) * 2020-12-31 2021-04-13 中国农业银行股份有限公司 一种数据迁移方法及装置
US11036698B2 (en) 2018-12-06 2021-06-15 International Business Machines Corporation Non-relational database coprocessor for reading raw data files copied from relational databases
CN113553458A (zh) * 2021-08-10 2021-10-26 北京明略软件系统有限公司 图数据库中的数据导出方法及装置
CN113778988A (zh) * 2021-08-23 2021-12-10 咪咕数字传媒有限公司 数据处理方法、装置、设备及计算机程序产品
CN114238469A (zh) * 2021-12-07 2022-03-25 杭州天均数聚科技有限公司 数据提取接口开放方法、装置、计算机设备及存储介质
CN114490858A (zh) * 2022-02-22 2022-05-13 北京科杰科技有限公司 一种大数据与rmdb的表结构类型转换系统及方法
CN112650736B (zh) * 2020-12-31 2024-07-05 中国农业银行股份有限公司 一种数据迁移方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHONGXIN LI: "Transforming Relational Database into HBase", 《SOFTWARE ENGINEERING AND SERVICE SCIENCE(ICSESS),2010 IEEE INTERNATIONAL CONFERENCE ON.IEEE》 *
WEI CHEN ET AL.: "Data Migration from Grid to Cloud Computing", 《APPLIED MATHEMATICS & INFORMATION SCIENCES》 *
杨寒冰等: "HBase数据库迁移工具的设计与实现", 《计算机科学与探索》 *

Cited By (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902701B (zh) * 2014-03-31 2017-12-29 北京皮尔布莱尼软件有限公司 一种数据存储系统和存储方法
CN103902701A (zh) * 2014-03-31 2014-07-02 北京车商汇软件有限公司 一种数据存储系统和存储方法
CN103902698A (zh) * 2014-03-31 2014-07-02 北京车商汇软件有限公司 一种数据存储系统和存储方法
CN103902698B (zh) * 2014-03-31 2018-04-13 北京皮尔布莱尼软件有限公司 一种数据存储系统和存储方法
CN105005572A (zh) * 2014-04-24 2015-10-28 中国移动通信集团云南有限公司 一种数据库映射方法及装置
CN104036006A (zh) * 2014-06-20 2014-09-10 浪潮(北京)电子信息产业有限公司 一种实现Windows下连接控制Hbase的方法及装置
CN105243067A (zh) * 2014-07-07 2016-01-13 北京明略软件系统有限公司 一种实现实时增量同步数据的方法及装置
CN105243067B (zh) * 2014-07-07 2019-06-28 北京明略软件系统有限公司 一种实现实时增量同步数据的方法及装置
CN104077420A (zh) * 2014-07-21 2014-10-01 北京京东尚科信息技术有限公司 一种数据导入HBase数据库的方法和装置
CN104077420B (zh) * 2014-07-21 2017-05-03 北京京东尚科信息技术有限公司 一种数据导入HBase数据库的方法和装置
CN104123392A (zh) * 2014-08-11 2014-10-29 吉林禹硕动漫游戏科技股份有限公司 一种关系型数据库迁移到HBase数据库的工具和方法
CN105447052A (zh) * 2014-09-24 2016-03-30 阿里巴巴集团控股有限公司 数据处理方法及系统
CN105447052B (zh) * 2014-09-24 2018-10-02 阿里巴巴集团控股有限公司 数据处理方法及系统
CN104391891A (zh) * 2014-11-11 2015-03-04 上海新炬网络信息技术有限公司 一种数据库异构复制方法
CN104391891B (zh) * 2014-11-11 2017-12-05 上海新炬网络信息技术股份有限公司 一种数据库异构复制方法
CN104504008A (zh) * 2014-12-10 2015-04-08 华南师范大学 一种基于嵌套的SQL到HBase的数据迁移算法
CN104504008B (zh) * 2014-12-10 2018-10-02 华南师范大学 一种基于嵌套的SQL到HBase的数据迁移算法
CN104598587A (zh) * 2015-01-19 2015-05-06 深圳市华成峰数据技术有限公司 发票真伪查询方法和系统
CN104809212A (zh) * 2015-04-29 2015-07-29 苏州星熙数据科技有限公司 一种基于低延迟的HBase枚举系统设计方法
US10929366B1 (en) 2015-05-22 2021-02-23 State Farm Mutual Automobile Insurance Company Systems and methods for ingesting relational data into a delimited column qualifier NOSQL database
US9798752B1 (en) * 2015-05-22 2017-10-24 State Farm Mutual Automobile Insurance Company Systems and methods for ingesting relational data into a delimited column qualifier NoSQL database
CN106326222B (zh) * 2015-06-16 2019-08-02 阿里巴巴集团控股有限公司 一种数据处理方法和装置
CN106326222A (zh) * 2015-06-16 2017-01-11 阿里巴巴集团控股有限公司 一种数据处理方法和装置
CN104915450A (zh) * 2015-07-01 2015-09-16 武汉大学 一种基于HBase的大数据存储与检索方法及系统
CN104915450B (zh) * 2015-07-01 2017-11-28 武汉大学 一种基于HBase的大数据存储与检索方法及系统
CN106445727A (zh) * 2015-08-07 2017-02-22 中国移动通信集团重庆有限公司 数据备份和恢复方法及系统
WO2017071135A1 (zh) * 2015-10-28 2017-05-04 北京汇商融通信息技术有限公司 基于多种数据存储平台的数据迁移系统
CN105354314B (zh) * 2015-11-10 2020-03-03 中国建设银行股份有限公司 数据迁移方法及装置
CN105354314A (zh) * 2015-11-10 2016-02-24 中国建设银行股份有限公司 数据迁移方法及装置
CN106933859A (zh) * 2015-12-30 2017-07-07 中国移动通信集团公司 一种医疗数据的迁移方法和装置
CN106933859B (zh) * 2015-12-30 2020-10-20 中国移动通信集团公司 一种医疗数据的迁移方法和装置
CN106021344B (zh) * 2016-05-09 2019-12-03 国电南瑞科技股份有限公司 一种多适应性cime电网模型共享方法
CN106021344A (zh) * 2016-05-09 2016-10-12 国电南瑞科技股份有限公司 一种多适应性cime电网模型共享方法
CN106909595A (zh) * 2016-06-20 2017-06-30 阿里巴巴集团控股有限公司 一种数据迁移方法及装置
CN106227803A (zh) * 2016-07-21 2016-12-14 浪潮电子信息产业股份有限公司 一种基于Hbase的海量数据导入方法及装置
CN107038179B (zh) * 2016-08-23 2020-04-10 平安科技(深圳)有限公司 信息项存储方法和系统
CN107038179A (zh) * 2016-08-23 2017-08-11 平安科技(深圳)有限公司 信息项存储方法和系统
CN106528786A (zh) * 2016-11-08 2017-03-22 国网山东省电力公司电力科学研究院 快速迁移多源异构电网大数据到HBase的方法及系统
CN106528786B (zh) * 2016-11-08 2019-07-12 国网山东省电力公司电力科学研究院 快速迁移多源异构电网大数据到HBase的方法及系统
CN108090106A (zh) * 2016-11-22 2018-05-29 财团法人资讯工业策进会 数据库转换服务器及其数据库转换方法
CN106777108A (zh) * 2016-12-15 2017-05-31 贵州电网有限责任公司电力科学研究院 一种基于混合存储架构的数据查询方法和装置
CN107045534A (zh) * 2017-01-20 2017-08-15 中国航天系统科学与工程研究院 大数据环境下基于HBase的异构数据库在线交换与共享系统
CN107045534B (zh) * 2017-01-20 2018-06-05 中国航天系统科学与工程研究院 大数据环境下基于HBase的异构数据库在线交换与共享系统
CN110019448A (zh) * 2017-09-26 2019-07-16 大唐移动通信设备有限公司 一种数据交互方法及装置
CN110019448B (zh) * 2017-09-26 2021-12-28 大唐移动通信设备有限公司 一种数据交互方法及装置
CN108009195B (zh) * 2017-10-23 2022-06-28 环亚数据技术有限公司 一种基于大数据的降维转换方法、电子设备、存储介质
CN108009195A (zh) * 2017-10-23 2018-05-08 苏州市环亚数据技术有限公司 一种基于大数据的降维转换方法、电子设备、存储介质
CN107992559A (zh) * 2017-11-28 2018-05-04 江苏中威科技软件系统有限公司 多数据源的数据迁移方法
CN108319645A (zh) * 2017-12-25 2018-07-24 中国科学院信息工程研究所 一种异构存储环境下多版本文件视图管理方法和装置
CN108319645B (zh) * 2017-12-25 2022-09-16 中国科学院信息工程研究所 一种异构存储环境下多版本文件视图管理方法和装置
CN108255966A (zh) * 2017-12-25 2018-07-06 太极计算机股份有限公司 一种数据迁移方法及存储介质
CN110019135A (zh) * 2017-12-27 2019-07-16 航天信息股份有限公司 一种将关系型数据迁移至HBase数据库的方法及装置
CN108256001A (zh) * 2017-12-31 2018-07-06 安徽中凯信息产业股份有限公司 一种人工智能通信数据监测系统
CN110362582A (zh) * 2018-04-03 2019-10-22 北京京东尚科信息技术有限公司 一种实现零停机升级的方法和装置
CN108647270A (zh) * 2018-04-28 2018-10-12 尚谷科技(天津)有限公司 一种基于容错时间日志的数据迁移的方法
WO2019219010A1 (zh) * 2018-05-14 2019-11-21 杭州海康威视数字技术股份有限公司 数据迁移方法、装置及计算机可读存储介质
CN108804606A (zh) * 2018-05-29 2018-11-13 上海欣能信息科技发展有限公司 一种电力量测类数据迁移到HBase的方法及系统
CN108959205A (zh) * 2018-06-27 2018-12-07 成都泰盟软件有限公司 一种erp系统导出数据快速迁移的方法
CN108829884A (zh) * 2018-06-27 2018-11-16 中国建设银行股份有限公司 数据映射方法及装置
CN108829884B (zh) * 2018-06-27 2021-10-15 中国建设银行股份有限公司 数据映射方法及装置
CN109299068A (zh) * 2018-08-31 2019-02-01 安徽四创电子股份有限公司 从关系型数据库到HBase数据库的数据流迁移方法
US11036698B2 (en) 2018-12-06 2021-06-15 International Business Machines Corporation Non-relational database coprocessor for reading raw data files copied from relational databases
CN110134706A (zh) * 2019-04-01 2019-08-16 平安科技(深圳)有限公司 Sql语句自动优化方法、装置、计算机设备以及存储介质
CN110245148A (zh) * 2019-06-25 2019-09-17 河南中原消费金融股份有限公司 一种数据存储方法、装置、系统及介质
CN110569243A (zh) * 2019-08-22 2019-12-13 厦门网宿有限公司 一种数据查询方法、数据查询插件和数据查询服务器
CN110569243B (zh) * 2019-08-22 2022-07-01 厦门网宿有限公司 一种数据查询方法、数据查询插件和数据查询服务器
CN110784532A (zh) * 2019-10-25 2020-02-11 北京天润融通科技股份有限公司 双向数据同步方法及系统
CN111078753B (zh) * 2019-12-17 2024-02-27 联想(北京)有限公司 基于HBase数据库的时序数据的存储方法及装置
CN111078753A (zh) * 2019-12-17 2020-04-28 联想(北京)有限公司 基于HBase数据库的时序数据的存储方法及装置
CN111104396A (zh) * 2019-12-31 2020-05-05 紫光云(南京)数字技术有限公司 一种跨数据库的数据迁移方法、数据访问方法
CN111382209A (zh) * 2020-04-02 2020-07-07 北京思特奇信息技术股份有限公司 分布式内存数据库的数据转存和操作方法
CN111752928A (zh) * 2020-06-30 2020-10-09 武汉虹信技术服务有限责任公司 一种数据库对象迁移方法及系统
CN112035432A (zh) * 2020-07-22 2020-12-04 大箴(杭州)科技有限公司 数据的置换迁移方法、装置计算机设备
CN112035432B (zh) * 2020-07-22 2024-02-23 大箴(杭州)科技有限公司 数据的置换迁移方法、装置计算机设备
CN112632015A (zh) * 2020-12-18 2021-04-09 上海明略人工智能(集团)有限公司 数据格式的转换方法及装置、存储介质、电子设备
CN112650736A (zh) * 2020-12-31 2021-04-13 中国农业银行股份有限公司 一种数据迁移方法及装置
CN112650736B (zh) * 2020-12-31 2024-07-05 中国农业银行股份有限公司 一种数据迁移方法及装置
CN113553458A (zh) * 2021-08-10 2021-10-26 北京明略软件系统有限公司 图数据库中的数据导出方法及装置
CN113778988A (zh) * 2021-08-23 2021-12-10 咪咕数字传媒有限公司 数据处理方法、装置、设备及计算机程序产品
CN114238469B (zh) * 2021-12-07 2022-07-12 杭州天均数聚科技有限公司 数据提取接口开放方法、装置、计算机设备及存储介质
CN114238469A (zh) * 2021-12-07 2022-03-25 杭州天均数聚科技有限公司 数据提取接口开放方法、装置、计算机设备及存储介质
CN114490858A (zh) * 2022-02-22 2022-05-13 北京科杰科技有限公司 一种大数据与rmdb的表结构类型转换系统及方法

Also Published As

Publication number Publication date
CN103631907B (zh) 2016-09-07

Similar Documents

Publication Publication Date Title
CN103631907A (zh) 一种将关系型数据迁移至HBase的方法及系统
KR102177190B1 (ko) 유연한 스키마를 사용한 데이터 관리
US9547681B2 (en) Combining row based and column based tables to form mixed-mode tables
CN100468402C (zh) 一种数据存储及查询方法
CN102254029B (zh) 一种基于视图的数据访问系统及其方法
CN104899295B (zh) 一种异构数据源数据关联分析方法
CN106708993A (zh) 基于大数据技术的空间数据存储处理中间件框架实现方法
CN104915450A (zh) 一种基于HBase的大数据存储与检索方法及系统
CN103440245A (zh) 数据库系统的行列混合存储方法
CN103699638A (zh) 一种基于配置参数实现跨数据库类型同步数据的方法
US10762068B2 (en) Virtual columns to expose row specific details for query execution in column store databases
CN108205454A (zh) 基于可扩展模板库的数据管理页面自动生成方法及系统
CN103377210A (zh) 建立增量型导航数据库的方法和对数据库进行更新的方法
CN102693286A (zh) 一种对文件内容与元数据进行组织管理的方法
CN112000851B (zh) 一种键值模型、文档模型和图模型数据的统一存储方法
CN114860727A (zh) 拉链表更新方法及装置
CN107273443B (zh) 一种基于大数据模型元数据的混合索引方法
CN104516945A (zh) 一种基于关系数据库的hdfs元数据存储方法
CN102147794A (zh) 一种基于sql语句的多数据库字幕播出方法和装置
CN109213760B (zh) 非关系数据存储的高负载业务存储及检索方法
CN101853278A (zh) 数据存储系统应用方法
US10409799B2 (en) Supporting updatable repeated values over variable schema
CN103116652A (zh) 一种基于拉链信息的索引存储管理方法
CN113886505B (zh) 一种基于搜索引擎和关系型数据库实现动态建模的管理系统
Zhao Research on MongoDB design and query optimization in vehicle management information system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant