CN103186651A - 一种分布式关系数据库及其建立、查询方法和装置 - Google Patents

一种分布式关系数据库及其建立、查询方法和装置 Download PDF

Info

Publication number
CN103186651A
CN103186651A CN2011104613082A CN201110461308A CN103186651A CN 103186651 A CN103186651 A CN 103186651A CN 2011104613082 A CN2011104613082 A CN 2011104613082A CN 201110461308 A CN201110461308 A CN 201110461308A CN 103186651 A CN103186651 A CN 103186651A
Authority
CN
China
Prior art keywords
data
tables
memory node
target column
plural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011104613082A
Other languages
English (en)
Other versions
CN103186651B (zh
Inventor
齐骥
钱岭
郭磊涛
周大
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201110461308.2A priority Critical patent/CN103186651B/zh
Priority claimed from CN201110461308.2A external-priority patent/CN103186651B/zh
Publication of CN103186651A publication Critical patent/CN103186651A/zh
Application granted granted Critical
Publication of CN103186651B publication Critical patent/CN103186651B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明实施例公开了一种分布式关系数据库及其建立、查询方法和装置。该方法包括:将未来需要执行连接查询操作的数据列作为目标列,从两个以上的数据表中,提取出目标列的取值相同的各行数据,将所述各行数据存储在同一个存储节点内。应用本发明能够降低数据表的复制和传输开销、以及内存消耗。

Description

一种分布式关系数据库及其建立、查询方法和装置
技术领域
本发明涉及数据库技术领域,尤其涉及一种分布式关系数据库及其建立、查询方法和装置。
背景技术
连接(join)查询操作是关系数据库的主要特点,也是关系数据库区别于其他类型数据库的一个标志,通过连接运算符,可以对连接数据库中的多个数据表进行查询。
在关系数据库中,数据表建立时,各个数据表之间的关系不必确定,通常将一个实体的所有信息存储在一个数据表中。当检索数据时,通过连接查询操作查询出存放在多个数据表中的不同实体的信息。连接查询操作给用户带来很大的灵活性,他们可以在任何时候增加新的数据类型。为不同实体创建新的数据表,尔后通过连接进行查询。
分布式数据库与传统数据库不同的是,分布式数据库将数据表分布式地存储在多个节点上。例如,假设现在有A表和B表,分布式数据库集群中2个节点,分别为节点1和节点2,则A表的数据可以分布在节点1和节点2上,而B表的数据也可以分布在节点1和节点2上。
对于分布式关系数据库,当执行连接查询操作时,如果需要连接的数据表不在一个节点上,目前通常采用的方法是:将数据量较小的数据表装入所有节点的内容,然后针对连接条件,与其他需要连接的数据表进行逐一比对。
考虑A、B两个数据表执行连接查询操作的情况,假定较小的数据表的数据量很少,则将数据表的复制和传输开销尚可忍受,但若A、B两个数据表的规模差异不大,都是数据量较大的表,或者A、B两个数据表中较小的数据表的数据量也较大,例如超过10GB,则数据表的复制和传输开销就非常大了,而且还很可能导致节点的内存溢出。
可见,现有的分布式关系数据库,存在以下的技术问题:在执行带有连接查询操作的信息查询时,数据表的复制和传输开销较大;而且可能造成节点内存溢出,最终导致连接查询操作失败,数据库可能停止服务。
发明内容
有鉴于此,本发明提供了一种分布式关系数据库及其建立、查询方法和装置,以便降低数据表的复制和传输开销、以及内存消耗。
本发明的技术方案具体是这样实现的:
一种分布式关系数据库的建立方法,该方法包括:
将未来需要执行连接查询操作的数据列作为目标列,从两个以上的数据表中,提取出目标列的取值相同的各行数据,将所述各行数据存储在同一个存储节点内。
一种分布式关系数据库的建立装置,该装置包括数据提取模块和写入模块;
所述数据提取模块,用于将未来需要执行连接查询操作的数据列作为目标列,从两个以上的数据表中,提取出目标列的取值相同的各行数据;
所述写入模块,用于将从两个以上的数据表中提取的、目标列的取值相同的各行数据,存储在同一个存储节点内。
一种分布式关系数据库,该数据库包括两个以上的存储节点,在单个存储节点中存储有从两个以上的数据表中提取的、目标列的取值相同的各行数据,其中,所述目标列是未来需要执行连接查询操作的数据列。
一种分布式关系数据库的查询方法,该方法包括:
根据执行连接查询操作的数据列的信息,查询每个存储节点,将从每个存储节点中取得的查询结果取并集,得到对两个以上的数据表的所述数据列执行连接查询操作时的查询结果;
其中,所述两个以上的数据表中所述数据列的取值相同的各行数据,存储在同一个存储节点内。
一种分布式关系数据库的查询装置,该装置包括存储节点查询模块和结果合并模块;
所述存储节点查询模块,用于根据执行连接查询操作的数据列的信息,查询每个存储节点;
所述结果合并模块,用于将从每个存储节点中取得的查询结果取并集,得到对两个以上的数据表的所述数据列执行连接查询操作时的查询结果;
其中,所述两个以上的数据表中所述数据列的取值相同的各行数据,存储在同一个存储节点内。
由上述技术方案可见,本发明通过将未来需要执行连接查询操作的数据列作为目标列,从两个以上的数据表中,提取出目标列的取值相同的各行数据,将所述各行数据存储在同一个存储节点内,使得对所述两个以上的数据表中的所述目标列执行连接查询操作时,由于所述目标列的取值相同的数据列存储在同一个存储节点内,因此不需要在不同存储节点之间传输数据表,从而降低了数据表的复制和传输开销,也降低了内存消耗。
附图说明
图1是本发明提供的分布式关系数据库的建立方法流程图。
图2是本发明提供的分布式关系数据库的建立装置结构图。
图3是本发明提供的分布式关系数据库的查询装置结构图。
具体实施方式
本申请在分布式关系数据库的建立阶段,需要针对存在连接需求的表,根据连接的目标列,在创建数据表时进行一定的配置,从而将需要执行连接查询操作的数据预先安排在相同的节点上,使得在连接查询操作发生时产生的数据传输开销得到优化,避免了连接查询操作时大量数据拷贝开销和内存溢出的可能。
具体地,本发明将未来需要执行连接查询操作的数据列作为目标列,从两个以上的数据表中,提取出目标列的取值相同的各行数据,将所述各行数据存储在同一个存储节点内。
其中,实际应用中,可以采用多种方法从两个以上的数据表中提取出目标列的取值相同的各行数据。
例如,按照预定的映射规则,从两个以上的数据表中提取出目标列的取值相同的各行数据,典型地,可以利用哈希函数,将两个以上的数据表中目标列的取值相同的各行数据映射到同一个存储节点内。
所述哈希函数有很多种,例如,可以是对每个数据表中的目标列的取值进行模n取余操作,从所述两个以上的数据表中提取出对目标列的取值进行模n取余操作结果相同的各行数据,将所述各行数据存储在同一个存储节点内其中,n是不小于2的整数。再例如,对每个数据表中的目标列的取值进行模n取整操作,从两个以上的数据表中提取出对目标列的取值进行模n取整操作结果相同的各行数据,将所述各行数据存储在同一个存储节点内,其中,n是不小于2的整数。比如,当n取值为6时,在目标列的取值为0~5时,模6取整的结果均为0,所以可以将目标列的取值为0~5的各行数据都存储在同一个存储节点内,目标列的取值为6~11时,模6取整的结果均为1,所以可以将目标列的取值为6~11的各行数据都存储在同一个存储节点内,以此类推。
为了能够提高执行连接查询操作时的数据扫描速度,即提高执行连接查询操作时对数据进行顺序性查询的速度,本发明还提供了另外一种从两个以上的数据表中提取出目标列的取值相同的各行数据,并将所述各行数据存储在同一个存储节点内的方法,具体请参见图1。
图1是本发明提供的分布式关系数据库的建立方法流程图。
如图1所示,该方法包括:
步骤101,将未来需要执行连接查询操作的数据列作为目标列,按照目标列的取值,将两个以上的数据表进行整体排列,得到预连接数据表。
步骤102,根据各个存储节点的当前可用存储空间,对所述预连接数据表进行切分得到子表,使得所述两个以上的数据表中目标列的取值相同的各行数据在同一个子表内。
步骤103,将切分出的不同子表,存储在不同的存储节点内。
其中,在对所述预连接数据表进行切分时,可以根据单个存储节点中的当前可用存储空间,从所述预连接数据表中切分出不大于所述当前可用存储空间的子表,将该子表存储在该单个存储节点中。作为极限情况,如果该单个存储节点中的当前可用存储空间很大,足以容纳整个预连接数据表,则所述子表可以就是该整个预连接数据表,即可以将该整个预连接数据表存储在该单个存储节点中。
通常,可以将预连接数据表切分成两个以上的子表,并将不同的子表存储在不同的存储节点中。
采用本发明方法建立分布式关系数据库以后,在对所述分布式关系数据库进行查询时,根据执行连接查询操作的数据列的信息,查询每个存储节点,将从每个存储节点中取得的查询结果取并集,得到对两个以上的数据表的所述数据列执行连接查询操作时的查询结果;其中,所述两个以上的数据表中所述数据列的取值相同的各行数据,存储在同一个存储节点内。
其中,采用图1所示方法建立分布式关系数据库以后,对所述分布式关系数据库进行查询时,可以根据需要执行连接查询操作的数据列信息,从每个存储节点中查询以所述数据列作为目标列得到的预连接数据表的子表,从所述子表中取得查询结果,将从所述预连接数据表的所有子表中取得的查询结果取并集,得到对组成所述预连接数据表的两个以上的数据表执行连接查询操作时的查询结果。其中,所述预连接数据表,通过按照所述目标列的取值,将两个以上的数据表进行整体排列得到,所述子表,通过根据各个存储节点的当前可用存储空间,对所述预连接数据表进行切分得到。
可见,通过根据需要执行连接查询操作的数据列,从每个存储节点中查询根据所述数据列得到的预连接数据表的子表,从所述子表中取得查询结果,实现了可以直接从单个存储节点中查询结果,将从多个单个存储节点中查询出的结果取并集,就可以得到对预连接数据表的查询结果、即得到对组成所述预连接数据表的两个以上的数据表执行连接查询操作时的查询结果。
下面举两个具体的例子对本发明进行示例性说明。
首先,以名称分别为iubcdr表和iucscdr表的两个表为例阐述本发明技术方案。
假定未来可能对iubcdr表和iucscdr表以(imsi)和(imsi,starttime)为条件进行连接查询操作,则iubcdr表的建表语句可以为:
Figure BSA00000651743000061
iubcdr表的建表语句中,指定主索引为执行连接查询操作的目标列(imsi,starttime),“in hugetable cdr”子句中的hugetable可以理解为一个表的容器,该容器内所有表具有相同的主索引。
iucscdr表的建表语句可以为:
iucscdr表的建表语句中,同样指定主索引为执行连接查询操作的目标列(imsi,starttime),且iucscdr表与iubcdr表处于同一hugetable容器当中。
将iubcdr表和iucscdr表按照执行连接查询操作的目标列(imsi,starttime)进行整体排列,得到预连接数据表,具体请参见表一,表一展示出了所述预连接数据表的一部分。
表一
  RowKey   iubcdr.imsi   iubcdr.starttime   iubcdr.cid   iucscdr.imsi   iucscdr.starttime  iucscdr.rncid
  100,001   100   001   1
  100,002   100   002  10
  100,003   100   003   2   100   003  20
  100,004   100   004  30
如表一所示,hugetable容器内,所有表的数据都根据执行连接查询操作的目标列的取值进行排序,执行连接查询操作的目标列的取值相同的数据被放置在相邻的位置,例如表一中执行连接查询操作的目标列(RowKey)为“100,003”的行,即包括了iubcdr表中,imsi为100,starttime为003的数据行,又包括了iucscdr表中imsi未100,starttime为003的数据行。
在存储所述预连接数据表时,数据库存储引擎将执行连接查询操作的目标列的取值相同的数据存储于同一分片上,同一分片的数据会存储在同一个节点上,因此在执行连接查询操作的时候,无需进行节点间的数据传输,且无需预留大量内存保存相关数据。
例如有如下的连接查询语句:
Figure BSA00000651743000071
所述连接查询语句,用于从数据表iubcdr和数据表iucscdr的预连接数据表中查询满足一定条件的数据行。在执行所述连接查询语句时,无需进行节点间的数据传输,且无需预留大量内存保存相关数据。
其中,hugetable容器可以为HBase容器,HBase容器将执行连接查询操作的目标列的取值相同的各行数据的自动安排在相同的分片中,并排序。需要说明的是,本申请不依赖于使用HBase作为容器,任何支持按照主索引排序或按照主索引哈希的存储引擎均可作为实施例加以实现。
下面,以学生信息表STUDENT和考试成绩表SCORE来进一步阐述本发明技术方案。
假设STUDENT表有student_id和student_age两列数据,其中student_id为未来执行连接查询操作的目标列,其中STUDENT表的数据如表二所示:
表二
  Student_id   Student_age
  001   15
  003   16
  004   10
假设SCORE表有student_id和student_score两列数据,其中student_id为未来执行连接查询操作的目标列,其中SCORE表的数据如表三所示:
表三
  Student_id   Student_score
  001   99
  002   100
  003   80
第一步,将STUDENT表和SCORE表按照执行连接查询操作的目标列Student_id进行整体排列,得到预连接数据表,具体请参见表四。
表四
Figure BSA00000651743000081
第二步,根据预连接数据表的数据量、当前物理节点的个数和单个物理节点当前的可用存储空间,对预连接数据表进行切分,将切分出的不同子表存储在不同的物理节点内。
如表四所示,预连接数据表有6行数据,假设当前物理节点有2个,每个物理节点当前的可用存储空间均为4行数据,则可以将预连接数据表的前3行数据存储在物理节点1中,将预连接数据表的后3行数据存储在物理节点2中。
第三步,在执行连接查询操作“select*from STUDENT join SCORE whereSTUDENT.student_id=SCORE.student_id”的时候,直接从物理节点1取得一行返回值:“001,15,99”;直接从物理节点2取得一行返回值:“003,16,80”。
根据本发明提供的上述方法,本发明还提供了一种分布式关系数据库的建立装置、分布式关系数据库和分布式关系数据库的查询装置。
图2是本发明提供的分布式关系数据库的建立装置结构图。
如图2所示,该装置包括数据提取模块201和写入模块202。
数据提取模块201,用于将未来需要执行连接查询操作的数据列作为目标列,从两个以上的数据表中,提取出目标列的取值相同的各行数据。
写入模块202,用于将从两个以上的数据表中提取的、目标列的取值相同的各行数据,存储在同一个存储节点内。
其中的数据提取模块201,可以用于对每个数据表中的目标列的取值进行模2取余操作,从所述两个以上的数据表中提取出对目标列的取值进行模2取余操作结果相同的各行数据,或者,对每个数据表中的目标列的取值进行模n取整操作,从所述两个以上的数据表中提取出对目标列的取值进行模n取整操作结果相同的各行数据,或者,对每个数据表中的目标列的取值进行哈希操作,从所述两个以上的数据表中提取出对目标列的取值进行哈希操作结果相同的各行数据。
其中的数据提取模块201可以包括预连接模块2011和切分模块2012。
预连接模块2011,用于将未来需要执行连接查询操作的数据列作为目标列,按照目标列的取值,将两个以上的数据表进行整体排列,得到预连接数据表。
切分模块2012,用于根据各个存储节点的当前可用存储空间,对所述预连接数据表进行切分。
写入模块202,用于将所述切分模块切分出的不同子表,写入到不同的存储节点内。
切分模块2012,可以用于根据单个存储节点中的当前可用存储空间,从所述预连接数据表中切分出不大于所述当前可用存储空间的子表。
切分模块2012,可以用于将所述预连接数据表切分成两个以上的子表。
本发明提供的分布式关系数据库包括两个以上的存储节点,在单个存储节点中存储有从两个以上的数据表中提取的、目标列的取值相同的各行数据,其中,所述目标列是未来需要执行连接查询操作的数据列。
其中,在单个存储节点中存储有从两个以上的数据表中提取的、目标列的取值相同的各行数据包括:在单个存储节点中存储有从预连接数据表中划分出的子表。
其中,所述预连接数据表,通过按照未来需要执行连接查询操作的数据列的取值,将两个以上的数据表进行整体排列得到,所述子表,通过根据各个存储节点的当前可用存储空间,对所述预连接数据表进行切分得到。
在两个以上的存储节点中,分别存储有从同一个预连接数据表中划分出的不同子表。
在存储节点中包括查询模块。
所述查询模块,用于接收执行连接查询操作的数据列的信息,根据所述数据列的信息查询预连接数据表的子表,返回从所述子表中取得的查询结果。
图3是本发明提供的分布式关系数据库的查询装置结构图。
如图3所示,该装置包括存储节点查询模块301和结果合并模块302。
存储节点查询模块301,用于根据执行连接查询操作的数据列的信息,查询每个存储节点。
结果合并模块302,用于将从每个存储节点中取得的查询结果取并集,得到对两个以上的数据表的所述数据列执行连接查询操作时的查询结果。
其中,所述两个以上的数据表中所述数据列的取值相同的各行数据,存储在同一个存储节点内。
存储节点查询模块301,具体可以用于根据执行连接查询操作的数据列的信息,从每个存储节点中查询以所述数据列作为目标列得到的预连接数据表的子表,从所述子表中取得查询结果。
其中,所述预连接数据表,通过按照所述目标列的取值,将两个以上的数据表进行整体排列得到,所述子表,通过根据各个存储节点的当前可用存储空间,对所述预连接数据表进行切分得到。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (18)

1.一种分布式关系数据库的建立方法,其特征在于,该方法包括:
将未来需要执行连接查询操作的数据列作为目标列,从两个以上的数据表中,提取出目标列的取值相同的各行数据,将所述各行数据存储在同一个存储节点内。
2.根据权利要求1所述的方法,其特征在于,所述从两个以上的数据表中,提取出目标列的取值相同的各行数据,将所述各行数据存储在同一个存储节点内包括:
按照预定的映射规则,从两个以上的数据表中提取出目标列的取值相同的各行数据,并将所述各行数据存储在同一个存储节点内。
3.根据权利要求1所述的方法,其特征在于,所述从两个以上的数据表中,提取出目标列的取值相同的各行数据,将所述各行数据存储在同一个存储节点内包括:
按照目标列的取值,将两个以上的数据表进行整体排列,得到预连接数据表;
根据各个存储节点的当前可用存储空间,对所述预连接数据表进行切分得到子表,使得所述两个以上的数据表中目标列的取值相同的各行数据在同一个子表内,将切分出的不同子表,存储在不同的存储节点内。
4.根据权利要求3所述的建立方法,其特征在于,对所述预连接数据表进行切分包括:
根据单个存储节点中的当前可用存储空间,从所述预连接数据表中切分出不大于所述当前可用存储空间的子表。
5.根据权利要求3所述的方法,其特征在于,对所述预连接数据表进行切分包括:
将所述预连接数据表切分成两个以上的子表。
6.一种分布式关系数据库的建立装置,其特征在于,该装置包括数据提取模块和写入模块;
所述数据提取模块,用于将未来需要执行连接查询操作的数据列作为目标列,从两个以上的数据表中,提取出目标列的取值相同的各行数据;
所述写入模块,用于将从两个以上的数据表中提取的、目标列的取值相同的各行数据,存储在同一个存储节点内。
7.根据权利要求6所述的装置,其特征在于,
所述数据提取模块,用于按照预定的映射规则,从两个以上的数据表中提取出目标列的取值相同的各行数据。
8.根据权利要求6所述的装置,其特征在于,所述数据提取模块包括预连接模块和切分模块;
所述预连接模块,用于将未来需要执行连接查询操作的数据列作为目标列,按照目标列的取值,将两个以上的数据表进行整体排列,得到预连接数据表;
所述切分模块,用于根据各个存储节点的当前可用存储空间,对所述预连接数据表进行切分得到子表,使得所述两个以上的数据表中目标列的取值相同的各行数据在同一个子表内;
所述写入模块,用于将所述切分模块切分出的不同子表,写入到不同的存储节点内。
9.根据权利要求8所述的装置,其特征在于,
所述切分模块,用于根据单个存储节点中的当前可用存储空间,从所述预连接数据表中切分出不大于所述当前可用存储空间的子表。
10.根据权利要求8所述的装置,其特征在于,
所述切分模块,用于将所述预连接数据表切分成两个以上的子表。
11.一种分布式关系数据库,其特征在于,该数据库包括两个以上的存储节点,在单个存储节点中存储有从两个以上的数据表中提取的、目标列的取值相同的各行数据,其中,所述目标列是未来需要执行连接查询操作的数据列。
12.根据权利要求11所述的数据库,其特征在于,在单个存储节点中存储有从两个以上的数据表中提取的、目标列的取值相同的各行数据包括:
在单个存储节点中存储有从预连接数据表中划分出的子表;
其中,所述预连接数据表,通过按照未来需要执行连接查询操作的数据列的取值,将两个以上的数据表进行整体排列得到,所述子表,通过根据各个存储节点的当前可用存储空间,对所述预连接数据表进行切分得到。
13.根据权利要求12所述的数据库,其特征在于,
在两个以上的存储节点中,分别存储有从同一个预连接数据表中划分出的不同子表。
14.根据权利要求12所述的数据库,其特征在于,在存储节点中包括查询模块;
所述查询模块,用于接收执行连接查询操作的数据列的信息,根据所述数据列的信息查询预连接数据表的子表,返回从所述子表中取得的查询结果。
15.一种分布式关系数据库的查询方法,其特征在于,该方法包括:
根据执行连接查询操作的数据列的信息,查询每个存储节点,将从每个存储节点中取得的查询结果取并集,得到对两个以上的数据表的所述数据列执行连接查询操作时的查询结果;
其中,所述两个以上的数据表中所述数据列的取值相同的各行数据,存储在同一个存储节点内。
16.根据权利要求15所述的方法,其特征在于,所述查询每个存储节点包括:
根据执行连接查询操作的数据列的信息,从每个存储节点中查询以所述数据列作为目标列得到的预连接数据表的子表,从所述子表中取得查询结果;
其中,所述预连接数据表,通过按照所述目标列的取值,将两个以上的数据表进行整体排列得到,所述子表,通过根据各个存储节点的当前可用存储空间,对所述预连接数据表进行切分得到。
17.一种分布式关系数据库的查询装置,其特征在于,该装置包括存储节点查询模块和结果合并模块;
所述存储节点查询模块,用于根据执行连接查询操作的数据列的信息,查询每个存储节点;
所述结果合并模块,用于将从每个存储节点中取得的查询结果取并集,得到对两个以上的数据表的所述数据列执行连接查询操作时的查询结果;
其中,所述两个以上的数据表中所述数据列的取值相同的各行数据,存储在同一个存储节点内。
18.根据权利要求17所述的装置,其特征在于,
所述存储节点查询模块,用于根据执行连接查询操作的数据列的信息,从每个存储节点中查询以所述数据列作为目标列得到的预连接数据表的子表,从所述子表中取得查询结果;
其中,所述预连接数据表,通过按照所述目标列的取值,将两个以上的数据表进行整体排列得到,所述子表,通过根据各个存储节点的当前可用存储空间,对所述预连接数据表进行切分得到。
CN201110461308.2A 2011-12-31 一种分布式关系数据库及其建立、查询方法和装置 Active CN103186651B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110461308.2A CN103186651B (zh) 2011-12-31 一种分布式关系数据库及其建立、查询方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110461308.2A CN103186651B (zh) 2011-12-31 一种分布式关系数据库及其建立、查询方法和装置

Publications (2)

Publication Number Publication Date
CN103186651A true CN103186651A (zh) 2013-07-03
CN103186651B CN103186651B (zh) 2016-12-14

Family

ID=

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103500185A (zh) * 2013-09-13 2014-01-08 北京奇虎科技有限公司 一种基于多平台数据生成数据表的方法和系统
CN103631924A (zh) * 2013-12-03 2014-03-12 Tcl集团股份有限公司 一种分布式数据库平台的应用方法和系统
CN104008199A (zh) * 2014-06-16 2014-08-27 北京京东尚科信息技术有限公司 一种数据查询方法
CN104252535A (zh) * 2014-09-16 2014-12-31 福建新大陆软件工程有限公司 一种基于hbase的数据散列处理方法及装置
CN104516967A (zh) * 2014-12-25 2015-04-15 国家电网公司 一种电力系统海量数据管理系统及其使用方法
CN104636389A (zh) * 2013-11-14 2015-05-20 博雅网络游戏开发(深圳)有限公司 实现Hbase数据库实时查询的方法和系统
CN106060594A (zh) * 2016-05-25 2016-10-26 武汉斗鱼网络科技有限公司 一种基于播放器心跳的白名单生成系统及方法
CN106294740A (zh) * 2016-08-10 2017-01-04 北京创锐文化传媒有限公司 数据处理方法、装置及服务器
CN106484740A (zh) * 2015-09-01 2017-03-08 北京国双科技有限公司 一种数据表连接方法及装置
CN106933933A (zh) * 2015-12-31 2017-07-07 北京国双科技有限公司 数据表信息的处理方法及装置
CN107153643A (zh) * 2016-03-02 2017-09-12 阿里巴巴集团控股有限公司 数据表连接方法及装置
CN105357311B (zh) * 2015-11-23 2018-11-27 中国南方电网有限责任公司 一种云计算技术的二次设备大数据存储与处理方法
CN110334543A (zh) * 2019-06-20 2019-10-15 广东技术师范大学天河学院 一种基于算力的区块链知识系统及其使用方法
WO2019223598A1 (zh) * 2018-05-25 2019-11-28 杭州海康威视数字技术股份有限公司 融合数据表的方法和装置
CN112181989A (zh) * 2020-10-12 2021-01-05 浙江大华技术股份有限公司 一种分布式数据库的数据处理方法及装置
CN113190577A (zh) * 2021-03-11 2021-07-30 新华三大数据技术有限公司 一种表连接查询方法、装置及存储介质
CN114676073A (zh) * 2022-05-18 2022-06-28 飞腾信息技术有限公司 一种tlb表项管理的方法、装置及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030229625A1 (en) * 2002-06-06 2003-12-11 Melchior Timothy Allan Structured query language processing integrated circuit and distributed database processor
CN1581060A (zh) * 2003-07-30 2005-02-16 智邦科技股份有限公司 合并排序分布式数据的方法
US20100011013A1 (en) * 2008-07-09 2010-01-14 Yahoo! Inc. Operations on Multi-Level Nested Data Structure
CN101916261A (zh) * 2010-07-28 2010-12-15 北京播思软件技术有限公司 一种分布式并行数据库系统的数据分区方法
CN102033870A (zh) * 2009-09-24 2011-04-27 中国移动通信集团公司 数据查找方法及装置
CN102214176A (zh) * 2010-04-02 2011-10-12 中国人民解放军国防科学技术大学 超大维表的切分与表连接方法
CN102262675A (zh) * 2011-08-12 2011-11-30 北京握奇数据系统有限公司 数据库查询方法及智能卡

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030229625A1 (en) * 2002-06-06 2003-12-11 Melchior Timothy Allan Structured query language processing integrated circuit and distributed database processor
CN1581060A (zh) * 2003-07-30 2005-02-16 智邦科技股份有限公司 合并排序分布式数据的方法
US20100011013A1 (en) * 2008-07-09 2010-01-14 Yahoo! Inc. Operations on Multi-Level Nested Data Structure
CN102033870A (zh) * 2009-09-24 2011-04-27 中国移动通信集团公司 数据查找方法及装置
CN102214176A (zh) * 2010-04-02 2011-10-12 中国人民解放军国防科学技术大学 超大维表的切分与表连接方法
CN101916261A (zh) * 2010-07-28 2010-12-15 北京播思软件技术有限公司 一种分布式并行数据库系统的数据分区方法
CN102262675A (zh) * 2011-08-12 2011-11-30 北京握奇数据系统有限公司 数据库查询方法及智能卡

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨跃武等: "分布式数据库同步更新的实现方法", 《佛山科学技术学院学报(自然科学版)》 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103500185A (zh) * 2013-09-13 2014-01-08 北京奇虎科技有限公司 一种基于多平台数据生成数据表的方法和系统
CN103500185B (zh) * 2013-09-13 2018-07-06 北京奇虎科技有限公司 一种基于多平台数据生成数据表的方法和系统
CN104636389A (zh) * 2013-11-14 2015-05-20 博雅网络游戏开发(深圳)有限公司 实现Hbase数据库实时查询的方法和系统
CN104636389B (zh) * 2013-11-14 2018-03-27 博雅网络游戏开发(深圳)有限公司 实现Hbase数据库实时查询的方法和系统
CN103631924A (zh) * 2013-12-03 2014-03-12 Tcl集团股份有限公司 一种分布式数据库平台的应用方法和系统
CN103631924B (zh) * 2013-12-03 2018-08-31 Tcl集团股份有限公司 一种分布式数据库平台的应用方法和系统
CN104008199B (zh) * 2014-06-16 2017-05-31 北京京东尚科信息技术有限公司 一种数据查询方法
CN104008199A (zh) * 2014-06-16 2014-08-27 北京京东尚科信息技术有限公司 一种数据查询方法
CN104252535A (zh) * 2014-09-16 2014-12-31 福建新大陆软件工程有限公司 一种基于hbase的数据散列处理方法及装置
CN104516967A (zh) * 2014-12-25 2015-04-15 国家电网公司 一种电力系统海量数据管理系统及其使用方法
CN106484740A (zh) * 2015-09-01 2017-03-08 北京国双科技有限公司 一种数据表连接方法及装置
CN106484740B (zh) * 2015-09-01 2019-08-30 北京国双科技有限公司 一种数据表连接方法及装置
CN105357311B (zh) * 2015-11-23 2018-11-27 中国南方电网有限责任公司 一种云计算技术的二次设备大数据存储与处理方法
CN106933933A (zh) * 2015-12-31 2017-07-07 北京国双科技有限公司 数据表信息的处理方法及装置
CN106933933B (zh) * 2015-12-31 2019-12-10 北京国双科技有限公司 数据表信息的处理方法及装置
CN107153643A (zh) * 2016-03-02 2017-09-12 阿里巴巴集团控股有限公司 数据表连接方法及装置
TWI746511B (zh) * 2016-03-02 2021-11-21 香港商阿里巴巴集團服務有限公司 資料表連接方法及裝置
CN107153643B (zh) * 2016-03-02 2021-02-19 阿里巴巴集团控股有限公司 数据表连接方法及装置
CN106060594A (zh) * 2016-05-25 2016-10-26 武汉斗鱼网络科技有限公司 一种基于播放器心跳的白名单生成系统及方法
CN106294740A (zh) * 2016-08-10 2017-01-04 北京创锐文化传媒有限公司 数据处理方法、装置及服务器
WO2019223598A1 (zh) * 2018-05-25 2019-11-28 杭州海康威视数字技术股份有限公司 融合数据表的方法和装置
CN110334543A (zh) * 2019-06-20 2019-10-15 广东技术师范大学天河学院 一种基于算力的区块链知识系统及其使用方法
CN110334543B (zh) * 2019-06-20 2023-01-17 广东技术师范大学天河学院 一种基于算力的区块链知识系统及其使用方法
CN112181989A (zh) * 2020-10-12 2021-01-05 浙江大华技术股份有限公司 一种分布式数据库的数据处理方法及装置
CN113190577A (zh) * 2021-03-11 2021-07-30 新华三大数据技术有限公司 一种表连接查询方法、装置及存储介质
CN113190577B (zh) * 2021-03-11 2022-08-30 新华三大数据技术有限公司 一种表连接查询方法、装置及存储介质
CN114676073A (zh) * 2022-05-18 2022-06-28 飞腾信息技术有限公司 一种tlb表项管理的方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN104252536B (zh) 一种基于hbase的上网日志数据查询方法及装置
CN102122285B (zh) 一种数据缓存系统中的数据查询系统和数据查询方法
CN103631907B (zh) 一种将关系型数据迁移至HBase的方法及系统
CN102323947B (zh) 环形架构数据库上预连接表的生成方法
CN104199860B (zh) 一种基于二维地理位置信息的数据集分片方法
CN102467521B (zh) 一种易扩展的多级分类检索方法及系统
CN102332030A (zh) 用于分布式键-值存储系统的数据存储、管理和查询方法及系统
CN106326429A (zh) 一种基于solr的Hbase秒级查询方案
CN106528786B (zh) 快速迁移多源异构电网大数据到HBase的方法及系统
CN100458784C (zh) 在数字图书馆中所采用的检索系统和检索方法
CN103678491A (zh) 一种基于Hadoop中小文件优化和倒排索引的方法
CN102682108B (zh) 一种行列混合的数据库存储方法
CN101727502A (zh) 一种数据查询方法及装置、系统
CN105426396A (zh) 一种基于路由算法的数据库分片方法、系统和中间件系统
CN102622434A (zh) 数据存储方法、查找方法及装置
CN106326361A (zh) 一种基于HBase数据库的数据查询方法及装置
CN103544261A (zh) 一种海量结构化日志数据全局索引管理方法及装置
CN103324760A (zh) 使用解说词文档自动生成营养健康教育视频的方法及系统
CN106991149B (zh) 一种融合编码和多版本数据的海量空间对象存储方法
CN102110109A (zh) 一种数字报专题的制作方法及系统
CN103823846A (zh) 一种基于图论的大数据存储及查询方法
CN109213820A (zh) 一种实现多种类型的数据库融合使用的方法
CN104504030B (zh) 一种面向电力调度自动化海量报文的索引方法
CN101093482A (zh) 一种大量信息存储和检索的方法
CN103077208A (zh) 统一资源定位符匹配处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant