CN101908075A - 基于sql的并行计算系统及方法 - Google Patents

基于sql的并行计算系统及方法 Download PDF

Info

Publication number
CN101908075A
CN101908075A CN 201010255613 CN201010255613A CN101908075A CN 101908075 A CN101908075 A CN 101908075A CN 201010255613 CN201010255613 CN 201010255613 CN 201010255613 A CN201010255613 A CN 201010255613A CN 101908075 A CN101908075 A CN 101908075A
Authority
CN
China
Prior art keywords
data
node
database
server
sql
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201010255613
Other languages
English (en)
Inventor
李晓华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI CLOUDYBI INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI CLOUDYBI INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI CLOUDYBI INFORMATION TECHNOLOGY Co Ltd filed Critical SHANGHAI CLOUDYBI INFORMATION TECHNOLOGY Co Ltd
Priority to CN 201010255613 priority Critical patent/CN101908075A/zh
Publication of CN101908075A publication Critical patent/CN101908075A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种基于SQL的并行计算系统和方法,其方法包括以下步骤:(1)设置多个节点数据库。(2)将源数据库中的海量数据按照一定规则进行分割,并分配到各个节点数据库。(3)对各个节点数据库进行并行查询或统计。本发明可以大大提高大型数据库的查询或统计速度。

Description

基于SQL的并行计算系统及方法
技术领域
本发明涉及一种数据库的查询或统计方法,特别涉及一种基于SQL的并行计算系统及方法。
背景技术
随着计算机技术的发展和普及,大型数据库迅速地进入到电信、金融等各个行业。SQL(Structured Query Language,结构化查询语言)是专为数据库而建立的操作命令集,是一种数据库语言。SQL的主要功能就是同各种数据库建立联系,使不同类型的数据库之间进行沟通。按照ANSI(美国国家标准协会)的规定,SQL被作为关系型数据库管理系统的标准语言。在使用SQL时,只需要发出“做什么”的命令,而不需要考虑“怎么做”。SQL语句可以用来执行对数据库的各种各样的操作,例如更新数据库中的数据,从数据库中提取数据等。目前,绝大多数流行的关系型数据库管理系统,如Qracle,Sybase,Microsoft Sql Server,Access等都采用了SQL语言标准。
然而,随着信息化建设的深入,各行各业都建立了大量的数据库,而这些数据库的数据量也越来越大,限制了对数据库的查询和统计速度。例如在计费系统中,各种业务程序需要对数据库中的数据进行频繁的查询操作,涉及的数据量非常巨大,访问数据库的频率很高,由此过多的数据库交互导致计算机程序的性能降低。
为了提高数据库的查询和统计速度,最常用的方式是对硬件系统进行优化,例如中国专利局申请号为200610041548.6的专利申请,其提出了一种加速数据库查询速度的方法,如图1所示,其通过在系统内存中开辟用于存放数据和数据索引的共享内存段,由守护进程按约定的方式将数据库中的数据和数据索引分别调入相应的共享内存段中供务业进程调用,同时由守护进程定时或循环对数据库中的记录进行查询,及时将更接的数据内容记录到上述共享内存段中。
这种加速数据库查询速度的方法可以在一定程度上提高数据库的查询速度,减少对数据库性能的依赖。但是对于海量数据库的查询或统计来说,由于硬件运算速度的限制,这种方法并不能从根本上解决数据库查询速度慢的问题,而计算机性能的提升,如提高CPU频率、增加内存、提高磁盘访问速度等,其提升空间有限,且硬件性能的升级需要投入大量的资金成本。因而如何行之有效地解决大型数据库查询或统计的速率问题,一直是一个需要解决的问题。
发明内容
本发明的目的是提供一种基于SQL的并行计算系统,以解决大型数据库的查询或统计速度慢的问题。
本发明的另一目的是提供一种基于SQL的并行计算方法,以解决大型数据库的查询或统计速度慢的问题。
本发明提出一种一种基于SQL的并行计算系统,用于对一源数据库进行统计或查询,包括数据分割服务器和多个节点服务器。数据分割服务器与源数据库相连,用于将源数据库中的海量数据按照一定规则进行分割。节点服务器均与数据分割服务器相连,且每个节点服务器又进一步包括节点数据库和节点处理器。节点数据库与数据分割服务器相连,用于存放经数据分割服务器分割后分配来的数据。节点处理器与节点数据库相连,用于对节点数据库中的数据进行查询或统计。
依照本发明较佳实施例所述的基于SQL的并行计算系统,其还包括汇总服务器,且汇总服务器又进一步包括临时表存储单元和主处理器。临时表存储单元与各个节点服务器相连,用于存放各个节点服务器反馈的查询或统计结果,并汇总形成临时表。主处理器与临时表存储单元相连,用于对临时表的信息进行查询或统计,并形成最终的结果集。
依照本发明较佳实施例所述的基于SQL的并行计算系统,其还包括前端展现模块,与汇总服务器相连,用于将查询或统计结果形成图形数据或表格数据。
本发明另提出一种基于SQL的并行计算方法,用于对源数据库进行统计或查询,包括以下步骤:(1)设置多个节点数据库。(2)将源数据库中的海量数据按照一定规则进行分割,并分配到各个节点数据库。(3)对各个节点数据库进行并行查询或统计。
依照本发明较佳实施例所述的基于SQL的并行计算方法,对各个节点数据库进行并行查询或统计之后还包括步骤:(1)将各个节点数据库的查询或统计结果进行汇总,并形成临时表。(2)对临时表的信息再次进行查询或统计,并形成最终的结果集。
依照本发明较佳实施例所述的基于SQL的并行计算方法,其还包括步骤:将查询或统计结果形成图形数据或表格数据。
依照本发明较佳实施例所述的基于SQL的并行计算方法,对数据进行分割时,按照数据量最大的分类字段或分类表进行分割。
相对于现有技术,本发明具有以下优点:
1、本发明通过多节点并行运算的方式,将一个大型数据库的运算量分配给多个节点数据库,从而可以充分发挥多机、多核同时计算的能力,可以极大地提高大数据量数据库的查询或统计速度,相对于优化硬件配置的方式,本发明不会受到提升空间的限制,查询或统计速率可以提高10倍、100倍甚至1000倍。
2、本发明所采用的节点服务器可以是普通的PC机,相对于硬件配置的优化所需要的成本,在提升相同的查询或统计速率的前提下,增加节点服务器势必需要更少的投入成本。
3、本发明不依赖于专门的硬件和网络,普通的PC机和千兆网络甚至百兆网络就可以实现。与其它需要昂贵服务器(小型机)、专用通讯通道的方案相比,本发明具有很高的性价比。
附图说明
图1为中国专利局申请号为200610041548.6的专利申请的一种加速数据库查询速度的方法的原理示意图;
图2为本发明基于SQL的并行计算系统的一种实施例架构图;
图3为本发明基于SQL的并行计算方法的一种实施例流程图;
图4为一个大数据量的源数据库示意图。
具体实施方式
本发明的主要思想是将源数据库中的海量数据分割并分配到多个节点数据库,并以多个独立的节点服务器进行并行计算,从而可以充分发挥多机、多核同时计算的能力,可以大大提高大数据量数据库的统计或查询效率。
本发明的数据查询或统计是建立在SQL指令下的,特别适用于BI(Business Intelligence,商务智能)系统。以下结合附图,具体说明本发明。
请参见图2,其为本发明基于SQL的并行计算系统的一种架构图。此系统包括数据分割服务器14、汇总服务器11、多个节点服务器12和前端展现模块19,数据分割服务器14与源数据库13相连(源数据库13中存放有大量数据),并与各个节点服务器12通过有线或无线的方式相连,数据分割服务器14与节点服务器12之间可进行数据传输,且每个节点服务器12均有独立的运算处理能力。汇总服务器11分别与各个节点服务器12相连。前端展现模块19与汇总服务器11相连,用来将统计或查询结果形成图形数据或表格数据,以便于向技术员展现。
汇总服务器11又包括主处理器15和临时表存储单元16,每个节点服务器12又包括节点数据库17和节点处理器18。其中,临时表存储单元16与主处理器15相连,并连接到各个节点服务器12的节点处理器18,节点处理器18与节点数据库17相连。
工作时,数据分割服务器14会将源数据库13中的数据按照一定规则进行分割,然后将分割后的数据分配到各个节点服务器12的节点数据库17中(优选的方式是按照数据量最大的分类字段或分类表进行分割,数据量较小的分类字段或分类表不用分割,而直接复制到各个节点数据库17中)。各个节点处理器18会根据技术员的设定对节点数据库17中的数据分别进行查询或统计,并反馈给汇总服务器11。如果汇总服务器11接收到的结果集数据量不大,或者节点服务器12的数量不多(例如两个或三个节点服务器12),则汇总服务器11可以直接将节点服务器12的查询或统计结果传输给前端展现模块19。而如果节点服务器12的数量较多,或者节点服务器12向汇总服务器11返回的数据量较大,则可以将查询或统计结果复制到临时表存储单元16中,并由临时表存储单元16汇总生成一个临时表。然后由主处理器15再次对这个临时表进行查询或统计,形成最终的结果集后传输给前端展现模块19。前端展现模块19将接收到的数据生成图形、表格等形式,并与技术员实现交互。
本发明的系统利用多个独立的节点服务器12实现并行计算,充分利用每一个节点服务器12的运算能力,大大提高查询或统计效率。而节点服务器12的数量可以根据需要相应地增加或减少,且每增加一个节点服务器12也就意味着系统整体性能的成倍增加,数据分小之后,每个节点的运算量减小,总的运算量也会减小,使系统的查询、统计速度可以提高10倍、100倍甚至1000倍。相对于传统的提高cpu,内存,硬盘频率(转速)等硬件配置,增加节点服务器12的难度低,且成本投入少。
相应于上述基于SQL的并行计算系统,本发明还提出了一种基于SQL的并行计算方法,用于对源数据库进行统计或查询,请参见图3,其包括以下步骤:
S301,设置多个节点数据库。
S302,将源数据库中的海量数据按照一定规则进行分割,并分配到各个节点数据库。
其中可以根据需要来设置分割方式,优选的是按照数据量最大的分类字段或分类表进行分割,比如客户表。而数据量较小的分类字段或分类表不用分割,直接复制到各个节点数据库中。
S303,对各个节点数据库进行并行查询或统计。其中,各个节点数据库均可以进行独立的运算,从而每一个节点数据库均可以分担一部份查询或统计任务,并大大提高数据库的访问效率。
S304,将各个节点数据库的查询或统计结果进行汇总,并形成一个临时表。
S305,对临时表的信息再次进行查询或统计,并形成最终的结果集。
当然,如果节点数据库的数量较少,或者查询或统计的数据量不多,则可以将节点数据库的查询或统计结果作为最终的结果集。而当节点数据库的数量较多,或者查询或统计的数据量较大时,则可以将各个节点数据库的查询或统计结果进行汇总,以便于分析。
S306,将查询或统计结果形成图形数据或表格数据。
下面结合一个具体统计过程来进一步理解本发明,如图4所示,其为一个大数据量的源数据库示意图。此源数据库包括有四个数据表:Store表、Sales表、Time表和Product表,数据量分别是40万、1亿、1825和1000。
首先要对源数据库的数据进行分割,并分配到各个节点数据库中。由于Store表和Sales表的数据量比较大,Time表和Product表数据量不大,因此对Store表和Sales表,按Store字段进行分割,Time表和Product表不分割,直接复制到各个节点数据库。分割数据时,还可以加上city字段,region字段进行排序,尽量保证一个城市或一个区域的数据在一个节点数据库或相邻节点数据库上。
然后对各个节点数据库的数据进行统计,即对各个节点数据库执行SQL统计指令。假设要统计各地区各品牌在各年度的销售汇总,则各节点的SQL写法可以如下:
Select store.region,product.brand,time.year,sum(sales.amount)as amount from sales join store on sales.store=store.store join time on sales.date=time.date join product on sales.product=product.product group by store.region,product.brand,time.year
从而从各个节点数据库可以统计出如表1的结果集:
  Region   Brand   Year   Amount
  地区1   品牌1   2010   1000000
...
...
表1
然后将各节点的结果集导入到临时表,进行汇总后再进行统计,即对导入完成的临时表再次执行SQL统计指令,SQL写法可以如下:
Select region,brand,year,sum(amount)as amount from temptable group by region,brand,year
从而可以得到表示源数据库中各地区各品牌在各年度的销售汇总的结果集。最后将结果集传递给前端展现模块,利用各种展现控件(如表格,图形)展现出来。
本发明通过多节点并行运算的方式,将一个大型数据库的运算量分配给多个节点数据库,从而可以充分发挥多机、多核同时计算的能力,可以极大地提高大数据量数据库的查询或统计速度。
以上公开的仅为本发明的几个具体实施例,但本发明并非局限于此,任何本领域的技术人员能思之的变化,都应落在本发明的保护范围内。

Claims (7)

1.一种基于SQL的并行计算系统,用于对一源数据库进行统计或查询,其特征在于,包括:
一数据分割服务器,与该源数据库相连,用于将该源数据库中的海量数据按照一定规则进行分割;
多个节点服务器,均与该数据分割服务器相连,且每个节点服务器又进一步包括:
一节点数据库,与该数据分割服务器相连,用于存放经该数据分割服务器分割后分配来的数据;
一节点处理器,与该节点数据库相连,用于对该节点数据库中的数据进行查询或统计。
2.如权利要求1所述的基于SQL的并行计算系统,其特征在于,其还包括一汇总服务器,且该汇总服务器又进一步包括:
一临时表存储单元,与各个节点服务器相连,用于存放各个节点服务器反馈的查询或统计结果,并汇总形成一临时表;
一主处理器,与该临时表存储单元相连,用于对该临时表的信息进行查询或统计,并形成最终的结果集。
3.如权利要求2所述的基于SQL的并行计算系统,其特征在于,其还包括一前端展现模块,与该汇总服务器相连,用于将查询或统计结果形成图形数据或表格数据。
4.一种基于SQL的并行计算方法,用于对一源数据库进行统计或查询,其特征在于,包括以下步骤:
设置多个节点数据库;
将该源数据库中的海量数据按照一定规则进行分割,并分配到各个节点数据库;
对各个节点数据库进行并行查询或统计;
5.如权利要求4所述的基于SQL的并行计算方法,其特征在于,对各个节点数据库进行并行查询或统计之后还包括步骤:
将各个节点数据库的查询或统计结果进行汇总,并形成一临时表;
对该临时表的信息再次进行查询或统计,并形成最终的结果集。
6.如权利要求4所述的基于SQL的并行计算方法,其特征在于,其还包括步骤:将查询或统计结果形成图形数据或表格数据。
7.如权利要求4所述的基于SQL的并行计算方法,其特征在于,对数据进行分割时,按照数据量最大的分类字段或分类表进行分割。
CN 201010255613 2010-08-17 2010-08-17 基于sql的并行计算系统及方法 Pending CN101908075A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010255613 CN101908075A (zh) 2010-08-17 2010-08-17 基于sql的并行计算系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010255613 CN101908075A (zh) 2010-08-17 2010-08-17 基于sql的并行计算系统及方法

Publications (1)

Publication Number Publication Date
CN101908075A true CN101908075A (zh) 2010-12-08

Family

ID=43263534

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010255613 Pending CN101908075A (zh) 2010-08-17 2010-08-17 基于sql的并行计算系统及方法

Country Status (1)

Country Link
CN (1) CN101908075A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521405A (zh) * 2011-12-26 2012-06-27 中国科学院计算技术研究所 支持高速加载的海量结构化数据存储、查询方法和系统
CN102521406A (zh) * 2011-12-26 2012-06-27 中国科学院计算技术研究所 海量结构化数据复杂查询任务的分布式查询方法和系统
CN102930062A (zh) * 2012-11-30 2013-02-13 南京富士通南大软件技术有限公司 一种数据库快速水平扩展的方法
CN103279546A (zh) * 2013-05-13 2013-09-04 清华大学 图数据查询方法
CN103279543A (zh) * 2013-05-13 2013-09-04 清华大学 海量图数据上的路径模式查询系统
CN103782295A (zh) * 2011-09-15 2014-05-07 甲骨文国际公司 分布式数据管理系统中的查询说明计划
CN104090934A (zh) * 2014-06-26 2014-10-08 山东金质信息技术有限公司 一种标准服务平台分布式并行计算数据库及其检索方法
CN104156358A (zh) * 2013-05-13 2014-11-19 腾讯科技(深圳)有限公司 一种用于数据库的表的批量读取方法、装置和系统
WO2015149710A1 (en) * 2014-04-02 2015-10-08 Huawei Technologies Co., Ltd. System and method for massively parallel processing database
CN105045790A (zh) * 2015-03-13 2015-11-11 北京航空航天大学 图数据搜索系统、方法和设备
CN105183901A (zh) * 2015-09-30 2015-12-23 北京京东尚科信息技术有限公司 一种数据查询引擎读取数据库表的方法及装置
CN105302818A (zh) * 2014-06-25 2016-02-03 国家电网公司 查询处理方法及装置
WO2016138614A1 (en) * 2015-03-02 2016-09-09 Microsoft Technology Licensing, Llc Management of database queries against large datasets
CN106339432A (zh) * 2016-08-19 2017-01-18 上海巨数信息科技有限公司 一种按查询内容进行负载均衡的系统及其方法
CN109165257A (zh) * 2018-08-07 2019-01-08 中国建设银行股份有限公司 数据查询方法及相关系统、设备和存储介质
CN110362404A (zh) * 2019-06-28 2019-10-22 北京淇瑀信息科技有限公司 一种基于sql的资源分配方法、装置和电子设备
CN110673794A (zh) * 2019-09-18 2020-01-10 中兴通讯股份有限公司 分布式数据的均衡处理方法、装置、计算终端和存储介质
CN112597173A (zh) * 2021-03-08 2021-04-02 成都虚谷伟业科技有限公司 一种分布式数据库集群系统对等处理系统及处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040186832A1 (en) * 2003-01-16 2004-09-23 Jardin Cary A. System and method for controlling processing in a distributed system
CN101071434A (zh) * 2007-05-14 2007-11-14 腾讯科技(深圳)有限公司 一种分布式数据库系统中用户分布的方法、装置及系统
CN101276364A (zh) * 2007-03-30 2008-10-01 阿里巴巴公司 一种分布式计算数据合并方法、系统及其装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040186832A1 (en) * 2003-01-16 2004-09-23 Jardin Cary A. System and method for controlling processing in a distributed system
CN101276364A (zh) * 2007-03-30 2008-10-01 阿里巴巴公司 一种分布式计算数据合并方法、系统及其装置
CN101071434A (zh) * 2007-05-14 2007-11-14 腾讯科技(深圳)有限公司 一种分布式数据库系统中用户分布的方法、装置及系统

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103782295B (zh) * 2011-09-15 2017-03-22 甲骨文国际公司 分布式数据管理系统中的查询说明计划
CN103782295A (zh) * 2011-09-15 2014-05-07 甲骨文国际公司 分布式数据管理系统中的查询说明计划
CN102521405A (zh) * 2011-12-26 2012-06-27 中国科学院计算技术研究所 支持高速加载的海量结构化数据存储、查询方法和系统
CN102521406A (zh) * 2011-12-26 2012-06-27 中国科学院计算技术研究所 海量结构化数据复杂查询任务的分布式查询方法和系统
CN102521406B (zh) * 2011-12-26 2014-06-25 中国科学院计算技术研究所 海量结构化数据复杂查询任务的分布式查询方法和系统
CN102930062A (zh) * 2012-11-30 2013-02-13 南京富士通南大软件技术有限公司 一种数据库快速水平扩展的方法
CN102930062B (zh) * 2012-11-30 2016-04-13 南京富士通南大软件技术有限公司 一种数据库快速水平扩展的方法
CN104156358A (zh) * 2013-05-13 2014-11-19 腾讯科技(深圳)有限公司 一种用于数据库的表的批量读取方法、装置和系统
CN104156358B (zh) * 2013-05-13 2018-09-18 腾讯科技(深圳)有限公司 一种用于数据库的表的批量读取方法、装置和系统
CN103279543B (zh) * 2013-05-13 2017-05-17 清华大学 海量图数据上的路径模式查询系统
CN103279543A (zh) * 2013-05-13 2013-09-04 清华大学 海量图数据上的路径模式查询系统
CN103279546A (zh) * 2013-05-13 2013-09-04 清华大学 图数据查询方法
CN103279546B (zh) * 2013-05-13 2017-03-01 清华大学 图数据查询方法
CN106462593A (zh) * 2014-04-02 2017-02-22 华为技术有限公司 大规模并行处理数据库的系统和方法
WO2015149710A1 (en) * 2014-04-02 2015-10-08 Huawei Technologies Co., Ltd. System and method for massively parallel processing database
US9348865B2 (en) 2014-04-02 2016-05-24 Futurewei Technologies, Inc. System and method for massively parallel processing database
CN105302818A (zh) * 2014-06-25 2016-02-03 国家电网公司 查询处理方法及装置
CN104090934A (zh) * 2014-06-26 2014-10-08 山东金质信息技术有限公司 一种标准服务平台分布式并行计算数据库及其检索方法
CN104090934B (zh) * 2014-06-26 2017-09-12 山东金质信息技术有限公司 一种标准服务平台分布式并行计算数据库及其检索方法
WO2016138614A1 (en) * 2015-03-02 2016-09-09 Microsoft Technology Licensing, Llc Management of database queries against large datasets
CN105045790A (zh) * 2015-03-13 2015-11-11 北京航空航天大学 图数据搜索系统、方法和设备
CN105183901A (zh) * 2015-09-30 2015-12-23 北京京东尚科信息技术有限公司 一种数据查询引擎读取数据库表的方法及装置
CN106339432A (zh) * 2016-08-19 2017-01-18 上海巨数信息科技有限公司 一种按查询内容进行负载均衡的系统及其方法
CN109165257A (zh) * 2018-08-07 2019-01-08 中国建设银行股份有限公司 数据查询方法及相关系统、设备和存储介质
CN110362404A (zh) * 2019-06-28 2019-10-22 北京淇瑀信息科技有限公司 一种基于sql的资源分配方法、装置和电子设备
CN110362404B (zh) * 2019-06-28 2022-08-23 北京淇瑀信息科技有限公司 一种基于sql的资源分配方法、装置和电子设备
CN110673794A (zh) * 2019-09-18 2020-01-10 中兴通讯股份有限公司 分布式数据的均衡处理方法、装置、计算终端和存储介质
CN110673794B (zh) * 2019-09-18 2021-12-17 中兴通讯股份有限公司 分布式数据的均衡处理方法、装置、计算终端和存储介质
CN112597173A (zh) * 2021-03-08 2021-04-02 成都虚谷伟业科技有限公司 一种分布式数据库集群系统对等处理系统及处理方法

Similar Documents

Publication Publication Date Title
CN101908075A (zh) 基于sql的并行计算系统及方法
CN101916280A (zh) 并行计算系统及按查询内容进行负载均衡的方法
US7281000B2 (en) Method for efficient query execution using dynamic queries in database environments
US6801903B2 (en) Collecting statistics in a database system
US10120902B2 (en) Apparatus and method for processing distributed relational algebra operators in a distributed database
US8195602B2 (en) Relational database management system (RDBMS) employing a relational datastore and a multi-dimensional database (MDDB) for serving query statements from client machines
CN113711197B (zh) 查询计划中自适应聚合操作符和属性的放置
WO2012012968A1 (zh) 一种分布式并行数据库系统的数据分区方法
CN101916281B (zh) 并行计算系统及去重计数方法
Agathangelos et al. RDF query answering using apache spark: Review and assessment
Labouseur et al. Scalable and Robust Management of Dynamic Graph Data.
Saleem Storage, indexing, query processing, and benchmarking in centralized and distributed RDF engines: a survey
Bleiholder et al. Subsumption and complementation as data fusion operators
US11429606B2 (en) Densification of expression value domain for efficient bitmap-based count(distinct) in SQL
CN106339432A (zh) 一种按查询内容进行负载均衡的系统及其方法
CN110321388B (zh) 一种基于Greenplum的快速排序查询方法及系统
US11216457B1 (en) Selectively assigning join operations for remote data processing
US11275737B2 (en) Assignment of objects to processing engines for efficient database operations
Bellatreche et al. Some issues in design of data warehousing systems
Scabora et al. Relational graph data management on the edge: Grouping vertices’ neighborhood with Edge-k
Al-Harbi et al. PHD-Store: an adaptive SPARQL engine with dynamic partitioning for distributed RDF repositories
Anzum et al. R2GSync and edge views: practical RDBMS to GDBMS synchronization
Arora et al. Allocation of Join and Semi Join Operations based on Dynamic Selectivity Factor in a Distributed Database Query

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20101208