CN101916280A - 并行计算系统及按查询内容进行负载均衡的方法 - Google Patents

并行计算系统及按查询内容进行负载均衡的方法 Download PDF

Info

Publication number
CN101916280A
CN101916280A CN 201010255624 CN201010255624A CN101916280A CN 101916280 A CN101916280 A CN 101916280A CN 201010255624 CN201010255624 CN 201010255624 CN 201010255624 A CN201010255624 A CN 201010255624A CN 101916280 A CN101916280 A CN 101916280A
Authority
CN
China
Prior art keywords
node
data
server
database
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201010255624
Other languages
English (en)
Inventor
李晓华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI CLOUDYBI INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI CLOUDYBI INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI CLOUDYBI INFORMATION TECHNOLOGY Co Ltd filed Critical SHANGHAI CLOUDYBI INFORMATION TECHNOLOGY Co Ltd
Priority to CN 201010255624 priority Critical patent/CN101916280A/zh
Publication of CN101916280A publication Critical patent/CN101916280A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明另提出一种并行计算系统及按查询内容进行负载均衡的方法,其方法包括以下步骤:(1)设置多个节点数据库。(2)将主数据库中的海量数据按照一定规则进行分割,并分配到各个节点数据库。(3)根据分割规则,形成表示各个节点数据库所分配到的数据内容的索引信息。(4)对查询或统计参数进行解析,并结合索引信息,分配各个节点数据库的查询或统计任务。(5)对各个节点数据库进行并行查询或统计。本发明可以大大提高大型数据库的查询或统计速度。

Description

并行计算系统及按查询内容进行负载均衡的方法
技术领域
本发明涉及一种数据库的查询或统计方法,特别涉及一种并行计算系统及按查询内容进行负载均衡的方法。
背景技术
随着计算机技术的发展和普及,大型数据库迅速地进入到电信、金融等各个行业。SQL(Structured Query Language,结构化查询语言)是专为数据库而建立的操作命令集,是一种数据库语言。SQL的主要功能就是同各种数据库建立联系,使不同类型的数据库之间进行沟通。按照ANSI(美国国家标准协会)的规定,SQL被作为关系型数据库管理系统的标准语言。在使用SQL时,只需要发出“做什么”的命令,而不需要考虑“怎么做”。SQL语句可以用来执行对数据库的各种各样的操作,例如更新数据库中的数据,从数据库中提取数据等。目前,绝大多数流行的关系型数据库管理系统,如Qracle,Sybase,Microsoft Sql Server,Access等都采用了SQL语言标准。
然而,随着信息化建设的深入,各行各业都建立了大量的数据库,而这些数据库的数据量也越来越大,限制了对数据库的查询和统计速度。例如在计费系统中,各种业务程序需要对数据库中的数据进行频繁的查询操作,涉及的数据量非常巨大,访问数据库的频率很高,由此过多的数据库交互导致计算机程序的性能降低。
为了提高数据库的查询和统计速度,最常用的方式是对硬件系统进行优化,例如中国专利局申请号为200610041548.6的专利申请,其提出了一种加速数据库查询速度的方法,如图1所示,其通过在系统内存中开辟用于存放数据和数据索引的共享内存段,由守护进程按约定的方式将数据库中的数据和数据索引分别调入相应的共享内存段中供务业进程调用,同时由守护进程定时或循环对数据库中的记录进行查询,及时将更接的数据内容记录到上述共享内存段中。
这种加速数据库查询速度的方法可以在一定程度上提高数据库的查询速度,减少对数据库性能的依赖。但是对于海量数据库的查询或统计来说,由于硬件运算速度的限制,这种方法并不能从根本上解决数据库查询速度慢的问题,而计算机性能的提升,如提高CPU频率、增加内存、提高磁盘访问速度等,其提升空间有限,且硬件性能的升级需要投入大量的资金成本。因而如何行之有效地解决大型数据库查询或统计的速率问题,一直是一个需要解决的问题。
发明内容
本发明的目的是提供一种并行计算系统,以解决大型数据库的查询或统计速度慢的问题。
本发明的另一目的是提供一种按查询内容进行负载均衡的方法,以解决大型数据库的查询或统计速度慢的问题。
本发明提出一种并行计算系统,用于对源数据库进行统计或查询,包括数据分割服务器、多个节点服务器和主服务器。数据分割服务器与源数据库相连,用于将源数据库中的海量数据按照一定规则进行分割。多个节点服务器均与数据分割服务器相连,且每个节点服务器又进一步包括节点数据库和节点处理器。节点数据库与数据分割服务器相连,用于存放经数据分割服务器分割后分配来的数据。节点处理器与节点数据库相连,用于对节点数据库中的数据进行查询或统计。主服务器分别与数据分割服务器及所有的节点服务器相连,且主服务器又进一步包括节点索引存储单元和线程分配单元。节点索引存储单元与数据分割服务器相连,用于存放表示各个节点服务器所分配到的数据内容的索引信息。线程分配单元与节点索引存储单元相连,用于对查询或统计参数的解析,并结合各个节点服务器的该索引信息,分配各个节点服务器的查询或统计任务。
依照本发明较佳实施例所述的并行计算系统,主服务器还包括简化单元,其与节点索引存储单元相连,用于根据分割规则,对索引信息进行简化。
依照本发明较佳实施例所述的并行计算系统,主服务器还包括临时表存储单元和主处理器。临时表存储单元与各个节点服务器相连,用于存放各个节点服务器反馈的查询或统计结果,并汇总形成临时表。主处理器与临时表存储单元相连,用于对临时表的信息进行查询或统计,并形成最终的结果集。
依照本发明较佳实施例所述的并行计算系统,其还包括前端展现模块,与主服务器相连,用于将查询或统计结果形成图形数据或表格数据。
本发明另提出一种按查询内容进行负载均衡的方法,用于对源数据库进行统计或查询,包括以下步骤:(1)设置多个节点数据库。(2)将源数据库中的海量数据按照一定规则进行分割,并分配到各个节点数据库。(3)根据分割规则,形成表示各个节点数据库所分配到的数据内容的索引信息。(4)对查询或统计参数进行解析,并结合索引信息,分配各个节点数据库的查询或统计任务。(5)对各个节点数据库进行并行查询或统计。
依照本发明较佳实施例所述的按查询内容进行负载均衡的方法,在形成该索引信息之后还进一步包括步骤:根据分割规则,对索引信息进行简化。
依照本发明较佳实施例所述的按查询内容进行负载均衡的方法,对各个节点数据库进行并行查询或统计之后还包括步骤:(1)将各个节点数据库的查询或统计结果进行汇总,并形成临时表。(2)对临时表的信息再次进行查询或统计,并形成最终的结果集。
依照本发明较佳实施例所述的按查询内容进行负载均衡的方法,其还包括步骤:将查询或统计结果形成图形数据或表格数据。
依照本发明较佳实施例所述的按查询内容进行负载均衡的方法,对数据进行分割时,按照数据量最大的分类字段或分类表进行分割。
相对于现有技术,本发明具有以下优点:
1、本发明通过多节点并行运算的方式,将一个大型数据库的运算量分配给多个节点数据库,从而可以充分发挥多机、多核同时计算的能力,可以极大地提高大数据量数据库的查询或统计速度,相对于优化硬件配置的方式,本发明不会受到提升空间的限制,查询或统计速率可以提高10倍、100倍甚至1000倍。
2、本发明利用对查询的内容进行负载均衡,对每个查询,先提前判断该查询可能要访问的节点,可以大大减少不必要的并行计算。(比如查询条件中有过滤条件,如果所有节点都查,那么绝大部分查询都是空查询,减少后可能只要对某一个或某几个节点执行查询就可以了)使用本发明,在同样的硬件条件下,可以成倍甚至几十倍的提高整个系统的并发访问能力。
3、本发明所采用的节点服务器可以是普通的PC机,相对于主服务器硬件配置的优化所需要的成本,在提升相同的查询或统计速率的前提下,增加节点服务器势必需要更少的投入成本。
4、本发明不依赖于专门的硬件和网络,普通的PC机和千兆网络甚至百兆网络就可以实现。与其它需要昂贵服务器(小型机)、专用通讯通道的方案相比,本发明具有很高的性价比。
附图说明
图1为中国专利局申请号为200610041548.6的专利申请的一种加速数据库查询速度的方法的原理示意图;
图2为本发明并行计算系统的一种实施例架构图;
图3为本发明按查询内容进行负载均衡的方法的一种实施例流程图;
图4为一个大数据量的主数据库示意图;
图5为本发明一种查询或统计的线程分配示意图。
具体实施方式
本发明的主要思想是将源数据库中的海量数据分割并分配到多个节点数据库,并以多个独立的节点服务器进行并行计算,从而可以充分发挥多机、多核同时计算的能力。另外,本发明对查询内容进行负载均衡,并根据各节点服务器的索引信息分配查询和统计任务,可以大大提高大数据量数据库的统计或查询效率。
本发明的数据查询或统计是建立在SQL指令下的,特别适用于BI(Business Intelligence,商务智能)系统。以下结合附图,具体说明本发明。
请参见图2,其为本发明并行计算系统的一种架构图。此系统包括数据分割服务器14、主服务器11、多个节点服务器12和前端展现模块19,数据分割服务器14与源数据库13相连(源数据库13中存放有大量数据),并与各个节点服务器12通过有线或无线的方式相连,数据分割服务器14与节点服务器12之间可进行数据传输,且每个节点服务器12均有独立的运算处理能力。主服务器11分别与数据分割服务器14及各个节点服务器12相连。前端展现模块19与主服务器11相连,用来将统计或查询结果形成图形数据或表格数据,以便于向技术员展现。
主服务器11又包括节点索引存储单元20、线程分配单元21、简化单元22、主处理器15和临时表存储单元16。其中,节点索引存储单元20分别与数据分割服务器14、简化单元22及线程分配单元21相连。线程分配单元21与各个节点服务器12相连。临时表存储单元16与主处理器15相连,并连接到各个节点服务器12的节点处理器18,节点处理器18与节点数据库17相连。
工作时,数据分割服务器14会将源数据库13中的数据按照一定规则进行分割,然后将分割后的数据分配到各个节点服务器12的节点数据库17中(优选的方式是按照数据量最大的分类字段或分类表进行分割,数据量较小的分类字段或分类表不用分割,而直接复制到各个节点数据库17中)。同时,在分割数据的时候,可以得到关于数据内容和节点服务器12的关系信息,即表示各个节点服务器12所分配到的数据内容的索引信息,并存放在节点索引存储单元20中。而线程分配单元21会根据对查询或统计参数的解析,并结合节点索引存储单元20中的索引信息,分配各个节点服务器12的查询或统计任务,从而找出每个特定查询或统计所对应的特定节点,从而避免所有的查询或统计都要访问所有节点,有效地减少了系统的压力,合理地分配了资源,极大地提高了系统应对并发查询或统计的能力。
值得注意的是,在分割数据时,如果数据内容与节点服务器12的对应信息的数据量不大,可以直接作为索引信息。而如果数据内容与节点服务器12的对应信息的数据量比较大,则可能造成解析耗时过长,因而可以利用简化单元22对索引信息进行简化,以提高线程分配单元21的解析效率。各个节点处理器18则会根据分配到的查询或统计任务,对节点数据库17中的数据分别进行查询或统计,并反馈给主服务器11。如果主服务器11接收到的结果集数据量不大,或者节点服务器12的数量不多(例如两个或三个节点服务器12),则主服务器11可以直接将节点服务器12的查询或统计结果传输给前端展现模块19。而如果节点服务器12的数量较多,或者节点服务器12向主服务器11返回的数据量较大,则可以将查询或统计结果复制到临时表存储单元16中,并由临时表存储单元16汇总生成一个临时表。然后由主处理器15再次对这个临时表进行查询或统计,形成最终的结果集后传输给前端展现模块19。前端展现模块19将接收到的数据生成图形、表格等形式,并与技术员实现交互。
本发明的系统利用多个独立的节点服务器12实现并行计算,充分利用每一个节点服务器12的运算能力,大大提高查询或统计效率。而节点服务器12的数量可以根据需要相应地增加或减少,且每增加一个节点服务器12也就意味着系统整体性能的成倍增加,数据分小之后,每个节点的运算量减小,总的运算量也会减小,使系统的查询、统计速度可以提高10倍、100倍甚至1000倍。相对于传统的提高cpu,内存,硬盘频率(转速)等硬件配置,增加节点服务器12的难度低,且成本投入少。并且,本发明根据对查询或统计进行解析,并结合数据分割时的索引信息,可以确定查询或统计内容所在的节点服务器,从而针对特定的节点产生访问线程,大大减少了不必要的并行计算,可以更合理地分配系统资源,提高系统的查询或统计能力。
相应于上述并行计算系统,本发明还提出了一种按查询内容进行负载均衡的方法,用于对源数据库进行统计或查询,请参见图3,其包括以下步骤:
S301,设置多个节点数据库。
S302,将源数据库中的海量数据按照一定规则进行分割,并分配到各个节点数据库。
其中可以根据需要来设置分割方式,优选的是按照数据量最大的分类字段或分类表进行分割,比如客户表。而数据量较小的分类字段或分类表不用分割,直接复制到各个节点数据库中。
S303,根据分割规则,形成表示各个节点数据库所分配到的数据内容的索引信息。
S304,根据分割规则,对索引信息进行简化。
S305,对查询或统计参数进行解析,并结合索引信息,分配各个节点数据库的查询或统计任务。
S306,对各个节点数据库进行并行查询或统计。其中,各个节点数据库均可以进行独立的运算,从而每一个节点数据库均可以分担一部份查询或统计任务,并大大提高数据库的访问效率。
S307,将各个节点数据库的查询或统计结果进行汇总,并形成一个临时表。
S308,对临时表的信息再次进行查询或统计,并形成最终的结果集。
当然,如果节点数据库的数量较少,或者查询或统计的数据量不多,则可以将节点数据库的查询或统计结果作为最终的结果集。而当节点数据库的数量较多,或者查询或统计的数据量较大时,则可以将各个节点数据库的查询或统计结果进行汇总,以便于分析。
S309,将查询或统计结果形成图形数据或表格数据。
下面结合一个具体统计过程来进一步理解本发明,如图4所示,其为一个大数据量的源数据库示意图。此源数据库包括有四个数据表:Store表、Sales表、Time表和Product表,数据量分别是40万、1亿、1825和1000。
首先要对源数据库的数据进行分割,并分配到各个节点数据库中。由于Store表和Sales表的数据量比较大,Time表和Product表数据量不大,因此对Store表和Sales表,按Store字段进行分割,Time表和Product表不分割,直接复制到各个节点数据库。分割数据时,还可以加上city字段,region字段进行排序,尽量保证一个城市或一个区域的数据在一个节点数据库或相邻节点数据库上。
接着根据分割规则形成索引信息。假设这里是按照Store名称进行分割的,则形成Store名称与节点服务器的对应信息。为了便于说明,现将Store名称划分为Store1、Store2、Store3...,则索引信息可以以表1来表示:
  节点服务器   Store名称
  N1   Store1
  N2   Store2
  N3   Store3
...
...
表1
而如果索引信息的数据量较大时(例如Store的具体名称过长,或者Store数量较多),可以对索引信息进行简化处理。例如可以产生一张上层分类汇总字段的对应表,如表2所示:
  节点服务器   Store名称  Store名称的上层字段
  N1   Store1   A
  N2   Store2   B
  N3   Store3   C
...   
...   
表2
其中,表2中的上层字段用字母A、B、B来分别表示Store名称,除此之外,上层字段也可以采用Store名称的缩写、特定的符号等,其作用为简化搜索、减少解析的时间。
当用户要访问数据库时,对其查询或统计参数进行解析,并结合索引信息,分配各个节点数据库的查询或统计任务。这里所述的查询或统计参数可以是查询内容、用户权限等。例如,当用户需要查询Store1和Store2的相关数据时,由于Store1和Store2的数据是分别被分割到N1和N2两个节点上了,因此根据索引信息,系统会在产生N1和N2两个节点上产生两个线程进行并行运算,而不会在N3节点上产生线程(请参见图5),这样当同时有许多用户访问数据库时,便会大大减小系统的运算量。当然,如果某用户为Store1的负责人,而其只能有查询Store1相关数据的权限时,即使该用户的查询内容包括Store1和Store2,系统会取查询内容和用户权限的交集(即解析过程),从而只在N1节点上产生一个线程。
分配了线程任务以后,要对各个节点数据库的数据进行查询或统计,即对各个节点数据库执行SQL指令。然后将各节点的结果集导入到临时表,进行汇总后再进行查询或统计,即对导入完成的临时表再次执行SQL指令,从而可以得到最终的结果集。最后将结果集传递给前端展现模块,利用各种展现控件(如表格,图形)展现出来。
本发明通过多节点并行运算的方式,将一个大型数据库的运算量分配给多个节点数据库,从而可以充分发挥多机、多核同时计算的能力,并根据查询参数以及索引信息对运算线程进行合理地分配,可以极大地提高大数据量数据库的查询或统计速度。
以上公开的仅为本发明的几个具体实施例,但本发明并非局限于此,任何本领域的技术人员能思之的变化,都应落在本发明的保护范围内。

Claims (9)

1.一种并行计算系统,用于对一源数据库进行统计或查询,其特征在于,包括:
一数据分割服务器,与该源数据库相连,用于将该源数据库中的海量数据按照一定规则进行分割;
多个节点服务器,均与该数据分割服务器相连,且每个节点服务器又进一步包括:
一节点数据库,与该数据分割服务器相连,用于存放经该数据分割服务器分割后分配来的数据;
一节点处理器,与该节点数据库相连,用于对该节点数据库中的数据进行查询或统计;
一主服务器,分别与该数据分割服务器及所有的节点服务器相连,且该主服务器又进一步包括:
一节点索引存储单元,与该数据分割服务器相连,用于存放表示各个节点服务器所分配到的数据内容的一索引信息;
一线程分配单元,与该节点索引存储单元相连,用于对查询或统计参数的解析,并结合各个节点服务器的该索引信息,分配各个节点服务器的查询或统计任务。
2.如权利要求1所述的并行计算系统,其特征在于,该主服务器还包括一简化单元,其与该节点索引存储单元相连,用于根据分割规则,对该索引信息进行简化。
3.如权利要求1所述的并行计算系统,其特征在于,该主服务器还包括:
一临时表存储单元,与各个节点服务器相连,用于存放各个节点服务器反馈的查询或统计结果,并汇总形成一临时表;
一主处理器,与该临时表存储单元相连,用于对该临时表的信息进行查询或统计,并形成最终的结果集。
4.如权利要求1所述的并行计算系统,其特征在于,其还包括一前端展现模块,与该主服务器相连,用于将查询或统计结果形成图形数据或表格数据。
5.一种按查询内容进行负载均衡的方法,用于对一源数据库进行统计或查询,其特征在于,包括以下步骤:
设置多个节点数据库;
将该源数据库中的海量数据按照一定规则进行分割,并分配到各个节点数据库;
根据分割规则,形成表示各个节点数据库所分配到的数据内容的一索引信息;
对查询或统计参数进行解析,并结合该索引信息,分配各个节点数据库的查询或统计任务;
对各个节点数据库进行并行查询或统计。
6.如权利要求5所述的按查询内容进行负载均衡的方法,其特征在于,在形成该索引信息之后还进一步包括步骤:根据分割规则,对该索引信息进行简化。
7.如权利要求5所述的按查询内容进行负载均衡的方法,其特征在于,对各个节点数据库进行并行查询或统计之后还包括步骤:
将各个节点数据库的查询或统计结果进行汇总,并形成一临时表;
对该临时表的信息再次进行查询或统计,并形成最终的结果集。
8.如权利要求5所述的按查询内容进行负载均衡的方法,其特征在于,其还包括步骤:将查询或统计结果形成图形数据或表格数据。
9.如权利要求5所述的按查询内容进行负载均衡的方法,其特征在于,对数据进行分割时,按照数据量最大的分类字段或分类表进行分割。
CN 201010255624 2010-08-17 2010-08-17 并行计算系统及按查询内容进行负载均衡的方法 Pending CN101916280A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010255624 CN101916280A (zh) 2010-08-17 2010-08-17 并行计算系统及按查询内容进行负载均衡的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010255624 CN101916280A (zh) 2010-08-17 2010-08-17 并行计算系统及按查询内容进行负载均衡的方法

Publications (1)

Publication Number Publication Date
CN101916280A true CN101916280A (zh) 2010-12-15

Family

ID=43323792

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010255624 Pending CN101916280A (zh) 2010-08-17 2010-08-17 并行计算系统及按查询内容进行负载均衡的方法

Country Status (1)

Country Link
CN (1) CN101916280A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102081841A (zh) * 2011-01-18 2011-06-01 北京世纪高通科技有限公司 一种海量交通数据的处理方法及系统
CN102609316A (zh) * 2012-02-07 2012-07-25 中山爱科数字科技股份有限公司 一种网络计算资源的管理系统及方法
CN103077074A (zh) * 2012-12-26 2013-05-01 深圳先进技术研究院 一种三维空间数据并行调度方法和系统
CN103092886A (zh) * 2011-11-07 2013-05-08 中国移动通信集团公司 一种数据查询操作的实现方法、装置及系统
CN103455641A (zh) * 2013-09-29 2013-12-18 方正国际软件有限公司 交叉多次检索的系统和方法
WO2014036684A1 (zh) * 2012-09-04 2014-03-13 华为技术有限公司 一种进行数据存储和检索的方法及装置
CN103793318A (zh) * 2012-10-29 2014-05-14 百度在线网络技术(北京)有限公司 一种模块稳定性的分布式测试方法及装置
CN103970902A (zh) * 2014-05-27 2014-08-06 重庆大学 一种大量数据情况下的可靠即时检索方法及系统
CN105302818A (zh) * 2014-06-25 2016-02-03 国家电网公司 查询处理方法及装置
CN105373556A (zh) * 2014-08-26 2016-03-02 凌群电脑股份有限公司 一种具高传输性与正确性的数据快取方法
CN106022908A (zh) * 2016-05-17 2016-10-12 中国建设银行股份有限公司 一种资产负债信息的查询方法及系统
CN106339432A (zh) * 2016-08-19 2017-01-18 上海巨数信息科技有限公司 一种按查询内容进行负载均衡的系统及其方法
CN106649804A (zh) * 2016-12-29 2017-05-10 深圳市优必选科技有限公司 数据查询服务器的数据处理方法及装置、数据处理系统
CN108268468A (zh) * 2016-12-30 2018-07-10 北京京东尚科信息技术有限公司 一种大数据的分析方法及系统
CN108510383A (zh) * 2017-03-13 2018-09-07 平安科技(深圳)有限公司 客户筛选方法和装置
WO2019128978A1 (zh) * 2017-12-29 2019-07-04 阿里巴巴集团控股有限公司 一种数据库系统以及查询数据库的方法和装置
CN113452767A (zh) * 2021-06-23 2021-09-28 新华三大数据技术有限公司 一种应用于服务集群内的负载均衡方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101120340A (zh) * 2004-02-21 2008-02-06 数据迅捷股份有限公司 超无共享并行数据库
CN101727465A (zh) * 2008-11-03 2010-06-09 中国移动通信集团公司 分布式列存储数据库索引建立、查询方法及装置与系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101120340A (zh) * 2004-02-21 2008-02-06 数据迅捷股份有限公司 超无共享并行数据库
CN101727465A (zh) * 2008-11-03 2010-06-09 中国移动通信集团公司 分布式列存储数据库索引建立、查询方法及装置与系统

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102081841A (zh) * 2011-01-18 2011-06-01 北京世纪高通科技有限公司 一种海量交通数据的处理方法及系统
CN103092886A (zh) * 2011-11-07 2013-05-08 中国移动通信集团公司 一种数据查询操作的实现方法、装置及系统
CN103092886B (zh) * 2011-11-07 2016-03-02 中国移动通信集团公司 一种数据查询操作的实现方法、装置及系统
CN102609316B (zh) * 2012-02-07 2014-08-27 中山爱科数字科技股份有限公司 一种网络计算资源的管理系统及方法
CN102609316A (zh) * 2012-02-07 2012-07-25 中山爱科数字科技股份有限公司 一种网络计算资源的管理系统及方法
CN103891244B (zh) * 2012-09-04 2016-11-16 华为技术有限公司 一种进行数据存储和检索的方法及装置
WO2014036684A1 (zh) * 2012-09-04 2014-03-13 华为技术有限公司 一种进行数据存储和检索的方法及装置
CN103891244A (zh) * 2012-09-04 2014-06-25 华为技术有限公司 一种进行数据存储和检索的方法及装置
CN103793318A (zh) * 2012-10-29 2014-05-14 百度在线网络技术(北京)有限公司 一种模块稳定性的分布式测试方法及装置
CN103077074B (zh) * 2012-12-26 2016-08-03 深圳先进技术研究院 一种三维空间数据并行调度方法和系统
CN103077074A (zh) * 2012-12-26 2013-05-01 深圳先进技术研究院 一种三维空间数据并行调度方法和系统
CN103455641B (zh) * 2013-09-29 2017-02-22 北大医疗信息技术有限公司 交叉多次检索的系统和方法
CN103455641A (zh) * 2013-09-29 2013-12-18 方正国际软件有限公司 交叉多次检索的系统和方法
CN103970902A (zh) * 2014-05-27 2014-08-06 重庆大学 一种大量数据情况下的可靠即时检索方法及系统
CN105302818A (zh) * 2014-06-25 2016-02-03 国家电网公司 查询处理方法及装置
CN105373556A (zh) * 2014-08-26 2016-03-02 凌群电脑股份有限公司 一种具高传输性与正确性的数据快取方法
CN106022908A (zh) * 2016-05-17 2016-10-12 中国建设银行股份有限公司 一种资产负债信息的查询方法及系统
CN106339432A (zh) * 2016-08-19 2017-01-18 上海巨数信息科技有限公司 一种按查询内容进行负载均衡的系统及其方法
CN106649804A (zh) * 2016-12-29 2017-05-10 深圳市优必选科技有限公司 数据查询服务器的数据处理方法及装置、数据处理系统
CN108268468A (zh) * 2016-12-30 2018-07-10 北京京东尚科信息技术有限公司 一种大数据的分析方法及系统
CN108510383A (zh) * 2017-03-13 2018-09-07 平安科技(深圳)有限公司 客户筛选方法和装置
WO2019128978A1 (zh) * 2017-12-29 2019-07-04 阿里巴巴集团控股有限公司 一种数据库系统以及查询数据库的方法和装置
EP3734476A4 (en) * 2017-12-29 2021-09-15 Alibaba Group Holding Limited DATABASE SYSTEM AND METHOD AND DEVICE FOR REQUESTING A DATABASE
US11789957B2 (en) 2017-12-29 2023-10-17 Alibaba Group Holding Limited System, method, and apparatus for querying a database
CN113452767A (zh) * 2021-06-23 2021-09-28 新华三大数据技术有限公司 一种应用于服务集群内的负载均衡方法及装置

Similar Documents

Publication Publication Date Title
CN101916280A (zh) 并行计算系统及按查询内容进行负载均衡的方法
CN101908075A (zh) 基于sql的并行计算系统及方法
Tao et al. Minimal mapreduce algorithms
US6789071B1 (en) Method for efficient query execution using dynamic queries in database environments
US20170083573A1 (en) Multi-query optimization
US6801903B2 (en) Collecting statistics in a database system
Lu et al. Scalagist: Scalable generalized search trees for mapreduce systems [innovative systems paper]
US9235621B2 (en) Data-aware scalable parallel execution of rollup operations
CN104871153B (zh) 用于分布式大规模并行处理数据库的方法和系统
US10452654B2 (en) Database query optimizer that takes network choice into consideration
Labouseur et al. Scalable and Robust Management of Dynamic Graph Data.
Nashat et al. A comprehensive taxonomy of fragmentation and allocation techniques in distributed database design
CN101916281B (zh) 并行计算系统及去重计数方法
US11537613B1 (en) Merge small file consolidation
US11645281B1 (en) Caching query plans in database systems
CN114297173A (zh) 一种面向大规模海量数据的知识图谱构建方法和系统
Theeten et al. Chive: Bandwidth optimized continuous querying in distributed clouds
US20220197904A1 (en) Database Management System
CN116541427B (zh) 数据查询方法、装置、设备及存储介质
CN106339432A (zh) 一种按查询内容进行负载均衡的系统及其方法
Schroeder et al. A data distribution model for RDF
US20220215021A1 (en) Data Query Method and Apparatus, Computing Device, and Storage Medium
MahmoudiNasab et al. AdaptRDF: adaptive storage management for RDF databases
Zhang et al. GraphA: Efficient partitioning and storage for distributed graph computation
US20140379691A1 (en) Database query processing with reduce function configuration

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20101215