CN105975617A - 一种多分区表查询处理的方法和装置 - Google Patents

一种多分区表查询处理的方法和装置 Download PDF

Info

Publication number
CN105975617A
CN105975617A CN201610335305.7A CN201610335305A CN105975617A CN 105975617 A CN105975617 A CN 105975617A CN 201610335305 A CN201610335305 A CN 201610335305A CN 105975617 A CN105975617 A CN 105975617A
Authority
CN
China
Prior art keywords
statement
database
query
partition
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610335305.7A
Other languages
English (en)
Inventor
白贤锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201610335305.7A priority Critical patent/CN105975617A/zh
Publication of CN105975617A publication Critical patent/CN105975617A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24532Query optimisation of parallel queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24558Binary matching operations
    • G06F16/2456Join operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种多分区表查询处理的方法和装置,能够实现并行执行查询各分区表数据,从而增加了输入输出数据量,提高了Presto的执行效率。本发明的多分区表查询处理的方法包括:接收数据库查询语句;解析所述数据库查询语句以获得数据源表;从所述数据源表提取数据分区;如果所述数据分区的数目是一个,则直接执行所述数据库查询语句,否则对所述数据库查询语句进行并行化转换,把所述数据库查询语句分解成分别与各数据分区对应的多个子查询语句,然后并行执行所述多个子查询语句。

Description

一种多分区表查询处理的方法和装置
技术领域
本发明涉及计算机及计算机软件技术领域,特别地涉及一种多分区表查询处理的方法和装置。
背景技术
数据在关系数据库中的存储采用表(table)的形式。
当表中的数据量不断增大,查询数据的速度就会变慢,应用程序的性能就会下降,这时就应该考虑对表进行分区。表进行分区后,在逻辑上,表仍然是完整的表,只是将表中的数据在物理上存放到多个分区对应的表空间(物理文件上)。这样,在查询数据时,不是每次都扫描整个表。因此,很多数据库(例如:MySQL、Oracle、Hive等)在进行建模时都会进行数据分区。
以Hive数据库为例,在Hive Select数据查询中一般会扫描整个表的内容,会消耗很多时间做没必要的工作。但是,有时候只需要扫描表中关心的一部分数据,因此Hive在建表时引入了分区partition的概念。在Hive表中的一个partition对应于表下的一个目录,所有的partition的数据都存储在该分区字段目录中(比如按日期范围分区等)。在创建Hive表时指定的partition的分区空间叫做分区表。
Presto是Facebook最新研发的数据查询引擎,可对250PB以上的数据进行快速地交互式分析,且Presto的性能远超Hive,因此Presto是目前常用的大数据查询引擎。
现有的Presto在进行数据查询时的方案是采用串行读取各分区内容的方式进行,其运行步骤如:先读取第一个分区内容,再读取第二个分区内容,然后读取第三个分区内容,……直至依次读取所有分区内容。
由于现有的方案是串行读取各分区表数据,故在进行数据查询时具有以下的缺点:
1、整体执行时间长、效率低;
2、输入输出I/0数据量小
因此,现有的技术方案无法发挥Presto基于内存的强大查询优势。
发明内容
有鉴于此,本发明提供一种多分区表查询处理的方法和装置,能够实现并行执行查询各分区表数据,从而增加了输入输出数据量,提高了Presto的执行效率。
为实现上述目的,根据本发明的一个方面,提供了一种多分区表查询处理的方法。
一种多分区表查询处理的方法,包括:接收数据库查询语句;解析所述数据库查询语句以获得数据源表;从所述数据源表提取数据分区;如果所述数据分区的数目是一个,则直接执行所述数据库查询语句,否则对所述数据库查询语句进行并行化转换,把所述数据库查询语句分解成分别与各数据分区对应的多个子查询语句,然后并行执行所述多个子查询语句。
可选地,对所述数据库查询语句的并行化转换包括:根据所述数据分区的数目将所述数据库查询语句复制成对应的数目;为每个所述数据库查询语句添加相应的分区条件以形成相应的子查询语句,所述分区条件为相应的数据分区的标识;将添加了分区条件的各子查询语句拼接以使得并行执行各子查询。
可选地,所述拼接通过UNION ALL实现。
可选地,所述数据库查询语句是SQL语句,所述数据源表从所述SQL语句的FROM子句中解析。
可选地,所述数据分区是按每日划分的数据分区。
根据本发明的另一方面,提供了一种多分区表查询处理的装置。
一种多分区表查询处理的装置,包括:查询语句接收模块,用于接收数据库查询语句;数据源表获取模块,用于解析所述数据库查询语句以获得数据源表;数据分区提取模块,用于从所述数据源表提取数据分区;查询语句执行模块,用于如果所述数据分区的数目是一个,则直接执行所述数据库查询语句,否则对所述数据库查询语句进行并行化转换,把所述数据库查询语句分解成分别与各数据分区对应的多个子查询语句,然后并行执行所述多个子查询语句。
可选地,所述查询语句执行模块还用于:根据所述数据分区的数目将所述数据库查询语句复制成对应的数目;为每个所述数据库查询语句添加相应的分区条件以形成相应的子查询语句,所述分区条件为相应的数据分区的标识;将添加了分区条件的各子查询语句拼接以使得并行执行各子查询。
可选地,所述拼接通过UNION ALL实现。
可选地,所述数据库查询语句是SQL语句,所述数据源表从所述SQL语句的FROM子句中解析。
可选地,所述数据分区是按每日划分的数据分区。
根据本发明的又一方面,提供了一种多分区表查询处理的装置。
一种多分区表查询处理的装置,包括:存储器和处理器,其中,所述存储器存储指令;所述处理器执行所述指令用于:接收数据库查询语句;解析所述数据库查询语句以获得数据源表;从所述数据源表提取数据分区;如果所述数据分区的数目是一个,则直接执行所述数据库查询语句,否则对所述数据库查询语句进行并行化转换,把所述数据库查询语句分解成分别与各数据分区对应的多个子查询语句,然后并行执行所述多个子查询语句。
可选地,所述处理器还用于:根据所述数据分区的数目将所述数据库查询语句复制成对应的数目;为每个所述数据库查询语句添加相应的分区条件以形成相应的子查询语句,所述分区条件为相应的数据分区的标识;将添加了分区条件的各子查询语句拼接以使得并行执行各子查询。
根据本发明的技术方案,根据数据库查询SQL语句中数据源表的数据分区,对SQL语句进行并行化转换,以将多分区数据源表的SQL查询转换为可并行执行的多个子SQL查询,从而提高了数据库查询的运行效率,增加了数据的输入输出量;使Presto同一时间可处理的SQL任务更多,进而大大提高了Presto运行的稳定性。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的多分区表查询处理的方法的主要步骤示意图;
图2是本发明实施例的原理架构图;
图3是本发明实施例的执行流程图;
图4是本发明实施例的查询语句并行化转换过程示意图;
图5是根据本发明一个实施例的多分区表查询处理的装置的主要模块示意图;
图6是根据本发明另一实施例的多分区表查询处理的装置的主要模块示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的多分区表查询处理的方法的主要步骤示意图。如图1所示,本发明的多分区表查询处理的方法主要包括如下的步骤S11至步骤S14。
步骤S11:接收数据库查询语句;
步骤S12:解析数据库查询语句以获得数据源表;
步骤S13:从数据源表提取数据分区;
步骤S14:如果数据分区的数目是一个,则直接执行数据库查询语句,否则对数据库查询语句进行并行化转换,把数据库查询语句分解成分别与各数据分区对应的多个子查询语句,然后并行执行该多个子查询语句。
其中,对所述数据库查询语句的并行化转换包括:根据所述数据分区的数目将所述数据库查询语句复制成对应的数目;为每个所述数据库查询语句添加相应的分区条件以形成相应的子查询语句,所述分区条件为相应的数据分区的标识;将添加了分区条件的各子查询语句拼接以使得并行执行各子查询。
根据本发明的技术方案,所述拼接通过UNION ALL实现。所述数据库查询语句是SQL语句,所述数据源表从所述SQL语句的FROM子句中解析;且所述数据分区是按每日划分的数据分区。
图2是本发明实施例的原理架构图。如图2所示,以Hive数据库表为例来进行说明,也可以是其他具有分区partition的数据库表,例如:MySQL、Oracle等等。本发明是通过对接收到的Hive表的查询SQL语句(执行语句)进行解析以提取查询数据源,然后判断该数据源表是否为多分区表(亦即,该Hive表包括多个分区)。对于多分区Hive表进行SQL语句的并行化转换处理,以生成与分区个数相同的多个SQL语句,然后将该多个SQL语句进行拼接,并且并行运行该多个SQL语句,从而得到SQL执行语句的查询结果。
图3是本发明实施例的执行流程图。如图3所示,数据查询操作开始后,首先接收SQL语句(步骤S31),再解析该SQL语句(步骤S32)以获得数据源Hive表。SQL语句例如是:
SELECT dt,chan_first_cate_cd,count(distinct session_id)visits
FROM online_log_index
GROUP BY dt,chan_first_cate_cd;
则对该SQL语句进行解析,从SQL语句中“FROM”后找出原始数据源Hive表,即:online_log_index。
获取数据源表后,根据该数据源表包含的分区字段确定数据源表的所有分区,进而判断该数据源是否是多分区表(步骤S33)。在如上的例子中,可通过指令“show partitions online_log_index”来得到分区字段,如果分区字段值只有一个,则该数据源表为单分区表,否则该数据源表为多分区表。对于单分区表进行数据查询,直接运行原SQL语句即可;对于多分区表进行数据查询,则需将原SQL语句进行并行化转换处理,然后再运行。
结合上述示例,假设数据源Hive表online_log_index有3个以日期为标识的分区,例如分别是:2015-12-25、2015-12-26、2015-12-27,表示相应业务在这三日的数据,那么数据源Hive表即为多分区表,此时,需将原SQL语句进行并行化转换处理。
本发明实施例的查询语句并行化转换过程示意图如图4所示。首先是将原SQL语句进行复制为多个子SQL语句,其中,复制的个数与数据源表的分区个数相同,本实施例中,需将原SQL语句复制为3个子SQL语句;再为这3个子SQL语句添加分区条件;然后将添加了分区条件的子SQL语句通过“UNION ALL”拼接成临时表;最后,执行SELECT*FROM临时表,即可将所有分区的查询结果全部显示出来。
下面结合前述的例子,详细说明本发明的实施过程。
原SQL执行语句为:
SELECT dt,chan_first_cate_cd,count(distinct session_id)visits
FROM online_log_index
GROUP BY dt,chan_first_cate_cd;
由于本实施例中有3个以日期为标识的分区,分别是:2015-12-25、2015-12-26、2015-12-27,故需将原SQL执行语句复制为3份,分别对应3个子SQL语句。此处“复制”的过程为本领域技术人员所公知的技术,不再赘述。
之后,依次为每个子SQL语句增加分区条件。以分区条件“2015-12-25”为例,对一个子SQL语句增加分区条件后得到:
SELECT dt,chan_first_cate_cd,count(distinct session_id)visits
FROM online_log_index Where dt='2015-12-25'
GROUP BY dt,chan_first_cate_cd;
另外两个子SQL语句的处理方法相同,此处不再列举。该3个子SQL语句的区别仅在于分区条件,(如上述子SQL语句出现中的Wheredt='2015-12-25')。
然后,通过UNION ALL将各分区的子SQL语句拼接起来,形成一个大的SQL语句,并且并行执行各子SQL,将所得到的结果作为一个临时表,通过“SELECT*FROM临时表”从临时表中查找目标数据。具体执行过程如下所示:
SELECT*FROM(SELECT dt,chan_first_cate_cd,count(distinctsession_id)visits
FROM online_log_index
GROUP BY dt,chan_first_cate_cd
SELECT dt,chan_first_cate_cd,count(distinct session_id)visits
FROM online_log_index where dt='2015-12-25'
GROUP BY dt,chan_first_cate_cd
union all
SELECT dt,chan_first_cate_cd,count(distinct session_id)visits
FROM online_log_index where dt='2015-12-26'
GROUP BY dt,chan_first_cate_cd
union all
SELECT dt,chan_first_cate_cd,count(distinct session_id)visits
FROM online_log_index where dt='2015-12-27'
GROUP BY dt,chan_first_cate_cd)。
根据如上所述实施例的实施过程,即可实现将多分区数据源表的数据查询并行运行,从而极大提高了SQL的运行效率,使Presto同一时间可以处理更多的SQL任务。由于Presto在进行数据库查询时是基于内存计算的,SQL早运行完即可早释放内存,因此,可避免导致内存溢出。
图5是根据本发明一个实施例的多分区表查询处理的装置的主要模块示意图。如图5所示,本发明的多分区表查询处理的装置50主要包括查询语句接收模块51、数据源表获取模块52、数据分区提取模块53和查询语句执行模块54。
查询语句接收模块51用于接收数据库查询语句;数据源表获取模块52用于解析所述数据库查询语句以获得数据源表;数据分区提取模块53用于从所述数据源表提取数据分区;查询语句执行模块54用于如果所述数据分区的数目是一个,则直接执行所述数据库查询语句,否则对所述数据库查询语句进行并行化转换,把所述数据库查询语句分解成分别与各数据分区对应的多个子查询语句,然后并行执行所述多个子查询语句。
查询语句执行模块54还可以用于:根据所述数据分区的数目将所述数据库查询语句复制成对应的数目;为每个所述数据库查询语句添加相应的分区条件以形成相应的子查询语句,所述分区条件为相应的数据分区的标识;将添加了分区条件的各子查询语句拼接以使得并行执行各子查询。
其中,所述拼接通过UNION ALL实现。
根据本发明实施例的技术方案,所述数据库查询语句是SQL语句,所述数据源表从所述SQL语句的FROM子句中解析。并且,所述数据分区是按每日划分的数据分区。
图6是根据本发明另一实施例的多分区表查询处理的装置的主要模块示意图。如图6所示,本发明的多分区表查询处理的装置60主要包括存储器61和处理器62。
其中,存储器61存储指令;处理器62执行所述指令用于:接收数据库查询语句;解析所述数据库查询语句以获得数据源表;从所述数据源表提取数据分区;如果所述数据分区的数目是一个,则直接执行所述数据库查询语句,否则对所述数据库查询语句进行并行化转换,把所述数据库查询语句分解成分别与各数据分区对应的多个子查询语句,然后并行执行所述多个子查询语句。
处理器62还可以用于:根据所述数据分区的数目将所述数据库查询语句复制成对应的数目;为每个所述数据库查询语句添加相应的分区条件以形成相应的子查询语句,所述分区条件为相应的数据分区的标识;将添加了分区条件的各子查询语句拼接以使得并行执行各子查询。
根据本发明实施例的技术方案,根据数据库查询SQL语句中数据源表的数据分区,对SQL语句进行并行化转换,以将多分区数据源表的SQL查询转换为可并行执行的多个子SQL查询,从而提高了数据库查询的运行效率,增加了数据的输入输出量;使Presto同一时间可处理的SQL任务更多,进而大大提高了Presto运行的稳定性。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (12)

1.一种多分区表查询处理的方法,其特征在于,包括:
接收数据库查询语句;
解析所述数据库查询语句以获得数据源表;
从所述数据源表提取数据分区;
如果所述数据分区的数目是一个,则直接执行所述数据库查询语句,否则对所述数据库查询语句进行并行化转换,把所述数据库查询语句分解成分别与各数据分区对应的多个子查询语句,然后并行执行所述多个子查询语句。
2.根据权利要求1所述的方法,其特征在于,对所述数据库查询语句的并行化转换包括:
根据所述数据分区的数目将所述数据库查询语句复制成对应的数目;
为每个所述数据库查询语句添加相应的分区条件以形成相应的子查询语句,所述分区条件为相应的数据分区的标识;
将添加了分区条件的各子查询语句拼接以使得并行执行各子查询。
3.根据权利要求2所述的方法,其特征在于,所述拼接通过UNION ALL实现。
4.根据权利要求1所述的方法,其特征在于,所述数据库查询语句是SQL语句,所述数据源表从所述SQL语句的FROM子句中解析。
5.根据权利要求1所述的方法,其特征在于,所述数据分区是按每日划分的数据分区。
6.一种多分区表查询处理的装置,其特征在于,包括:
查询语句接收模块,用于接收数据库查询语句;
数据源表获取模块,用于解析所述数据库查询语句以获得数据源表;
数据分区提取模块,用于从所述数据源表提取数据分区;
查询语句执行模块,用于如果所述数据分区的数目是一个,则直接执行所述数据库查询语句,否则对所述数据库查询语句进行并行化转换,把所述数据库查询语句分解成分别与各数据分区对应的多个子查询语句,然后并行执行所述多个子查询语句。
7.根据权利要求6所述的装置,其特征在于,所述查询语句执行模块还用于:
根据所述数据分区的数目将所述数据库查询语句复制成对应的数目;
为每个所述数据库查询语句添加相应的分区条件以形成相应的子查询语句,所述分区条件为相应的数据分区的标识;
将添加了分区条件的各子查询语句拼接以使得并行执行各子查询。
8.根据权利要求7所述的装置,其特征在于,所述拼接通过UNION ALL实现。
9.根据权利要求6所述的装置,其特征在于,所述数据库查询语句是SQL语句,所述数据源表从所述SQL语句的FROM子句中解析。
10.根据权利要求6所述的装置,其特征在于,所述数据分区是按每日划分的数据分区。
11.一种多分区表查询处理的装置,其特征在于,包括:存储器和处理器,其中,
所述存储器存储指令;
所述处理器执行所述指令用于:
接收数据库查询语句;
解析所述数据库查询语句以获得数据源表;
从所述数据源表提取数据分区;
如果所述数据分区的数目是一个,则直接执行所述数据库查询语句,否则对所述数据库查询语句进行并行化转换,把所述数据库查询语句分解成分别与各数据分区对应的多个子查询语句,然后并行执行所述多个子查询语句。
12.根据权利要求11所述的装置,其特征在于,所述处理器还用于:
根据所述数据分区的数目将所述数据库查询语句复制成对应的数目;
为每个所述数据库查询语句添加相应的分区条件以形成相应的子查询语句,所述分区条件为相应的数据分区的标识;
将添加了分区条件的各子查询语句拼接以使得并行执行各子查询。
CN201610335305.7A 2016-05-20 2016-05-20 一种多分区表查询处理的方法和装置 Pending CN105975617A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610335305.7A CN105975617A (zh) 2016-05-20 2016-05-20 一种多分区表查询处理的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610335305.7A CN105975617A (zh) 2016-05-20 2016-05-20 一种多分区表查询处理的方法和装置

Publications (1)

Publication Number Publication Date
CN105975617A true CN105975617A (zh) 2016-09-28

Family

ID=56957130

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610335305.7A Pending CN105975617A (zh) 2016-05-20 2016-05-20 一种多分区表查询处理的方法和装置

Country Status (1)

Country Link
CN (1) CN105975617A (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107894997A (zh) * 2017-10-19 2018-04-10 苏州工业大数据创新中心有限公司 工业时序数据的查询处理方法及系统
CN108287868A (zh) * 2017-12-19 2018-07-17 北京国电通网络技术有限公司 一种数据库查询、数据块划分方法和装置
CN108345603A (zh) * 2017-01-22 2018-07-31 腾讯科技(深圳)有限公司 一种sql语句解析方法及装置
CN108388564A (zh) * 2017-02-03 2018-08-10 百度在线网络技术(北京)有限公司 查询处理方法、装置及其设备
CN108804712A (zh) * 2018-06-27 2018-11-13 中国建设银行股份有限公司 数据导出方法及装置
CN108874849A (zh) * 2018-01-31 2018-11-23 中国科学院计算技术研究所 一种非等值关联子查询的优化方法和系统
CN108920575A (zh) * 2018-06-22 2018-11-30 北京优特捷信息技术有限公司 基于动态感知的日志数据分析方法、装置及可读存储介质
CN109117426A (zh) * 2017-06-23 2019-01-01 中兴通讯股份有限公司 分布式数据库查询方法、装置、设备及存储介质
CN109492006A (zh) * 2018-11-08 2019-03-19 中国银行股份有限公司 一种基于Oracle的海量数据处理方法和装置
CN109542953A (zh) * 2018-11-29 2019-03-29 成都四方伟业软件股份有限公司 基于presto的数据处理方法及装置
CN109947788A (zh) * 2017-10-30 2019-06-28 北京京东尚科信息技术有限公司 数据查询方法和装置
CN110334096A (zh) * 2019-06-25 2019-10-15 武汉达梦数据库有限公司 一种对非分区表进行分区并行读取的方法及装置
CN110851483A (zh) * 2019-11-07 2020-02-28 京东数字科技控股有限公司 用于筛选对象的方法、装置、电子设备以及介质
CN111125178A (zh) * 2018-10-30 2020-05-08 亿度慧达教育科技(北京)有限公司 一种数据查询方法、装置、终端、presto查询引擎及存储介质
CN111125157A (zh) * 2018-10-31 2020-05-08 北京国双科技有限公司 查询数据的处理方法、装置、存储介质及处理器
CN111125149A (zh) * 2019-12-19 2020-05-08 广州品唯软件有限公司 基于Hive的数据获取方法、装置及存储介质
CN111209296A (zh) * 2019-12-31 2020-05-29 航天信息股份有限公司企业服务分公司 数据库访问方法、装置、电子设备及存储介质
CN112231318A (zh) * 2020-10-14 2021-01-15 北京人大金仓信息技术股份有限公司 创建全局索引的方法和装置
CN112307061A (zh) * 2019-10-31 2021-02-02 北京京东尚科信息技术有限公司 用于查询数据的方法和装置
CN112307126A (zh) * 2020-11-24 2021-02-02 上海浦东发展银行股份有限公司 一种信用卡账户管理数据的批处理方法及系统
CN112347097A (zh) * 2020-09-23 2021-02-09 中国科学院信息工程研究所 支持多版本Hive表分区的数据加载、查询方法及电子装置
CN112559306A (zh) * 2020-11-17 2021-03-26 贝壳技术有限公司 用户行为轨迹获取方法、装置与电子设备
CN114969110A (zh) * 2022-07-21 2022-08-30 阿里巴巴(中国)有限公司 查询方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101436192A (zh) * 2007-11-16 2009-05-20 国际商业机器公司 用于优化针对垂直存储式数据库的查询的方法和设备
CN103927331A (zh) * 2014-03-21 2014-07-16 珠海多玩信息技术有限公司 数据查询方法、装置及系统
CN105045871A (zh) * 2015-07-15 2015-11-11 国家超级计算深圳中心(深圳云计算中心) 数据聚合查询方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101436192A (zh) * 2007-11-16 2009-05-20 国际商业机器公司 用于优化针对垂直存储式数据库的查询的方法和设备
CN103927331A (zh) * 2014-03-21 2014-07-16 珠海多玩信息技术有限公司 数据查询方法、装置及系统
CN105045871A (zh) * 2015-07-15 2015-11-11 国家超级计算深圳中心(深圳云计算中心) 数据聚合查询方法及装置

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108345603A (zh) * 2017-01-22 2018-07-31 腾讯科技(深圳)有限公司 一种sql语句解析方法及装置
CN108345603B (zh) * 2017-01-22 2022-08-19 腾讯科技(深圳)有限公司 一种sql语句解析方法及装置
CN108388564A (zh) * 2017-02-03 2018-08-10 百度在线网络技术(北京)有限公司 查询处理方法、装置及其设备
CN108388564B (zh) * 2017-02-03 2022-11-01 百度在线网络技术(北京)有限公司 查询处理方法、装置及其设备
CN109117426B (zh) * 2017-06-23 2023-06-09 金篆信科有限责任公司 分布式数据库查询方法、装置、设备及存储介质
CN109117426A (zh) * 2017-06-23 2019-01-01 中兴通讯股份有限公司 分布式数据库查询方法、装置、设备及存储介质
CN107894997A (zh) * 2017-10-19 2018-04-10 苏州工业大数据创新中心有限公司 工业时序数据的查询处理方法及系统
CN107894997B (zh) * 2017-10-19 2021-10-12 苏州工业大数据创新中心有限公司 工业时序数据的查询处理方法及系统
CN109947788A (zh) * 2017-10-30 2019-06-28 北京京东尚科信息技术有限公司 数据查询方法和装置
CN108287868A (zh) * 2017-12-19 2018-07-17 北京国电通网络技术有限公司 一种数据库查询、数据块划分方法和装置
CN108874849A (zh) * 2018-01-31 2018-11-23 中国科学院计算技术研究所 一种非等值关联子查询的优化方法和系统
CN108874849B (zh) * 2018-01-31 2020-12-25 中国科学院计算技术研究所 一种非等值关联子查询的优化方法和系统
CN108920575A (zh) * 2018-06-22 2018-11-30 北京优特捷信息技术有限公司 基于动态感知的日志数据分析方法、装置及可读存储介质
CN108804712A (zh) * 2018-06-27 2018-11-13 中国建设银行股份有限公司 数据导出方法及装置
CN111125178B (zh) * 2018-10-30 2021-05-28 亿度慧达教育科技(北京)有限公司 一种数据查询方法、装置、终端、presto查询引擎及存储介质
CN111125178A (zh) * 2018-10-30 2020-05-08 亿度慧达教育科技(北京)有限公司 一种数据查询方法、装置、终端、presto查询引擎及存储介质
CN111125157B (zh) * 2018-10-31 2023-07-04 北京国双科技有限公司 查询数据的处理方法、装置、存储介质及处理器
CN111125157A (zh) * 2018-10-31 2020-05-08 北京国双科技有限公司 查询数据的处理方法、装置、存储介质及处理器
CN109492006A (zh) * 2018-11-08 2019-03-19 中国银行股份有限公司 一种基于Oracle的海量数据处理方法和装置
CN109492006B (zh) * 2018-11-08 2022-02-11 中国银行股份有限公司 一种基于Oracle的海量数据处理方法和装置
CN109542953A (zh) * 2018-11-29 2019-03-29 成都四方伟业软件股份有限公司 基于presto的数据处理方法及装置
CN110334096A (zh) * 2019-06-25 2019-10-15 武汉达梦数据库有限公司 一种对非分区表进行分区并行读取的方法及装置
CN110334096B (zh) * 2019-06-25 2021-09-10 武汉达梦数据库股份有限公司 一种对非分区表进行分区并行读取的方法及装置
CN112307061A (zh) * 2019-10-31 2021-02-02 北京京东尚科信息技术有限公司 用于查询数据的方法和装置
CN110851483B (zh) * 2019-11-07 2021-03-05 京东数字科技控股有限公司 用于筛选对象的方法、装置、电子设备以及介质
CN110851483A (zh) * 2019-11-07 2020-02-28 京东数字科技控股有限公司 用于筛选对象的方法、装置、电子设备以及介质
CN111125149A (zh) * 2019-12-19 2020-05-08 广州品唯软件有限公司 基于Hive的数据获取方法、装置及存储介质
CN111125149B (zh) * 2019-12-19 2024-01-26 广州品唯软件有限公司 基于Hive的数据获取方法、装置及存储介质
CN111209296A (zh) * 2019-12-31 2020-05-29 航天信息股份有限公司企业服务分公司 数据库访问方法、装置、电子设备及存储介质
CN112347097B (zh) * 2020-09-23 2022-07-29 中国科学院信息工程研究所 支持多版本Hive表分区的数据加载、查询方法及电子装置
CN112347097A (zh) * 2020-09-23 2021-02-09 中国科学院信息工程研究所 支持多版本Hive表分区的数据加载、查询方法及电子装置
CN112231318A (zh) * 2020-10-14 2021-01-15 北京人大金仓信息技术股份有限公司 创建全局索引的方法和装置
CN112559306B (zh) * 2020-11-17 2022-11-15 贝壳技术有限公司 用户行为轨迹获取方法、装置与电子设备
CN112559306A (zh) * 2020-11-17 2021-03-26 贝壳技术有限公司 用户行为轨迹获取方法、装置与电子设备
CN112307126B (zh) * 2020-11-24 2022-09-27 上海浦东发展银行股份有限公司 一种信用卡账户管理数据的批处理方法及系统
CN112307126A (zh) * 2020-11-24 2021-02-02 上海浦东发展银行股份有限公司 一种信用卡账户管理数据的批处理方法及系统
CN114969110A (zh) * 2022-07-21 2022-08-30 阿里巴巴(中国)有限公司 查询方法和装置
CN114969110B (zh) * 2022-07-21 2022-10-21 阿里巴巴(中国)有限公司 查询方法和装置

Similar Documents

Publication Publication Date Title
CN105975617A (zh) 一种多分区表查询处理的方法和装置
CN107122443B (zh) 一种基于Spark SQL的分布式全文检索系统及方法
Bajda-Pawlikowski et al. Efficient processing of data warehousing queries in a split execution environment
US8332389B2 (en) Join order for a database query
US10534770B2 (en) Parallelizing SQL on distributed file systems
WO2016167999A1 (en) Geo-scale analytics with bandwidth and regulatory constraints
CN106777108A (zh) 一种基于混合存储架构的数据查询方法和装置
CN111177148B (zh) 一种水电数据库自动建表分表的方法
CN107783985B (zh) 一种分布式数据库查询方法、装置及管理系统
CN102955843B (zh) 一种键值数据库的多键查找实现方法
Hubail et al. Couchbase analytics: NoETL for scalable NoSQL data analysis
Luo et al. Storing and indexing massive RDF datasets
CN112685446B (zh) 通过Elasticsearch数据库的复杂SQL查询方法、装置、处理器及存储介质
CN106599052A (zh) 一种基于ApacheKylin的数据查询系统及其方法
US11573987B2 (en) System for detecting data relationships based on sample data
Gao et al. GLog: A high level graph analysis system using MapReduce
CN113918605A (zh) 数据查询方法、装置、设备以及计算机存储介质
Chawla et al. Storage, partitioning, indexing and retrieval in Big RDF frameworks: A survey
US9607044B2 (en) Systems and methods for searching multiple related tables
Guo et al. Leon: A distributed rdf engine for multi-query processing
Khelil et al. Combining graph exploration and fragmentation for scalable RDF query processing
Mishra et al. A lightweight online framework for query progress indicators
CN107818181A (zh) 基于Plcient交互式引擎的索引方法及其系统
Braganholo et al. A survey on xml fragmentation
Arnold et al. HRDBMS: Combining the best of modern and traditional relational databases

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160928