CN108304499A - 一种sql连接操作中谓词下推的方法、终端及介质 - Google Patents

一种sql连接操作中谓词下推的方法、终端及介质 Download PDF

Info

Publication number
CN108304499A
CN108304499A CN201810037072.1A CN201810037072A CN108304499A CN 108304499 A CN108304499 A CN 108304499A CN 201810037072 A CN201810037072 A CN 201810037072A CN 108304499 A CN108304499 A CN 108304499A
Authority
CN
China
Prior art keywords
histogram
predicate
regions
hash
histogram regions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810037072.1A
Other languages
English (en)
Other versions
CN108304499B (zh
Inventor
埃里克·欧哈迪
刘明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Jingjie Information Technology Co Ltd
Guizhou Esgyn Information Technology Co Ltd
Original Assignee
Guizhou Jingjie Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Jingjie Information Technology Co Ltd filed Critical Guizhou Jingjie Information Technology Co Ltd
Priority to CN201810037072.1A priority Critical patent/CN108304499B/zh
Publication of CN108304499A publication Critical patent/CN108304499A/zh
Application granted granted Critical
Publication of CN108304499B publication Critical patent/CN108304499B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24532Query optimisation of parallel queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24549Run-time optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24558Binary matching operations
    • G06F16/2456Join operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于数据库技术领域,具体涉及一种SQL连接操作中谓词下推的方法、终端及介质,包括以下步骤:将事实表和维度表进行Hash join,根据所述维度表生成Hash表,根据所述事实表生成事实表直方图;根据所述Hash表和所述事实表直方图得到的N个谓词直方图区域,所述N为正整数;将所述N个谓词直方图区域转换为谓词,并将所述谓词下推至数据存储层。本发明与最小值/最大值和完整Hash下推相比较,能根据事实表直方图提高数据过滤能力,从而提高存储层的计算效率。

Description

一种SQL连接操作中谓词下推的方法、终端及介质
技术领域
本发明属于数据库技术领域,具体涉及一种SQL连接操作中谓词下推的方法、终端及介质。
背景技术
数据库,更准确地说是RDBMS(关系型数据库管理系统)广泛地应用于各种应用程序,SQL是数据库中执行查询最常用的语言。数据库中包括多张表,包含相似值的特定列能存储在多张表中,表之间可以通过这特定列进行相互关联。
例如,CustomerTable表存储了CustomerId列,还存储所有客户和其相关信息(例如,姓名、年龄、性别和生日等),同时,StoreSalesTable表也能存储CustomerId列,还存储了某一业务的销售信息。通过Join查询,您无需返回CustomerId,即可获取所有销售信息和客户姓名,从而实现高效查询。
Join是SQL查询的关键因素,优化Join计算至关重要。目前存在几种Join方式,三目前最重要的Join算法是:Merge Join、Nested Join和Hash Join。
数据库可以在多个软件层构建。例如,存储层从非易失性存储(例如,HDD)保存或获取数据。优化数据库的方式之一是尽可能在存储层过滤数据,而不是在更高层(例如,引擎层)过滤数据。
例如,执行select*from table T where a=10;语句,如果a不是表的键,则会开始全表扫描,每一行的值与10进行比较,如果相等,则保存该行的值,否则跳过。“a=10”被称为“谓词”,它可以在比存储层更高的层进行数据过滤,但如果谓词下推至存储层,数据能被更早过滤,执行相同操作的成本会更少,而且性能会提高。
在Trafodion中,处理Hash Join的方法是最小值/最大值优化,它收集Hash表的MIN和MAX,将其下推至存储层,并过滤小于MIN的值和大于MAX的值。此方案存在一个明显的局限性,在MIN和MAX之间存在某些应该被过滤的值却没有被过滤,因此过滤能力有限,会降低效率。
在Phoenix中,处理Hash Join的方法是将Hash表作为谓词整个下推至regionserver层(Phoenix的存储层),但该方法并不适用于region server层内存不足且无法存储整张Hash表的情况。这种方案使高计算成本的运算符应用至存储层,这会导致缺乏足够资源处理高并发查询。
如上所述,最小值/最大值的谓词下推解决方案在提高过滤效率方面能力有限。Hash表的谓词下推方案,若Hash表较大,但内存不足,会导致缺乏足够资源处理高并发查询。
发明内容
针对现有技术中的缺陷,本发明提供了一种SQL连接操作中谓词下推的方法、终端及介质,本发明与最小值/最大值和完整Hash下推相比较,能根据事实表直方图提高数据过滤能力,从而提高存储层的计算效率。
第一方面,本发明提供了一种SQL连接操作中谓词下推的方法,包括以下步骤:
将事实表和维度表进行Hash join,根据所述维度表生成Hash表,根据所述事实表生成事实表直方图;
根据所述Hash表和所述事实表直方图得到的N个谓词直方图区域,所述N为正整数;
将所述N个谓词直方图区域转换为谓词,并将所述谓词下推至数据存储层。
优选地,所述Hash表中包括若干个键值。
优选地,所述根据所述Hash表和所述事实表直方图得到的N个谓词直方图区域具体为:
对所述Hash表中的键值进行Hash排序,生成排序列表;
根据所述排序列表得到排序列表的M个直方图区域;
根据所述事实表直方图计算每个所述直方图区域的行数;
按行数的从大到小顺序,从所述M个直方图区域中筛选出行数较大的前N个直方图区域,并将所述N个直方图区域作为N个谓词直方图区域,所述M为大于N的正整数。
第二方面,本发明提供了一种终端,包括处理器和与所述处理器连接的存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如第一方面所述的方法。
第三方面,本发明提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如第一方面所述的方法。
本发明的有益效果为:本发明与最小值/最大值和完整Hash下推相比较,能根据事实表直方图提高数据过滤能力,从而提高存储层的计算效率。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1为本实施例中SQL连接操作中谓词下推的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
事实表,即事实数据表,每个数据仓库都包含一个或者多个事实数据表。事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,事实数据表通常包含大量的行。事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关单位作为历史的数据,每个事实数据表包含一个由多个部分组成的索引,该索引包含作为外键的相关性维度表的主键,而维度表包含事实记录的特性。事实数据表不应该包含描述性的信息,也不应该包含除数字度量字段及使事实与维度表中对应项的相关索引字段之外的任何数据。
维度表,维度表可以看作是用户来分析数据的窗口,维度表中包含事实数据表中事实记录的特性,有些特性提供描述性信息,有些特性指定如何汇总事实数据表数据,以便为分析者提供有用的信息,维度表包含帮助汇总数据的特性的层次结构。
通常数据库中的数据存在不同的表中,而不同的表有着它们自身的表结构,不同表之间可以是有关联的,大部分实际使用中,不会仅仅只需要一张表的信息。
比如需要从一个学校的学生表(维度表)中找出杭州地区的学生,再用这个信息去检索成绩表(事实表)中他们的数学成绩,如果没有多表连接,那只能手动将第一个表的信息查询出来作为第二个表的检索信息去查询最终的结果,可想而知这将会是多么繁琐。
实施例一:
本实施例提供了一种SQL连接操作中谓词下推的方法,如图1所示,包括以下步骤:
S1,将事实表和维度表进行Hash join,根据所述维度表生成Hash表,根据所述事实表生成事实表直方图;所述Hash表中包括若干个键值。
S2,根据所述Hash表和所述事实表直方图得到的N个谓词直方图区域,所述N为正整数;
具体为,S21,对所述Hash表中的键值进行Hash排序,生成排序列表;
例如,排序列表为(90,91,92,93,94,95,96,97,98,99,100)
S22,根据所述排序列表得到排序列表的M个直方图区域;
例如,根据排序列表得到了9个直方图区域,分别为90至91的直方图区域、91至92的直方图区域、92至93的直方图区域、93至94的直方图区域、94至95的直方图区域、95至96的直方图区域、96至97的直方图区域、97至98的直方图区域、98至99的直方图区域和99至100的直方图区域。
S23,根据所述事实表直方图计算每个所述直方图区域的行数;
例如,计算上述每个直方图区域的行数,分别为203、697、112、235、1032、254、322、20和35。
S24,按行数的从大到小顺序,从所述M个直方图区域中筛选出行数较大的前N个直方图区域,并将所述N个直方图区域作为N个谓词直方图区域,所述M为大于N的正整数。
例如,根据行数的从大到小顺序,从9个直方图区域中筛选出行数较大的前两个直方图区域,即91至92的直方图区域和94至95的直方图区域,并将这两个直方图区域作为谓词直方图区域。
S3,将所述N个谓词直方图区域转换为谓词,并将所述谓词下推至数据存储层。
例如,根据上述的两个谓词直方图区域转换为谓词[91,92]和[94,95],得到了最可能的排出范围,并将谓词下推至数据存储层。
谓词下推如下:
NOT(key>=91and key<=92)or NOT(key>=94and key<=95)or key is notnull。
综上所述,本实施例与最小值/最大值和完整Hash下推相比较,能根据事实表直方图提高数据过滤能力,从而提高存储层的计算效率。
实施例二:
本实施例提供了一种终端,包括处理器和与所述处理器连接的存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如实施例一所述的SQL连接操作中谓词下推的方法,如图1所示,包括以下步骤:
S1,将事实表和维度表进行Hash join,根据所述维度表生成Hash表,根据所述事实表生成事实表直方图;所述Hash表中包括若干个键值。
S2,根据所述Hash表和所述事实表直方图得到的N个谓词直方图区域,所述N为正整数;
具体为,S21,对所述Hash表中的键值进行Hash排序,生成排序列表;
例如,排序列表为(90,91,92,93,94,95,96,97,98,99,100)
S22,根据所述排序列表得到排序列表的M个直方图区域;
例如,根据排序列表得到了9个直方图区域,分别为90至91的直方图区域、91至92的直方图区域、92至93的直方图区域、93至94的直方图区域、94至95的直方图区域、95至96的直方图区域、96至97的直方图区域、97至98的直方图区域、98至99的直方图区域和99至100的直方图区域。
S23,根据所述事实表直方图计算每个所述直方图区域的行数;
例如,计算上述每个直方图区域的行数,分别为203、697、112、235、1032、254、322、20和35。
S24,按行数的从大到小顺序,从所述M个直方图区域中筛选出行数较大的前N个直方图区域,并将所述N个直方图区域作为N个谓词直方图区域,所述M为大于N的正整数。
例如,根据行数的从大到小顺序,从9个直方图区域中筛选出行数较大的前两个直方图区域,即91至92的直方图区域和94至95的直方图区域,并将这两个直方图区域作为谓词直方图区域。
S3,将所述N个谓词直方图区域转换为谓词,并将所述谓词下推至数据存储层。
例如,根据上述的两个谓词直方图区域转换为谓词[91,92]和[94,95],得到了最可能的排出范围,并将谓词下推至数据存储层。
谓词下推如下:
NOT(key>=91and key<=92)or NOT(key>=94and key<=95)or key is notnull。
综上所述,本实施例与最小值/最大值和完整Hash下推相比较,能根据事实表直方图提高数据过滤能力,从而提高存储层的计算效率。
应当理解,在本实施例中,所称处理器可以是中央处理单元(Central ProcessingUnit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
该存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器的一部分还可以包括非易失性随机存取存储器。例如,存储器还可以存储设备类型的信息。
实施例三:
本实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行实施例一所述的SQL连接操作中谓词下推的方法,如图1所示,包括以下步骤:
S1,将事实表和维度表进行Hash join,根据所述维度表生成Hash表,根据所述事实表生成事实表直方图;所述Hash表中包括若干个键值。
S2,根据所述Hash表和所述事实表直方图得到的N个谓词直方图区域,所述N为正整数;
具体为,S21,对所述Hash表中的键值进行Hash排序,生成排序列表;
例如,排序列表为(90,91,92,93,94,95,96,97,98,99,100)
S22,根据所述排序列表得到排序列表的M个直方图区域;
例如,根据排序列表得到了9个直方图区域,分别为90至91的直方图区域、91至92的直方图区域、92至93的直方图区域、93至94的直方图区域、94至95的直方图区域、95至96的直方图区域、96至97的直方图区域、97至98的直方图区域、98至99的直方图区域和99至100的直方图区域。
S23,根据所述事实表直方图计算每个所述直方图区域的行数;
例如,计算上述每个直方图区域的行数,分别为203、697、112、235、1032、254、322、20和35。
S24,按行数的从大到小顺序,从所述M个直方图区域中筛选出行数较大的前N个直方图区域,并将所述N个直方图区域作为N个谓词直方图区域,所述M为大于N的正整数。
例如,根据行数的从大到小顺序,从9个直方图区域中筛选出行数较大的前两个直方图区域,即91至92的直方图区域和94至95的直方图区域,并将这两个直方图区域作为谓词直方图区域。
S3,将所述N个谓词直方图区域转换为谓词,并将所述谓词下推至数据存储层。
例如,根据上述的两个谓词直方图区域转换为谓词[91,92]和[94,95],得到了最可能的排出范围,并将谓词下推至数据存储层。
谓词下推如下:
NOT(key>=91and key<=92)or NOT(key>=94and key<=95)or key is notnull。
综上所述,本实施例与最小值/最大值和完整Hash下推相比较,能根据事实表直方图提高数据过滤能力,从而提高存储层的计算效率。
所述计算机可读存储介质可以是前述实施例所述终端的存储器,例如终端的硬盘或内存。所述计算机可读存储介质也可以是所述终端的外部存储设备,例如所述终端上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述终端的存储器也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的终端和介质的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (5)

1.一种SQL连接操作中谓词下推的方法,其特征在于,包括以下步骤:
将事实表和维度表进行Hash join,根据所述维度表生成Hash表,根据所述事实表生成事实表直方图;
根据所述Hash表和所述事实表直方图得到的N个谓词直方图区域,所述N为正整数;
将所述N个谓词直方图区域转换为谓词,并将所述谓词下推至数据存储层。
2.根据权利要求1所述的一种SQL连接操作中谓词下推的方法,其特征在于,所述Hash表中包括若干个键值。
3.根据权利要求2所述的一种SQL连接操作中谓词下推的方法,其特征在于,所述根据所述Hash表和所述事实表直方图得到的N个谓词直方图区域具体为:
对所述Hash表中的键值进行Hash排序,生成排序列表;
根据所述排序列表得到排序列表的M个直方图区域;
根据所述事实表直方图计算每个所述直方图区域的行数;
按行数的从大到小顺序,从所述M个直方图区域中筛选出行数较大的前N个直方图区域,并将所述N个直方图区域作为N个谓词直方图区域,所述M为大于N的正整数。
4.一种终端,其特征在于,包括处理器和与所述处理器连接的存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-3任一项所述的方法。
5.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-3任一项所述的方法。
CN201810037072.1A 2018-01-15 2018-01-15 一种sql连接操作中谓词下推的方法、终端及介质 Active CN108304499B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810037072.1A CN108304499B (zh) 2018-01-15 2018-01-15 一种sql连接操作中谓词下推的方法、终端及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810037072.1A CN108304499B (zh) 2018-01-15 2018-01-15 一种sql连接操作中谓词下推的方法、终端及介质

Publications (2)

Publication Number Publication Date
CN108304499A true CN108304499A (zh) 2018-07-20
CN108304499B CN108304499B (zh) 2021-06-29

Family

ID=62869089

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810037072.1A Active CN108304499B (zh) 2018-01-15 2018-01-15 一种sql连接操作中谓词下推的方法、终端及介质

Country Status (1)

Country Link
CN (1) CN108304499B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112347126A (zh) * 2021-01-05 2021-02-09 平安科技(深圳)有限公司 大数据处理方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6134546A (en) * 1998-06-25 2000-10-17 International Business Machines Corporation Method and computer program product for implementing subquery join
CN102609493A (zh) * 2012-01-20 2012-07-25 东华大学 一种基于列存储模型的连接顺序查询优化方法
CN102663116A (zh) * 2012-04-11 2012-09-12 中国人民大学 面向列存储数据仓库的多维olap查询处理方法
CN103793422A (zh) * 2012-10-31 2014-05-14 国际商业机器公司 基于增强星型模型的立方体元数据及查询语句生成
CN103942343A (zh) * 2014-05-12 2014-07-23 中国人民大学 一种面向哈希连接的数据存储优化方法
CN107066551A (zh) * 2017-03-23 2017-08-18 中国科学院计算技术研究所 一种树状数据的行式和列式存储方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6134546A (en) * 1998-06-25 2000-10-17 International Business Machines Corporation Method and computer program product for implementing subquery join
CN102609493A (zh) * 2012-01-20 2012-07-25 东华大学 一种基于列存储模型的连接顺序查询优化方法
CN102663116A (zh) * 2012-04-11 2012-09-12 中国人民大学 面向列存储数据仓库的多维olap查询处理方法
CN103793422A (zh) * 2012-10-31 2014-05-14 国际商业机器公司 基于增强星型模型的立方体元数据及查询语句生成
CN103942343A (zh) * 2014-05-12 2014-07-23 中国人民大学 一种面向哈希连接的数据存储优化方法
CN107066551A (zh) * 2017-03-23 2017-08-18 中国科学院计算技术研究所 一种树状数据的行式和列式存储方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIAOJIAN ZHANG 等: "Clustering-Variable-Width Histogram Based Window Semi-hash Multi-join over Streams", 《 2007 INTERNATIONAL CONFERENCE ON CONVERGENCE INFORMATION TECHNOLOGY (ICCIT 2007)》 *
李宏辉: "基于下推自动机的XML数据流递归查询处理技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112347126A (zh) * 2021-01-05 2021-02-09 平安科技(深圳)有限公司 大数据处理方法、装置、设备及介质
CN112347126B (zh) * 2021-01-05 2021-04-02 平安科技(深圳)有限公司 大数据处理方法、装置、设备及介质

Also Published As

Publication number Publication date
CN108304499B (zh) 2021-06-29

Similar Documents

Publication Publication Date Title
US20240248895A1 (en) Systems and methods for rapid data analysis
CA3003756C (en) Storing and retrieving data of a data cube
Kaur et al. Association rule mining: A survey
US9043310B2 (en) Accessing a dimensional data model when processing a query
US20150242407A1 (en) Discovery of Data Relationships Between Disparate Data Sets
US9218396B2 (en) Insight determination and explanation in multi-dimensional data sets
US9996607B2 (en) Entity resolution between datasets
US20120023586A1 (en) Determining privacy risk for database queries
Jin et al. Querying business process models based on semantics
WO2016029230A1 (en) Automated creation of join graphs for unrelated data sets among relational databases
US12066992B2 (en) Maintaining a dataset based on periodic cleansing of raw source data
AU2014271289A1 (en) Extract, transform and load (etl) system and method
US8548980B2 (en) Accelerating queries based on exact knowledge of specific rows satisfying local conditions
CN108304499A (zh) 一种sql连接操作中谓词下推的方法、终端及介质
US20080301085A1 (en) Dynamic Database File Column Statistics for Arbitrary Union Combination
CN106326295B (zh) 语义数据的存储方法及装置
US20220342887A1 (en) Predictive query processing
Aggarwal et al. On dimensionality reduction of massive graphs for indexing and retrieval
Pandey et al. Rough set model for discovering multidimensional association rules
Paradies et al. Robust cardinality estimation for subgraph isomorphism queries on property graphs
Khurana An introduction to temporal graph data management
Stantic et al. The POINT approach to represent now in bitemporal databases
US12026133B2 (en) Data space scalability for algorithm traversal
CN118193753A (zh) 数据查询方法、装置、计算机设备以及存储介质
Hidayat et al. Study of Graph Database Implementation on Dynamic Table of BPS Website

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant