CN117131069B - 一种数据库单表分组扫描方法 - Google Patents

一种数据库单表分组扫描方法 Download PDF

Info

Publication number
CN117131069B
CN117131069B CN202311398767.XA CN202311398767A CN117131069B CN 117131069 B CN117131069 B CN 117131069B CN 202311398767 A CN202311398767 A CN 202311398767A CN 117131069 B CN117131069 B CN 117131069B
Authority
CN
China
Prior art keywords
page
scanning
pfs
acquiring
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311398767.XA
Other languages
English (en)
Other versions
CN117131069A (zh
Inventor
李彬
何清法
刘碧楠
周丽霞
马岳
刘爱莉
顾云苏
吴嵩
赵冬伟
胡薇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TIANJIN SHENZHOU GENERAL DATA TECHNOLOGY CO LTD
Original Assignee
TIANJIN SHENZHOU GENERAL DATA TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TIANJIN SHENZHOU GENERAL DATA TECHNOLOGY CO LTD filed Critical TIANJIN SHENZHOU GENERAL DATA TECHNOLOGY CO LTD
Priority to CN202311398767.XA priority Critical patent/CN117131069B/zh
Publication of CN117131069A publication Critical patent/CN117131069A/zh
Application granted granted Critical
Publication of CN117131069B publication Critical patent/CN117131069B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种数据库单表分组扫描方法,包括:步骤S1:在SQL语句中提供分组数量和当前要获取的分组序号;步骤S2:启动分组扫描begin阶段,得到当前页面;步骤S3:启动分组扫描next阶段,从分组扫描获取PFS页面;步骤S4:分组扫描返回有效PFS页面则执行步骤S6,否则执行步骤S5;步骤S5:分组扫描已经结束,结束堆扫描;步骤S6:当前PFS页面是否存在下一个有效范围,是则继续,否则执行步骤S3;步骤S7获取有效范围,解析8个页面上的所有行,并将所有行放到待发送缓冲区;步骤S8将缓冲区中的数据发送给前端,并回到步骤S6。本发明对表中数据进行跳跃式分组访问为并行获取数据库单表数据提供支撑。

Description

一种数据库单表分组扫描方法
技术领域
本发明涉及数据库技术领域,特别涉及一种数据库单表分组扫描方法。
背景技术
随着大数据时代的到来,存储在数据库中的数据量越来越大,按现有的扫描方式,在表数据达到TB时,至少需要125,000,000个数据页面,假定每个页面存储了20行数据,那么服务器需要顺序迭代125,000,000*20次才能将所有行全部返回,为了能够快速读取数据,通常需要采用并行的方案,但是由于单表数据无法分区获取,只能采用多个Limitoffset的方式进行分批获取,而limit offset在获取后面的数据时,要先按行定位到开始位置需要扫描前面的每个数据页面,产生了大量损耗,影响并行效果。
发明内容
为了解决上述问题,本发明设计了一种数据库单表分组扫描方法,可以对表中数据进行跳跃式的分组访问,为应用并行获取数据库单表数据提供基础支撑。
为实现以上目的,本发明的技术方案为:一种数据库单表分组扫描方法,包括以下步骤:
步骤S1:在SQL语句中提供分组数量和当前要获取的分组序号;
步骤S2:启动分组扫描begin阶段,得到当前PI页面;
步骤S3:启动分组扫描next阶段,从分组扫描获取PFS页面;
步骤S4:分组扫描返回有效PFS页面则执行步骤S6,否则执行步骤S5;
步骤S5:分组扫描已经结束,结束堆扫描;
步骤S6:当前PFS页面是否存在下一个有效范围,是则继续,否则继续执行步骤S3;
步骤S7:获取有效范围,解析8个页面上的所有行,并将所有行放到待发送缓冲区;
步骤S8:将缓冲区中的数据发送给前端,并回到步骤S6;
页面(page)是操作系统,数据库存储的最小单位,一个页面为 8 k,每个页面都有唯一的页面号,页面号由文件号以及文件内偏移组成,根据页面号,可以获取指定页面内容,同理获取到页面内容后,也可以获取本页面的页面号,虽然页面固定为8k,但是根据页面用途的不同划分了不同的页面类型,比如存储表中的数据的页面称为数据页面,而管理数据页面的页面是PFS页面,而PI页面可以管理PI页面或者PFS页面,范围(extent)是数据库分配空间的最小单位,一个范围由8个连续的页面组成,段(segment)是逻辑对象的物理载体,每个表对应唯一的段,段由n多个extent组成,堆组织表是一种无序存储数据的多路树结构,树的叶子节点为PFS页面,PFS页面存储200个范围id,也就是1600个数据页面。树的非叶子节点为PI页面,PI页面存储200个子项位置,如果树为一层那么可以管理 200 * 8个数据页面,如果是两层可以管理 200 * 200 * 8 个数据页面(320M)。PFS页面以及PI页面内容中记录了右侧页面的页面号,这样可以方便的查找同一层中的所有页面。数据库中的普通表就是堆组织表,定位到堆的根页面,根据根页面定位到树的最左侧的PFS页面,获取PFS页面中记录的范围,根据范围中记录的页面号获取数据页面并将数据页面返回给堆扫描,通过PFS页面中记录的右侧页面号找到右侧PFS页面,同理可以获取右侧PFS页面中记录的数据页面,直到整个树的最右侧PFS页。此过程为段扫描,段扫描负责收集数据页面,向堆扫描返回数据页面,堆扫描使用段扫描获取一个数据页面,获取数据页面上的有效行,每解析一行后返回给前端,然后继续解析下一行。页面遍历完毕后,继续向段扫描获取下一个数据页面,直到段扫描结束。
优选的:所述SQL语句的语法如下:
DIRECT EXTENT column FROM t GROUP count By n;
其中,DIRECT EXTENT:表示基于EXTENT返回数据,区别于 SELECT 语句,column:表示需要获取的投影列,FROM t:获取t表中的数据,GROUP count: GROUP关键字表示分组,分成count 组,By n:By表示获取第n组,使用PFS页面号与 count取模,如果值等于 n 则说明需要获取该页面,否则不获取本PFS页。
优选的:所述SQL语句语法预期结果为:DIRECT EXTENT column FROM t GROUP 2By 0;
合并上 DIRECT EXTENT column FROM t GROUP 2 By 1;数据结果等于 SELECTCOLUMN from t。
优选的:所述分组扫描begin阶段包括以下步骤:
步骤S21:根据表名字定位到堆根页面,设置根页面为当前页面;
步骤S22:获取当前页面管理的第一个子项页面,判断子项页面类型是否为PFS页面,如果是则执行步骤S24,如果不是则执行步骤S23;
步骤S23:如果不是PFS页面则为PI页面,获取PI页面,并将其设置为当前页面,并跳转到步骤S22;
步骤S24:返回当前页面。
优选的:所述步骤S24中的当前页面是树的倒数第二层。
优选的:分组扫描next阶段包括以下步骤:
步骤S31:获取当前PI页面中记录的下一个PFS页面号;
步骤S32:如果获取成功则执行步骤S35,否则执行步骤S33;
步骤S33:当前PI页面是否存在右侧PI页面,如果存在继续,否则执行步骤S37;
步骤S34:根据页面号,获取右侧PI页面,并将此页面设置成当前页面,到步骤S31;
步骤S35:进行PFS页面号 mod (count) 运算,如果结果等于 n,则继续,否则跳转到步骤S31;
步骤S36:根据PFS页面号获取PFS页面,并将PFS页面返回给堆扫描;
步骤S37:无右侧页面,返回NULL,结束分段扫描。
优选的:DIRECT EXTENT表示基于EXTENT返回数据,区别于 SELECT语句。
优选的:column:表示需要获取的投影列。
优选的:FROM t:获取t表中的数据。
优选的:GROUP count:GROUP关键字表示分组,分成count组,By n:By表示获取第n组,使用PFS页面号与count取模,如果值等于n则说明需要获取该页面,否则不获取本PFS页。
有益效果
1、本发明可以对表中数据进行跳跃式的分组访问,为应用并行获取数据库单表数据提供基础支撑。
2、单表分组扫描方法相对简单直观,易于理解和实现。不需要进行多表关联或连接操作,只需对单个表进行扫描和分组,降低了操作的复杂性,相比于多表连接或关联操作,单表分组扫描通常需要更少的资源和时间。因为只需对单个表进行扫描和聚合操作,减少了数据的传输和处理开销。
3、单表分组扫描方法可以根据具体需求选择合适的分组列,并对数据进行自定义的聚合操作。这种灵活性可以满足不同场景下的分组查询需求,单表分组扫描方法可以使用索引、排序、分区等技术进行优化。通过合理设计索引和使用适当的优化技术,可以提高查询性能和响应时间,单表分组扫描方法适用于各种规模和复杂度的数据表。无论是小型表还是大型表,都可以使用单表分组扫描方法进行数据的分类和聚合。
附图说明
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。
图1为本发明的整体流程示意图;
图2为本发明中分组扫描Begin阶段的流程示意图;
图3为本发明中Next阶段的流程示意图;
图4为本发明中假定用户要求分成四组时的PI页面示意图。
具体实施方式
本申请实施例通过提供一种数据库单表分组扫描方法,有效解决了存储在数据库中的数据量越来越大,按现有的扫描方式,在表数据达到TB时,至少需要125,000,000个数据页面,假定每个页面存储了20行数据,那么服务器需要顺序迭代125,000,000*20次才能将所有行全部返回,为了能够快速读取数据,通常需要采用并行的方案,但是由于单表数据无法分区获取,只能采用多个Limit offset的方式进行分批获取,而limit offset在获取后面的数据时,要先按行定位到开始位置需要扫描前面的每个数据页面,产生了大量损耗,影响并行效果的技术问题。
实施例
参见图1,本申请实施例中的技术方案总体思路如下:
针对现有技术中存在的问题,本发明提供一种数据库单表分组扫描方法,包括以下步骤:
步骤S1:在SQL语句中提供分组数量和当前要获取的分组序号;
步骤S2:启动分组扫描begin阶段,得到当前PI页面;
步骤S3:启动分组扫描next阶段,从分组扫描获取PFS页面;
步骤S4:分组扫描返回有效PFS页面则执行步骤S6,否则执行步骤S5;
步骤S5:分组扫描已经结束,结束堆扫描;
步骤S6:当前PFS页面是否存在下一个有效范围,是则继续,否则继续执行步骤S3;
步骤S7:获取有效范围,解析8个页面上的所有行,并将所有行放到待发送缓冲区;
步骤S8:将缓冲区中的数据发送给前端,并回到S6。
页面(page)是操作系统,数据库存储的最小单位,一个页面为 8 k,每个页面都有唯一的页面号,页面号由文件号以及文件内偏移组成,根据页面号,可以获取指定页面内容,同理获取到页面内容后,也可以获取本页面的页面号,虽然页面固定为8k,但是根据页面用途的不同划分了不同的页面类型,比如存储表中的数据的页面称为数据页面,而管理数据页面的页面是PFS页面,而PI页面可以管理PI页面或者PFS页面,范围(extent)是数据库分配空间的最小单位,一个范围由8个连续的页面组成,段(segment)是逻辑对象的物理载体,每个表对应唯一的段,段由n多个extent组成,堆组织表是一种无序存储数据的多路树结构,树的叶子节点为PFS页面,PFS页面存储200个范围id,也就是1600个数据页面。树的非叶子节点为PI页面,PI页面存储200个子项位置,如果树为一层那么可以管理 200 * 8个数据页面,如果是两层可以管理 200 * 200 * 8 个数据页面(320M)。PFS页面以及PI页面内容中记录了右侧页面的页面号,这样可以方便的查找同一层中的所有页面。数据库中的普通表就是堆组织表,定位到堆的根页面,根据根页面定位到树的最左侧的PFS页面,获取PFS页面中记录的范围,根据范围中记录的页面号获取数据页面并将数据页面返回给堆扫描,通过PFS页面中记录的右侧页面号找到右侧PFS页面,同理可以获取右侧PFS页面中记录的数据页面,直到整个树的最右侧PFS页。此过程为段扫描,段扫描负责收集数据页面,向堆扫描返回数据页面,堆扫描使用段扫描获取一个数据页面,获取数据页面上的有效行,每解析一行后返回给前端,然后继续解析下一行。页面遍历完毕后,继续向段扫描获取下一个数据页面,直到段扫描结束。
所述SQL语句的语法如下(大写为关键字,小写为标识符):
DIRECT EXTENT column FROM t GROUP count By n;
其中,DIRECT EXTENT:表示基于EXTENT返回数据,区别于 SELECT 语句,column:表示需要获取的投影列,FROM t:获取t表中的数据,GROUP count: GROUP关键字表示分组,分成count 组,By n:By表示获取第n组,使用PFS页面号与 count取模,如果值等于 n 则说明需要获取该页面,否则不获取本PFS页;
所述SQL语句语法预期结果为:DIRECT EXTENT column FROM t GROUP 2 By 0,合并上 DIRECT EXTENT column FROM t GROUP 2 By 1;数据结果等于 SELECT COLUMNfrom t;
在表数据达到TB时,至少需要125,000,000 个数据页面,假定每个页面存储了 20行数据,假定用户从10个客户端分别执行如下10个sql,那么服务器每个sql的处理迭代次数为125,000,000/8/10。
DIRECT EXTENT column FROM t GROUP 10 By 0 ;
DIRECT EXTENT column FROM t GROUP 10 By 1 ;
........
DIRECT EXTENT column FROM t GROUP 10 By 8 ;
DIRECT EXTENT column FROM t GROUP 10 By 9 ;
参见图2,所述分组扫描begin阶段包括以下步骤:
步骤S21:根据表名字定位到堆根页面,设置根页面为当前页面;
步骤S22:获取当前页面管理的第一个子项页面,判断子项页面类型是否为PFS页面,如果是则执行步骤S24,如果不是则执行步骤S23;
步骤S23:如果不是PFS页面则为PI页面,获取PI页面,并将其设置为当前页面,并跳转到步骤S22;
步骤S24:返回当前页面,当前页面是树的倒数第二层。
参见图3,分组扫描next阶段包括以下步骤:
步骤S31:获取当前PI页面中记录的下一个PFS页面号;
步骤S32:如果获取成功则执行步骤S35,否则执行步骤S33;
步骤S33:当前PI页面是否存在右侧PI页面,如果存在继续,否则执行步骤S37;
步骤S34:根据页面号,获取右侧PI页面,并将此页面设置成当前页面,到步骤S31;
步骤S35:进行 (PFS页面号) mod (count) 运算,如果结果等于n,则继续,否则跳转到步骤S31;
步骤S36:根据PFS页面号获取PFS页面,并将PFS页面返回给堆扫描;
步骤S37:无右侧页面,返回NULL,结束分段扫描。
DIRECT EXTENT表示基于EXTENT返回数据,区别于 SELECT语句,column表示需要获取的投影列,FROM t获取t表中的数据,GROUP count:GROUP关键字表示分组,分成count组,By n:By表示获取第 n组,使用PFS页面号与count取模,如果值等于n则说明需要获取该页面,否则不获取本PFS页。
如说明书图4,假定用户要求分成四组:
第一组 (group 4 by 0)
第二组 (group 4 by 1)
第三组 (group 4 by 2)
第四组 (group 4 by 3)
每组中负责扫描的PFS进行区分,这样将PFS页面较为平均的分为4组,各组段扫描之间不会重复扫描同一个PFS,也不会漏掉任意一个PFS页面,可以对表中数据进行跳跃式的分组访问,为应用并行获取数据库单表数据提供基础支撑,单表分组扫描方法相对简单直观,易于理解和实现。不需要进行多表关联或连接操作,只需对单个表进行扫描和分组,降低了操作的复杂性,相比于多表连接或关联操作,单表分组扫描通常需要更少的资源和时间。因为只需对单个表进行扫描和聚合操作,减少了数据的传输和处理开销,单表分组扫描方法可以根据具体需求选择合适的分组列,并对数据进行自定义的聚合操作。这种灵活性可以满足不同场景下的分组查询需求,单表分组扫描方法可以使用索引、排序、分区等技术进行优化。通过合理设计索引和使用适当的优化技术,可以提高查询性能和响应时间,单表分组扫描方法适用于各种规模和复杂度的数据表。无论是小型表还是大型表,都可以使用单表分组扫描方法进行数据的分类和聚合。
最后应说明的是:显然,上述实施例仅仅是为清楚地说明本发明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明的保护范围之中。

Claims (8)

1.一种数据库单表分组扫描方法,其特征在于,包括以下步骤:
步骤S1:在SQL语句中提供分组数量和当前要获取的分组序号;
步骤S2:启动分组扫描begin阶段,得到当前pi页面;所述分组扫描begin阶段包括以下步骤:
步骤S21:根据表名字定位到堆根页面,设置根页面为当前页面;
步骤S22:获取当前页面管理的第一个子项页面,判断子项页面类型是否为PFS页面,如果是则执行步骤S24,如果不是则执行步骤S23;
步骤S23:如果不是PFS页面则为PI页面,获取PI页面,并将其设置为当前页面,并跳转到步骤S22;
步骤S24:返回当前页面;步骤S3:启动分组扫描next阶段,从分组扫描获取PFS页面;
分组扫描next阶段包括以下步骤:
步骤S31:获取当前PI页面中记录的下一个PFS页面号;
步骤S32:如果获取成功则执行步骤S35步,否则执行步骤S33;
步骤S33:当前PI页面是否存在右侧PI页面,如果存在继续,否则执行步骤S37;
步骤S34:根据页面号,获取右侧PI页面,并将此页面设置成当前页面,到步骤S31;
步骤S35:进行 PFS页面号 mod count 运算,如果结果等于 n,则继续,否则跳转到步骤S31;
步骤S36:根据PFS页面号获取PFS页面,并将PFS页面返回给堆扫描;
步骤S37:无右侧页面,返回NULL,结束分段扫描;
步骤S4:分组扫描返回有效PFS页面则执行步骤S6,否则执行步骤S5;
步骤S5:分组扫描已经结束,结束堆扫描;
步骤S6:当前PFS页面是否存在下一个有效范围,是则继续,否则继续执行步骤S3;
步骤S7:获取有效范围,解析8个页面上的所有行,并将所有行放到待发送缓存区;
步骤S8:将缓冲区中的数据发送给前端,并回到S6;
其中,管理数据页面的页面是PFS页面,而PI页面管理PI页面或者PFS页面。
2.如权利要求1所述的一种数据库单表分组扫描方法,其特征在于:所述SQL语法如下:
DIRECT EXTENT column FROM t GROUP count By n;
其中,DIRECT EXTENT:表示基于EXTENT返回数据,区别于 SELECT 语句,column:表示需要获取的投影列,FROM t:获取t表中的数据,GROUP count: GROUP关键字表示分组,分成count 组,By n:By表示获取第n组,使用PFS页面号与 count取模,如果值等于 n 则说明需要获取该页面,否则不获取本PFS页。
3.如权利要求2所述的一种数据库单表分组扫描方法,其特征在于:所述SQL语法预期结果为:Direct EXTENT column FROM t GROUP 2 By 0;
合并上 Direct EXTENT column FROM t GROUP 2 By 1;数据结果等于 SELECTCOLUMN from t。
4.如权利要求3所述的一种数据库单表分组扫描方法,其特征在于:所述步骤S24中的当前页面是树的倒数第二层。
5.如权利要求3所述的一种数据库单表分组扫描方法,其特征在于:DIRECT EXTENT表示基于EXTENT返回数据,区别于 SELECT语句。
6.如权利要求5所述的一种数据库单表分组扫描方法,其特征在于:column:表示需要获取的投影列。
7.如权利要求6所述的一种数据库单表分组扫描方法,其特征在于:FROM t:获取t表中的数据。
8.如权利要求7所述的一种数据库单表分组扫描方法,其特征在于:GROUP count:GROUP关键字表示分组,分成count组,By n:By表示获取第 n组,使用PFS页面号与count取模,如果值等于n则说明需要获取该页面,否则不获取本PFS页。
CN202311398767.XA 2023-10-26 2023-10-26 一种数据库单表分组扫描方法 Active CN117131069B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311398767.XA CN117131069B (zh) 2023-10-26 2023-10-26 一种数据库单表分组扫描方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311398767.XA CN117131069B (zh) 2023-10-26 2023-10-26 一种数据库单表分组扫描方法

Publications (2)

Publication Number Publication Date
CN117131069A CN117131069A (zh) 2023-11-28
CN117131069B true CN117131069B (zh) 2023-12-22

Family

ID=88863169

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311398767.XA Active CN117131069B (zh) 2023-10-26 2023-10-26 一种数据库单表分组扫描方法

Country Status (1)

Country Link
CN (1) CN117131069B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03139697A (ja) * 1989-10-26 1991-06-13 Ricoh Co Ltd ミクストモード文書の表示方法
US7418706B1 (en) * 2003-05-08 2008-08-26 Teradota Us, Inc. Rescheduling table scan transactions
CN112099996A (zh) * 2020-09-21 2020-12-18 天津神舟通用数据技术有限公司 基于页面更新序号的数据库集群多节点重做日志恢复方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10346398B2 (en) * 2017-03-07 2019-07-09 International Business Machines Corporation Grouping in analytical databases

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03139697A (ja) * 1989-10-26 1991-06-13 Ricoh Co Ltd ミクストモード文書の表示方法
US7418706B1 (en) * 2003-05-08 2008-08-26 Teradota Us, Inc. Rescheduling table scan transactions
CN112099996A (zh) * 2020-09-21 2020-12-18 天津神舟通用数据技术有限公司 基于页面更新序号的数据库集群多节点重做日志恢复方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《基于XML的WEB日志挖掘研究》;方杰;《中国优秀硕士学位论文全文数据库 信息科技辑》;全文 *

Also Published As

Publication number Publication date
CN117131069A (zh) 2023-11-28

Similar Documents

Publication Publication Date Title
US9798772B2 (en) Using persistent data samples and query-time statistics for query optimization
US6374232B1 (en) Method and mechanism for retrieving values from a database
US7158996B2 (en) Method, system, and program for managing database operations with respect to a database table
US7562090B2 (en) System and method for automating data partitioning in a parallel database
US6029163A (en) Methods for collecting query workload based statistics on column groups identified by RDBMS optimizer
US7814104B2 (en) Techniques for partition pruning
US8429133B2 (en) Partial key indexes
US7756889B2 (en) Partitioning of nested tables
CN105975617A (zh) 一种多分区表查询处理的方法和装置
US9141666B2 (en) Incremental maintenance of range-partitioned statistics for query optimization
US20030055813A1 (en) Query optimization by sub-plan memoization
US20110264667A1 (en) Column-oriented storage in a row-oriented database management system
CN107783985B (zh) 一种分布式数据库查询方法、装置及管理系统
Cheng et al. An efficient hybrid join algorithm: A DB2 prototype
US10783142B2 (en) Efficient data retrieval in staged use of in-memory cursor duration temporary tables
US20190005092A1 (en) Query optimization using propagated data distinctness
CN111552710A (zh) 一种分布式数据库的查询优化方法
CN102253990A (zh) 一种交互应用多媒体数据的查询方法及其装置
CN113553339A (zh) 数据查询方法、中间件、电子装置和存储介质
US7725448B2 (en) Method and system for disjunctive single index access
Cioloca et al. Increasing database performance using indexes
CN110471925A (zh) 实现搜索系统中索引数据同步的方法及系统
CN117131069B (zh) 一种数据库单表分组扫描方法
D’silva et al. Secondary indexing techniques for key-value stores: Two rings to rule them all
US8832157B1 (en) System, method, and computer-readable medium that facilitates efficient processing of distinct counts on several columns in a parallel processing system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant