CN104731889B - 一种估算查询结果大小的方法 - Google Patents

一种估算查询结果大小的方法 Download PDF

Info

Publication number
CN104731889B
CN104731889B CN201510111127.5A CN201510111127A CN104731889B CN 104731889 B CN104731889 B CN 104731889B CN 201510111127 A CN201510111127 A CN 201510111127A CN 104731889 B CN104731889 B CN 104731889B
Authority
CN
China
Prior art keywords
data
matrix
record
true value
row
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510111127.5A
Other languages
English (en)
Other versions
CN104731889A (zh
Inventor
冯钧
徐斌
唐志贤
杜丙帅
査显月
李宗祥
王纯
陆佳民
李士进
朱跃龙
万定生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN201510111127.5A priority Critical patent/CN104731889B/zh
Publication of CN104731889A publication Critical patent/CN104731889A/zh
Application granted granted Critical
Publication of CN104731889B publication Critical patent/CN104731889B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1748De-duplication implemented within the file system, e.g. based on file segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种估算查询结果大小的方法,属于数据库管理技术领域。其步骤为:(1)构建数据对象标识到布尔矩阵元素的一对一映射关系;(2)构建用于对象查询计数的数据记录模型结构及其算法,当某一对象存在时,数据记录模型所表示的布尔矩阵与对象标识相对应的矩阵元素记为1,反之则为0;(3)读入原始数据并在数据记录模型中插入相应记录,同时更新数据记录模型中每列的真值元素统计总数;(4)将查询的数据标识范围换算成布尔矩阵的列范围,累加查询范围内矩阵列的真值元素总数,得出查询结果大小的估算值。

Description

一种估算查询结果大小的方法
技术领域
本发明涉及一种估算查询结果大小的方法,属于计算机数据库管理技术领域。
背景技术
用户对数据查询的需求日益复杂,因此需要改进数据处理方法以实现高效的复杂查询,在数据库系统的实现中,查询优化器一般都是基于代价的,查询优化器比较各种不同执行方案的代价,从中选出代价最小者执行。估算代价的主要问题是估算查询结果的大小。对查询结果大小的估算准确与否直接影响到相应方案代价估算的准确性,从而对查询优化器的质量有实质性的影响。此外,针对大规模移动对象数据管理,难以实现精确聚集查询,就需要以估算方法来满足查询应用。
针对估算查询结果大小的问题,目前研究人员已提出不少方法,如采样法、曲线拟合、直方图、概率估算等,但由于估算效率或精度的不足,至今仍没有很好的解决方案。
直方图方法[Piatetsky-Shapiro G,Connell C.Accurate estimation of thenumber or tuples satisfying a condition.In:Proceedings of ACM SIGM ODConference,1984]的主要思想是将给定的数据分布分成若干相对平滑的段,即直方图的桶,然后通过桶中包含的数据产生一个估计值(一般选用平均数),作为桶中各个数据的近似值。即用直方图近似给定的数据分布,桶中数据的平滑程度决定着直方图对给定数据分布的近似程度。直方图方法虽然可以加以误差限定改进[吴胜利,限定误差的直方图,计算机学报,Vol.21No.81998.8:704-712],但由于直方图方法不能消除重复的数据记录,从根本上存在估算精度的缺陷,限制了应用范围。
概率估算法[Flajolet,P.,Martin,G.Probabilistic Counting Algorithms forData Base Applications.JCSS,31(2)1985.8:182-209]的主要思想是:初始化长度为r的二进制字符串草图,草图的r位均为0,将对象数据集DS中的每一个OID进行散列转换,设计散列算法使得输出的散列值为二进制形式并尽量接近线性均匀分布,将所得的散列值与草图进行按位或运算得到结果草图,当数据量达到一定规模时,该草图的位数据越靠近低位则为1的概率越大,越靠近高位则为0的概率越大,根据草图的01分界点所在的位置,即可估算出数据集的规模大小。当第一个0出现在草图第k位时,对象数据集中不同对象数量的估算值n=1.29﹒2k
发明内容
发明目的:估算查询结果大小是数据库系统中查询优化器的关键支撑技术,同时也是解决大规模移动对象数据库管理中聚集查询重要技术。因此,该问题引起许多研究人员的关注,不断提高估算查询结果的精度和速度。本发明的目的是提出一种高效的能去除重复的数据查询估算方法。
技术方案:一种估算查询结果大小的方法,它包括下列步骤:(1)构建数据对象标识到布尔矩阵元素的一对一映射关系,当某一对象存在时,数据记录模型所表示的布尔矩阵与对象标识相对应的矩阵元素记为真值“1”,反之则为假值“0”;(2)构建用于表达布尔矩阵和真值元素计数的数据记录模型结构及其算法;(3)建立模型数据:读入原始数据并在数据记录模型中插入相应记录;(4)将查询的数据标识的值范围换算成布尔矩阵的列范围,累加查询范围内矩阵列的真值元素总数,得出查询结果大小的估算值。
本发明用于估算查询结果大小的数据对象可视为一个多元组O=(OID,A1,A2...),其中,OID为对象标识,A1,A2...为数据对象的多个属性值。
本发明使用布尔矩阵记录数据对象是否存在于数据库中,矩阵的每一元素(由矩阵行列号表示)与所代表的数据对象标识具有唯一映射关系,当数据库中存在某一数据对象时,与该数据对象标识相对应的矩阵元素赋值为1,成为真值元素,反之,该元素赋值为0,成为假值元素。在本发明技术方案中,只需记录存在的数据对象个数,即在最终算法中只统计矩阵中的为1的元素,同时由于矩阵中存在大量的0元,具有稀疏性,因此可采取链表结构保存该矩阵的真值元素,数据对象记录模型的具体方案如下:
引入一个数组IROW,用于表示矩阵中真值元素的行号,IROW(i)为第i个真值元素的行号,这里,i=1,2,…,NZ,NZ为真值元素的个数;
为了便于插入数据,引入链指针数组LNXT,LNXT(i)表示第i个真值元素的下一个真值元素的位置,每列真值元素,均以链指针LNXT连起来,每列最后一个真值元素,链指针为0,表示链的结束,对于布尔矩阵的每一个真值元素,表中有一个二元组,即[IROW(行号),LNXT(下一个真值元素的位置)];
引入一个指针数组ICFR,用于表示矩阵中真值元素的列号,ICFR(j)表示第j列第一个真值元素在数组IROW中的位置,这里j=1,2,…,N,N为矩阵的列数,如果第j列没有真值元素,则置ICFR(j)=0,同时用数组ICNZ记录各列真值元素的个数;
最后,用一个指针LF指向链表空单元的首位置。
模型数据建立方法用于初始化数据对象记录模型、读取数据库并根据数据记录的标识在布尔矩阵中插入对应的真值元素,模型数据可以在数据库插入记录的同时建立,也可以单独建立,可以方便的追加数据。
由于数据记录模型采用布尔矩阵记录数据对象的存在,首先应建立数据对象标识与矩阵行列号的唯一映射关系,如哈希法,使得:i为矩阵行号,j为矩阵列号,i,j=1,2,3…;
所述的模型数据建立方法如下:
步骤1:将IROW、ICFR、ICNZ全清成零,置LF=1,将LNXT顺次存2、3、...、MM、0(即将所有单元当作空单元,并将这些单元按自然顺序拉成链)。
步骤2:读取目标数据,获取其对象标识;
步骤3:根据所读取数据的对象标识,计算其所对应的矩阵行列号(i,j),检查数据记录模型中布尔矩阵所对应的元素Mij是否为真值元素,若是,则直接返回到步骤2处理下一数据;若不存在,则进入步骤4;
步骤4:在布尔矩阵中插入所对应的真值元素Mij,然后返回到步骤2继续处理下一数据。
上述模型数据建立方法中需要检查Mij是否真值元素,即根据行列坐标(i,j)查找矩阵模型中的元素,其方法如下:
步骤1:读取ICFR(j),判断ICFR(j)的值;
步骤2:如果ICFR(j)=0,则表示第j列无真值元素,即Mij为零元,查找结束;如果ICFR(j)=x,x≠0,则表示第j列首个真值元素位置为x,其行号为IROW(x),此元素的下一真值元素位置为LNXT(x),执行步骤3;
步骤3:如果IROW(x)=i,则Mij为真值元素;如果IROW(x)>i,则Mij为零元;如果IROW(x)<i,则根据链指针数组搜索下一真值元素位置LNXT(x),令x=LNXT(x),继续执行步骤3。
上述模型数据建立方法中插入真值元素Mij的方法如下:
先找到第j列首元位置,若为0,表示此列无真值元素,应该插入j列首元。否则,表示j列有真值元素,因而沿列链表找有无行号为i的元,若有,表示矩阵中此元素已为真值元素,不必插入;若无,就应把Mij插到j列中行号小于i和行号大于i的两个元之间,用指针L存放当前元的位置,用指针LA存放前一个元的位置。LA和L这两个指针始终保持先行后继关系。插入时,首先检查空单元链首指针LF是否为0,若为0,则表示空单元已用完,应增加MM的值。若LF不为0,就表示有空单元,应取此空单元存放插入元,然后修改指针。这时应该注意,若LA=0,表示此真值元素插入j列后成为该列首元,所以应修改ICFR(J),否则应修改LNXT(LA);接着修改空单元链首指针LF,及后一个元指针LNXT(LN)。然后可以将行号存入IROW(LN),同时将j列真值元素个数ICNZ(J)加1。
所述的查询结果估算方法如下:
设所需估算查询范围的数据标识OID的值范围为[id1,id2],则估算步骤如下:
步骤1:根据所查询数据的关键属性id的值范围为[id1,id2]计算与其相对应的数据记录模型中布尔矩阵的列范围[j1,j2];
步骤2:将所述数据记录模型中数组ICNZ中与步骤1所计算的列范围所对应的元素值累加,即
注意到,将查询范围换算到数据记录模型的列范围时,所统计的目标数据对象范围存在变大的可能,因此本方法的计算结果为估算值。
本发明与现有技术相比,其有益效果是:
(1)本发明采用布尔矩阵记录数据量,特征属性值相同的数据不论出现一次还是多次,在布尔矩阵中都同样标记为真值元素,因此可以自动排除重复数据记录,大大提高估算精度;
(2)本发明针对布尔矩阵的数据稀疏性,采用链表构建数据记录模型,占用存储空间小,存储代价低。
(3)本发明使用数组同步记录布尔矩阵中每列的真值元素数量,估算查询结果时,只需访问数据记录模型中的数组,查询速度快,估算效率高。
附图说明
图1为初始状态的数据记录模型结构;
图2为在数据记录模型中插入一个真值元素的操作流程;
图3为数据记录模型建立的流程图;
图4为根据表1示例原始数据建立的估算数据记录模型;
图5为本发明数据处理流程示意图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如附图1所示,引入一个数组IROW,用于表示矩阵中真值元素的行号,IROW(i)为第i个真值元素的行号,这里,i=1,2,…,NZ,NZ为真值元素的个数;
为了便于插入数据,引入链指针数组LNXT,LNXT(i)表示第i个真值元素的下一个真值元素的位置,每列真值元素,均以链指针LNXT连起来,每列最后一个真值元素,链指针为0,表示链的结束,对于布尔矩阵的每一个真值元素,表中有一个二元组,即[IROW(行号),LNXT(下一个真值元素的位置)];
引入一个指针数组ICFR,用于表示矩阵中真值元素的列号,ICFR(j)表示第j列第一个真值元素在数组IROW中的位置,这里j=1,2,…,N,N为矩阵的列数,如果第j列没有真值元素,则置ICFR(j)=0,同时用数组ICNZ记录各列真值元素的个数;
最后,用一个指针LF指向链表空单元的首位置。
模型数据建立方法用于初始化数据对象记录模型、读取数据库并根据数据记录的标识在布尔矩阵中插入对应的真值元素,模型数据可以在数据库插入记录的同时建立,也可以单独建立,可以方便的追加数据。
由于数据记录模型采用布尔矩阵记录数据对象的存在,首先应建立数据对象标识与矩阵行列号的唯一映射关系,如哈希法,使得:i为矩阵行号,j为矩阵列号,i,j=1,2,3…;
所述的模型数据建立方法如下:
步骤1:将IROW、ICFR、ICNZ全清成零,置LF=1,将LNXT顺次存2、3、...、MM、0(即将所有单元当作空单元,并将这些单元按自然顺序拉成链,如图1所示状态)。
步骤2:读取目标数据,获取其对象标识;
步骤3:根据所读取数据的对象标识,计算其所对应的矩阵行列号(i,j),检查数据记录模型中布尔矩阵所对应的元素Mij是否为真值元素,若是,则直接返回到步骤2处理下一数据;若不存在,则进入步骤4;
步骤4:在布尔矩阵中插入所对应的真值元素Mij,然后返回到步骤2继续处理下一数据。
上述模型数据建立方法中需要检查Mij是否真值元素,即根据行列坐标(i,j)查找矩阵模型中的元素,其方法如下:
步骤1:读取ICFR(j),判断ICFR(j)的值;
步骤2:如果ICFR(j)=0,则表示第j列无真值元素,即Mij为零元,查找结束;如果ICFR(j)=x,x≠0,则表示第j列首个真值元素位置为x,其行号为IROW(x),此元素的下一真值元素位置为LNXT(x),执行步骤3;
步骤3:如果IROW(x)=i,则Mij为真值元素;如果IROW(x)>i,则Mij为零元;如果IROW(x)<i,则根据链指针数组搜索下一真值元素位置LNXT(x),令x=LNXT(x),继续执行步骤3。
上述模型数据建立方法中插入真值元素Mij的方法如下:
如图2所示,先找到第j列首元位置,若为0,表示此列无真值元素,应该插入j列首元。否则,表示j列有真值元素,因而沿列链表找有无行号为i的元,若有,表示矩阵中此元素已为真值元素,不必插入;若无,就应把Mij插到j列中行号小于i和行号大于i的两个元之间插入,用指针L存放当前元的位置,用指针LA存放前一个元的位置。LA和L这两个指针始终保持先行后继关系。插入时,首先检查空单元链首指针LF是否为0,若为0,则表示空单元已用完,应增加MM的值。若LF不为0,就表示有空单元,应取此空单元存放插入元,然后修改指针。这时应该注意,若LA=0,表示此真值元素插入j列后成为该列首元,所以应修改ICFR(J),否则应修改LNXT(LA);接着修改空单元链首指针LF,及后一个元指针LNXT(LN)。然后可以将行号存入IROW(LN),同时将j列真值元素个数ICNZ(J)加1。
查询结果估算方法如下:
设所需估算查询范围的数据标识OID的值范围为[id1,id2],则估算步骤如下:
步骤1:根据所查询数据的关键属性id的值范围为[id1,id2]计算与其相对应的数据记录模型中布尔矩阵的列范围[j1,j2];
步骤2:将所述数据记录模型中数组ICNZ中与步骤1所计算的列范围所对应的元素值累加,即
设R是数据库中的一个关系实例,R的对象标识为11位数字的手机号码A,A的值域是整数,设R中所有元组在A属性上的取值介于Min和Max之间(含Min和Max)。通过适当函数取手机号第3位映射为矩阵列号,取手机号最末位映射为矩阵行号;
第一步,建立基于布尔矩阵的数据记录模型,将A映射到矩阵的行列号:
使得:i为矩阵行号,j为矩阵列号,i,j=1,2,3…;矩阵的每列j与A的子区间对应。
表1 示例原始数据对象及其与矩阵元素映射表
序号 对象标识A 属性组 行号i 列号j 矩阵元素
1 13700100001 1 7 M17
2 13100100006 6 1 M61
3 13300100001 1 3 M13
4 13800100007 7 8 M78
5 13400100004 4 4 M44
6 13200100005 5 2 M52
7 13400100006 6 4 M64
8 13300100001 1 3 M13
9 13700100002 2 7 M27
10 13100100001 1 1 M11
11 13500100007 7 5 M75
12 13800100002 2 8 M28
13 13700100002 2 7 M27
14 13600100005 5 6 M56
15 13400100002 2 4 M24
16 13600100008 8 6 M86
根据数据记录模型所要构建的布尔矩阵M如下:
第二步,读取数据库记录,根据读入的原始数据填充数据记录模型;
在本例中,按表1中的序号顺序依次读入原始数据,即在数据记录模型中依次插入M17、M61、M13、M78、M44、M52、M64、M27、M11、M75、M28、M56、M24、M86等非零元,按照附图3的流程,建立起来的链表如图4所示。表1中第9行与第13行数据重复,第3行与第8行数据重复,在最终的数据模型中只记录一次。
如需估算表1中属性A的值前三位为134的数据记录个数,即所对应数据记录模型中列号为4的真值元素总数,如图4所示,取ICNZ(4)=3。
如估算表1中属性A的值前三位为131-134之间的数据记录个数,即所对应数据记录模型中列号为1、2、3、4的真值元素总数,即ICNZ(1)+ICNZ(2)+ICNZ(3)+ICNZ(4)=2+1+1+3=7。
上述估算查询结果大小的方法中关键数据处理流程如图5所示。
当数据查询范围与数据记录模型中的列划分范围不一致时,采取近似估计,即以查询范围所涉及到的列范围区间内的记录汇总值为查询估算值。
如需估算表1中属性A的值为13100100002和13400100004之间的数据记录个数,即所对应稀疏矩阵中列号为1、2、3、4的真值元素总数,即ICNZ(1)+ICNZ(2)+ICNZ(3)+ICNZ(4)=2+1+1+3=7,本例中实际查询数据记录个数为6,估算误差来源于矩阵列范围所包含的元素范围要大于目标查询的元素范围,通过调整数据记录模型减少布尔矩阵的行数和适当增加布尔矩阵的列宽或数量可以减少估算误差。

Claims (4)

1.一种估算查询结果大小的方法,其特征在于,包括下列步骤:(1)构建数据对象标识到布尔矩阵元素的一对一映射关系;(2)构建用于表达布尔矩阵和真值元素计数的数据记录模型结构及其算法;(3)建立模型数据:读入原始数据并在数据记录模型中插入相应记录;(4)将查询的数据标识的值范围换算成布尔矩阵的列范围,累加查询范围内矩阵列的真值元素总数,得出查询结果大小的估算值;
所述的建立模型数据过程具有数据去重复功能,当读到重复数据时,不需对模型数据进行写操作。
2.如权利要求 1所述的估算查询结果大小的方法,其特征在于,所述的布尔矩阵元素与数据对象标识映射关系是通过哈希法建立的,i为矩阵行号,j为矩阵列号。
3.如权利要求 1所述的估算查询结果大小的方法,其特征在于,所述的数据记录模型采用链表结构表示布尔矩阵,同时采用数组记录布尔矩阵各列真值元素的个数。
4.如权利要求 1所述的估算查询结果大小的方法,其特征在于,所述的累加查询范围内矩阵列的真值元素总数,是通过累加列记录数组元素值获得,不需读取布尔矩阵。
CN201510111127.5A 2015-03-13 2015-03-13 一种估算查询结果大小的方法 Active CN104731889B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510111127.5A CN104731889B (zh) 2015-03-13 2015-03-13 一种估算查询结果大小的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510111127.5A CN104731889B (zh) 2015-03-13 2015-03-13 一种估算查询结果大小的方法

Publications (2)

Publication Number Publication Date
CN104731889A CN104731889A (zh) 2015-06-24
CN104731889B true CN104731889B (zh) 2018-02-06

Family

ID=53455776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510111127.5A Active CN104731889B (zh) 2015-03-13 2015-03-13 一种估算查询结果大小的方法

Country Status (1)

Country Link
CN (1) CN104731889B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608135B (zh) * 2015-12-18 2020-03-31 Tcl集团股份有限公司 一种基于Apriori算法的数据挖掘方法及系统
CN106940693B (zh) * 2017-02-28 2020-09-01 广东智源信息技术有限公司 实验室原始记录单结构化处理方法
CN107193977A (zh) * 2017-05-26 2017-09-22 刘伟 数据查找方法、人工智能系统、图像处理系统、数据库、搜索引擎、通讯系统、计算机应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101826076A (zh) * 2009-01-14 2010-09-08 中国科学院地理科学与资源研究所 一种基于cd直方图的空间查询选择性估计方法
CN101826098A (zh) * 2010-02-03 2010-09-08 中国科学院地理科学与资源研究所 一种基于ab直方图的空间查询选择率估计方法
CN101866358A (zh) * 2010-06-12 2010-10-20 中国科学院计算技术研究所 一种多维区间查询方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020103793A1 (en) * 2000-08-02 2002-08-01 Daphne Koller Method and apparatus for learning probabilistic relational models having attribute and link uncertainty and for performing selectivity estimation using probabilistic relational models
US7389283B2 (en) * 2004-12-07 2008-06-17 International Business Machines Corporation Method for determining an optimal grid index specification for multidimensional data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101826076A (zh) * 2009-01-14 2010-09-08 中国科学院地理科学与资源研究所 一种基于cd直方图的空间查询选择性估计方法
CN101826098A (zh) * 2010-02-03 2010-09-08 中国科学院地理科学与资源研究所 一种基于ab直方图的空间查询选择率估计方法
CN101866358A (zh) * 2010-06-12 2010-10-20 中国科学院计算技术研究所 一种多维区间查询方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"一种新的用于估算查询结果大小的直方图方法";马勇 等;《计算机工程与应用》;20040430;第40卷(第5期);第88-90页 *
"劣质数据库上查询估计技术的研究";杨龙;《中国优秀硕士学位论文全文数据库 信息科技辑》;20140315(第3期);第I138-502页 *
"数据库查询中结果大小估计的研究";王于同 等;《杭州电子工业学院学报》;20040108;第21卷(第3期);第1-5页 *

Also Published As

Publication number Publication date
CN104731889A (zh) 2015-06-24

Similar Documents

Publication Publication Date Title
CN102915347B (zh) 一种分布式数据流聚类方法及系统
CN102722531B (zh) 一种云环境中基于分片位图索引的查询方法
CN106933833B (zh) 一种基于空间索引技术的位置信息快速查询方法
CN107291847A (zh) 一种基于MapReduce的大规模数据分布式聚类处理方法
CN103140840B (zh) 数据管理的方法及装置
CN106021541A (zh) 区分准标识符属性的二次k-匿名隐私保护算法
CN110023925A (zh) 生成、访问和显示沿袭元数据
CN106897374B (zh) 一种基于轨迹大数据最近邻查询的个性化推荐方法
CN104112005B (zh) 分布式海量指纹识别方法
CN113918733B (zh) 一种获取目标知识图谱的数据处理系统
CN104731889B (zh) 一种估算查询结果大小的方法
CN107145519B (zh) 一种基于超图的图像检索与标注方法
CN107103032A (zh) 一种分布式环境下避免全局排序的海量数据分页查询方法
CN103345496A (zh) 多媒体信息检索方法和系统
CN107145523A (zh) 基于迭代匹配的大型异构知识库对齐方法
CN108399268B (zh) 一种基于博弈论的增量式异构图聚类方法
WO2019056569A1 (zh) 滑动窗口下基于位置top-k关键词查询的优先查询算法及系统
CN106055652A (zh) 一种基于模式和实例的数据库匹配方法及系统
WO2019056570A1 (zh) 滑动窗口下基于位置top-k关键词查询的快速索引方法及系统
CN106599190A (zh) 基于云计算的动态Skyline查询方法
CN106649731A (zh) 一种基于大规模属性网络的节点相似性搜索方法
CN105183792A (zh) 一种基于局部敏感哈希的分布式快速文本分类方法
CN104199821B (zh) 一种基于概要结构的流数据立方体构建方法
Abbasifard et al. Efficient indexing for past and current position of moving objects on road networks
CN102722557B (zh) 一种相同数据块的自适应识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant