CN112988754A - 一种面向数据集成的快速查询方法 - Google Patents

一种面向数据集成的快速查询方法 Download PDF

Info

Publication number
CN112988754A
CN112988754A CN202110379374.9A CN202110379374A CN112988754A CN 112988754 A CN112988754 A CN 112988754A CN 202110379374 A CN202110379374 A CN 202110379374A CN 112988754 A CN112988754 A CN 112988754A
Authority
CN
China
Prior art keywords
data
hash
bitem
code
data packet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110379374.9A
Other languages
English (en)
Other versions
CN112988754B (zh
Inventor
李勇
钟宇
王璇
陶冶
罗剑
戴书球
周琪森
谢勤列
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Smart City Science And Technology Research Institute Co ltd
CCTEG Chongqing Research Institute Co Ltd
Original Assignee
Chongqing Smart City Science And Technology Research Institute Co ltd
CCTEG Chongqing Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Smart City Science And Technology Research Institute Co ltd, CCTEG Chongqing Research Institute Co Ltd filed Critical Chongqing Smart City Science And Technology Research Institute Co ltd
Priority to CN202110379374.9A priority Critical patent/CN112988754B/zh
Publication of CN112988754A publication Critical patent/CN112988754A/zh
Application granted granted Critical
Publication of CN112988754B publication Critical patent/CN112988754B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2272Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于信息检索技术领域,由于涉及一种面向数据集成的快速查询方法,包括:S1、使用局部敏感性质哈希方法计算待查询数据对象关键字Code的哈希值HV;S2、使用HV对数据分组对象表的固定长度N取模,获取数据对象所在的数据分组对象表的序号gIndex[0,N‑1],使用数据字典根据key值快速取得数据分组对象gItem;S3、在gItem中判断是否存在key值为HV的对象,存在则转到S4,不存在则转到S7;S4、使用数据字典根据key值快速取得HV对应的哈希桶对象bItem;S5、在哈希桶对象bItem中查询是否包含关键字为Code的数据对象,存在则转到S6,不存在则转到S7;S6、返回在哈希桶bItem中唯一匹配的关键字为Code的数据对象;S7、返回空。本方法能够解决当前数据查询技术的技术瓶颈。

Description

一种面向数据集成的快速查询方法
技术领域
本发明属于信息检索技术领域,由于涉及一种面向数据集成的快速查询方法。
背景技术
随着物联网技术的发展,物联网系统中需要存储和管理的数据规模也变得越来越大,面对规模庞大的数据量,如何高效的处理数据已经成为了一个重要的研究方向。
目前,国内外的专家学者提出了大量的优化算法,如用于商业系统中的动态编程法,智能领域中的蚁群算法、粒子群算法等。在面向海量数据检索时的检索方式主要有两个方向,基于树结构的检索方法和基于哈希的检索方法。其中,相较于树结构的检索而言,哈希检索方法对维度不敏感,并可以通过优化后的哈希编码达到降维的效果,因此在查询速度和内存占用上更有优势。
例如,公开号为CN102541968A的发明专利就公开了一种索引方法,包括:对接收的关键字进行哈希运算,以从哈希桶表中确定对应的哈希桶,并从哈希桶中获得哈希节点指针;利用哈希节点指针的前预定位从标识信息列表中确定对应的哈希节点数据块识别信息;利用哈希节点指针的后预定位作为偏移量,从哈希节点数据块识别信息对应的哈希节点数据块中获取对应的哈希节点。该发明提供了一种间接寻址的哈希索引方法,可节省索引的空间,提高内存的使用效率。又如,公开号为CN103279509A的发明专利公开了一种采用动态查询语言的快速查询方法,采用了一种领域对象语义建模与XQL动态查询语言数据访问方式实现灵活、快速查询的方法。该专利摈弃了原来查询的多层、硬编码实现方式,而是通过查询引擎加配置方式来实现用户的灵活、高效、快捷的查询要求。
但是,包括上述专利在内的现有技术,都侧重于内存使用效率和优化查询引擎以实现快速查询,但对于数据集成处理中的数据快速查询过程的优化却没有涉及。但内存使用效率及查询引擎的优化比较容易达到技术瓶颈,随着物联网数据规模的扩大,现有技术的技术瓶颈很容易造成数据查询效率的低下。
因此,需要一种面向数据集成的快速查询方法,能够解决当前数据查询技术的技术瓶颈,面对海量数据时也能够有效的提高查询效率。
发明内容
本发明的目的在于,提供一种面向数据集成的快速查询方法,能够解决当前数据查询技术的技术瓶颈,面对海量数据时也能够有效的提高查询效率。
为了解决上述技术问题,本申请提供如下技术方案:
一种面向数据集成的快速查询方法,包括:
S1、使用局部敏感性质哈希方法计算待查询数据对象关键字Code的哈希值HV,降低哈西值冲突的概率;
S2、使用计算所得HV对数据分组对象表的固定长度N取模,获取数据对象所在的数据分组对象表的序号gIndex[0,N-1],使用数据字典根据key值快速取得数据分组对象gItem;
S3、在gItem中判断是否存在key值为HV的对象,存在则转到S4,不存在则转到S7;
S4、使用数据字典根据key值快速取得HV对应的哈希桶对象bItem;
S5、在哈希桶对象bItem中查询是否包含关键字为Code的数据对象,存在则转到S6,不存在则转到S7;
S6、返回在哈希桶bItem中唯一匹配的关键字为Code的数据对象;
S7、返回空。
基础方案原理及有益效果如下:
本申请针对物联网海量数据集成中查询的效率低下问题,通过引入局部敏感性质哈希和增强哈希桶改进了查询方法,以分布式哈希索引和数据字典为基础提出了快速查询的数据模型和流程,极大地提高查询效率,并有效地解决数据集成的技术瓶颈问题。
使用本方法,能够解决当前数据查询技术的技术瓶颈,面对海量数据时也能够有效的提高查询效率。
进一步,数据对象的关键字Code为字符串类型。是数据对象唯一标识。
进一步,数据分组对象的存储模型创建如下:建立一个存储元素长度固定为N的数据字典,用于存储数据分组对象PointHashGroup,其Key的类型为整形;在数据分组对象中定义一个存储元素不固定的数据字典,用于存储哈希桶对象,其Key的类型为整形;在哈希桶中定义一个存储元素不固定长度的列表,作为数据对象分组表,用于存储数据对象。
进一步,当一个数据对象需要插入到数据分组对象表时,先获取其关键字Code的哈希值HV;用HV对数据分组对象表长度N求余数,求得其所属数据分组对象的序号gIndex[0,N-1],及其对应数据分组对象gItem;在gItem中根据HV查找对应哈希桶bItem,如果不存在则创建哈希桶bItem;如果bItem中不存在关键字为Code的对象,则将数据对象插入到bItem的数据对象分组表的末尾。
进一步,当一个数据对象需要插入到数据分组对象表时,如果bItem中存在关键字为Code的对象,则放弃插入。
进一步,S1中,使用局部敏感性质哈希方法计算关键字Code的哈希值HV,并结合使用哈希桶存储不可避免的哈希桶冲突对象。
这样的处理方式,可尽可能的减少哈希桶冲突概率。
进一步,S1的详细计算步骤如下:
步骤1:假设V为一个特征点向量,构造一组服从稳态分布的随机变量集合a和一个在[0,W]范围内的随机实数b,其中W为一个设定的较大实数。
Figure BDA0003012323070000031
步骤2:根据式(1)计算向量V的哈希初始值Ha,b(V),将映射后的哈希值随机实数r′点乘,并对较大的prime常数取模,从而得到哈希值h。
Figure BDA0003012323070000032
通过上述步骤,可实现对数据关键字的哈希值计算,在此基础上,将分布式索引架构设置为按组将数据对象存储到多个数据分组中,每个数据对象的哈希索引计算公式如下:
I(V)=h mod size (3);
如式(3)所示,将哈希值h按数据分组的节点个数size取模,然后根据结果I(V)∈[0,Size-1]将特征点V分配到对应的数据分组中。
有益效果:本方法基于局部敏感性质哈希和哈希桶方法,结合使用数据字典,设计了快速查询数据模型和了查询流程,从而提出了一种面向物联网数据集成的快速查询方法,实现了在106级数据量时执行1000次查询的时间在毫秒级,大幅提升了单线程解析处理数据的性能。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例的数据分组模型示意图。
具体实施方式
下面通过具体实施方式进一步详细说明:
如图1、图2所示,为了解决上述技术问题,本申请提供如下技术方案:
一种面向数据集成的快速查询方法,包括:
S1、使用局部敏感性质哈希方法计算待查询数据对象关键字Code的哈希值HV;降低哈西值冲突的概率。并结合使用哈希桶存储不可避免的哈希桶冲突对象,具体如下:
步骤1:假设V为一个特征点向量,构造一组服从稳态分布的随机变量集合a和一个在[0,W]范围内的随机实数b,其中W为一个设定的较大实数。
Figure BDA0003012323070000041
步骤2:根据式(1)计算向量V的哈希初始值Ha,b(V),将映射后的哈希值随机实数r′点乘,并对较大的prime常数取模,从而得到哈希值h。
Figure BDA0003012323070000042
通过上述步骤,可实现对数据关键字的哈希值计算,在此基础上,将分布式索引架构设置为按组将数据对象存储到多个数据分组中,每个数据对象的哈希索引计算公式如下:
I(V)=h mod size (3);
如式(3)所示,将哈希值h按数据分组的节点个数size取模,然后根据结果I(V)∈[0,Size-1]将特征点V分配到对应的数据分组中。
S2、使用计算所得HV对数据分组对象表的固定长度N取模,获取数据对象所在的数据分组对象表的序号gIndex[0,N-1],使用数据字典根据key值快速取得数据分组对象gItem;
S3、在gItem中判断是否存在key值为HV的对象,存在则转到S4,不存在则转到S7;
S4、使用数据字典根据key值快速取得HV对应的哈希桶对象bItem;
S5、在哈希桶对象bItem中查询是否包含关键字为Code的数据对象,存在则转到S6,不存在则转到S7;
S6、返回在哈希桶bItem中唯一匹配的关键字为Code的数据对象;
S7、返回空。
其中,数据对象的关键字Code为字符串类型,是数据对象唯一标识。数据分组对象的存储模型创建如下:
建立一个存储元素长度固定为N的数据字典,用于存储数据分组对象PointHashGroup,其Key的类型为整形;在数据分组对象中定义一个存储元素不固定的数据字典,用于存储哈希桶对象,其Key的类型为整形;在哈希桶中定义一个存储元素不固定长度的列表,作为数据对象分组表,用于存储数据对象。
当一个数据对象需要插入到数据分组对象表时,先获取其关键字Code的哈希值HV;用HV对数据分组对象表长度N求余数,求得其所属数据分组对象的序号gIndex[0,N-1],及其对应数据分组对象gItem;在gItem中根据HV查找对应哈希桶bItem,如果不存在则创建哈希桶bItem;如果bItem中不存在关键字为Code的对象,则将数据对象插入到bItem的数据对象分组表的末尾;如果bItem中存在关键字为Code的对象,则放弃插入。
其中,N值可根据业务场景的需要具体设定。
本申请针对物联网海量数据集成中查询的效率低下问题,通过引入局部敏感性质哈希和增强哈希桶改进了查询方法,以分布式哈希索引和数据字典为基础提出了快速查询的数据模型和流程,并结合使用数据字典,设计了快速查询数据模型和了查询流程,从而提出了一种面向物联网数据集成的快速查询方法,实现了在106级数据量时执行1000次查询的时间在毫秒级,大幅提升了单线程解析处理数据的性能。
极大地提高查询效率,并有效地解决数据集成的技术瓶颈问题。使用本方法,能够解决当前数据查询技术的技术瓶颈,面对海量数据时也能够有效的提高查询效率。
以上的仅是本发明的实施例,该发明不限于此实施案例涉及的领域,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

Claims (7)

1.一种面向数据集成的快速查询方法,其特征在于,包括:
S1、使用局部敏感性质哈希方法计算待查询数据对象关键字Code的哈希值HV,降低哈西值冲突的概率;
S2、使用计算所得HV对数据分组对象表的固定长度N取模,获取数据对象所在的数据分组对象表的序号gIndex[0,N-1],使用数据字典根据key值快速取得数据分组对象gItem;
S3、在gItem中判断是否存在key值为HV的对象,存在则转到S4,不存在则转到S7;
S4、使用数据字典根据key值快速取得HV对应的哈希桶对象bItem;
S5、在哈希桶对象bItem中查询是否包含关键字为Code的数据对象,存在则转到S6,不存在则转到S7;
S6、返回在哈希桶bItem中唯一匹配的关键字为Code的数据对象;
S7、返回空。
2.根据权利要求1所述的面向数据集成的快速查询方法,其特征在于:数据对象的关键字Code为字符串类型。
3.根据权利要求2所述的面向数据集成的快速查询方法,其特征在于:数据分组对象的存储模型创建如下:建立一个存储元素长度固定为N的数据字典,用于存储数据分组对象PointHashGroup,其Key的类型为整形;在数据分组对象中定义一个存储元素不固定的数据字典,用于存储哈希桶对象,其Key的类型为整形;在哈希桶中定义一个存储元素不固定长度的列表,作为数据对象分组表,用于存储数据对象。
4.根据权利要求3所述的面向数据集成的快速查询方法,其特征在于:当一个数据对象需要插入到数据分组对象表时,先获取其关键字Code的哈希值HV;用HV对数据分组对象表长度N求余数,求得其所属数据分组对象的序号gIndex[0,N-1],及其对应数据分组对象gItem;在gItem中根据HV查找对应哈希桶bItem,如果不存在则创建哈希桶bItem;如果bItem中不存在关键字为Code的对象,则将数据对象插入到bItem的数据对象分组表的末尾。
5.根据权利要求4所述的面向数据集成的快速查询方法,其特征在于:当一个数据对象需要插入到数据分组对象表时,如果bItem中存在关键字为Code的对象,则放弃插入。
6.根据权利要求5所述的面向数据集成的快速查询方法,其特征在于:S1中,使用局部敏感性质哈希方法计算关键字Code的哈希值HV,并结合使用哈希桶存储不可避免的哈希桶冲突对象。
7.根据权利要求6所述的面向数据集成的快速查询方法,其特征在于:S1的详细计算步骤如下:
步骤1:假设V为一个特征点向量,构造一组服从稳态分布的随机变量集合a和一个在[0,W]范围内的随机实数b,其中W为一个设定的较大实数。
Figure FDA0003012323060000021
步骤2:根据式(1)计算向量V的哈希初始值Ha,b(V),将映射后的哈希值随机实数r′点乘,并对较大的prime常数取模,从而得到哈希值h。
Figure FDA0003012323060000022
通过上述步骤,可实现对数据关键字的哈希值计算,在此基础上,将分布式索引架构设置为按组将数据对象存储到多个数据分组中,每个数据对象的哈希索引计算公式如下:
I(V)=h mod size (3);
如式(3)所示,将哈希值h按数据分组的节点个数size取模,然后根据结果I(V)∈[0,Size-1]将特征点V分配到对应的数据分组中。
CN202110379374.9A 2021-04-08 2021-04-08 一种面向数据集成的快速查询方法 Active CN112988754B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110379374.9A CN112988754B (zh) 2021-04-08 2021-04-08 一种面向数据集成的快速查询方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110379374.9A CN112988754B (zh) 2021-04-08 2021-04-08 一种面向数据集成的快速查询方法

Publications (2)

Publication Number Publication Date
CN112988754A true CN112988754A (zh) 2021-06-18
CN112988754B CN112988754B (zh) 2023-07-14

Family

ID=76339556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110379374.9A Active CN112988754B (zh) 2021-04-08 2021-04-08 一种面向数据集成的快速查询方法

Country Status (1)

Country Link
CN (1) CN112988754B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03174652A (ja) * 1989-07-24 1991-07-29 Hitachi Ltd データ検索方法および装置
WO2001004802A1 (en) * 1999-07-12 2001-01-18 Yahoo, Inc. System and method for personalized information filtering and alert generation
CN101692651A (zh) * 2009-09-27 2010-04-07 中兴通讯股份有限公司 一种哈希查找表的方法和装置
CN101753445A (zh) * 2009-12-23 2010-06-23 重庆邮电大学 基于关键字分解Hash算法的快速流分类方法
US20100250504A1 (en) * 2009-03-24 2010-09-30 Microsoft Corporation Dynamic integrated database index management
CN101916302A (zh) * 2010-09-01 2010-12-15 中国地质大学(武汉) 基于哈希表的三维空间数据自适应缓存管理方法及系统
CN103473248A (zh) * 2012-12-17 2013-12-25 东北大学 一种路网环境下的连续移动k近邻查询方法
CN104391908A (zh) * 2014-11-17 2015-03-04 南京邮电大学 一种图上基于局部敏感哈希的多关键字索引方法
CN104769555A (zh) * 2012-06-18 2015-07-08 艾克特菲欧有限公司 增强型数据管理虚拟化系统
CN106033420A (zh) * 2015-03-11 2016-10-19 杭州华三通信技术有限公司 哈希表的处理方法及装置
CN107515901A (zh) * 2017-07-24 2017-12-26 中国科学院信息工程研究所 一种链式日志存储结构及其哈希索引结构、数据操作方法及服务器、介质
US20180089188A1 (en) * 2016-09-26 2018-03-29 Splunk Inc. Hash bucketing of data
CN112131200A (zh) * 2020-09-15 2020-12-25 北京精一强远科技有限公司 一种基于cifs共享的分布式海量文件查询系统和方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03174652A (ja) * 1989-07-24 1991-07-29 Hitachi Ltd データ検索方法および装置
WO2001004802A1 (en) * 1999-07-12 2001-01-18 Yahoo, Inc. System and method for personalized information filtering and alert generation
US20100250504A1 (en) * 2009-03-24 2010-09-30 Microsoft Corporation Dynamic integrated database index management
CN101692651A (zh) * 2009-09-27 2010-04-07 中兴通讯股份有限公司 一种哈希查找表的方法和装置
CN101753445A (zh) * 2009-12-23 2010-06-23 重庆邮电大学 基于关键字分解Hash算法的快速流分类方法
CN101916302A (zh) * 2010-09-01 2010-12-15 中国地质大学(武汉) 基于哈希表的三维空间数据自适应缓存管理方法及系统
CN104769555A (zh) * 2012-06-18 2015-07-08 艾克特菲欧有限公司 增强型数据管理虚拟化系统
CN103473248A (zh) * 2012-12-17 2013-12-25 东北大学 一种路网环境下的连续移动k近邻查询方法
CN104391908A (zh) * 2014-11-17 2015-03-04 南京邮电大学 一种图上基于局部敏感哈希的多关键字索引方法
CN106033420A (zh) * 2015-03-11 2016-10-19 杭州华三通信技术有限公司 哈希表的处理方法及装置
US20180089188A1 (en) * 2016-09-26 2018-03-29 Splunk Inc. Hash bucketing of data
CN107515901A (zh) * 2017-07-24 2017-12-26 中国科学院信息工程研究所 一种链式日志存储结构及其哈希索引结构、数据操作方法及服务器、介质
CN112131200A (zh) * 2020-09-15 2020-12-25 北京精一强远科技有限公司 一种基于cifs共享的分布式海量文件查询系统和方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
M. CHUAH 等: "Privacy-aware bedtree based solution for fuzzy multi-keyword search over encrypted data", 《2011 31ST INTERNATIONAL CONFERENCE ON DISTRIBUTED COMPUTING SYSTEMS WORKSHOPS》, pages 273 - 281 *
QISEN ZHOU 等: "Improved query model for rapidly query based on distributed hash index", 《2020 IEEE 3RD INTERNATIONAL CONFERENCE OF SAFE PRODUCTION AND INFORMATIZATION》 *
QISEN ZHOU 等: "Improved query model for rapidly query based on distributed hash index", 《2020 IEEE 3RD INTERNATIONAL CONFERENCE OF SAFE PRODUCTION AND INFORMATIZATION》, 1 February 2021 (2021-02-01), pages 2 *
冯钧 等: "路网环境下的移动对象查询技术研究综述", 《软件学报》, vol. 28, no. 6, pages 1606 *
刘义: "大规模空间数据的高性能查询处理关键技术研究", 《中国博士学位论文全文数据库信息科技辑》, no. 2016, pages 138 - 39 *

Also Published As

Publication number Publication date
CN112988754B (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
US8295286B2 (en) Apparatus and method using hashing for efficiently implementing an IP lookup solution in hardware
US6522632B1 (en) Apparatus and method for efficient prefix search
US6430527B1 (en) Prefix search circuitry and method
EP1808987B1 (en) Longest prefix matching using tree bitmap data structures
EP2438512B1 (en) Methods, systems and computer program products for providing a distributed associative memory base
TW412693B (en) System and method for locating a route in a route table using hashing and compressed radix tree searching
US7827182B1 (en) Searching for a path to identify where to move entries among hash tables with storage for multiple entries per bucket during insert operations
US8385343B2 (en) Method and apparatus for searching IP address
CN101655861B (zh) 基于双计数布鲁姆过滤器的哈希方法和哈希装置
CN104904167A (zh) 通信网络中对于分组处理的高性能基于哈希的查找
US7478109B1 (en) Identification of a longest matching prefix based on a search of intervals corresponding to the prefixes
CN101500012B (zh) 一种报文分类方法和系统
US7558775B1 (en) Methods and apparatus for maintaining sets of ranges typically using an associative memory and for using these ranges to identify a matching range based on a query point or query range and to maintain sorted elements for use such as in providing priority queue operations
Song et al. Packet classification using coarse-grained tuple spaces
CN112988754A (zh) 一种面向数据集成的快速查询方法
KR101587756B1 (ko) 블룸 필터 선-검색을 이용한 스트링 정보 검색 장치 및 방법
CN113343034A (zh) Ip查找方法、系统及存储介质
CN110334251B (zh) 一种有效解决rehash冲突的元素序列生成方法
CN115167755A (zh) 一种基于共享前缀的以太坊数据存储方法及系统
CN115080626A (zh) 关联节点查询方法及系统
CN118282943A (zh) 一种查找路由表项的方法及装置
CN117194331A (zh) 一种支持隐匿查询的索引构建和检索方法及装置
CN116415036A (zh) 一种数据存储方法、装置、存储介质及服务器
Onkhum et al. Efficient bulk-insertion for content-based video indexing
Hu et al. Triec: A high-speed ipv6 lookup with fast updates using network processor

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant