CN107451271A - 一种哈希表处理方法、装置、设备及存储介质 - Google Patents

一种哈希表处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN107451271A
CN107451271A CN201710655959.2A CN201710655959A CN107451271A CN 107451271 A CN107451271 A CN 107451271A CN 201710655959 A CN201710655959 A CN 201710655959A CN 107451271 A CN107451271 A CN 107451271A
Authority
CN
China
Prior art keywords
hash
groove
data
burst
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710655959.2A
Other languages
English (en)
Inventor
宋鑫
张钦
朱仲颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Dameng Database Co Ltd
Original Assignee
Shanghai Dameng Database Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Dameng Database Co Ltd filed Critical Shanghai Dameng Database Co Ltd
Priority to CN201710655959.2A priority Critical patent/CN107451271A/zh
Publication of CN107451271A publication Critical patent/CN107451271A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables

Abstract

本发明实施例公开了一种哈希表处理方法、装置、设备及存储介质,其中,该方法包括:将创建的哈希表划分成至少两个哈希分片,并将所述哈希分片的访问信息进行存储;其中,哈希分片由至少两个哈希槽构成;当对哈希表进行插入数据操作时,通过哈希函数确定插入的数据对应的第一目标哈希槽,并基于存储的所述访问信息判断所述第一目标哈希槽所在的第一目标哈希分片是否被访问;若否,将所述第一目标哈希分片中的所有哈希槽进行初始化,并继续访问所述第一目标哈希槽的操作以在所述第一目标哈希槽中插入数据。本发明实施例解决了哈希表较大时,且哈希表创建后立即对哈希表初始化导致性能消耗较大的问题,节省了系统资源。

Description

一种哈希表处理方法、装置、设备及存储介质
技术领域
本发明涉及计算机领域,尤其涉及一种哈希表处理方法、装置、设备及存储介质。
背景技术
哈希表在数据处理领域应用非常广泛,哈希表中的一个地址空间成为一个槽,即哈希槽,每个槽存放相同键值的所有数据块。
在现有技术中,哈希表的处理方法,是在创建哈希表之后需要立即对哈希表的槽进行初始化,全部设置为NULL。其中,NULL代表该槽未被使用过。后续访问哈希表的操作会根据这个初始值来判断哈希表的槽是否已经被使用。从而根据哈希表中槽的使用情况执行相应的操作,例如,将数据插入到哈希表的一个槽时:如果这个槽还没有被使用过,那么就将这个数据块放入槽中;如果已经被使用了,那么新的数据块要连接在这个槽的所有数据块之后。但是,当哈希表较大时,当对哈希表中所有槽进行初始化,性能消耗较大,占用系统资源较大。
发明内容
本发明实施例提供一种哈希表处理方法、装置、设备及存储介质,可以解决初始化时性能消耗较大的问题。
第一方面,本发明实施例提供了一种哈希表处理方法,包括:
将创建的哈希表划分成至少两个哈希分片,并将所述哈希分片的访问信息进行存储;其中,哈希分片由至少两个哈希槽构成;
当对哈希表进行插入数据操作时,通过哈希函数确定插入的数据对应的第一目标哈希槽,并基于存储的所述访问信息判断所述第一目标哈希槽所在的第一目标哈希分片是否被访问;
若否,将所述第一目标哈希分片中的所有哈希槽进行初始化,并继续访问所述第一目标哈希槽的操作以在所述第一目标哈希槽中插入数据。
第二方面,本发明实施例还提供了一种哈希表处理装置,包括:
划分模块,用于将创建的哈希表划分成至少两个哈希分片,并将所述哈希分片的访问信息进行存储;其中,哈希分片由至少两个哈希槽构成;
判断模块,用于当对哈希表进行插入数据操作时,通过哈希函数确定插入的数据对应的第一目标哈希槽,并基于存储的所述访问信息判断所述第一目标哈希槽所在的第一目标哈希分片是否被访问;
初始化模块,用于若否,将所述第一目标哈希分片中的所有哈希槽进行初始化,并继续访问所述第一目标哈希槽的操作以在所述第一目标哈希槽中插入数据。
第三方面,本发明实施例提供了一种设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例所述的哈希表处理方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所述的哈希表处理方法
本发明实施例提供的技术方案,通过对创建的哈希表进行分片,当对哈希表插入数据时,通过哈希函数确认插入的数据对应的第一目标哈希槽,若根据存储的访问信息判断第一目标哈希槽所在的第一目标哈希分片被访问,对第一目标哈希片中的哈希槽初始化,并访问第一目标哈希槽。当哈希表较大时,解决了现有技术中哈希表创建后立即对哈希表初始化导致性能消耗较大的问题,节省了系统资源。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1a是本发明实施例提供的一种哈希表处理方法流程图;
图1b是本发明实施例提供的一种哈希表分片示意图;
图2是本发明实施例提供的一种哈希处理装置结构框图;
图3是本发明实施例提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
图1a是本发明实施例提供的一种哈希表处理方法流程图,所述方法由一种哈希表处理装置来执行,所述装置由软件和/或硬件来执行,所述装置配置在设备中,所述方法可以用于处理较大的哈希表,即可以用于大小超过设定值的哈希表的处理情况。如图1a所示,本发明实施例提供的技术方案包括:
S110:将创建的哈希表划分成至少两个哈希分片,并将所述哈希分片的访问信息进行存储;其中,哈希分片由至少两个哈希槽构成。
在本实施例中,创建哈希表,并将哈希表进行分片,其中,可以将哈希表分成两个,或者两个以上的哈希分片。划分哈希表的方法可以根据需要进行任意设置,满足包含所有的哈希槽且每一个哈希槽在所有哈希分片中仅出现一次。
在本发明的一个实施例中,对哈希表的划分方法可以是如下方式:设置哈希分片的哈希槽的个数G,连续的G个哈希槽的为一个哈希分片。需要说明的是,哈希表的哈希槽的个数不是G的整数倍时,哈希槽不能被均匀的划分,设置最后一个哈希分片的个数可以小于等于G。例如,当一个哈希表的哈希槽的个数为43个时,设置G为8,则该哈希表被划分成6个哈希分片,前5个哈希分片的哈希槽的个数为8,第6个哈希分片的哈希槽的个数为3个。
在本发明的一个实施例中,可以创建访问标记表,每一个哈希分片对应访问标记表中的一条记录;当哈希分片被访问时,标记访问标记表,访问标记表中的标记信息表征了哈希分片的访问信息,并将访问信息进行存储。其中,访问标记表可以作为哈希表的信息,与哈希表作为一个整体存储,或者也可以与哈希表单独存储。
在现有技术中,在创建哈希表后,由于所有的哈希槽没有初始化(没有初始值),需要存储哈希槽是否已经被访问过的信息(哈希槽访问标记),由于哈希槽的访问标记与哈希槽一一对应,当哈希槽较大时,访问标记会占用较大的空间。本发明实施例中采用存储哈希分片访问信息的方法,即多个哈希槽的由一个访问标记控制,相对于现有技术中存储每一个哈希槽访问标记的方法,节约了空间。
需要说明的是,当创建哈希表时,由于哈希槽没有被访问,因此,创建的访问标记表不存在被标记的信息。
S120:当对哈希表进行插入数据操作时,通过哈希函数确定插入的数据对应的第一目标哈希槽,并基于存储的所述访问信息判断所述第一目标哈希槽所在的第一目标哈希分片是否被访问。
在本发明实施例中,当对哈希表插入数据时,将插入的数据输入到哈希函数,就可以确定数据对应的哈希槽,即第一目标哈希槽,并计算第一目标哈希槽所在的第一目标哈希分片的编号;基于存储的哈希分片的访问信息确定第一目标哈希分片是否被访问。其中,每一个哈希槽对应一个编号。哈希函数,用于将数据划分到对应的哈希槽中。并且对于确定哈希分片可以采用如下的方法:通过公式P=ceiling(H/G)计算哈希分片的编号,P为哈希分片的编号,H为哈希槽的编号,G为一个哈希分片中哈希槽的个数;Ceiling为计算机语言,将参数向上舍入为最接近的基数的倍数。
在对第一目标哈希槽进行插入数据的操作进行举例说明,如图1b所示,哈希表中哈希槽的个数为43个,被分成6个哈希分片,其中,前5个哈希分片中均有8个哈希槽,第6个哈希分片的哈希槽的个数为3个。哈希表中已存储的数据如图1b所示。具体是,3号哈希槽、7号哈希槽、12号哈希槽、18号哈希槽、24号哈希槽、27号哈希槽、29号哈希槽以及43号哈希槽均存储有数据,则其他哈希槽中没有存储数据。因此,标记访问表中,第4哈希分片和第5哈希分片没有被标记,即第4哈希分片和第5哈希分片没有被访问,其他哈希分片均已经被访问。若向哈希表中插入数据ZA时,通过哈希函数计算出向27号哈希槽中插入数据ZA,并通过公式P=ceiling(H/G)计算出哈希分片的编号,即P=ceiling(27/8)=4。因此,27号哈希槽对应的哈希分片的编号为4。
查看存储的哈希分片的访问信息,判断27号哈希槽对应的4号哈希分片是否被访问。即查看访问标记表中4号哈希访问表是否被标记。
S130:若否,将所述第一目标哈希分片中的所有哈希槽进行初始化,并继续访问第一所述目标哈希槽的操作以在所述第一目标哈希槽中插入数据。
在本实施例中,若第一目标哈希槽所在的第一目标哈希分片没有被访问,将第一目标哈希分片中的所有哈希槽进行初始化,并继续访问第一目标哈希槽以在第一目标哈希槽中插入数据。若第一目标哈希槽所在第一目标哈希分片被访问过,直接访问第一目标哈希槽以将数据插入到第一目标哈希槽。
在步骤S120中,通过存储的哈希分片的访问信息判断4号哈希分片是否被访问,通过查看标记访问表,则标记访问表中记录的4号哈希分片并没有被标记,则4号哈希分片没有被访问。所以先将4号哈希分片中的所有哈希槽初始化(将编号为25-32号的哈希槽均进行初始化),初始化完成后,继续访问27号哈希槽,将数据ZA插入到27号哈希槽。
在插入数据ZA之后,如图1b所示,若将数据ZB插入到29号哈希槽,对应的4号哈希分片已经被访问过了,直接将数据插入到29号哈希槽。
在现有技术中,在创建哈希表后,需要对所有的哈希槽进行初始化以存储哈希槽的访问信息。当哈希表较大时,对所有哈希槽进行初始化导致性能消耗较大。本申请采用上述的方法,哈希表创建后并没有对所有的哈希槽进行初始化,而是在哈希槽被插入数据时初始化一片哈希分片,可以保证只有被访问的哈希分片中的哈希槽被初始化,节省了系统资源,性能消耗较小。
本实施例提供了一种哈希表处理方法,通过对创建的哈希表进行分片,当对哈希表插入数据时,通过哈希函数确认插入的数据对应的第一目标哈希槽,若根据存储的访问信息判断第一目标哈希槽所在的第一目标哈希分片被访问,对第一目标哈希片中的哈希槽初始化,并访问第一目标哈希槽。当哈希表较大时,解决了现有技术中哈希表创建后立即对哈希表初始化导致性能消耗较大的问题,节省了系统资源。
在上述实施例的基础上,所述方法还包括:当对哈希表进行查找数据的操作时,通过哈希函数确定查找的数据对应的第三目标哈希槽,并基于存储的所述访问信息判断所述第三目标哈希槽所在的第三目标哈希分片是否被访问;若否,确定所述第三目标哈希槽中不存在数据,结束查找数据的操作;若是,继续访问所述第三目标哈希槽以查找数据。
当在哈希表中查找数据时,通过哈希函数计算数据对应的哈希槽的编号,从而对第三目标哈希槽中进行查找数据的操作,基于存储的哈希分片的访问信息判断第三目标哈希槽所在的第三目标哈希分片是否被访问,若否,确定第三目标哈希槽中不存在数据,结束查找数据的操作;若是,继续访问第三目标哈希槽以查找数据。
举例说明,如图1b所示,在哈希表中查找数据RR时,通过哈希函数计算得到对应的哈希槽的编号为34,从而在编号为34的哈希槽中查找数据RR。并且34号哈希槽所在的是5号哈希分片,访问标记表中记录的5号哈希分片没有被标记,即5号哈希分片没有被访问过,因此,确定34号哈希槽中不存在数据,结束查找数据的操作。
又如,如图1b所示,在哈希表中查找数据QB时,通过哈希函数计算得到对应的哈希槽的编号为24,从而在编号为24的哈希槽中查找数据QB。并且24号哈希槽所在的是3号哈希分片,访问标记表中记录的3号哈希分片被标记,即3号哈希分片被访问过,获取24号哈希槽中数据,分别为QA、QB、QC,按照顺序可以查找到数据QB。
通过上述的方法查找数据,通过采用存储的哈希分片的访问信息判断哈希分片是否被访问,从而执行相对应的查找操作,节省了系统的资源,且并不影响查找数据的效率。
在上述实施例的基础上,所述方法还包括:当对哈希表进行删除数据的操作时,通过哈希函数确定删除的数据对应的第二目标哈希槽,并基于存储的所述访问信息判断所述第二目标哈希槽所在的第二目标哈希分片是否被访问;若否,确定所述第二目标哈希槽中不存在数据,结束删除数据的操作;若是,继续访问所述第二目标哈希槽以删除数据。
在本发明的一个实施例中,当对哈希表删除数据时,通过哈希函数计算数据对应的哈希槽的编号,从而对第二目标哈希槽进行删除数据的操作,基于存储的哈希分片的访问信息判断第二目标哈希槽所在的第二目标哈希分片是否被访问,若否,确定第二目标哈希槽中不存在数据,结束删除数据的操作;若是,继续访问第二目标哈希槽以删除数据。
举例说明,如图1b所示,若对哈希表删除数据RR,通过哈希函数计算得到的哈希槽的编号为34,编号为34的哈希槽所在的是5号哈希分片,由于访问标记表中记录的5号哈希分片没有被标记,即5号哈希分片没有被访问,可以确定哈希表中不存储数据RR,结束删除数据操作,删除操作完成。
又如,如图1b所示,在哈希表中删除数据QB时,通过哈希函数计算得到对应的哈希槽的编号为24,从而在编号为24的哈希槽中删除数据QB。并且24号哈希槽所在的是3号哈希分片,访问标记表中记录的3号哈希分片被标记,即3号哈希分片被访问过,获取24号哈希槽中数据,分别为QA、QB、QC,按照顺序可以查找到数据QB,并将数据QB删除,24号哈希槽中的数据为QA,QC。
通过上述的方法删除数据,通过采用哈希分片的访问信息判断哈希分片是否被访问,从而执行相对应的删除操作,节省了系统的资源,且并不影响删除数据的效率。
在上述实施例的基础上,所述方法还包括:当对哈希表进行修改数据的操作时,通过哈希函数确定被修改的数据对应的第四目标哈希槽,并基于存储的所述访问信息判断所述第四目标哈希槽所在的目标哈希分片是否被访问;若否,确定所述第四目标哈希槽中不存在数据,结束修改数据的操作;若是,删除所述第四目标哈希槽中被修改的数据,并将修改的数据插入到所述第四目标哈希槽。
在本发明的一个实施例中,在对哈希表进行修改数据时,通过哈希函数计算被修改数据所在的哈希槽的编号,从而确定对第四目标哈希槽进行修改数据的操作。基于存储的访问信息判断第四目标哈希槽所在的第四目标哈希分片是否被访问,若没有被访问,确定第四目标哈希槽中不存在数据,结束修改数据的操作。若被访问过,删除第四目标哈希槽中被修改数据,并将修改的数据插入到第四目标哈希槽中。
需要说明的是,本发明实施例中所涉及的第一目标哈希槽、第二目标哈希槽、第三目标哈希槽以及第四目标哈希槽可以相同,也可以不相同。并且第一目标哈希分片、第二目标哈希分片、第三目标哈希分片以及第四目标哈希分片可以相同,也可以不相同。
在上述实施例的基础上,所述方法还包括:当对哈希表进行遍历时,基于存储的所述访问信息确定被访问的哈希分片;依次对被访问过的哈希分片中的哈希槽进行遍历,并获取被访问过的哈希分片中的哈希槽存储的数据。
举例说明,如图1b所示,按照哈希分片访问标记表中的排序,对被标记的访问标记表对应的哈希分片依次进行遍历。即首先遍历1号哈希分片,再获取哈希分片中编号为1-8的哈希槽的中数据,在3号哈希槽中可以获取数据AA。然后再遍历2号哈希分片,3号哈希分片、4号哈希分片,最后遍历6号哈希分片,以获取数据,遍历结束。
其中,对于遍历哈希分片的顺序并不局限于上述的顺序,也可以按照需要进行设置遍历顺序。
通过上述的方法对哈希表进行遍历,将多个哈希槽通过一个访问标记进行控制,避免了依次对没有访问过的哈希槽的辨识,提高了遍历效率。
在上述实施例的基础上,所述方法还包括:删除所述哈希表,并删除存储的所述访问信息。
在本实施例中,当删除哈希表时,可以设置哈希表与哈希分片访问信息的对应关系,当删除哈希表时,可以将存储的访问信息一并删除,提高操作效率。
图2是本发明实施例提供的一种哈希表处理装置结构框图,如图2所示,所述装置用于执行哈希表处理方法,如图2所示,所述装置包括划分模块210、判断模块220和初始化模块230。
其中,划分模块210,用于将创建的哈希表划分成至少两个哈希分片,并将所述哈希分片的访问信息进行存储;其中,哈希分片由至少两个哈希槽构成;
判断模块220,用于当对第一目标哈希槽进行插入数据操作时,基于存储的所述访问信息判断所述第一目标哈希槽所在的第一目标哈希分片是否被访问;
初始化模块230,用于若否,将所述第一目标哈希分片中的所有哈希槽进行初始化,并继续访问所述第一目标哈希槽的操作以在所述第一目标哈希槽中插入数据。
进一步的,所述装置还包括:
数据删除模块240,用于当对哈希表进行删除数据的操作时,通过哈希函数确定删除的数据对应的第二目标哈希槽,并基于存储的所述访问信息判断所述第二目标哈希槽所在的第二目标哈希分片是否被访问;
若否,确定所述第二目标哈希槽中不存在数据,结束删除数据的操作;
若是,继续访问所述第二目标哈希槽以删除数据。
进一步的,所述装置还包括数据查找模块250,用于当对哈希表进行查找数据的操作时,通过哈希函数确定查找的数据对应的第三目标哈希槽,并基于存储的所述访问信息判断所述第三目标哈希槽所在的第三目标哈希分片是否被访问;
若否,确定所述第三目标哈希槽中不存在数据,结束查找数据的操作;
若是,继续访问所述第三目标哈希槽以查找数据。
进一步的,所述装置还包括:数据修改模块260,用于当对哈希表进行修改数据的操作时,通过哈希函数确定被修改的数据对应的第四目标哈希槽,并基于存储的所述访问信息判断所述第四目标哈希槽所在的第四目标哈希分片是否被访问;
若否,确定所述第四目标哈希槽中不存在数据,结束修改数据的操作;
若是,删除所述第四目标哈希槽中被修改的数据,并将修改的数据插入到所述第四目标哈希槽。
进一步的,所述装置还包括遍历模块270,用于当对哈希表进行遍历时,基于存储的所述访问信息确定被访问的哈希分片;
依次对被访问过的哈希分片中的哈希槽进行遍历,并获取被访问过的哈希分片中的哈希槽存储的数据。
进一步的,所述装置还包括删除模块280,用于删除所述哈希表,并删除存储的所述访问信息。
进一步的,所述装置还包括直接访问模块290,用于若判断所述第一目标哈希槽所在的第一目标哈希分片被访问,直接访问所述第一目标哈希槽以在所述第一目标哈希槽中插入数据。
本发明实施例提供的一种哈希表处理装置,通过对创建的哈希表进行分片,当对哈希表插入数据时,通过哈希函数确认插入的数据对应的第一目标哈希槽,若根据存储的访问信息判断第一目标哈希槽所在的第一目标哈希分片被访问,对第一目标哈希片中的哈希槽初始化,并访问第一目标哈希槽。当哈希表较大时,解决了现有技术中哈希表创建后立即对哈希表初始化导致性能消耗较大的问题,节省了系统资源。
图3是本发明实施例提供的一种设备的结构示意图。图3示出了适于用于实现本发明实施方式的示例性设备312的框图。图3显示的设备312仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图3所示,设备312以通用计算设备的形式表现。设备312的组件可以包括但不限于:一个或者多个处理器或者处理单元316,系统存储器328,连接不同系统组件(包括系统存储器328和处理单元316)的总线318。
总线318表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
设备312典型地包括多种计算机系统可读介质。这些介质可以是任何能够访问设备312的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器328可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)330和/或高速缓存存储器332。设备312可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统334可以用于读写不可移动的、非易失性磁介质(图3未显示,通常称为“硬盘驱动器”)。尽管图3中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线318相连。存储器328可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块342的程序/实用工具340,可以存储在例如系统存储器328中,这样的程序模块342包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块342通常执行本发明所描述的实施例中的功能和/或方法。
设备312也可以与一个或多个外部设备314(例如键盘、指向设备、显示器324等)通信,还可与一个或者多个使得用户能与该设备312交互的设备通信,和/或与使得该设备312能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口322进行。并且,设备312还可以通过网络适配器320与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图3所示,网络适配器320通过总线318与服务器312的其它模块通信。应当明白,尽管图中未示出,可以结合设备312使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元316通过运行存储在系统存储器328中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的哈希表处理方法。
也即,所述处理单元执行所述程序时实现:将创建的哈希表划分成至少两个哈希分片,并将所述哈希分片的访问信息进行存储;其中,哈希分片由至少两个哈希槽构成;当对哈希表进行插入数据操作时,通过哈希函数确定插入的数据对应的第一目标哈希槽,并基于存储的所述访问信息判断所述第一目标哈希槽所在的第一目标哈希分片是否被访问;若否,将所述第一目标哈希分片中的所有哈希槽进行初始化,并继续访问所述第一目标哈希槽的操作以在所述第一目标哈希槽中插入数据。
本发明实施例还提供了一种包含计算机可执行指令的存储介质。其上存储有计算机程序,该程序被处理器执行时实现本发明实施例提供的哈希表处理方法。
本发明实施例提供的包含计算机可执行指令的存储介质,可以采用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种哈希表处理方法,其特征在于,包括:
将创建的哈希表划分成至少两个哈希分片,并将所述哈希分片的访问信息进行存储;其中,哈希分片由至少两个哈希槽构成;
当对哈希表进行插入数据操作时,通过哈希函数确定插入的数据对应的第一目标哈希槽,并基于存储的所述访问信息判断所述第一目标哈希槽所在的第一目标哈希分片是否被访问;
若否,将所述第一目标哈希分片中的所有哈希槽进行初始化,并继续访问所述第一目标哈希槽的操作以在所述第一目标哈希槽中插入数据。
2.根据权利要求1所述的方法,其特征在于,还包括:
当对哈希表进行删除数据的操作时,通过哈希函数确定删除的数据对应的第二目标哈希槽,并基于存储的所述访问信息判断所述第二目标哈希槽所在的第二目标哈希分片是否被访问;
若否,确定所述第二目标哈希槽中不存在数据,结束删除数据的操作;
若是,继续访问所述第二目标哈希槽以删除数据。
3.根据权利要求1所述的方法,其特征在于,还包括:
当对哈希表进行查找数据的操作时,通过哈希函数确定查找的数据对应的第三目标哈希槽,并基于存储的所述访问信息判断所述第三目标哈希槽所在的第三目标哈希分片是否被访问;
若否,确定所述第三目标哈希槽中不存在数据,结束查找数据的操作;
若是,继续访问第三所述目标哈希槽以查找数据。
4.根据权利要求1所述的方法,其特征在于,还包括:
当对哈希表进行修改数据的操作时,通过哈希函数确定被修改的数据对应的第四目标哈希槽,并基于存储的所述访问信息判断所述第四目标哈希槽所在的第四目标哈希分片是否被访问;
若否,确定所述第四目标哈希槽中不存在数据,结束修改数据的操作;
若是,删除所述第四目标哈希槽中被修改的数据,并将修改的数据插入到所述第四目标哈希槽。
5.根据权利要求1所述的方法,其特征在于,还包括:
当对哈希表进行遍历时,基于存储的所述访问信息确定被访问的哈希分片;
依次对被访问过的哈希分片中的哈希槽进行遍历,并获取被访问过的哈希分片中的哈希槽存储的数据。
6.根据权利要求1所述的方法,其特征在于,还包括:
删除所述哈希表,并删除存储的所述访问信息。
7.根据权利要求1所述的方法,其特征在于,还包括:
若判断所述第一目标哈希槽所在的目标哈希分片被访问,直接访问所述第一目标哈希槽以在所述第一目标哈希槽中插入数据。
8.一种哈希表处理装置,其特征在于,包括:
划分模块,用于将创建的哈希表划分成至少两个哈希分片,并将所述哈希分片的访问信息进行存储;其中,哈希分片由至少两个哈希槽构成;
判断模块,用于当对哈希表进行插入数据操作时,通过哈希函数确定插入的数据对应的第一目标哈希槽,并基于存储的所述访问信息判断所述第一目标哈希槽所在的第一目标哈希分片是否被访问;
初始化模块,用于若否,将所述第一目标哈希分片中的所有哈希槽进行初始化,并继续访问所述第一目标哈希槽的操作以在所述第一目标哈希槽中插入数据。
9.一种设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的哈希表处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的哈希表处理方法。
CN201710655959.2A 2017-08-03 2017-08-03 一种哈希表处理方法、装置、设备及存储介质 Pending CN107451271A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710655959.2A CN107451271A (zh) 2017-08-03 2017-08-03 一种哈希表处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710655959.2A CN107451271A (zh) 2017-08-03 2017-08-03 一种哈希表处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN107451271A true CN107451271A (zh) 2017-12-08

Family

ID=60489893

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710655959.2A Pending CN107451271A (zh) 2017-08-03 2017-08-03 一种哈希表处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN107451271A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110413215A (zh) * 2018-04-28 2019-11-05 伊姆西Ip控股有限责任公司 用于获取访问权限的方法、设备和计算机程序产品
CN111414422A (zh) * 2020-03-19 2020-07-14 上海达梦数据库有限公司 一种数据分布方法、装置、设备和存储介质
CN112541039A (zh) * 2020-12-07 2021-03-23 武汉联影医疗科技有限公司 数据库处理方法、装置、计算机设备和存储介质
CN114707023A (zh) * 2022-02-28 2022-07-05 苏州浪潮智能科技有限公司 一种哈希表遍历方法、系统、设备及计算机可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101826107A (zh) * 2010-04-02 2010-09-08 华为技术有限公司 哈希数据处理方法和装置
CN103942343A (zh) * 2014-05-12 2014-07-23 中国人民大学 一种面向哈希连接的数据存储优化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101826107A (zh) * 2010-04-02 2010-09-08 华为技术有限公司 哈希数据处理方法和装置
CN103942343A (zh) * 2014-05-12 2014-07-23 中国人民大学 一种面向哈希连接的数据存储优化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
崔华: "《基于Oracle的SQL优化》", 31 January 2014, 电子工业出版社 *
李凯 等: "OceanBase内存事务引擎", 《华东师范大学学报(自然科学版)》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110413215A (zh) * 2018-04-28 2019-11-05 伊姆西Ip控股有限责任公司 用于获取访问权限的方法、设备和计算机程序产品
CN110413215B (zh) * 2018-04-28 2023-11-07 伊姆西Ip控股有限责任公司 用于获取访问权限的方法、设备和计算机程序产品
CN111414422A (zh) * 2020-03-19 2020-07-14 上海达梦数据库有限公司 一种数据分布方法、装置、设备和存储介质
CN111414422B (zh) * 2020-03-19 2023-09-29 上海达梦数据库有限公司 一种数据分布方法、装置、设备和存储介质
CN112541039A (zh) * 2020-12-07 2021-03-23 武汉联影医疗科技有限公司 数据库处理方法、装置、计算机设备和存储介质
CN114707023A (zh) * 2022-02-28 2022-07-05 苏州浪潮智能科技有限公司 一种哈希表遍历方法、系统、设备及计算机可读存储介质
CN114707023B (zh) * 2022-02-28 2024-01-23 苏州浪潮智能科技有限公司 一种哈希表遍历方法、系统、设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN104238963B (zh) 一种数据存储方法、存储装置及存储系统
CN107451271A (zh) 一种哈希表处理方法、装置、设备及存储介质
WO2017107414A1 (zh) 文件操作方法和装置
CN103345469B (zh) 号码集合的存储、查询方法及其装置
CN105335411A (zh) 用于数据处理的方法和系统
CN103853596A (zh) 公共相邻存储区域优化长距离虚拟机迁移方法和系统
CN105468300B (zh) Ip硬盘的管理方法和装置
CN109710709A (zh) 兴趣点数据处理方法、装置、电子设备及存储介质
CN102982182B (zh) 一种数据存储规划方法及装置
CN106648939A (zh) 用于进程间资源共享的方法与设备
CN110688256B (zh) 一种元数据上电恢复方法、装置、电子设备及存储介质
CN106201652B (zh) 一种数据处理方法及虚拟机
CN107291950A (zh) 表单数据更新方法、装置及计算机设备
CN110223216B (zh) 一种基于并行plb的数据处理方法、装置及计算机存储介质
CN108089822A (zh) 存储芯片的管理方法、系统、设备及存储介质
CN107291392A (zh) 一种固态硬盘及其读写方法
CN113127382A (zh) 用于追加写的数据读取方法、装置、设备和介质
CN104461384B (zh) 一种数据写入方法及存储设备
CN108615077B (zh) 一种应用于深度学习网络的缓存优化方法及装置
CN108304142A (zh) 一种数据管理方法和装置
CN103294407B (zh) 存储装置和数据读写方法
US11030714B2 (en) Wide key hash table for a graphics processing unit
CN109347899A (zh) 在分布式存储系统中写入日志数据的方法
CN104216834A (zh) 一种内存访问的方法、缓冲调度器和内存模块
CN116431080B (zh) 一种数据落盘方法、系统、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171208