CN102541968B - 一种索引方法 - Google Patents

一种索引方法 Download PDF

Info

Publication number
CN102541968B
CN102541968B CN201110036319.6A CN201110036319A CN102541968B CN 102541968 B CN102541968 B CN 102541968B CN 201110036319 A CN201110036319 A CN 201110036319A CN 102541968 B CN102541968 B CN 102541968B
Authority
CN
China
Prior art keywords
data block
data
information
hash
hash node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110036319.6A
Other languages
English (en)
Other versions
CN102541968A (zh
Inventor
蒋锦鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201110036319.6A priority Critical patent/CN102541968B/zh
Publication of CN102541968A publication Critical patent/CN102541968A/zh
Application granted granted Critical
Publication of CN102541968B publication Critical patent/CN102541968B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种索引方法,包括:对接收的关键字进行哈希运算,以从哈希桶表中确定对应的哈希桶,并从哈希桶中获得哈希节点指针;利用哈希节点指针的前预定位从标识信息列表中确定对应的哈希节点数据块识别信息;利用哈希节点指针的后预定位作为偏移量,从哈希节点数据块识别信息对应的哈希节点数据块中获取对应的哈希节点。通过上述方式,本发明提供了一种间接寻址的哈希索引方法,节省了索引的空间,提高了内存的使用效率。

Description

一种索引方法
技术领域
本发明涉及数据处理技术领域,特别涉及一种索引方法。
背景技术
随着互联网的高速发展,人们的信息来源得到了极大的丰富,信息获取方式也随之而改变,这给人类带来机遇的同时也带来挑战,在Web信息成几何基数增长的前提下,如何能够快速准确的进行数据搜索,搜索到需要的东西,是数据处理技术领域研究的方向之一。
在数据搜索中,搜索引擎spider得到越来越多的应用,spider是搜索引擎的一个自动程序,其作用是抓取互联网上的网页,建立索引数据库,使用户能在搜索引擎中搜索到相关网站的网页。
在具体实施过程中,spider每天要抓取大量网站链接,在抓取之前都需要获取待抓取网站的IP地址以及robots等信息,这些信息不可能实时的从互联网上查询,而只能通过内部的域名服务器DNS查询。
但是,由于DNS中存储的数据量在不断的增加,因此查询速度也会随之变慢,不能满足快速查询的需求。而且,对DNS中的数据进行更新时,也会增加DNS的工作量,这也影响了查询的速度。同样,在实时网页数据库以及其他关键字-数据值(Key-value)数据库中也会遇到类似的问题。
如何能够更好的对数据进行查询以及更新,满足高性能的读写服务,是数据处理技术领域研究的方向之一。
发明内容
本发明所要解决的技术问题是提供一种索引方法,以节省索引的空间,提高内存的使用效率。
本发明为解决技术问题而采用的技术方案是提供一种索引方法,包括:a.对接收的关键字进行哈希运算,以从哈希桶表中确定对应的哈希桶,并从所述哈希桶中获得哈希节点指针;b.利用所述哈希节点指针的前预定位从标识信息列表中确定对应的哈希节点数据块识别信息;c.利用所述哈希节点指针的后预定位作为偏移量,从所述哈希节点数据块识别信息对应的哈希节点数据块中获取对应的哈希节点。
根据本发明之一优选实施例,所述哈希节点指针为4个字节,所述前预定位为所述哈希节点指针的前9位,所述后预定位为所述哈希节点指针的后23位。
根据本发明之一优选实施例,所述哈希节点包括所述关键字、数据块识别信息、数据项长度信息以及数据项偏移信息。
根据本发明之一优选实施例,所述哈希节点进一步包括下一哈希节点指针,其中空闲的哈希节点通过所述下一哈希节点指针串成一个回收链表。
根据本发明之一优选实施例,所述哈希节点为20个字节,其中所述关键字为8个字节、所述数据块识别信息为2个字节、所述数据项长度信息为2个字节、所述数据项偏移信息为4个字节以及所述下一哈希节点指针为4个字节。
根据本发明之一优选实施例,所述索引方法进一步包括:d.根据所述数据块识别信息查询与所述数据块识别信息对应的数据块信息,所述数据块信息包括数据块状态、内存指针以及固态存储器文件描述符;e.根据所述数据块状态判断对应数据块位于内存还是位于固态存储器。
根据本发明之一优选实施例,所述索引方法进一步包括:f.若所述数据块位于所述内存,则根据所述内存指针、所述数据项偏移信息以及所述数据项长度信息读取所述对应数据项。
根据本发明之一优选实施例,所述索引方法进一步包括:f.若所述数据块位于所述固态存储器,则根据所述固态存储器文件描述符、所述数据项偏移信息以及所述数据项长度信息读取所述对应数据项。
由以上技术方案可以看出,本发明的索引方法通过间接哈希寻址节省了索引的空间,提高了内存的使用效率。
附图说明
图1是本发明实施例中的数据库控制方法的流程示意图;
图2是本发明实施例中的数据库的存储介质及存储内容的示意图;
图3是本发明实施例中的第一索引及数据块的数据结构示意图;
图4是本发明实施例中的第二索引的数据结构示意图;
图5是本发明实施例中的哈希容器的结构示意图;
图6是本发明实施例中的数据块生命周期管理过程的示意图;
图7是本发明实施例中的数据库读取操作的流程示意图;
图8是本发明实施例中的数据库写入操作的流程示意图;
图9是图8中的步骤S809的具体流程示意图;
图10是本发明实施例的数据库导出操作的流程示意图;
图11是本发明实施例中的数据库控制装置的结构示意图。
具体实施方式
下面结合附图和实施例对本发明进行详细说明。
请参阅图1,图1是本发明实施例中的数据库控制方法的流程示意图。在本实施例中,数据库的控制方法主要包括以下几个步骤:
步骤S101,接收操作信息。
步骤S102,根据操作信息在位于内存的索引中查询对应数据块的索引信息。
步骤S103,根据操作信息及索引信息对对应数据块进行相应操作。
在本发明中,操作信息可以包括具体操作指令以及待处理数据项或者待处理数据项的关键字。具体操作指令可以包括读取操作指令、写入操作指令、导出操作指令等,各种操作信息对应的具体操作过程将在下文中描述。
请参阅图2,图2是本发明实施例中的数据库的存储介质及存储内容的示意图。在本实施例中,数据库的存储介质包括内存以及固态存储器。存储内容包括索引和数据块。其中,数据块根据不同状态选择性位于内存及固态存储器中。具体来说,当数据块位于内存中时可称为内存数据块,当数据块位于固态存储器中时可称为固态存储器数据块。其中,索引设置在内存内,索引包括第一索引和第二索引。
请参阅图3-4,图3是本发明实施例中的第一索引及数据块的数据结构示意图。图4是本发明实施例中的第二索引的数据结构示意图。
请参阅图3,在本实施例中,第一索引用于记录关键字与对应数据项的位置信息的映射关系。位置信息主要包括如下信息:数据块识别信息、数据项偏移信息以及数据项长度信息。
其中,数据块识别信息用于记录对应数据项所属的数据块的ID,数据项偏移信息用于记录对应数据项在数据块中的偏移量,数据项长度信息用于记录对应数据项的长度。
请参阅图3,第二索引完成从位置信息中的数据块识别信息到数据块信息的映射。请参阅图4,在本实施例中,数据块信息主要包括:数据块识别信息、数据块长度信息、数据项总数、有效数据项个数、数据项有效位图、数据块状态、内存数据块容量、内存指针、固态存储器文件描述符以及引用计数。
其中,数据块识别信息用于记录数据块的ID,在本实施例中,每个数据块分配一个唯一的ID。数据块长度信息用于记录数据块的大小。数据项总数用于记录数据块内的数据项的总个数。有效数据项个数用于记录数据块内的有效数据项的个数,即数据项总数减去被标记删除的数据项的个数。数据项有效位图用于记录数据项的有效状态,其中,每一位(bit)代表一个数据项,若置1表示有效,置0表示被标记删除。数据块状态用于记录数据块的状态,主要用于判断对应数据块是位于内存中还是位于固态存储器中,下文中将详细描述各种数据块状态。内存数据块容量用于记录内存数据块中已存储的数据项的大小,主要用于与数据块长度信息配合来判断内存数据块是否已满。内存指针用于记录数据块在内存中的存储位置,当数据块不位于内存中时,则该值无效。固态存储器文件描述符用于记录数据块在固态存储器中的存储位置,当数据块不位于固态存储器中时,则该值无效。引用计数用于记录数据块的引用状态,用于管理数据块的生存周期。
在上述信息中,数据块识别信息、数据块长度信息、数据项总数、有效数据项个数、数据项有效位图为数据块的核心数据项,称为数据块的元信息。
请继续参阅图3,在数据块中存储多个数据项,每一数据项内存储有如下内容:数据项序号、关键字长度、数据值长度、关键字以及数据值。
其中,数据项序号为数据项在数据块中的序号,用于查找数据项有效位图。关键字长度用于记录关键字的长度。数据值长度用于记录数据值的长度。关键字为表示关键字的二进制串。数据值为表示数据值的二进制串。
在本发明中,第一索引和第二索引可通过本领域各种算法实现,例如哈希算法。
本发明一优选实施例提供了一种间接寻址的哈希容器,节省了索引的空间,提高了内存的使用效率。下面将以第一索引为例,进行详细描述。
请参阅图5,在本实施例中,第一索引包括一哈希桶表,该哈希桶表包括多个哈希桶。每一个哈希桶内存储一哈希节点指针。在本实施例中,哈希节点指针为预定字节(例如,4字节),其中前预定位(例如,前9位)用于标识哈希节点所在的哈希节点数据块,后预定位(例如,后23位)用于标识哈希节点在哈希节点数据块内部的偏移。
具体来说,所有的哈希节点数据块的识别信息被记录在标识信息列表中,并可根据哈希节点指针的前预定位从标识信息列表的对应位置查询到对应的识别信息。在本实施例中,标识信息列表所能存储的识别信息的最大数量为29=512。
此外,哈希节点存储在对应的哈希节点数据块内,每个哈希节点占用预定字节(例如,20字节),分别包括关键字(例如,8个字节)、数据块识别信息(例如,2个字节)、数据项长度信息(例如,2个字节)、数据项偏移信息(例如,4个字节)以及下一哈希节点指针(例如,4个字节)。
在上述哈希容器的使用过程中,首先对接收的关键字进行哈希运算从哈希桶表中确定对应的哈希桶,并从哈希桶中获得哈希节点指针。随后,利用哈希节点指针的前预定位从标识信息列表中确定对应的哈希节点数据块的识别信息,并根据哈希节点指针的后预定位作为偏移量从识别信息对应的哈希节点数据块中获取对应的哈希节点,进而获取与该关键字相关的数据项位置信息,例如数据块识别信息、数据项偏移信息以及数据项长度信息。
在本实施例中,每个哈希节点数据块内能够存储的哈希节点的最大数量为223=8388608个,因此每个哈希容器可以支持的最大数据量为512×8388608=42亿,很好的满足了域名服务器(Domain Name Server,DNS)的需求。
此外,在该哈希容器中,空闲哈希节点用空闲链表维护。当数据被删除时,对应的哈希节点也会被回收。空闲哈希节点通过哈希节点中的下一哈希节点指针来串成一个回收链表。当接收到新的数据时,优先使用回收链表中的指针。因此,哈希节点数据块中的哈希节点数据总是紧凑的,在站点数量为3亿的情况下,占用的内存为300M×20bytes=6Gbytes。
请参阅图6,图6为本发明实施例中的数据块生命周期管理过程的示意图。
在本实施例中,首先,在内存中创建数据块。在创建数据块后,为该数据块分配唯一的数据块识别信息(ID),并将该数据块的数据块状态标记为“内存”。随后,更新第二索引,以记录该数据块的数据块信息,例如数据块识别信息、数据块长度信息、数据块状态以及内存指针等。其中,数据库在任一时刻最多只有一个数据块处于“内存”状态。
标记为“内存”的数据块可接收待写入数据项,并将该数据项追加到数据块末端。随后,更新第二索引,以记录有效数据项个数、数据项有效位图、内存数据块容量等。同时,根据待写入数据项的关键字及存储位置更新第一索引,在第一索引中记录该关键字与数据块识别信息、数据项偏移信息以及数据项长度信息的映射关系,以便后续可根据该关键字查询到对应的数据项。数据项一旦写入数据块后,就不可以更改,仅允许对该数据项进行读取和标记删除。当对该数据项进行标记删除时,在第二索引中对该数据块的数据块信息的数据项有效位图中的对应位进行标记,例如将对应位置0。
当数据项不断写入数据块后,可通过内存数据块容量与数据块长度信息的比较结果来判断该数据块是否写满。若数据块写满,将该数据块的数据块状态标记为“写入”,并更新第二索引,以记录数据项总数。随后,将该数据块写入到固态存储器中。优选地,在写入过程中,将内存中该数据块的数据项以受控的速率(例如,5MB/S)写入到固态存储器中,有效地防止了对读取性能造成过大影响。同时,在内存中重新创建数据块状态标记为“内存”的新数据块,以接收后续写入的数据项。
在“写入”状态的该数据块的数据项全部写入到固态存储器后,将该数据块的数据块状态标记为“固态存储”,并释放该数据块原先占用的内存缓冲空间。随后,更新第二索引,以记录该数据块的数据块信息,例如固态存储器文件描述符。
如果处于“内存”状态和“写入”状态的数据块中的空洞太多,也就是说,数据块中的有效数据项的个数低于阈值,则将该数据块的数据块状态标记为“重建”。随后,将标记为“重建”的数据块内的有效数据项转存到标记为“内存”的新数据块中,以实现对“重建”的数据块内的无效数据项的清除及重建。在重建完成后,将标记为“重建”的数据块的数据块状态标记为“删除”。此时,根据该数据块的引用计数判断是否有其他线程引用该数据块,如果没有其他线程引用该数据块,则删除该数据块。如果有其他线程引用该数据块,则保留该数据块,直到其他线程使用完成后,通过引用解除操作释放该引用计数,再将该数据块进行删除。
如果处于“固态存储”状态的数据块中的空洞太多,则将该数据块的数据块状态标记为“读取”,并将该数据块读取到内存中。在读取完成后,将该数据块的数据块状态标记为“重建”,并将该数据块的有效数据项转存到标记为“内存”的数据块中,以实现对“重建”的数据块内的无效数据项的清除及重建。在重建完成后,将标记为“重建”的数据块的数据块状态标记为“删除”。此时,根据该数据块的引用计数判断是否有其他线程引用该数据块,如果没有其他线程引用该数据块,则删除该数据块。
具体来说,如果数据块状态为“内存”、“写入”以及“重建”,则表示该数据块位于内存中。如果数据块状态为“固态存储”以及“读取”,则表示该数据块位于固态存储器中。透过上述操作,可有效管理数据块生命周期。
下面将结合具体实施例,描述本发明的各种操作过程。
请参阅图7,图7为本发明实施例中的数据库读取操作的流程示意图。
在步骤S701中,接收读取操作指令以及待读取数据项的关键字。
在步骤S702中,利用该关键字从第一索引查询对应的位置信息。若未查询到,则进行步骤S708;若查询到,则进行步骤S703。
在本实施例中,位置信息包括数据块识别信息、数据项偏移信息以及数据项长度信息。具体查询过程在上文中已经进行详细描述,在此不再赘述。
在步骤S703中,利用该位置信息中的数据块识别信息从第二索引查询对应的数据块信息。在本实施例中,数据块信息包括数据块状态、内存指针以及固态存储器文件描述符等。
在步骤S704中,根据数据块状态判定对应数据块是位于内存中还是位于固态存储器,若对应数据块位于内存中,则进行步骤S705,若对应数据块位于固态存储器中,则进行步骤S706。
如上文所描述的,如果数据块状态为“内存”、“写入”以及“重建”,则表示该数据块位于内存中。如果数据块状态为“固态存储”以及“读取”,则表示该数据块位于固态存储器中。
在步骤S705中,根据内存指针、数据项偏移信息以及数据项长度信息在内存中读取对应数据项。
在步骤S706中,根据固态存储器文件描述符、数据项偏移信息以及数据项长度信息在固态存储器中读取对应数据项。
在步骤S707中,判断对应数据项的关键字与待读取数据项的关键字是否一致,若不一致,则进行步骤S708;若一致,则进行步骤S709。
在步骤S708中,判定待读取数据项不存在。
在步骤S709中,判定读取成功,并将对应数据项的数据值作为待读取数据项的数据值。
请参阅图8,图8为本发明实施例的数据库写入操作的流程示意图。
在步骤S801中,接收写入操作指令以及待写入数据项的关键字及数据值。
在步骤S802中,利用该关键字从第一索引查询对应的位置信息。若查询到,则进行步骤S803;若没有查询到,则进行步骤S809。
在本实施例中,位置信息包括数据块识别信息、数据项偏移信息以及数据项长度信息。具体查询过程在上文中已经进行详细描述,在此不再赘述。
在步骤S803中,利用该位置信息中的数据块识别信息从第二索引查询对应的数据块信息。在本实施例中,数据块信息包括数据块状态、内存指针以及固态存储器文件描述符等。
在步骤S804中,根据数据块状态判定对应数据块位于内存中还是位于固态存储器中,若对应数据块位于内存中,则进行步骤S805,若对应数据块位于固态存储器中,则进行步骤S806。
如上文所描述的,如果数据块状态为“内存”、“写入”以及“重建”,则表示该数据块位于内存中。如果数据块状态为“固态存储”以及“读取”,则表示该数据块位于固态存储器中。
在步骤S805中,根据内存指针、数据项偏移信息以及数据项长度信息在内存中读取对应数据项。
在步骤S806中,根据固态存储器文件描述符、数据项偏移信息以及数据项长度信息在固态存储器中读取对应数据项;
在步骤S807中,判断对应的数据项的数据值与待写入数据项的数据值是否一致:若一致,则写入成功;若不一致,则进行步骤S808;
在步骤S808中,在对应数据项所属数据块的数据项有效位图中将该对应数据项标识删除。具体来说,在数据项有效位图中将对应位置0。
在步骤S809中,将待写入数据项写入位于内存中的用于接收待写入数据项的数据块内,即处于“内存”状态的数据块。随后,更新第一索引及第二索引以记录上述写入过程。
请参阅图9,图9是图8中的步骤S809的具体流程示意图。
在步骤S901中,判断内存中的处于“内存”状态的数据块是否已经写满,若未写满,则进行步骤S902,若写满,则进行步骤S903。具体来说,可通过数据块长度信息与内存数据块容量之间的比较结果来确定该数据块是否写满。
在步骤S902中,直接将待写入数据项写入到数据块的末端,并更新第一索引及第二索引。
在步骤S903中,将该数据块的数据块状态标记为“写入”状态。随后,进入步骤S904和步骤S905。
在步骤S904中,将该数据块写入固态存储器,同时进一步更新第一索引及第二索引。在写入完成后,将该数据块的数据块状态改为“固态存储”状态,同时在内存中释放该数据块。
在步骤S905中,创建标记为“内存”状态的新数据块,并将待写入数据项写入到新数据块的末端,并更新第一索引及第二索引。
通过上述方式,步骤S904和步骤S905可以并行进行,由此实现了读写分离。此外,处于“写入”状态的数据块中的数据项以受控的速率写入固态存储器,譬如受控的速率为5MB/S。本发明通过设置受控的速率,有效地防止了写入数据时对读取性能造成的影响。
请参阅图10,图10为本发明实施例的数据库导出操作的流程示意图。
在步骤S1001中,接收导出操作指令。
在步骤S1002中,对内存和固态存储器进行加锁,其中,在加锁状态下,禁止对内存和固态存储器进行修改。
在步骤S1003中,从内存的第二索引中复制待导出数据块对应的元信息。在本实施例中,待导出数据块可以是全部数据块或者预定数量的数据块。如上文所述的,元信息包括数据块识别信息、数据块长度信息、数据项总数、有效数据项个数以及数据项有效位图。
在步骤S1004中,对待导出数据块的引用计数进行引用标记操作,以避免待导出数据块被删除。例如,对引用计数加一或加特定步长。
在步骤S1005中,对内存和固态存储器进行解锁,其中,在解锁状态下,允许对内存和固态存储器进行修改。由于元信息的复制时间很短,数据块的后续导出可在后台进行,避免了影响数据块的读取及写入操作。
在步骤S1006中,将元信息写入元信息文件。
在步骤S1007中,根据元信息从内存或固态存储器上读取待导出数据块,并根据待导出数据块的关键字生成导出索引。
在步骤S1008中,将导出索引写入导出索引文件。
在步骤S1009中,将待导出数据块写入数据块文件。在本实施例中,元信息文件、导出索引文件以及数据块文件可在接到导出操作指令时创建,也可以在其他任意适当时刻创建。
在步骤S1010中,对待导出数据块的引用计数进行引用解除操作。例如,对引用计数减一或减特定步长。此时,如果数据块已经处于“删除”状态,且没有其他线程引用该数据块,则删除该数据块。
请参阅图11,图11为本发明实施例的数据库控制装置的结构示意图。该控制装置包括操作信息接收模块1101、索引信息查询模块1102以及数据块处理模块1103。
其中,操作信息接收模块1101用于接收上述操作信息。
索引信息查询模块1102用于根据上述操作信息在位于内存的索引中查询对应数据块的索引信息。在本实施例中,对应数据块包括多个数据项,每一数据项包括关键字与数据值,并且对应数据块可选择性位于内存及固态存储器中。
数据块处理模块1103用于根据上述操作信息及索引信息对对应数据块进行相应操作。
在具体实施过程中,索引包括上述的第一索引和第二索引。索引信息查询模块1102根据第一索引查询与关键字对应的位置信息,位置信息包括数据块识别信息、数据项偏移信息以及数据项长度信息。索引信息查询模块1102进一步根据第二索引查询与数据块识别信息对应的数据块信息,数据块信息包括数据块状态、内存指针以及固态存储器文件描述符等。
关于数据库控制装置的详细工作过程请参阅上文的描述,此处不再赘述。
由以上技术方案可以看出,本发明的数据库的控制方法及装置以数据块形式对多个数据项进行存储,并根据不同状态将数据块选择性存储于内存及固态存储中,进一步配合内存索引,可支持高性能读写操作,满足了对数据的高性能随机查询与更新需求。
在上述实施例中,仅对本发明进行了示范性描述,但是本领域技术人员在阅读本专利申请后可以在不脱离本发明的精神和范围的情况下对本发明进行各种修改。

Claims (8)

1.一种索引方法,其特征在于,所述索引方法包括:
a.对接收的关键字进行哈希运算,以从哈希桶表中确定对应的哈希桶,并从所述哈希桶中获得哈希节点指针;
b.利用所述哈希节点指针的前预定位从标识信息列表中确定对应的哈希节点数据块识别信息;
c.利用所述哈希节点指针的后预定位作为偏移量,从所述哈希节点数据块识别信息对应的哈希节点数据块中获取对应的哈希节点;
d.从第二索引中查询与所述哈希节点包括的数据块识别信息对应的数据块信息,所述第二索引完成从数据块识别信息到数据块信息的映射;
e.根据所述数据块信息中的数据块状态判断对应数据块位于内存还是位于固态存储器。
2.如权利要求1所述的方法,其特征在于,所述哈希节点指针为4个字节,所述前预定位为所述哈希节点指针的前9位,所述后预定位为所述哈希节点指针的后23位。
3.如权利要求1所述的方法,其特征在于,所述哈希节点包括所述关键字、数据块识别信息、数据项长度信息以及数据项偏移信息。
4.如权利要求3所述的方法,其特征在于,所述哈希节点进一步包括下一哈希节点指针,其中空闲的哈希节点通过所述下一哈希节点指针串成一个回收链表。
5.如权利要求4所述的方法,其特征在于,所述哈希节点为20个字节,其中所述关键字为8个字节、所述数据块识别信息为2个字节、所述数据项长度信息为2个字节、所述数据项偏移信息为4个字节以及所述下一哈希节点指针为4个字节。
6.如权利要求3所述的方法,其特征在于,所述数据块信息包括数据块状态、内存指针以及固态存储器文件描述符。
7.如权利要求6所述的方法,其特征在于,所述索引方法进一步包括:
f.若所述数据块位于所述内存,则根据所述内存指针、所述数据项偏移信息以及所述数据项长度信息读取对应数据项。
8.如权利要求6所述的方法,其特征在于,所述索引方法进一步包括:
f.若所述数据块位于所述固态存储器,则根据所述固态存储器文件描述符、所述数据项偏移信息以及所述数据项长度信息读取所述对应数据项。
CN201110036319.6A 2010-12-31 2010-12-31 一种索引方法 Active CN102541968B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110036319.6A CN102541968B (zh) 2010-12-31 2010-12-31 一种索引方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110036319.6A CN102541968B (zh) 2010-12-31 2010-12-31 一种索引方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN 201010619673 Division CN102567415B (zh) 2010-12-31 2010-12-31 一种数据库的控制方法和装置

Publications (2)

Publication Number Publication Date
CN102541968A CN102541968A (zh) 2012-07-04
CN102541968B true CN102541968B (zh) 2014-04-09

Family

ID=46348882

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110036319.6A Active CN102541968B (zh) 2010-12-31 2010-12-31 一种索引方法

Country Status (1)

Country Link
CN (1) CN102541968B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608224A (zh) * 2016-01-13 2016-05-25 广西师范大学 一种提高海量数据查询性能的正交多哈希映射索引方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103905503B (zh) * 2012-12-27 2017-09-26 中国移动通信集团公司 数据存取方法、调度方法、设备及系统
CN104008111B (zh) * 2013-02-27 2019-02-15 深圳市腾讯计算机系统有限公司 一种数据的存储管理方法及装置
CN104142958B (zh) * 2013-05-10 2018-03-13 华为技术有限公司 一种键值对系统中数据的存储方法和相关装置
CN103544292B (zh) * 2013-10-29 2017-05-24 大唐移动通信设备有限公司 基于HASH表的Diameter消息处理方法和装置
CN105447059B (zh) * 2014-09-29 2019-10-01 华为技术有限公司 一种数据处理方法及装置
CN105426408B (zh) * 2015-11-02 2019-03-08 北京锐安科技有限公司 一种多索引的数据处理方法及装置
CN105975587B (zh) * 2016-05-05 2019-05-10 诸葛晴凤 一种高性能的内存数据库索引组织与访问方法
CN108572958B (zh) * 2017-03-07 2022-07-29 腾讯科技(深圳)有限公司 数据处理方法及装置
CN107515901B (zh) * 2017-07-24 2020-12-04 中国科学院信息工程研究所 一种链式日志存储结构及其哈希索引结构、数据操作方法及服务器、介质
CN107609093B (zh) * 2017-09-08 2020-12-18 东软集团股份有限公司 一种数据库表监控方法、装置、设备和存储介质
CN107609143B (zh) * 2017-09-21 2020-06-05 国电南瑞科技股份有限公司 一种分布式实时内存数据库的分片信息存储方法
CN108052582A (zh) * 2017-12-08 2018-05-18 锐捷网络股份有限公司 一种访问数据库的方法和装置
CN110069496A (zh) * 2019-03-20 2019-07-30 韶关学院 一种新型链式哈希表构建方法及装置
CN110516121A (zh) * 2019-08-28 2019-11-29 中国银行股份有限公司 数据读取方法及装置
CN111565195A (zh) * 2020-05-21 2020-08-21 杭州安恒信息技术股份有限公司 分布式系统的挑战黑洞攻击防御方法和分布式系统
CN112162950B (zh) * 2020-09-11 2022-11-15 杭州涂鸦信息技术有限公司 基于文件系统的数据处理方法、装置和计算机设备
CN112199333B (zh) * 2020-09-24 2022-11-22 武汉绿色网络信息服务有限责任公司 一种支持多值索引文件的存储方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1912870A (zh) * 2006-09-05 2007-02-14 四川南山之桥微电子有限公司 一种哈希表查表方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4148529B2 (ja) * 2006-12-28 2008-09-10 インターナショナル・ビジネス・マシーンズ・コーポレーション データベースにおける索引の整合性をチェックするためのシステム、方法およびプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1912870A (zh) * 2006-09-05 2007-02-14 四川南山之桥微电子有限公司 一种哈希表查表方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JP特开2008-165474A 2008.07.17
潘爱民.windows内存管理.《windows内核原理与实现》.2010,第204-206页. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608224A (zh) * 2016-01-13 2016-05-25 广西师范大学 一种提高海量数据查询性能的正交多哈希映射索引方法

Also Published As

Publication number Publication date
CN102541968A (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
CN102541968B (zh) 一种索引方法
CN102567434B (zh) 一种数据块处理方法
CN102567415B (zh) 一种数据库的控制方法和装置
JP5996088B2 (ja) 暗号ハッシュ・データベース
CN103080910B (zh) 存储系统
CN102508784B (zh) 视频监控设备中闪存卡的数据存储方法及其系统
CN108431783B (zh) 访问请求处理方法、装置及计算机系统
CN103186617B (zh) 一种存储数据的方法和装置
CN105069048A (zh) 一种小文件存储方法、查询方法和装置
WO2014015828A1 (zh) 数据存储空间的处理方法、处理系统及数据存储服务器
CN105843551A (zh) 高性能和大容量储存重复删除中的数据完整性和损耗电阻
JP2005122702A5 (zh)
CN112131140B (zh) 基于ssd的支持高效存储空间管理的键值分离存储方法
CN101419571A (zh) 基于Hash算法的在NOR FLASH中存储配置参数的方法
CN110888837B (zh) 对象存储小文件归并方法及装置
CN109407985B (zh) 一种数据管理的方法以及相关装置
CN103279366A (zh) 固态硬盘及掉电后基于固态硬盘快速开机的方法
CN103617097A (zh) 文件恢复方法及装置
CN105045850A (zh) 云存储日志文件系统中垃圾数据回收方法
CN108431784B (zh) 访问请求处理方法、装置及计算机系统
CN110352410A (zh) 跟踪索引节点的访问模式以及预提取索引节点
US8239427B2 (en) Disk layout method for object-based storage devices
CN111831691B (zh) 一种数据读写方法及装置、电子设备、存储介质
CN111008183B (zh) 一种用于业务风控日志数据的存储方法及系统
CN106776361B (zh) 一种面向大规模非易失性存储介质的缓存方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant