CN102024047A - 数据检索方法及装置 - Google Patents

数据检索方法及装置 Download PDF

Info

Publication number
CN102024047A
CN102024047A CN2010105885516A CN201010588551A CN102024047A CN 102024047 A CN102024047 A CN 102024047A CN 2010105885516 A CN2010105885516 A CN 2010105885516A CN 201010588551 A CN201010588551 A CN 201010588551A CN 102024047 A CN102024047 A CN 102024047A
Authority
CN
China
Prior art keywords
document
identification information
word
search key
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010105885516A
Other languages
English (en)
Other versions
CN102024047B (zh
Inventor
石柱国
余孟春
谢清禄
王堃
陈新宾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing SA data Technology Co., Ltd.
Original Assignee
QINGDAO POJAA INTELLIGENT INFORMATION CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by QINGDAO POJAA INTELLIGENT INFORMATION CO Ltd filed Critical QINGDAO POJAA INTELLIGENT INFORMATION CO Ltd
Priority to CN 201010588551 priority Critical patent/CN102024047B/zh
Publication of CN102024047A publication Critical patent/CN102024047A/zh
Application granted granted Critical
Publication of CN102024047B publication Critical patent/CN102024047B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种数据检索方法及装置。该数据检索方法包括:获取用户输入的检索关键词,根据检索关键词查询词语索引模块,以获取词语索引模块中预置的与检索关键词对应的词语标识信息;根据词语标识信息查询反向索引模块,以获取反向索引模块中预置的与词语标识信息对应的压缩存储的文档信息;对文档信息进行解压缩,以获取与检索关键词相关的文档的文档标识信息;根据检索关键词和文档标识信息查询词语位置索引模块,以获取所述检索关键词在文档标识信息对应的文档中的位置信息;根据文档标识信息及所述位置信息显示文档。本发明的数据检索方法及装置能够降低检索系统的硬件资源消耗并提高检索效率。

Description

数据检索方法及装置
技术领域
本发明涉及一种数据处理方法及装置,尤其涉及一种数据检索方法及装置。
背景技术
全文检索是极为常用的一种通过网络获取所需信息的方式。全文检索一般是利用到排索引技术实现检索,每进行一次查询,都需要根据检索的关键词来寻找对应的文档,并根据搜索表达式进行一系列运算,这些操作都会产生一定的I/O消耗和CPU消耗,并且单次查询的资源消耗与多次查询的资源消耗是直接相关的。随着网络访问量的增大,这种资源消耗将直接影响网络搜索系统的承载量,即单次查询的资源消耗越小,网络搜索系统的承载量越大。当整个网络系统需面对每天数千万次、甚至是上亿次的访问时,查询效率和资源消耗对于整个网络搜索系统的硬件资源消耗、响应速度及承载量起着至关重要的作用。
发明内容
本发明提供一种数据检索方法及装置,用以实现高检索效率、低资源消耗的数据检索。
本发明提供的数据检索方法,包括:获取用户输入的检索关键词,根据所述检索关键词查询词语索引模块,以获取所述词语索引模块中预置的与所述检索关键词对应的词语标识信息;
根据所述词语标识信息查询反向索引模块,以获取所述反向索引模块中预置的与所述词语标识信息对应的压缩存储的文档信息;
对所述文档信息进行解压缩,以获取与所述检索关键词相关的文档的文档标识信息;
根据所述检索关键词和所述文档标识信息查询词语位置索引模块,以获取所述检索关键词在所述文档标识信息对应的文档中的位置信息;
根据所述文档标识信息及所述位置信息显示所述文档。
本发明提供的数据检索装置,包括获取模块、词语索引模块、反向索引模块、词语位置索引模块和显示模块,其中:
所述获取模块与所述词语索引模块、反向索引模块、词语位置索引模块和显示模块连接,用于获取用户输入的检索关键词,根据所述检索关键词查询词语索引模块,以获取所述词语索引模块中预置的与所述检索关键词对应的词语标识信息;
根据所述词语标识信息查询反向索引模块,以获取所述反向索引模块中预置的与所述词语标识信息对应的压缩存储的文档信息;
对所述文档信息进行解压缩,以获取与所述检索关键词相关的文档的文档标识信息;
根据所述检索关键词和所述文档标识信息查询词语位置索引模块,以获取所述检索关键词在所述文档标识信息对应的文档中的位置信息;
将对应于所述文档标识信息的所述文档及所述信息参数发送给所述显示模块,以根据所述文档标识信息及所述位置信息显示所述文档。
本发明的数据检索方法及装置,由于通过查询到对应于检索关键词的词语标识信息,并进一步通过该词语标识信息从反向索引模块中查询到对应的文档信息,从而仅对该部分文档信息进行解压缩,即可获取实现该检索所需文档标识信息。既能够节约存储空间,又能够极大地缩短处理时间,从而提高检索效率。
附图说明
图1为本发明数据检索方法的流程图。
图2为本发明数据检索方法中采用分组压缩方式进行数据压缩的示意图。
图3为本发明数据检索装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图,对本发明的技术方案进行清楚、完整地描述。
图1为本发明数据检索方法的流程图。如图1所示,该数据检索方法包括:
步骤S100,获取用户输入的检索关键词,根据检索关键词查询词语索引模块,以获取词语索引模块中预置的与检索关键词对应的词语标识信息;
其中,词语索引模块中存储有预置的词语列表,包括词语的循环冗余校验(CRC)值,词语标识信息,与各词语相关的文档数量及该词语在所有文档中出现的总次数信息。该词语索引模块中存储的文件以.pji作为文件扩展名。
步骤S200,根据词语标识信息查询反向索引模块,以获取反向索引模块中预置的与词语标识信息对应的压缩存储的文档信息;
其中,反向索引模块中存储有对应于词语索引模块中各词语的反向索引数据,其包括与各词语相关的文档标识信息(例如包括文档ID,文档的作者及文档的分类信息等),该词语在该文档中所属字段(例如,该词语包括在该文档的标题、摘要或正文等,该所属字段是用四个字节的bit位表示该词语出现在哪个字段,第N个bit位表示该关键词是否出现在第N个字段,故该所属字段可用于表示32个字段的信息),以及该词语在该文档中所出现的次数(保存该次数能够避免重复计算,以提高性能和检索速度)。该反向索引模块中存储的文件以.pjd作为文件扩展名。
步骤S300,对文档信息进行解压缩,以获取与所述检索关键词相关的文档的文档标识信息;
其中,由于该反向索引模块中存储的数据量较为庞大,为节约存储空间,将文档标识信息压缩存储。并且,在利用该反向索引模块进行检索时,并不一次性地将全部文档信息进行解压缩,而是在根据步骤S100中获取的词语标识信息,查询到该反向索引模块中用于存储所需文档信息的存储单元地址,仅对该存储单元地址所存储的内容进行解压缩,从而获取所需的文档标识信息。
步骤S400,根据检索关键词和文档标识信息查询词语位置索引模块,以获取检索关键词在文档标识信息对应的文档中的位置信息;
其中,词语位置索引模块中存储有各文档对应的所有词语出现的位置,具体包括词语出现在文档的哪个字段、以及字段中的哪个具体位置。对各词语的位置信息的比特(bit)位可按照如下分配:
词语在字段中的位置:长度23bit,bit位1~23;
是否是该字段中最后一次出现:长度1bit,bit位24;
字段ID:长度为8bit的整型数,用该8bit整型数来表示32个字段中的任意一个。
该词语位置索引模块中存储的文件以.pjp作为文件扩展名。
步骤S500,根据文档标识信息及位置信息显示文档。
其中,获取文档标识信息及检索关键词在该文档中的位置信息后,根据这些信息查询文档数据库(可以为任意形式的、存储文档资源的数据库或系统),以获取整篇文档或包含检索关键词的部分文档,并返回给检索用户。
根据上述实施例的数据检索方法,由于通过从词语索引模块中查询到对应于检索关键词的词语标识信息,并通过该词语标识信息从反向索引模块中查询到对应的文档信息,从而仅对该部分文档信息进行解压缩,即可获取实现该检索所需文档标识信息。一方面,能够节约存储空间,另一方面,其相对于对全部文档信息进行解压缩,能够极大地缩短处理时间,从而提高检索效率。
进一步地,在上述实施例的数据检索方法中,检索关键词对应的词语标识信息为反向索引模块中用于存储与该检索关键词相关的文档信息的起始位置。该起始位置即为反向索引模块中用于存储对应于该检索关键词的首个压缩的文档信息的存储单元地址。读取从该存储单元地址开始的连续数个存储单元的内容,直至读取到用于标识对应于该检索关键词的结束位为止,该结束位例如为所有值均为0的字节。
进一步地,对文档信息进行解压缩,以获取与检索关键词相关的文档的文档标识信息的步骤之后还包括:从文档信息中获取检索关键词在各文档中出现的次数;相应地,根据文档标识信息及位置信息显示文档的步骤中还包括显示检索关键词在文档中出现的次数。
根据上述实施例的数据检索方法,能够提供给检索用户更详细的信息,以方便用户根据各文档中该检索关键词出现的次数来选择性地进行文档浏览。
进一步地,获取用户输入的检索关键词,根据检索关键词查询词语索引模块,以从词语索引模块中预置的与检索关键词对应的词语标识信息的步骤之前,还包括:
在词语索引模块中预置词语列表,词语列表包括多个词语及与词语对应的词语标识信息;
在反向索引模块中预置与词语标识信息对应的文档标识信息;
对文档标识信息进行压缩。
进一步地,上述对文档信息进行压缩的步骤可具体包括:
利用2比特位来表示所述文档标识信息所占用的字节数,并将对应于各所述词语的连续四个文档标识信息所占用的字节数组合在一个用于存储字节数信息的字节中;
删除所述四个文档标识信息中所占用的内容为0的字节、并连续存储内容不为0的字节。
相应地,对所述文档信息进行压缩的步骤具体包括:
利用2比特位来表示所述文档标识信息所占用的字节数,并将对应于各所述词语的连续四个文档标识信息所占用的字节数组合在一个用于存储字节数信息的字节中;
删除所述四个文档标识信息中所占用的内容为0的字节、并连续存储内容不为0的字节。
上述压缩方法为分组压缩方法,其不仅可以用于压缩反射索引模块中存储的数据,也可以用于对词语索引模块和词语位置索引模块的数据进行压缩存储。
图2为本发明数据检索方法中采用分组压缩方式进行数据压缩的示意图。下面结合图2对该分组压缩方法进行详细说明。
在本数据检索方法中应用的各模块中,都是以整型数格式存储数据的,即为各数据分配四个字节。但是在该数据检索方法中,所存储的数据通常不会完全占用四个字节。尤其当采用“差值法”(即:在整型数序列中,只保存后一个与前一个的差值)进行数据存储时,这种现象就更为明显。因此,通过对未占有用的字节进行压缩,能够极大地节约存储空间。如图2所示,将每一个整型数占用的字节长度,用2个比特(bit)位表示,例如,将占用一个字节的“00000001”用“00”表示,“00001111”也仅占用一个字节,用“00”表示,将占用二个字节的“11111111 00000001”用“01”表示,将占用三个字节的“11111111 11111111 00000001”用“10”表示,同理,占用四个字节的数据可用“11”表示(图中未示出)。将图2中的四个整型数的用于表示字节长度的bit位组成一个字节,即构成“00000110”,并将上述占用的字节存储在连续的存储单元中。
在进行解压缩时,通对上述用于表示四个整型数字节长度的字节进行位运算,即可获知各整型数所占用的字节,根据该字节,即可对连续存储的多个存储单元进行划分,以获得压缩前的四个整型数。
利用上述分组压缩方法的数据检索方法,能够节约大量存储空间,并且由于在解压缩的过程中,通过对一个字节进行运算,即可处理四个整型数,能够极大地提高处理速度(处理速度其比传统方式快3~4倍),从而提高数据检索的响应速度,进一步提升整个检索系统的访问承载量。
进一步地,在上述实施例的数据检索方法中,还可包括索引信息模块,其用于保存索引meta信息及索引配置信息,以保证索引加载时读取到正确的参数。该索引信息模块中存储的文件以.pjh作为文件扩展名。
图3为本发明数据检索装置的结构示意图。如图3所示,本发明数据检索装置包括获取模块10、词语索引模块20、反向索引模块30、词语位置索引模块40和显示模块50,其中:
获取模块10与词语索引模块20、反向索引模块30、词语位置索引模块40和显示模块50连接,用于获取用户输入的检索关键词,根据检索关键词查询词语索引模块20,以获取词语索引模块20中预置的与检索关键词对应的词语标识信息;
根据词语标识信息查询反向索引模块30,以获取反向索引模块30中预置的与词语标识信息对应的压缩存储的文档信息;
对文档信息进行解压缩,以获取与检索关键词相关的文档的文档标识信息;
根据检索关键词和文档标识信息查询词语位置索引模块40,以获取检索关键词在文档标识信息对应的文档中的位置信息;
将对应于文档标识信息的文档及信息参数发送给显示模块50,以根据文档标识信息及位置信息显示文档。
根据上述实施例的数据检索装置,由于通过从词语索引模块中查询到对应于检索关键词的词语标识信息,并通过该词语标识信息从反向索引模块中查询到对应的文档信息,从而仅对该部分文档信息进行解压缩,即可获取实现该检索所需文档标识信息。一方面,能够节约存储空间,另一方面,其相对于对全部文档信息进行解压缩,能够极大地缩短处理时间,从而提高检索效率。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (7)

1.一种数据检索方法,其特征在于,包括:
获取用户输入的检索关键词,根据所述检索关键词查询词语索引模块,以获取所述词语索引模块中预置的与所述检索关键词对应的词语标识信息;
根据所述词语标识信息查询反向索引模块,以获取所述反向索引模块中预置的与所述词语标识信息对应的压缩存储的文档信息;
对所述文档信息进行解压缩,以获取与所述检索关键词相关的文档的文档标识信息;
根据所述检索关键词和所述文档标识信息查询词语位置索引模块,以获取所述检索关键词在所述文档标识信息对应的文档中的位置信息;
根据所述文档标识信息及所述位置信息显示所述文档。
2.根据权利要求1所述的数据检索方法,其特征在于,所述检索关键词对应的词语标识信息为所述反向索引模块中用于存储与所述检索关键词相关的文档信息的起始位置。
3.根据权利要求1或2所述的数据检索方法,其特征在于,对所述文档信息进行解压缩,以获取与所述检索关键词相关的文档的文档标识信息的步骤之后还包括:从所述文档信息中获取所述检索关键词在各所述文档中出现的次数;相应地,根据所述文档标识信息及所述位置信息显示所述文档的步骤中还包括显示所述检索关键词在所述文档中出现的次数。
4.根据权利要求1或2所述的数据检索方法,其特征在于,所述获取用户输入的检索关键词,根据所述检索关键词查询词语索引模块,以从所述词语索引模块中预置的与所述检索关键词对应的词语标识信息的步骤之前,还包括:
在词语索引模块中预置词语列表,所述词语列表包括多个词语及与所述词语对应的所述词语标识信息;
在反向索引模块中预置与所述词语标识信息对应的文档标识信息;
对所述文档标识信息进行压缩。
5.根据权利要求4所述的数据检索方法,其特征在于,对所述文档信息进行压缩的步骤具体包括:
利用2比特位来表示所述文档标识信息所占用的字节数,并将对应于各所述词语的连续四个文档标识信息所占用的字节数组合在一个用于存储字节数信息的字节中;
删除所述四个文档标识信息中所占用的内容为0的字节、并连续存储内容不为0的字节。
6.根据权利要求5所述的数据检索方法,其特征在于,对所述文档信息进行解压缩的步骤具体包括:
对所述用于存储字节数信息的字节进行位运算,以获取所述连续四个文档标识信息所占用的字节数,并根据所述字节数从所述连续存储的内容不为0的字节中读取所述连续四个文档标识信息。
7.一种数据检索装置,其特征在于,包括获取模块、词语索引模块、反向索引模块、词语位置索引模块和显示模块,其中:
所述获取模块与所述词语索引模块、反向索引模块、词语位置索引模块和显示模块连接,用于获取用户输入的检索关键词,根据所述检索关键词查询词语索引模块,以获取所述词语索引模块中预置的与所述检索关键词对应的词语标识信息;
根据所述词语标识信息查询反向索引模块,以获取所述反向索引模块中预置的与所述词语标识信息对应的压缩存储的文档信息;
对所述文档信息进行解压缩,以获取与所述检索关键词相关的文档的文档标识信息;
根据所述检索关键词和所述文档标识信息查询词语位置索引模块,以获取所述检索关键词在所述文档标识信息对应的文档中的位置信息;
将对应于所述文档标识信息的所述文档及所述信息参数发送给所述显示模块,以根据所述文档标识信息及所述位置信息显示所述文档。
CN 201010588551 2010-12-14 2010-12-14 数据检索方法及装置 Expired - Fee Related CN102024047B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010588551 CN102024047B (zh) 2010-12-14 2010-12-14 数据检索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010588551 CN102024047B (zh) 2010-12-14 2010-12-14 数据检索方法及装置

Publications (2)

Publication Number Publication Date
CN102024047A true CN102024047A (zh) 2011-04-20
CN102024047B CN102024047B (zh) 2013-05-29

Family

ID=43865344

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010588551 Expired - Fee Related CN102024047B (zh) 2010-12-14 2010-12-14 数据检索方法及装置

Country Status (1)

Country Link
CN (1) CN102024047B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103455637A (zh) * 2013-09-25 2013-12-18 浙江宇视科技有限公司 一种车牌检索的方法和装置
CN104657362A (zh) * 2013-11-18 2015-05-27 深圳市腾讯计算机系统有限公司 数据存储、查询方法和装置
CN105208596A (zh) * 2014-06-17 2015-12-30 中兴通讯股份有限公司 一种表头压缩方法、解压方法及装置
CN105683958A (zh) * 2013-10-29 2016-06-15 微软技术许可有限责任公司 文本样本条目组制定
CN106384108A (zh) * 2016-08-31 2017-02-08 上海斐讯数据通信技术有限公司 文字内容检索方法及词语解读装置和移动终端
WO2017067117A1 (zh) * 2015-10-21 2017-04-27 华为技术有限公司 数据查询方法和装置
CN107305586A (zh) * 2016-04-18 2017-10-31 富士通株式会社 索引生成方法、索引生成装置及搜索方法
CN108255829A (zh) * 2016-12-28 2018-07-06 腾讯科技(北京)有限公司 数据查找方法及装置
CN110718277A (zh) * 2019-09-02 2020-01-21 浙江大学 一种基于双向快速索引的多级临床基因组变异数据存储方法
CN110879810A (zh) * 2019-12-02 2020-03-13 北京明略软件系统有限公司 数据处理方法及装置
WO2020087704A1 (zh) * 2018-10-31 2020-05-07 平安科技(深圳)有限公司 信贷信息管理方法、装置、设备和存储介质
CN111651458A (zh) * 2020-06-04 2020-09-11 山东中创软件工程股份有限公司 一种市场监管数据检索方法、装置、设备及可读存储介质
CN112445830A (zh) * 2020-11-26 2021-03-05 湖南智慧政务区块链科技有限公司 一种基于区块链技术的数据分析系统
CN114095472A (zh) * 2021-11-22 2022-02-25 北京知道创宇信息技术股份有限公司 地址管理方法、终端、电子设备及计算机可读存储介质
CN116954745A (zh) * 2023-05-25 2023-10-27 成都融见软件科技有限公司 一种目标文件部分加载系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080133565A1 (en) * 2006-11-08 2008-06-05 Tomohiro Yasuda Device and method for constructing inverted indexes
US20080313213A1 (en) * 2007-06-15 2008-12-18 Microsoft Corporation Efficient data infrastructure for high dimensional data analysis
CN101676899A (zh) * 2008-09-18 2010-03-24 上海宝信软件股份有限公司 海量数据库记录的归档和查询方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080133565A1 (en) * 2006-11-08 2008-06-05 Tomohiro Yasuda Device and method for constructing inverted indexes
US20080313213A1 (en) * 2007-06-15 2008-12-18 Microsoft Corporation Efficient data infrastructure for high dimensional data analysis
CN101676899A (zh) * 2008-09-18 2010-03-24 上海宝信软件股份有限公司 海量数据库记录的归档和查询方法

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103455637A (zh) * 2013-09-25 2013-12-18 浙江宇视科技有限公司 一种车牌检索的方法和装置
CN105683958A (zh) * 2013-10-29 2016-06-15 微软技术许可有限责任公司 文本样本条目组制定
CN104657362B (zh) * 2013-11-18 2018-07-10 深圳市腾讯计算机系统有限公司 数据存储、查询方法和装置
CN104657362A (zh) * 2013-11-18 2015-05-27 深圳市腾讯计算机系统有限公司 数据存储、查询方法和装置
CN105208596A (zh) * 2014-06-17 2015-12-30 中兴通讯股份有限公司 一种表头压缩方法、解压方法及装置
WO2017067117A1 (zh) * 2015-10-21 2017-04-27 华为技术有限公司 数据查询方法和装置
CN107305586B (zh) * 2016-04-18 2021-10-15 富士通株式会社 索引生成方法、索引生成装置及搜索方法
US11080234B2 (en) 2016-04-18 2021-08-03 Fujitsu Limited Computer readable recording medium for index generation
CN107305586A (zh) * 2016-04-18 2017-10-31 富士通株式会社 索引生成方法、索引生成装置及搜索方法
CN106384108A (zh) * 2016-08-31 2017-02-08 上海斐讯数据通信技术有限公司 文字内容检索方法及词语解读装置和移动终端
CN108255829B (zh) * 2016-12-28 2021-10-19 腾讯科技(北京)有限公司 数据查找方法及装置
CN108255829A (zh) * 2016-12-28 2018-07-06 腾讯科技(北京)有限公司 数据查找方法及装置
WO2020087704A1 (zh) * 2018-10-31 2020-05-07 平安科技(深圳)有限公司 信贷信息管理方法、装置、设备和存储介质
CN110718277A (zh) * 2019-09-02 2020-01-21 浙江大学 一种基于双向快速索引的多级临床基因组变异数据存储方法
CN110718277B (zh) * 2019-09-02 2022-06-14 浙江大学 一种基于双向快速索引的多级临床基因组变异数据存储方法
CN110879810A (zh) * 2019-12-02 2020-03-13 北京明略软件系统有限公司 数据处理方法及装置
CN111651458A (zh) * 2020-06-04 2020-09-11 山东中创软件工程股份有限公司 一种市场监管数据检索方法、装置、设备及可读存储介质
CN112445830A (zh) * 2020-11-26 2021-03-05 湖南智慧政务区块链科技有限公司 一种基于区块链技术的数据分析系统
CN112445830B (zh) * 2020-11-26 2024-05-14 湖南智慧政务区块链科技有限公司 一种基于区块链技术的数据分析系统
CN114095472A (zh) * 2021-11-22 2022-02-25 北京知道创宇信息技术股份有限公司 地址管理方法、终端、电子设备及计算机可读存储介质
CN114095472B (zh) * 2021-11-22 2023-11-28 北京知道创宇信息技术股份有限公司 地址管理方法、终端、电子设备及计算机可读存储介质
CN116954745A (zh) * 2023-05-25 2023-10-27 成都融见软件科技有限公司 一种目标文件部分加载系统
CN116954745B (zh) * 2023-05-25 2024-02-09 成都融见软件科技有限公司 一种目标文件部分加载系统

Also Published As

Publication number Publication date
CN102024047B (zh) 2013-05-29

Similar Documents

Publication Publication Date Title
CN102024047B (zh) 数据检索方法及装置
CN102364474B (zh) 用于机群文件系统的元数据存储系统和管理方法
US8321485B2 (en) Device and method for constructing inverted indexes
KR101792168B1 (ko) 개별 액세스 가능한 데이터 유닛의 스토리지 관리
CN102890722B (zh) 应用于时序历史数据库的索引方法
US8032495B2 (en) Index compression
CN101782922B (zh) 一种面向海量数据检索的多级桶哈希索引方法
US20120317105A1 (en) Method and Apparatus for Updating Index and Sequencing Search Results Based on Updated Index in Terminal
US20070124277A1 (en) Index and Method for Extending and Querying Index
CN107368527B (zh) 基于数据流的多属性索引方法
CN102622434B (zh) 数据存储方法、查找方法及装置
CN101526965B (zh) 一种磁盘文件的索引节点定位方法和装置
CN1924854B (zh) 智能移动终端的桌面搜索方法
CN102024019A (zh) 一种分布式文件系统中基于后缀树的目录组织方法
Yang et al. An enhanced dynamic hash TRIE algorithm for lexicon search
CN102201007A (zh) 一种大规模数据搜索系统
CN102999637A (zh) 根据文件特征码为文件自动添加文件标签的方法及系统
CN116226425A (zh) 一种图数据的存储方法、读取方法和系统
CN107273443B (zh) 一种基于大数据模型元数据的混合索引方法
Zhang et al. Exploring large-scale small file storage for search engines
CN103902693A (zh) 一种读优化的内存数据库t树索引结构的方法
Belov et al. Analysis of Big Data Storage Tools for Data Lakes based on Apache Hadoop Platform
Ottaviano et al. Semi-indexing semi-structured data in tiny space
JP5374881B2 (ja) 情報検索システム、情報検索方法およびプログラム
CN110297836B (zh) 基于压缩位图方式的用户标签存储方法和检索方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20151030

Address after: 100015 Beijing City, Chaoyang District Shun Street No. 6 hospital of Beijing city LINK12

Patentee after: Beijing SA data Technology Co., Ltd.

Address before: 266555 Shandong city of Qingdao province Jiangshan Qingdao economic and Technological Development Zone Branch Road No. 458 building 18 layer

Patentee before: Qingdao Pojaa Intelligent Information Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130529

Termination date: 20161214

CF01 Termination of patent right due to non-payment of annual fee