CN100476821C - 一种数据存储/检索方法及系统 - Google Patents

一种数据存储/检索方法及系统 Download PDF

Info

Publication number
CN100476821C
CN100476821C CN 200610078690 CN200610078690A CN100476821C CN 100476821 C CN100476821 C CN 100476821C CN 200610078690 CN200610078690 CN 200610078690 CN 200610078690 A CN200610078690 A CN 200610078690A CN 100476821 C CN100476821 C CN 100476821C
Authority
CN
China
Prior art keywords
block
key word
data
crucial
crucial block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 200610078690
Other languages
English (en)
Other versions
CN1858747A (zh
Inventor
廖晔
李成祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Original Assignee
Beijing Kingsoft Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Software Co Ltd filed Critical Beijing Kingsoft Software Co Ltd
Priority to CN 200610078690 priority Critical patent/CN100476821C/zh
Publication of CN1858747A publication Critical patent/CN1858747A/zh
Application granted granted Critical
Publication of CN100476821C publication Critical patent/CN100476821C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种数据存储/检索方法及系统。所述存储方法为:提取关键字的字符,将所述提取的关键字的字符作为索引进行存储;存储由首字符相同的关键字组成的第一关键字块;分块存储第一关键字块对应的数据。所述检索方法包括:1)查找索引,根据索引所标识的第一关键字块和对应数据块的存储位置获取存储的与被检索关键字首字符相同的第一关键字块和对应数据块,所述索引由提取的关键字的字符组成,所述第一关键字块由首字符相同的关键字组成,所述对应数据块根据所述第一关键字块进行存储;2)查找第一关键字块中含有的被检索关键字所对应数据的存储位置,依据该位置从数据块中获取数据。本发明可提高无线设备检索词典类数据的速度。

Description

一种数据存储/检索方法及系统
技术领域
本发明涉及数据处理技术,尤其涉及一种词典类数据的存储/检索方法及系统。
背景技术
随着无线通讯技术的发展,人们希望在手机等无线设备中存储越来越多的有用信息,例如词典类的数据。通常情况下,词典类数据具有如下特征:数据量庞大,每本词典中的关键字唯一,关键字之间可按照一定顺序排列。为了满足不同用户的需求,通常会提供给用户多本不同类型的词典,例如:汉英词典,英汉词典,专业词典等。
现有词典类数据的存储方法,请参阅图1现有技术词典存储示意图,其存储内容包括:加密校验信息、字典信息、关键字、数据,其中关键字包含与关键字对应的每个解释数据的偏移量。存储的方法是首先将词典中所有关键字以及与关键字对应的每个解释数据的偏移量提取出来,再将整个解释数据压缩后作为一个文件保存。
根据现有存储方法,无线设备在进行数据检索时,在所有关键字中找到欲检索的关键字,获取其解释数据的偏移量,再解压缩解释数据所在文件,通过偏移量找到当前关键字的解释数据。请参阅图2现有技术的检索流程图,包括步骤:
S21、遍历每本目标词典,若遍历结束,则结束检索,若遍历未结束,进入步骤S22;
S22、根据加密校验信息,校验当前词典有效性,若有效,进入步骤S23,若无效,进入步骤S21;
S23、提取欲检索的关键字;
S24、遍历词典中所有关键字,看是否找到匹配关键字,若找到进入步骤S25,若没有找到进入步骤S21;
S25、根据找到的匹配关键字,获取关键字含有的与关键字对应的每个解释数据的偏移量;
S26、解压缩解释数据所在文件,通过偏移量找到当前关键字的解释数据,取出本词典数据后,进入步骤S21进行下一本目标词典的检索。
可以看出,根据现有存储方法,需要在所有关键字中进行查找并且获取解释数据,相当于对整个解释数据文件进行操作,致使手机检索速度慢。
另外,为了提高检索速度,只能缩小词典的检索范围,例如只选取词典中的部分数据存储在无线设备中,或者减少词典的数目。这两种选择,虽然能加快无线设备的处理检索速度,但由于词典的检索范围缩小,不能满足用户日益增长的信息检索需求。
发明内容
本发明要解决的技术问题是提供一种数据存储/检索方法及系统,该方法及系统能将词典类数据进行有效的组合,使无线设备提高数据检索速度,满足用户对信息的检索需求。
为解决上述技术问题,本发明的目的是通过以下技术方案实现:
本发明提供一种数据存储方法,包括:提取关键字的字符,将所述提取的关键字的字符作为索引进行存储,所述索引标识第一关键字块及其对应数据的存储位置;存储由首字符相同的关键字组成的第一关键字块;分块存储所述第一关键字块对应的数据。
进一步的,所述索引通过第一关键字块标识元组标识所述第一关键字块的首字符、第一关键字块的存储位置、第一关键字块对应的数据块的存储位置。
进一步的,存储由第一关键字块中前两位字符相同的关键字组成的第二关键字块;所述索引进一步通过第二关键字块标识元组标识第二关键字块的前两位字符组合、第二关键字块的存储位置;所述第二关键字块进一步通过关键字元组标识关键字、关键字所对应数据的存储位置。
通过偏移地址和长度标识所述关键字块或/和数据块的存储位置。
通过偏移地址和长度标识所述关键字所对应数据的存储位置。
本发明提供一种数据检索方法,包括步骤:61)查找索引,根据索引所标识的第一关键字块及其对应数据块的存储位置,直接获取存储的与被检索关键字首字符相同的第一关键字块及其对应数据块,所述索引由提取的关键字的字符组成,所述第一关键字块由首字符相同的关键字组成,所述对应数据块根据所述第一关键字块进行存储;62)查找第一关键字块中含有的所述被检索关键字所对应数据的存储位置,依据该位置从所述数据块中获取数据。
进一步的,所述索引通过标识元组标识第一关键字块和对应数据块的存储位置,所述步骤61)包括:611)提取被检索关键字的首字符;612)遍历标识元组,将被检索关键字的首字符与标识元组中标识的字符进行匹配,若成功,获取该标识元组中第一关键字块和对应数据块的存储位置;613)依据所述第一关键字块和对应数据块的存储位置,获取第一关键字块和数据块。
所述第一关键字块中前两位字符相同的关键字组成第二关键字块;所述步骤61)中进一步对索引进行查找,根据索引进一步所标识的第二关键字块的存储位置获取与被检索关键字前两位字符相同的第二关键字块;以及步骤62)中,被检索关键字所对应数据的存储位置的获取具体为,在第二关键字块中遍历关键字元组,查找所述被检索关键字,并获取关键字元组中该被检索关键字所对应数据的存储位置。
所述索引通过标识元组标识第二关键字块的存储位置,所述进一步对索引进行查找包括步骤:91)提取被检索关键字的第二位字符;92)遍历标识元组,将被检索关键字的前两位字符与标识元组中标识的字符进行匹配,若成功,获取该标识元组中第二关键字块的存储位置。
通过偏移地址和长度标识所述关键字块或/和数据块的存储位置。
通过偏移地址和长度标识所述关键字所对应数据的存储位置。
本发明提供一种数据存储系统,包括加密校验信息单元、词典信息单元,还包括:索引单元,用于提取关键字的字符,存储由所述关键字的字符组成的标识元组的集合,所述标识元组标识第一关键字块及其对应数据的存储位置;第一关键字块集合单元,用于存储由首字符相同的关键字构成的第一关键字块的集合;数据块集合单元,用于存储与所述第一关键字块集合单元存储的第一关键字块所对应的数据块的集合。
进一步的,所述索引单元存储的标识元组通过第一关键字块标识元组标识所述第一关键字块的首字符、第一关键字块的存储位置、第一关键字块对应的数据块的存储位置。
所述第一关键字块集合单元存储的第一关键字块进一步将前两位字符相同的关键字组成第二关键字块;所述索引单元存储的标识元组进一步通过第二关键字块标识元组标识第二关键字块的前两位字符组合、第二关键字块的存储位置;所述第二关键字块进一步通过关键字元组标识关键字、关键字所对应数据的存储位置。
所述索引单元通过偏移地址和长度标识所述关键字块或/和数据块的存储位置。
所述第一关键字块集合单元通过偏移地址和长度标识所述关键字所对应数据的存储位置。
以上技术方案可以看出,本发明具有以下有益效果:
首先,根据现有存储方法,需要在所有关键字中进行查找并且获取解释数据,相当于对整个数据文件进行操作,而本发明以标识元组为索引,将与第一关键字块对应的数据进行分块压缩并存储,在检索时,通过获取作为索引的标识元组,取出第一关键字块和对应的数据块,并通过获取关键字块中的关键字元组,从第一关键字块对应的数据块中取出数据。也就是说,不用对整个数据文件进行操作,只需解压缩关键字对应数据块,并从中获取数据,从而提高了无线设备的数据检索速度;
进一步的,根据本发明,由于无线设备的数据检索速度提高,所以可增大词典数据检索的范围,增加检索的词典数目,从而满足用户不断增长的信息检索需求。
附图说明
图1是现有技术的词典存储示意图;
图2是现有技术的检索流程图;
图3是本发明的词典存储示意图;
图4是本发明的索引存储示意图;
图5是本发明的第二关键字块存储示意图;
图6是本发明的检索流程图;
图7是本发明的词典存储系统结构图。
具体实施方式
本发明提供的一种数据存储/检索方法及系统,可以使无线设备检索词典类数据时加快检索速度,增大词典数据检索的范围,满足用户对信息的检索需求。
本发明是以每本词典作为存储单位进行存储,一个目标词典对应一个文件。为了便于对本发明进一步理解,下面结合附图对本发明进行详细描述。
本发明数据存储方法的核心思想是:提取关键字的字符作为索引;将首字符相同的关键字组成第一关键字块;将所述第一关键字块对应的数据进行存储。
请参阅图3,是本发明的词典存储示意图。
每本词典的存储数据包括五部分:加密校验信息、词典信息、索引、第一关键字块、数据块。第一关键字块包括第一关键字块1~第一关键字块n,数据块包括数据块1~数据块n。
以下对这五部分进行详细介绍:
1、加密校验信息
记录加密方法及验证信息,用于验证每本词典的完整性。如果校验出当前词典无效,说明此词典不完整,在检索过程中将进入下一本目标词典的检索;如果有效,则可以进入检索。
2、词典信息
用于记录词典的版本信息、词典类型、词典中最大解释数据块的长度等。通过此信息用户可以更好了解词典概况,决定是否查询此词典。
3、索引
存储所有第一关键字块标识元组和第二关键字块标识元组,其存储方法请参阅图4本发明的索引存储示意图。
索引的存储顺序是第一关键字块1标识元组,第一关键字块1中的所有第二关键字块的标识元组,第一关键字块2标识元组,第一关键字块2中的所有第二关键字块的标识元组,以此类推。
可以理解的是,第一关键字块标识元组之间和第一关键字块中的所有第二关键字块的标识元组之间是按字符顺序进行排列,但并不局限于此。
如图4所示,有两个第一关键字块标识元组,第一关键字块标识元组有i个第二关键字块标识元组,第二关键字块标识元组有j个第二关键字块标识元组,则存储为:第一关键字块1标识元组,第一关键字块1中的第二关键字块1标识元组、第二关键字块2标识元组、第二关键字块i标识元组;第一关键字块2标识元组,第一关键字块2中的第二关键字块1标识元组、第二关键字块2标识元组、第二关键字块j标识元组。
需要说明的是,索引的存储顺序并不局限于上述方法,也可以是第一关键字块1标识元组,第一关键字块2标识元组,第一关键字块1中的所有第二关键字块的标识元组,第一关键字块2中的所有第二关键字块的标识元组,以此类推。即在图4中,也可存储为第一关键字块1标识元组,第一关键字块2标识元组;第一关键字块1中的第二关键字块1标识元组、第二关键字块2标识元组、第二关键字块i标识元组,第一关键字块2中的第二关键字块1标识元组、第二关键字块2标识元组、第二关键字块j标识元组。
第一关键字块标识元组的格式为:(a,P,L,Pc,Lc)
a:标识每个第一关键字块的首字符;
P:表示以a为首字符的第一关键字块在整本词典中的偏移,其偏移是以词典首地址为基准的;
L:表示以a为首字符的第一关键字块的长度;
Pc:表示以a为首字符的第一关键字块所对应的数据块在整本词典中的偏移,其偏移是以词典首地址为基准的;
Lc:表示以a为首字符的第一关键字块所对应的数据块的长度。
第二关键字块标识元组的格式为:(ab,Ps,Ls)
ab:标识每个第二关键字块的前两位字符;
Ps:表示以ab为前两位字符的第二关键字块在以a为首字符的第一关键字块中的偏移,其偏移是以第一关键字块的地址为基准,解压缩后的偏移;
Ls:表示以ab为前两位字符的第二关键字块的长度。
如图4所示,第一关键字块1标识元组含有(a,P1,L1,Pc1,Lc1),第二关键字块1标识元组含有(aa,Ps1,Ls1),第二关键字块2标识元组含有(ab,Ps2,Ls2),第二关键字块i标识元组含有(az,Psi,Lsi),第一关键字块2标识元组含有(b,P2,L2,Pc2,Lc2),第二关键字块1标识元组含有(ba,Ps1,Ls1),第二关键字块2标识元组含有(bb,Ps2,Ls2),第二关键字块j标识元组含有(bz,Psj,Lsj)。
4、第一关键字块
第一关键字块包括第一关键字块1~第一关键字块n。
第一关键字块由第二关键字块组成,是首字符相同的第二关键字块的集合。在一本词典中,若有n个不同的首字符,就有n个第一关键字块。对每个第一关键字块,进行压缩后存储。
第二关键字块是前两个字符相同的所有关键字的集合,还包括关键字为一个字符的关键字集合,第二关键字块存储关键字元组。当前关键字块中有j个关键字,就有j个关键字元组。
关键字元组的存储格式为:(Str,Pk,Lk)
Str:表示关键字;
Pk:表示当前关键字所对应数据在数据块中的偏移,其偏移是以数据块的首地址为基准,解压缩后的偏移。
Lk:表示关键字对应数据的长度。
例如关键字元组(about,Pk,Lk),其中about表示关键字,Pk表示关键字about对应的数据在所属第一关键字块对应的数据块中的偏移,其偏移是以数据块的首地址为基准,解压缩后的偏移,Lk表示about对应数据的长度。
请参阅图5,是本发明的第二关键字块存储示意图。
图5中的41表示单字符a的第二关键字块,a表示关键字,Pk1表示a对应数据在所属第一关键字块对应的数据块中的偏移,其偏移是以数据块的首地址为基准,解压缩后的偏移,Lk1表示关键字a对应数据的长度;
42表示以ab开头的第二关键字块,如abacus表示关键字,Pk21表示abacus对应数据在所属第一关键字块对应的数据块中的偏移,其偏移是以数据块的首地址为基准,解压缩后的偏移,Lk21表示abacus对应数据的长度;
43表示以ac开头的第二关键字块;如academic表示关键字,Pk31表示academic对应数据在所属第一关键字块对应的数据块中的偏移,其偏移是以数据块的首地址为基准,解压缩后的偏移,Lk31表示academic对应数据的长度。
其他情况以此类推。
一般情况下,第一关键字块不存储关键字,当关键字是一个字符时,例如单词a,则存储a的关键字元组在第一关键字块中,与在第二关键字块中是并列的地位。
需要说明的是,由于每个第一关键字块所包括的第二关键字块的数量不同,并且每个第二关键字块的长度各不相同,其长度取决于每个关键字的长度和包括的关键字的数量,因此每个第一关键字块不一定占据相同的空间。
可以看出,此处提到的关键字元组和前面提到的索引中的标识元组的区别是:关键字元组存储的是各个具体的关键字,标识元组只是用于标识关键字块中存储的关键字的首位及前两位字符,还有相应的偏移。
5、数据块
数据块包括数据块1~数据块N。
每个数据块存储每个第一关键字块中所有第二关键字块的关键字所对应的数据。有多少个第一关键字块,就有多少个数据块。每个数据块压缩后进行存储。
本发明数据检索方法的核心思想包括步骤:1)查找索引,获取与被检索关键字首字符相同的第一关键字块和对应数据块;2)查找第一关键字块中所述被检索关键字所对应数据的存储位置,依据该位置从所述数据块中获取数据。
请参阅图6,是本发明的检索流程图。
在检索开始前,先获取用户欲检索的关键字Str,获取方式包括通过屏幕取词或者用户输入等,然后依据预先设置的目标词典ID,找到目标词典所存储的文件。一般一个文件对应一个目标词典。
此时进入检索流程,如图6所示,包括步骤:
S51、遍历每本目标词典,若遍历结束,则结束检索,若遍历未结束,进入步骤S52,遍历词典的数目是根据用户的设置,或者是程序预先的设置,例如共有10本词典,用户需要获取关键字在其中3本词典的解释,那么就检索那3本词典;
S52、根据加密校验信息,首先验证当前词典文件是否完整有效,若有效,进入步骤S53,若无效,进入步骤S51进行下一本目标词典的检索;
S53、提取关键字Str的第一个字符S1;
S54、遍历索引中第一关键字块标识元组,将Str的第一个字符S1与第一关键字块标识元组中的首字符进行匹配,若匹配成功,进入步骤S55,若匹配失败,进入步骤S51进行下一本目标词典的检索;
S55、获取第一关键字块标识元组X,得到相应第一关键字块的首字符S1、第一关键字块在整本词典中的偏移P、第一关键字块的长度L、第一关键字块所对应的数据块在整本词典中的偏移Pc、第一关键字块所对应的数据块的长度Lc;
S56、依据第一关键字块标识元组X中的P和L,取出Str所属第一关键字块,进行解压缩,依据第一关键字块标识元组X中的Pc和Lc,取出第一关键字块对应的数据块,进行解压缩;
S57、提取关键字Str的第二个字符S2,如果关键字只有一个字符S1时,进入步骤S61;
S58、遍历索引中上述第一关键字块标识元组后的第二关键字块标识元组,将关键字Str前两位字符S1,S2与第二关键字块标识元组中的字符进行匹配,若匹配成功,进入步骤S59,若匹配失败,进入步骤S51进行下一本目标词典的检索;
S59、获取第二关键字块标识元组Y,得到相应第二关键字块的前两位字符S1S2、第二关键字块在以S1为首字符的第一关键字块中的偏移Ps及第二关键字块的长度Ls;
S60、依据第二关键字块标识元组Y中的Ps和Ls,在已获取的第一关键字块中获取Str所属第二关键字块i;
S61、在第二关键字块i中,包括关键字只有一个字符S1时,遍历所有关键字元组,与str进行匹配,匹配成功,进入步骤S62,若匹配失败,进入步骤S51进行下一本目标词典的检索;
S62、获取关键字Str对应的关键字元组Z,得到相应关键字元组关键字Str,当前关键字所对应数据在数据块中的偏移Pk、关键字对应数据的长度Lk;
S63、在已获取的解压缩后的第一关键字块对应的数据块中,依据获取的关键字元组Z中的Pk和Lk,取出关键字str对应的数据,取出本词典数据后,进入步骤S51进行下一本目标词典的检索。
当所有目标词典检索完毕后,将检索到的每本目标词典中的解释数据反馈给用户。
请参阅图7,是本发明的词典存储系统结构图。
数据存储系统600包括:加密校验信息单元601、词典信息单元602、索引单元603、第一关键字块集合单元604、数据块集合单元605。
加密校验信息单元601记录加密方法及验证信息,用于验证每本词典的完整性。如果校验出当前词典无效,说明此词典不完整,将进入下一本目标词典的检索,如果有效,则可以进入检索。
词典信息单元602用于记录词典的版本信息、词典类型、词典中最大解释数据块的长度等。通过此单元信息用户可以更好了解词典概况,决定是否查询此词典。
索引单元603存储所有第一关键字块标识元组和第二关键字块标识元组。第一关键字块标识元组含有:标识每个第一关键字块的首字符a;以a为首字符的第一关键字块在整本词典中的偏移P,其偏移是以词典首地址为基准的;以a为首字符的第一关键字块的长度L;以a为首字符的第一关键字块所对应的数据块在整本词典中的偏移Pc,其偏移是以词典首地址为基准的;以a为首字符的第一关键字块所对应的数据块的长度Lc。第二关键字块标识元组含有:标识每个第二关键字块的前两位字符ab;以ab为前两位字符的第二关键字块在以a为首字符的第一关键字块中的偏移Ps,其偏移是以第一关键字块的地址为基准,解压缩后的偏移;以ab为前两位字符的第二关键字块的长度Ls。根据存储的第一关键字块标识元组,可以获取第一关键字块集合单元604存储的第一关键字块和数据块集合单元605存储的与第一关键字块对应的数据块,根据存储的第二关键字块标识元组,可以在第一关键字块集合单元604存储的第一关键字块中获取第二关键字块。
第一关键字块集合单元604存储第一关键字块,包括第一关键字块1~第一关键字块n。第一关键字块由第二关键字块组成,是首字符相同的第二关键字块的集合。第二关键字块是前两个字符相同的所有关键字的集合,还包括关键字为一个字符的关键字集合,第二关键字块存储关键字元组。第二关键字块存储的关键字元组含有:关键字Str;表示当前关键字在所属第一关键字块所对应的数据块中的偏移Pk,其偏移是以数据块的首地址为基准,解压缩后的偏移;关键字所对应数据的长度Lk。根据第二关键字块存储的关键字元组,可以从数据块集合单元605中存储的与第一关键字块对应的数据块中取出数据。
数据块集合单元605存储与第一关键字块集合单元604对应的数据,包括数据块1~数据块N。具体来说,所述数据是与第一关键字块集合单元604中第一关键字块含有的第二关键字块中所有关键字对应。
综上所述,本发明将词典中第一关键字块标识元组和第二关键字块标识元组作为索引,按第一关键字块、第一关键字块对应的数据块进行组织,并以第一关键字块为单位,对第一关键字块中的第二关键字块所有的关键字的数据解释,进行分块组织并压缩存储,因此在进行检索时,只需解压缩一小块数据获取所需信息,从而提高了检索速度,增大了词典数据检索的范围,满足了用户的检索需求。
以上对本发明所提供的一种数据存储/检索方法及系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (16)

1、一种数据存储方法,其特征在于:
提取关键字的字符,将所述提取的关键字的字符作为索引进行存储,所述索引标识第一关键字块及其对应数据的存储位置;
存储由首字符相同的关键字组成的第一关键字块;
分块存储所述第一关键字块对应的数据。
2、如权利要求1所述的数据存储方法,其特征在于,所述索引通过第一关键字块标识元组标识:
所述第一关键字块的首字符;
所述第一关键字块的存储位置;
所述第一关键字块对应的数据块的存储位置。
3、如权利要求2所述的数据存储方法,其特征在于:
进一步存储由第一关键字块中前两位字符相同的关键字组成的第二关键字块;
所述索引进一步通过第二关键字块标识元组标识第二关键字块的前两位字符组合、第二关键字块的存储位置;
所述第二关键字块进一步通过关键字元组标识关键字、关键字所对应数据的存储位置。
4、如权利要求3所述的数据存储方法,其特征在于:
通过偏移地址和长度标识所述关键字块或/和数据块的存储位置。
5、如权利要求3所述的数据存储方法,其特征在于:
通过偏移地址和长度标识所述关键字所对应数据的存储位置。
6、一种数据检索方法,其特征在于,包括步骤:
61)查找索引,根据索引所标识的第一关键字块及其对应数据块的存储位置,直接获取存储的与被检索关键字首字符相同的第一关键字块及其对应数据块,所述索引由提取的关键字的字符组成,所述第一关键字块由首字符相同的关键字组成,所述对应数据块根据所述第一关键字块进行存储;
62)查找第一关键字块中含有的所述被检索关键字所对应数据的存储位置,依据该位置从所述数据块中获取数据。
7、如权利要求6所述的数据检索方法,其特征在于,所述索引通过标识元组标识第一关键字块和对应数据块的存储位置,所述步骤61)包括:
611)提取被检索关键字的首字符;
612)遍历标识元组,将被检索关键字的首字符与标识元组中标识的字符进行匹配,若成功,获取该标识元组中第一关键字块和对应数据块的存储位置;
613)依据所述第一关键字块和对应数据块的存储位置,获取第一关键字块和数据块。
8、如权利要求7所述的数据检索方法,其特征在于:
所述第一关键字块中前两位字符相同的关键字组成第二关键字块;
所述步骤61)中进一步对索引进行查找,根据索引进一步所标识的第二关键字块的存储位置获取与被检索关键字前两位字符相同的第二关键字块;
以及步骤62)中,被检索关键字所对应数据的存储位置的获取具体为,在第二关键字块中遍历关键字元组,查找所述被检索关键字,并获取关键字元组中该被检索关键字所对应数据的存储位置。
9、如权利要求8所述的数据检索方法,其特征在于,所述索引通过标识元组标识第二关键字块的存储位置,所述进一步对索引进行查找包括步骤:
91)提取被检索关键字的第二位字符;
92)遍历标识元组,将被检索关键字的前两位字符与标识元组中标识的字符进行匹配,若成功,获取该标识元组中第二关键字块的存储位置。
10、如权利要求9所述的数据检索方法,其特征在于:
通过偏移地址和长度标识所述关键字块或/和数据块的存储位置。
11、如权利要求9所述的数据检索方法,其特征在于:
通过偏移地址和长度标识所述关键字所对应数据的存储位置。
12、一种数据存储系统,包括加密校验信息单元、词典信息单元,其特征在于,还包括:
索引单元,用于提取关键字的字符,存储由所述关键字的字符组成的标识元组的集合,所述标识元组标识第一关键字块及其对应数据的存储位置;
第一关键字块集合单元,用于存储由首字符相同的关键字构成的第一关键字块的集合;
数据块集合单元,用于存储与所述第一关键字块集合单元存储的第一关键字块所对应的数据块的集合。
13、如权利要求12所述的数据存储系统,其特征在于,所述索引单元存储的标识元组通过第一关键字块标识元组标识:
所述第一关键字块的首字符;
所述第一关键字块的存储位置;
所述第一关键字块对应的数据块的存储位置。
14、如权利要求13所述的数据存储系统,其特征在于:
所述第一关键字块集合单元存储的第一关键字块进一步将前两位字符相同的关键字组成第二关键字块;
所述索引单元存储的标识元组进一步通过第二关键字块标识元组标识第二关键字块的前两位字符组合、第二关键字块的存储位置;
所述第二关键字块进一步通过关键字元组标识关键字、关键字所对应数据的存储位置。
15、如权利要求14所述的数据存储系统,其特征在于:
所述索引单元通过偏移地址和长度标识所述关键字块或/和数据块的存储位置。
16、如权利要求14所述的数据存储系统,其特征在于:
所述第一关键字块集合单元通过偏移地址和长度标识所述关键字所对应数据的存储位置。
CN 200610078690 2006-04-30 2006-04-30 一种数据存储/检索方法及系统 Active CN100476821C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200610078690 CN100476821C (zh) 2006-04-30 2006-04-30 一种数据存储/检索方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200610078690 CN100476821C (zh) 2006-04-30 2006-04-30 一种数据存储/检索方法及系统

Publications (2)

Publication Number Publication Date
CN1858747A CN1858747A (zh) 2006-11-08
CN100476821C true CN100476821C (zh) 2009-04-08

Family

ID=37297655

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200610078690 Active CN100476821C (zh) 2006-04-30 2006-04-30 一种数据存储/检索方法及系统

Country Status (1)

Country Link
CN (1) CN100476821C (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100451958C (zh) * 2007-05-15 2009-01-14 无敌科技(西安)有限公司 一种电子辞典生成系统
CN101859306B (zh) * 2009-04-07 2013-01-23 日电(中国)有限公司 盲化索引表产生方法和设备、联合关键字搜索方法和设备
CN101957902B (zh) * 2009-07-20 2014-03-26 日电(中国)有限公司 扩展盲化倒排索引表产生方法和设备、联合关键字搜索方法和设备
CN102567768B (zh) * 2010-12-13 2015-03-11 中国移动通信集团贵州有限公司 基于智能卡实现电子词典的方法和装置
US9418238B2 (en) * 2011-02-22 2016-08-16 Mitsubishi Electric Corporation Search system, search method of search system, and information processing device
CN103514404A (zh) * 2012-06-29 2014-01-15 网秦无限(北京)科技有限公司 安全检测方法和安全检测装置
CN104063389B (zh) * 2013-03-20 2017-10-20 阿里巴巴集团控股有限公司 一种生成索引信息的方法和设备
CN104657362B (zh) * 2013-11-18 2018-07-10 深圳市腾讯计算机系统有限公司 数据存储、查询方法和装置
CN105353995A (zh) * 2015-12-15 2016-02-24 上海新储集成电路有限公司 非挥发内容可寻址的存储方法及系统
CN107526746B (zh) 2016-06-22 2020-11-24 伊姆西Ip控股有限责任公司 管理文档索引的方法和设备
CN108572958B (zh) * 2017-03-07 2022-07-29 腾讯科技(深圳)有限公司 数据处理方法及装置
TWI650656B (zh) * 2017-05-26 2019-02-11 虹光精密工業股份有限公司 於電腦系統搜尋影像檔案之方法、影像檔案搜尋裝置以及電腦系統
CN109213421B (zh) * 2017-06-29 2024-01-09 中兴通讯股份有限公司 一种存储记录方法及装置
CN108509505B (zh) * 2018-03-05 2022-04-12 昆明理工大学 一种基于分区双数组Trie的字符串检索方法及装置
CN110532347B (zh) * 2019-09-02 2023-12-22 北京博睿宏远数据科技股份有限公司 一种日志数据处理方法、装置、设备和存储介质
CN111061925B (zh) * 2019-12-16 2021-02-19 珠海格力电器股份有限公司 联系人查找方法、装置、终端设备及可读存储介质

Also Published As

Publication number Publication date
CN1858747A (zh) 2006-11-08

Similar Documents

Publication Publication Date Title
CN100476821C (zh) 一种数据存储/检索方法及系统
CN101276361B (zh) 一种显示相关关键词的方法及系统
CN101187941B (zh) 用于最优化索引搜索的方法和设备
US8799677B2 (en) Encrypted search database device, encrypted search data adding/deleting method and adding/deleting program
CN101727502A (zh) 一种数据查询方法及装置、系统
CN103955537A (zh) 一种语义模糊可搜索加密云盘设计方法及系统
CN102982130A (zh) 一种nosql与rdbms的数据库同步方法和系统
CN103049444A (zh) 一种数据信息分类结构的存储方法和系统
CN105447166A (zh) 一种基于关键字查找信息的方法及系统
CN102510421A (zh) 一种实现终端的拨号盘与数据应用相关联的方法及客户端
CN104462030A (zh) 字符转换装置、字符转换方法
CN102473261A (zh) 凭证访问码创建和管理
CN108572958B (zh) 数据处理方法及装置
CN103354576B (zh) 手机及其手机号归属信息的存储及查找方法
CN113868252A (zh) 数据库模式匹配方法及装置、sql查询语句生成方法
CN109492410A (zh) 数据可搜索加密和关键词搜索方法、系统及终端、设备
CN102436380A (zh) 一种stk菜单处理系统及其对菜单的处理方法
CN101340672B (zh) 一种联系人查找方法、系统及移动终端
KR101703828B1 (ko) 암호화된 데이터에 대한 색인 태그 생성 방법, 색인 태그를 이용한 암호화된 데이터 검색 방법 및 이를 위한 데이터베이스 장치
CN104281620A (zh) 一种支持多音字的联系人数据查询方法和装置
CN103646121B (zh) 一种标识码及使用方法和装置
CN106484691A (zh) 移动终端的数据存储方法和装置
CN101384050A (zh) 一种移动终端及其资源管理的方法及系统
CN114579617A (zh) 数据查询方法、装置、计算机设备和存储介质
JP2005004560A (ja) インバーテッドファイル作成方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: BEIJING KINGSOFT OFFICE SOFTWARE CO., LTD.

Free format text: FORMER OWNER: BEIJING JINSHAN SOFTWARE CO., LTD.

Effective date: 20140312

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100083 HAIDIAN, BEIJING TO: 100085 HAIDIAN, BEIJING

TR01 Transfer of patent right

Effective date of registration: 20140312

Address after: Kingsoft No. 33 building, 100085 Beijing city Haidian District Xiaoying Road

Patentee after: Beijing Kingsoft WPS Office Co., Ltd.

Address before: 100083, Beijing, Haidian District No. 238 North Fourth Ring Road, No. 20, Bai Yan building

Patentee before: Beijing Jinshan Software Co., Ltd.

C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: Kingsoft No. 33 building, 100085 Beijing city Haidian District Xiaoying Road

Patentee after: Beijing Kingsoft office software Limited by Share Ltd

Address before: Kingsoft No. 33 building, 100085 Beijing city Haidian District Xiaoying Road

Patentee before: Beijing Kingsoft WPS Office Co., Ltd.