CN1295295A - 使用快速查询索引结构的电子字典单词查询方法 - Google Patents

使用快速查询索引结构的电子字典单词查询方法 Download PDF

Info

Publication number
CN1295295A
CN1295295A CN 99123297 CN99123297A CN1295295A CN 1295295 A CN1295295 A CN 1295295A CN 99123297 CN99123297 CN 99123297 CN 99123297 A CN99123297 A CN 99123297A CN 1295295 A CN1295295 A CN 1295295A
Authority
CN
China
Prior art keywords
word
index value
index
secondary index
related content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 99123297
Other languages
English (en)
Other versions
CN1144143C (zh
Inventor
陈淮琰
李玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yingyeda Co Ltd (Shanghai)
Original Assignee
ELECTRONIC TECHNOLOGY CO Ltd (XIAN) OF YINGYEDA GROUP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ELECTRONIC TECHNOLOGY CO Ltd (XIAN) OF YINGYEDA GROUP filed Critical ELECTRONIC TECHNOLOGY CO Ltd (XIAN) OF YINGYEDA GROUP
Priority to CNB991232976A priority Critical patent/CN1144143C/zh
Publication of CN1295295A publication Critical patent/CN1295295A/zh
Application granted granted Critical
Publication of CN1144143C publication Critical patent/CN1144143C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种使用快速查询索引结构的电子字典的单词查询方法,该快速查询索引结构包括单词索引数据部,二次索引数据部以及单词相关内容索引数据部。该方法根据用户的输入单词,查询单词数据库和单词内容相关数据库,利用二次索引数据部的定位特性,加速查询速度,减少查询范围和次数,提高查询功能。

Description

使用快速查询索引结构的 电子字典单词查询方法
本发明涉及一种使用快速查询索引结构的电子字典单词查询方法,特别涉及利用二次索引数据和单词索引数据所建立的索引结构来快速查询单词,并且能够随着用户逐次输入单词各字母的同时,动态地快速查询数据的单词查询方法。
对于电脑上的电子字典来说,一般在用户输入单词的过程中,会利用输入单词的部分内容(例如前几个字母)来查询单词的相关内容,例如释义,同时还必须快速地查询出所输入单词部分内容的后续单词。换言之,每当用户输入待查询单词的任何一个字母时,电子字典就必须执行一遍查询动作,因此查询动作的快慢势必影响到用户对于电子字典整体性能的感觉。
图1表示传统电子字典执行动态单词查询的索引数据结构以及查询处理步骤的数据流图。其中,10表示用户所输入的单词,其可能是完整的待查询单词亦或是待查询单词的部分输入内容。20是单词索引数据,30则是单词数据库,图2表示单词数据库30的结构。其中,单词数据库30储存所有可查询的单词,而单词索引数据20则是用来储存指出某个单词在单词数据库30的储存位置的索引值。举例来说,如果单词数据库30中的所有可查询单词以连续方式储存,则单词“a”在单词索引数据20中对应项目的索引值设为0,单词“aardvark”在单词索引数据20中对应项目的索引值设为1(前一单词为单字母),单词“aardwolf”在单词索引数据20中对应项目的索引值设为9(前两个单词合计有9个字母),其余依此类推。40是单词相关内容索引数据,50是单词相关内容数据库。单词相关内容数据库50是用来储存所有可查询单词所对应到的内容,包括释义,文法等等信息;而单词相关内容索引数据40则是用来储存指出某个单词相关内容在单词相关内容数据库50的储存位置的索引值。
从于单词索引数据20、单词数据库30、单词相关内容索引数据40和单词相关内容数据库50为固定数据,因此在一般电子字典中是利用只读存储器(mask ROM)加以储存。另外,对于包含数万条或是数十万条单词的电子字典而言,单词数据库30和单词相关内容数据库50的数据量非常的大。为了节省储存空间,降低成本,一般会利用数据压缩的方式处理这些数据库。考虑到解压缩效率,一般会采用区块压缩的方式来减少每次解压缩所要处理的数据量。
以下说明现有技术单词查询处理流程。当用户输入单词10后,可以先利用折半查询方法来查询出对应的单词索引值。首先透过步骤1,在单词索引数据20中找出第一个和最后一个单词索引值,进行折半查询来找出真正对应此单词10的期望索引值。接着透过步骤2,从单词数据库30中找出对应此期望索引值的期望单词,如果单词数据库为压缩数据时,则在步骤2必须同时进行解压缩的处理。透过步骤3,从所找出的期望单词与单词10进行比较,如果两者相同,则表示已经找到对应的单词索引值;如果两者不同,则更新折半查询范围,重新执行步骤1到步骤3,直到找到真正的对应单词索引值为止。当找到对应单词10的单词索引值后,就可以透过步骤4,从单词相关内容索引数据40找出对应的单词相关内容索引值;再利用所找到的单词相关内容索引值,透过步骤5,从单词相关内容数据库50中找出对应的相关内容。
接着以一实例来说明现有技术中的单词查询过程。图3~图6表示使用电子字典输入查询单词“schema”的过程中,电子字典显示查询结果的示意图。在图3中,用户输入查询单词的部分字母“s”,系统会将单词索引数据20的第一项索引值和最后一项索引值之间设定为查询范围,进行连续性的折半查询;当系统查询到单词数据库30内的单词“S”之后,则结束连续性折半查询,再透过单词相关内容索引数据40和单词相关内容数据库50,找出其相关内容以便显示。接着在图4至图6的处理部分也与所述方式一致,用户依序输入“sc”、“sch”、“schema”,系统则利用折半查询方式,连续地进行查询/对比的动作,直到确认查询目标为止。
从上述说明的单词查询流程可以发现,整个处理最耗时的部分是找出对应的单词索引值,亦即步骤1至步骤3的循环处理。特别是对于具有十几万或数十万的大字典而言,重复查询的次数非常庞大。如果数据是利用压缩方式储存的,在步骤2的解压缩动作也会耗费相当多的时间,这也正是传统查询方法速度较慢的原因。
有鉴于此,本发明的主要目的在于提供一种使用电子字典快速查询索引结构的单词查询方法,能够简化用户在逐字输入单词过程中所需要的查询动作,以提高电子字典使用的效率。
根据上述的目的,本发明提出一种使用电子字典快速查询索引结构的单词查询方法,该电子字典包括:中央处理单元,为整个系统的控制中心,控制执行本发明方法的各个步骤;输入设备,用于输入用户想要查询的字串;显示设备,用于显示用户输入的字串和查询内容;存储器,其中存放有单词数据库和单词相关内容数据库,该单词数据库包括已排序的多个待查询单词并且该单词相关内容数据库包括分别对应于该待查询单词的多个单词相关内容,该存储器中还存储有电子字典快速查询索引结构,包括:(1)单词索引数据部,用来储存对应于待查询单词的多个个单词索引值,单词索引值是用以记录对应的待查询单词在单词数据库中的位置信息;(2)二次索引数据部,用以储存多个个二次索引值,其分别对应于具有预定字母数的有序序列中的各项目,而二次索引值则是用来记录具有与有序序列项目相同的开始字母的待查询单词,其对应的单词索引值在单词索引数据部中的位置信息;以及(3)单词相关内容索引数据部,用以储存对应于单词相关内容的多个个单词相关内容索引值,单词相关内容索引值则是用来记录对应的单词相关内容在单词相关内容数据库中的位置信息。
当利用上述索引数据结构来进行单词查询时,中央处理器先根据输入单词中与有序序列的预定字母数相同的开始字母部分,从二次索引部取出第一二次索引值,接着再从二次索引部取出第一二次索引值的下一个的第二二次索引值。接着再以第一二次索引值和第二二次索引值所对应的单词索引值为范围,从单词索引数据部找出对应于输入单词的单词索引值。最后便可以根据对应于输入单词的单词索引值,从单词相关内容索引数据部中找出对应的单词相关内容索引值。
按照本发明方法的另一方面,当利用上述索引数据结构来进行单词查询时,中央处理器可根据用户所输入的字母长度来做不同的处理。当输入单词的字母数不大于有序序列的预定字母数时,则先根据输入单词,从二次索引部取出第一二次索引值,从二次索引部取出所述第一二次索引值的下一个的第二二次索引值,设定第一二次索引值所对应的第一单词索引值和第二二次索引值所对应的第二单词索引值为一查询范围,接着根据第一二次索引值所对应的第一单词索引值,从单词相关内容索引数据部中找出对应的单词相关内容索引值。另外,当输入单词的字母数大于有序序列的预定字母数时,便可以利用第一单词索引值和第二单词索引值为查询范围,从单词索引数据部找出对应于输入单词的第三单词索引值。将查询到的第三单词索引值取代第一单词索引值,便可以利用取代后的第一单词索引值,从单词相关内容索引数据部中找出对应的单词相关内容索引值。此部分处理则随用户的输入持续进行。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举一优选实施例,并配合附图,作详细说明如下:
图1表示现有技术电子字典执行动态单词查询的索引数据结构以及查询处理步骤的数据流图。
图2表示一般单词数据库结构的示意图。
图3~图6表示使用电子字典输入查询单词“schema”的过程中,电子字典显示查询结果的示意图。
图7表示本发明实施例中执行动态单词查询所使用的索引数据结构以及查询处理步骤的数据流图。
图8表示本发明实施例中使用的二次索引数据结构的示意图。
图9表示本发明实施例中使用的二次索引数据、单词索引数据以及单词数据库之间关联性的示意图。
图10表示本发明实施例执行动态单词查询的处理流程图。
图11是实施本发明方法的电子字典的硬件组成配置图。符号说明:
10~单词;15~二次索引数据;20~单词索引数据;30~单词数据库;40~单词相关内容索引数据;50~单词相关内容数据库。
本发明的电子字典使用快速查询索引结构的单词查询方法,主要是透过二次索引数据来减少查询单词索引数据时所需要进行的循环数,同时可以减少执行单词数据库解压缩处理的次数,提高查询的效率。特别是适合于电子字典动态查询的应用上。以下配合图式,详细说明本发明的实施例。
图11是实施本发明方法的电子字典的硬件组成配置图。实施本发明方法的电子字典的硬件配置包括:中央处理单元1,为整个系统的控制中心,控制执行本发明方法的各个步骤;输入设备3,用于输入用户想要查询的字串;显示设备2,用于显示用户输入的字串和查询内容;存储器4,其中存放有单词数据库和单词相关内容数据库,该单词数据库包括已排序的多个待查询单词并且该单词相关内容数据库包括分别对应于该待查询单词的多个单词相关内容,该存储器中还存储有电子字典快速查询索引结构。
图7表示本实施例中执行动态单词查询的索引数据结构以及查询处理步骤的数据流图。在图7中,除了系统必备的单词数据库30和单词相关内容数据库之外,索引数据结构中包括了二次索引数据15、单词索引数据20和单词相关内容索引数据40。其中单词索引数据20和单词相关内容索引数据40与现有技术中所述者相同,此处不再赘述,以下则详细说明二次索引数据20的结构。
二次索引数据20是用来储存二次索引值,其分别对应于具有预定字母数的有序序列中的各项目。有序序列是指长度不超过预定字母数而依照字母顺序(类似一般字典中的排序方式)排列而成的序列。在本实施例中,有序序列的预定字母数为2个,因此其有序序列可以表示为(a、aa、ab、ac、…、b、ba、bb、bc、…c、ca、cb、cc、…zy、zz),其项目总数为26×27=702。二次索引值则是用来记录开始字母与有序序列项目相同的待查询单词,其对应的单词索引值在单词索引数据部20的位置信息。
图8表示本实施例中二次索引数据结构的示意图。如图所示,二次索引数据15包括彼此对应的有序序列部15b以及二次索引值部15a。必须说明的是,二次索引数据15实际置于存储器中者只有二次索引值部15a,有序序列部15b则为虚拟对应数据。当需要找出某个有序序列项目在二次索引数据20中所对应的二次索引值,可以透过以下公式决定:
(第一字母顺序编号-1)×27+第二字母顺序编号(1)
举例来说,有序序列项目“sc”所对应的二次索引值系置于二次索引数据20中的第(19-1)×27+3=489个位置中。另外,实际的二次索引值是用来指向以对应有序序列项目为首的第一个待查询单词的单词索引值位置。例如有序序列项目“sc”所对应的二次索引值为47,表示在单词索引数据20中第47个位置的单词索引值所对应的待查询单词,是以“sc”为首并且在单词数据库中排序在最前面的待查询单词。
图9可以用来说明本实施例中二次索引数据15、单词索引数据20以及单词数据库30之间关联性的示意图。如图所示,二次索引数据15中的二次索引值,是用来指向单词索引数据20中对应于其有序序列项的第一个单词的单词索引项;而单词索引数据20中的单词索引项则指向其对应单词在单词数据库30中的储存位置。例如,对应于有序序列项目“aa”的二次索引值为1,指向单词索引数据20中的第1个单词索引值,而此单词索引值则指向以“aa”为开头的第一个单词“aardvard”的储存位置;对应于有序序列项目“ab”的二次索引值为30,指向单词索引数据20中的第30个单词索引值,而此单词索引值则指向以“ab”为开头的第一个单词“ab”的储存位置;对应于有序序列项目“ba”的二次索引值为183,指向单词索引数据20中的第183个单词索引值,而此单词索引值则指向以“ab”为开头的第一个单词“backer”的储存位置。
回到图7,以下说明利用本实施例的索引数据结构进行单词查询的过程。首先,接收用户所输入的单词10。在步骤1a中,根据单词10的开始字母部分(在本实施例中为两个字母),利用上述的公式(1)计算出单词10所对应的二次索引值的储存位置;再透过此储存位置从二次索引数据15取出二次索引值I1。同时,从二次索引数据15取出二次索引值I1的下一个二次索引值I2。在步骤1b中,则根据在上一步骤中得到的二次索引值I1和二次索引值I2,从单词索引数据20中找出对应的单词索引值R1和单词索引值R2。在步骤2和步骤3中,则以单词索引值R1和单词索引值R2为范围,进行连续的折半查询/对比的处理,藉以从单词索引数据20找出对应于单词10的单词索引值。此折半查询/对比处理与现有技术方式相同,亦即以折半查询方式找出期望索引值,再从单词数据库30中找出对应于此期望索引值的期望单词(步骤2),期望单词与实际的单词10进行对比后(步骤3),则可以决定是否找到符合的单词索引值,如果尚未找到,则利用期望索引值来更新折半查询范围,反复进行直到找出为止。当找出对应于单词10的单词索引值之后,便可以透过单词相关内容索引数据40找出其对应的单词相关内容索引值(步骤4),再从单词相关内容数据库50找出其对应的单词相关内容(步骤5)。
以下利用查询单词“schema”为例说明上述查询动作。首先,利用此单词的前两个字母“sc”来对二次索引数据15进行查询。透过公式(1),可知其二次索引值储存于二次索引数据15的第(19-1)×27+3=489个位置。因此,在二次索引数据15的第489个和第490个位置上,可以找到二次索引值I1和I2。再利用二次索引值I1和I2,可以从单词索引数据20找到对应的单词索引值R1和R2。再以单词索引值R1和R2,以折半查询方式找出对应于“schema”的单词索引值,接着便可以查询出其对应的相关内容。
从上述说明可知,从于在本实施例中的查询动作是先利用二次索引数据来决定出折半查询范围,因此降低了执行折半查询/对比的次数,不仅可以缩短查询时间,同时减少对单词数据库(一般为压缩形式)进行解压缩的处理次数,提高整体单词查询的性能。
本实施例的查询索引结构是非常适合于一般电子字典中动态的查询方式,亦即随着用户逐次输入单词的各字母,能够快速地查询出与目前输入部分者相同或最接近的单词的相关内容。图10表示本实施例中执行动态单词查询的处理流程图。首先,系统依序接收用户所输入的单词字母(S1)。当输入单词的字母数不大于两个(有序序列的预定字母数)时(S2),则可以直接利用二次索引数据15来快速完成查询。先利用目前所输入的单词,计算出单词输入字母在二次索引数据15的位置,并且取得其所对应的二次索引值I1(S3)。接着再利用二次索引值I1和下一个项目的二次索引值I2,找出其对应的单词索引值R1、R2,用以确定折半查询范围为R1~R2(S4)。接着则利用二次索引值I1所得到的待查单词的单词索引值R1(S5),查询单词数据库30和单词相关内容数据库50(S6),找出目前输入部分所对应的最相似单词以及其相关内容,并且在电子字典的显示幕(未图示)上则显示出所查询出的最相似单词及其相关内容(S7),完成阶段性的查询工作。当用户输入的字母数超过两个以上时(S2),则是以先前所决定的单词索引值R1~R2范围间进行折半查询,找出最接近于目前输入单词部分的待查单词的单词索引值R3,并且以R3更新上述的查询范围中的R1(S8)。同样的,利用单词索引值R1(已更新)来查询单词数据库30和单词相关内容数据库50(S6),找出目前输入部分所对应的最相似单词以及其相关内容,并且在电子字典的显示幕上显示所查询出的最相似单词及其相关内容(S7)。上述动态查询动作会在用户结束输入或者是已查询到所需要单词时终止。
配合图3~图6,利用用户动态输入查询单词“schema”为范例,说明图10所示的动态查询动作。在图3中,用户输入部分查询单词“s”,从于尚未超过两个字母,所以利用公式(1)计算出在二次索引数据15中的对应储存位置:
储存位置=(字母“s”顺序编号-1)×27+0=(19-1)×27+0+486
因此,在二次索引数据15的第486项储存位置中可得到以“s”为首的第一个单词的二次索引值I1。接着利用二次索引值I1,可得到在单词索引数据20的第I1项中所储存的单词索引值R1,其表示以“s”为首的第一个单词在单词数据库30中的储存位置。同时可以在第I1+1项、第I1+2项等等得到其后续单词的单词索引值。在图3的左半部即显示目前最接近单词(即“s”)以及其后续单词。同时,利用单词索引值R1可以透过单词相关内容索引数据40以及单词相关内容数据库50查询出对应于此最接近单词(即“s”)的相关内容,如图显示于右半部。
在图4中,用户输入了部分查询单词“sc”,同样未超过两个字母,所以再利用公式(1)计算出在二次索引数据15中的对应储存位置:
储存位置=(字母“s”顺序编号-1)×27+(字母“c”顺序编号)=(19-1)×27+3=489
因此,在二次索引数据15的第489项储存位置中可得到以“sc”为首的第一个单词的二次索引值I1。接着利用二次索引值I1,可得到在单词索引数据20的第I1项中所储存的单词索引值R1,其表示以“sc”为首的第一个单词在单词数据库30中的储存位置。同样的,利用单词索引值R1可以透过单词相关内容索引数据40以及单词相关内容数据库50查询出对应于此最接近单词(即“sc”)的相关内容。另外,在处理此阶段的输入单词时,可以建立后续输入阶段所需要的折半查询范围。在上述处理中所得到的单词索引值R1为此范围的一端,其对应于以“sc”为首的第一个单词。接着,从二次索引数据15的第490项储存位置中得到其下一个的二次索引值I2,再从单词索引数据20找到第I2项中所储存的单词索引值R2,其为范围的另一端,对应于以“sd”为首的第一个单词。亦即,无论用户后续所输入的字母为何,此单词所对应的单词索引值会在R1(对应于“sa”为首的第一个单词)和R2(对应于“sd”为首的第一个单词)之间。
接着在图5中,用户输入了部分查询单词“sch”,已经超过两个字母,因此可以直接利用先前所建立的折半查询范围R1~R2来进行查询。当找到以“sch”为首的第一个单词以及其单词索引值R3时,则显示所查询到的最接近单词(即“SCH”)和后续单词以及其相关内容。另外,利用最接近单词的单词索引值R3来取代上述的折半查询范围值R1,亦即无论用户后续所输入的字母为何,此单词所对应的单词索引值会在更新后的R1(对应于“sch”首的第一个单词)和R2(对应于“sd”为首的第一个单词)之间。同样的处理适用于用户后续输入的各字母,直到如图6所示,用户输入“schema”之后,便完成所有查询的动作。
本实施例的索引数据结构以及动态查询方法,其优点便在于可以节省大量反复折半查询的次数。表1是用以比较现有技术和本发明的平均查询次数。一般标准折半查询的次数为log2(N),其中N表示待查询总项目。以字典单词数50000~100000为例,现有技术平均需要15.6到16.6次的查询动作。而在本发明中,从于利用二次索引数据先将所有单词区分为702类(以两个字母来分类),所以平均只需要6.1到7.1次查询动作,便可以找到所需要单词。表1
字典单词数 现有技术(次)     本发明(次)
    50000  log250000=15.6  log2(50000/702)=6.1
    10000  log2100000=16.6  log2(100000/702)=7.1
如果以50000字的字典为例分析逐次输入各单词字母的平均查询次数,则如表2所示。在表2中,输入字母数为累计次数,更可以看出本发明在减少查询次数上的效果。表2
输入字母数     现有技术(次)     本发明(次)
    1     log250000=15.6     1
    2  2×log250000=31.2     2
    5  5×log250000=78 3×log2(50000/702)+2=20.3
    10  10×log250000=156 6×log2(50000/702)+2=38.6
本发明虽以一优选实施例公开如上,然其并非用以限定本发明,本领域技术人员,在不脱离本发明的精神和范围内,可做某些改动和替代,因此本发明的保护范围当从后附的权利要求所界定。

Claims (7)

1.一种电子字典的单词查询方法,所述电子字典包括:
中央处理单元,为整个系统的控制中心,控制执行该方法的各个步骤;
输入设备,用于输入用户想要查询的字串;
显示设备,用于显示用户输入的字串和查询内容;
存储器,其中存放有单词数据库和单词相关内容数据库,所述单词数据库包括已排序的多个待查询单词并且所述单词相关内容数据库包括分别对应于所述待查询单词的多个单词相关内容,
其特征在于:
所述存储器中还存储有电子字典快速查询索引结构,包括:
单词索引数据部,用以储存对应于所述待查询单词的多个单词索引值,所述单词索引值用以记录对应的待查询单词在所述单词数据库中的位置信息;
二次索引数据部,用以储存分别对应于预定字母数的有序序列中的项目的多个二次索引值,所述二次索引值用以记录其开始字母与有序序列项目相同的待查询单词,其对应的单词索引值在所述单词索引数据部的位置信息;以及
单词相关内容索引数据部,用以储存对应于所述单词相关内容的多个单词相关内容索引值,其中所述单词相关内容索引值用以记录对应的单词相关内容在所述单词相关内容数据库中的位置信息,
该方法利用所述快速查询索引结构,根据用户的输入单词,查询所述单词数据库和所述单词内容相关数据库,其包括下列步骤:
中央处理单元根据用户从输入设备输入的单词中与所述有序序列的预定字母数相同的开始字母部分,从所述二次索引部取出一第一二次索引值;
中央处理单元从所述二次索引部取出所述第一二次索引值的下一个的第二二次索引值;
中央处理单元以所述第一二次索引值和所述第二二次索引值所对应的单词索引值为范围,从所述单词索引数据部找出对应于所述输入单词的单词索引值;以及
根据对应于所述输入单词的单词索引值,从所述单词相关内容索引数据部中找出对应的单词相关内容索引值。
2.如权利要求1所述的方法,其中所述快速查询索引结构中的所述二次索引数据部中,所述二次索引值系对应于两个字母的有序序列项目。
3.如权利要求1所述的方法,其中在所述第一二次索引值和所述第二二次索引值所对应的单词索引值为范围中,利用连续折半查询方法,找出对应于所述输入单词的单词索引值。
4.如权利要求1所述的单词查询方法,其中在所述二次索引数据部中,所述二次索引值系对应于两个字母的有序序列项目。
5.一种电子字典的单词查询方法,所述电子字典包括:
中央处理单元,为整个系统的控制中心,控制执行该方法的各个步骤;
输入设备,用于输入用户想要查询的字串;
显示设备,用于显示用户输入的字串和查询内容;
存储器,其中存放有单词数据库和单词相关内容数据库,所述单词数据库包括已排序的多个待查询单词并且所述单词相关内容数据库包括分别对应于所述待查询单词的多个单词相关内容,
其特征在于:
所述存储器中还存储有电子字典快速查询索引结构,包括:
单词索引数据部,用以储存对应于所述待查询单词的多个单词索引值,所述单词索引值用以记录对应的待查询单词在所述单词数据库中的位置信息;
二次索引数据部,用以储存分别对应于预定字母数的有序序列中的项目的多个二次索引值,所述二次索引值用以记录其开始字母与有序序列项目相同的待查询单词,其对应的单词索引值在所述单词索引数据部的位置信息;以及
单词相关内容索引数据部,用以储存对应于所述单词相关内容的多个单词相关内容索引值,其中所述单词相关内容索引值用以记录对应的单词相关内容在所述单词相关内容数据库中的位置信息,
该方法利用所述快速查询索引结构,根据用户的输入单词,动态地查询所述单词数据库和所述单词相关内容数据库,当所述输入单词的字母数不大于所述有序序列的预定字母数时,执行下列步骤:
中央处理单元根据所述输入单词,从所述二次索引部取出一第一二次索引值;
中央处理单元从所述二次索引部取出所述第一二次索引值的下一个的第二二次索引值;
设定所述第一二次索引值所对应的第一单词索引值和所述第二二次索引值所对应的第二单词索引值为一查询范围;以及
根据所述第一二次索引值所对应的第一单词索引值,从所述单词相关内容索引数据部中找出对应的单词相关内容索引值;
当所述输入单词的字母数大于所述有序序列的预定字母数,执行下列步骤:
以所述第一单词索引值和所述第二单词索引值为查询范围,从所述单词索引数据部找出对应于所述输入单词的第三单词索引值;
以所述第三单词索引值取代所述第一单词索引值;以及
根据取代后的所述第一单词索引值,从所述单词相关内容索引数据部中找出对应的单词相关内容索引值。
6.如权利要求5所述的单词查询方法,其中在所述第一单词索引值和所述第二单词索引值为范围中,利用连续折半查询方法,找出对应于所述输入单词的第三单词索引值。
7.如权利要求5所述的单词查询方法,其中在所述二次索引数据部中,所述二次索引值对应于两个字母的有序序列项目。
CNB991232976A 1999-11-04 1999-11-04 使用快速查询索引结构的电子字典单词查询方法 Expired - Fee Related CN1144143C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB991232976A CN1144143C (zh) 1999-11-04 1999-11-04 使用快速查询索引结构的电子字典单词查询方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB991232976A CN1144143C (zh) 1999-11-04 1999-11-04 使用快速查询索引结构的电子字典单词查询方法

Publications (2)

Publication Number Publication Date
CN1295295A true CN1295295A (zh) 2001-05-16
CN1144143C CN1144143C (zh) 2004-03-31

Family

ID=5282855

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB991232976A Expired - Fee Related CN1144143C (zh) 1999-11-04 1999-11-04 使用快速查询索引结构的电子字典单词查询方法

Country Status (1)

Country Link
CN (1) CN1144143C (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005066835A1 (fr) * 2003-12-31 2005-07-21 Zte Corporation Procede d'extraction d'un enregistrement d'une page de donnees d'une base de donnees
CN100357946C (zh) * 2004-06-09 2007-12-26 金宝电子(上海)有限公司 快速比对搜寻字串的电子装置及方法
CN100440207C (zh) * 2004-12-31 2008-12-03 北京中星微电子有限公司 中文字典搜索引擎及在中文字典中快速定位字的方法
CN101419596B (zh) * 2007-10-26 2010-07-21 英业达股份有限公司 应用于主从式架构的翻译字典查询系统及其方法
CN102216896A (zh) * 2008-11-18 2011-10-12 夏普株式会社 显示控制设备和显示控制方法
CN101582091B (zh) * 2009-06-10 2012-04-18 凌阳科技股份有限公司 一种词库创建方法和系统,及相应的单词查询方法和系统
CN104077363A (zh) * 2014-06-10 2014-10-01 新浪网技术(中国)有限公司 邮件服务器及其进行邮件全文搜索的方法
CN112579649A (zh) * 2020-12-24 2021-03-30 成都中科大旗软件股份有限公司 一种基于索引技术实现k-v逆转检索方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101251848B (zh) * 2008-04-14 2010-06-09 中山大学 一种电子词典的快速单词查询系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005066835A1 (fr) * 2003-12-31 2005-07-21 Zte Corporation Procede d'extraction d'un enregistrement d'une page de donnees d'une base de donnees
CN100357946C (zh) * 2004-06-09 2007-12-26 金宝电子(上海)有限公司 快速比对搜寻字串的电子装置及方法
CN100440207C (zh) * 2004-12-31 2008-12-03 北京中星微电子有限公司 中文字典搜索引擎及在中文字典中快速定位字的方法
CN101419596B (zh) * 2007-10-26 2010-07-21 英业达股份有限公司 应用于主从式架构的翻译字典查询系统及其方法
CN102216896A (zh) * 2008-11-18 2011-10-12 夏普株式会社 显示控制设备和显示控制方法
CN102216896B (zh) * 2008-11-18 2014-10-29 夏普株式会社 显示控制设备和显示控制方法
CN101582091B (zh) * 2009-06-10 2012-04-18 凌阳科技股份有限公司 一种词库创建方法和系统,及相应的单词查询方法和系统
CN104077363A (zh) * 2014-06-10 2014-10-01 新浪网技术(中国)有限公司 邮件服务器及其进行邮件全文搜索的方法
CN104077363B (zh) * 2014-06-10 2017-11-03 新浪网技术(中国)有限公司 邮件服务器及其进行邮件全文搜索的方法
CN112579649A (zh) * 2020-12-24 2021-03-30 成都中科大旗软件股份有限公司 一种基于索引技术实现k-v逆转检索方法

Also Published As

Publication number Publication date
CN1144143C (zh) 2004-03-31

Similar Documents

Publication Publication Date Title
US8359316B2 (en) Database table look-up
US6725223B2 (en) Storage format for encoded vector indexes
US7865509B2 (en) Creating profiling indices
US6778985B1 (en) Implementing descending indexes with a descend function
JP3216708B2 (ja) 多段式知能的文字列比較方法
EP1234258B1 (en) System for managing rdbm fragmentations
CN109815234B (zh) 一种流式计算模型下的多重布谷鸟过滤器
EP1402254A1 (en) Method and apparatus for high-speed approximate sub-string searches
WO2002071270A1 (en) Compression scheme for improving cache behavior in database systems
WO2000010103A1 (fr) Procede et dispositif de recuperation, de stockage et de triage de donnees formatees en tableaux
CN1144143C (zh) 使用快速查询索引结构的电子字典单词查询方法
CN101751416A (zh) 一种对字符串排序和查找的方法
CN109947770A (zh) 一种数据库查询方法、终端设备及存储介质
JP2888188B2 (ja) 情報検索装置
CN101082918A (zh) 一种利用字母索引表查询电子词典单词的方法及其系统
AU632267B2 (en) A relational database representation with relational database operation capability
CN1601524A (zh) 模糊查询系统及方法
CN107085603A (zh) 一种数据处理方法及装置
CN110457531A (zh) 一种基于OpenMP的并行字符串查询方法
Yan et al. Data reduction through early grouping.
CN1326073C (zh) 用于建立计算机文字信息的索引和进行检索的方法和系统
CN1368697A (zh) 数据查寻方法
JP3980326B2 (ja) データ管理方法およびコンピュータ読み取り可能な記録媒体
CN2710050Y (zh) 便携式列车时刻电子智能查询装置
Miled et al. Data compression in a pharmaceutical drug candidate database

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: YINGYEDA( SHANGHAI ) CO., LTD.

Free format text: FORMER OWNER: NONE WUDI TECHNOLOGY (XI AN) CO., LTD.

Effective date: 20051021

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20051021

Address after: 200000 No. 1295, Shanghai, Yishan Road

Patentee after: Yingyeda Co Ltd (Shanghai)

Address before: 2, building 710000, building F-2B, hi tech Industrial Development Zone, Shaanxi, Xi'an

Patentee before: Wudi Science and Technology Co., Ltd. (Xian)

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20040331

Termination date: 20111104