CN104298684B - 一种查询方法、装置及服务器 - Google Patents

一种查询方法、装置及服务器 Download PDF

Info

Publication number
CN104298684B
CN104298684B CN201310303339.4A CN201310303339A CN104298684B CN 104298684 B CN104298684 B CN 104298684B CN 201310303339 A CN201310303339 A CN 201310303339A CN 104298684 B CN104298684 B CN 104298684B
Authority
CN
China
Prior art keywords
characters
index
character
single character
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310303339.4A
Other languages
English (en)
Other versions
CN104298684A (zh
Inventor
段乾
张晓廷
杨志鹏
孟祥宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE ICT Technologies Co Ltd
Original Assignee
ZTE ICT Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE ICT Technologies Co Ltd filed Critical ZTE ICT Technologies Co Ltd
Priority to CN201310303339.4A priority Critical patent/CN104298684B/zh
Publication of CN104298684A publication Critical patent/CN104298684A/zh
Application granted granted Critical
Publication of CN104298684B publication Critical patent/CN104298684B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种查询方法,将待查询的关键字符分解为一个以上单字符;在索引名称库中分别查询所述一个以上单字符出现的次数,并记录包含出现次数最少的单字符的所有索引名称;在所述包含出现次数最少的单字符的所有索引名称中查询与所述待查询的关键字符匹配的索引名称。本发明还同时公开了一种查询装置及服务器。采用本发明的方案,缩短了查询时间,提高了查询效率。

Description

一种查询方法、装置及服务器
技术领域
本发明涉及通讯领域中的查询技术,尤其涉及一种查询方法、装置及服务器。
背景技术
随着即时通讯(IM,Instant Messenger)工具的普及化,即时通讯工具成为各个行业以及众多计算机用户必备的桌面工具。伴随着信息化进程越来越快地发展以及大数据时代的到来,越来越多的通讯数据需要相关的服务器在短时间内进行高效的处理,这对于服务器的性能以及相关处理方法提出了更为严格的要求。在众多的通讯数据处理中,对通讯数据进行查询无疑是最消耗时间的,因此,优化查询算法能够有效提高服务器的性能,但是,目前的查询算法的查询效率仍有待提升的空间。
发明内容
有鉴于此,本发明的主要目的在于提供一种查询方法、装置及服务器,能够提高查询效率,缩短查询时间。
为达到上述目的,本发明的技术方案是这样实现的:
一种查询方法,所述方法包括:
将待查询的关键字符分解为一个以上单字符;
在索引名称库中分别查询所述一个以上单字符出现的次数,并记录包含出现次数最少的单字符的所有索引名称;
在所述包含出现次数最少的单字符的所有索引名称中查询与所述待查询的关键字符匹配的索引名称。
其中,所述将待查询的关键字符分解为一个以上单字符之后,所述方法还包括:
计算所述一个以上单字符之间的梯度值。
其中,所述方法还包括:对所述索引名称库中的所有索引名称进行梯度计算,而获取每个索引名称中各单字符之间的梯度值。
其中,更新所述已建立的索引名称时,所述方法还包括:
对所述索引名称库中的更新的索引名称进行梯度计算,而获取所更新的每个索引名称中各单字符之间的梯度值。
其中,所述方法还包括:删除所述索引名称库中的索引名称时,还将所删除的索引名称中各单字符之间的梯度值进行删除。
其中,所述在所述包含出现次数最少的单字符的所有索引名称中查询与所述关键字符匹配的索引名称,包括:
以待查询的关键字符中所述出现次数最少的单字符为基准,分别确定待查询的关键字符中所述出现次数最少的单字符与其他所有单字符之间的第一梯度值;
对于所述包含出现次数最少的单字符的所有索引名称中的每一索引名称,以所述出现次数最少的单字符为基准,分别确定所述出现次数最少的单字符与其他所有单字符之间的第二梯度值;
将依次确定的第一梯度值与第二梯度值均匹配的所述包含出现次数最少的单字符的所有索引名称作为待查询的关键字符。
其中,所述在所述包含出现次数最少的单字符的所有索引名称中查询与所述关键字符匹配的索引名称,包括:
以待查询的关键字符中任一单字符为基准,分别确定待查询的关键字符中所述任一单字符与其他所有单字符之间的第一梯度值;
对于所述包含出现次数最少的单字符的所有索引名称中的每一索引名称,以与所述待查询的关键字符中对应次序的单字符为基准,分别确定所述对应次序的单字符与其他所有单字符之间的第二梯度值;
将依次确定的第一梯度值与第二梯度值均匹配的所述包含出现次数最少的单字符的所有索引名称作为待查询的关键字符。
一种查询装置,所述装置包括:分解单元、第一查询单元、记录单元以及第二查询单元;其中,
所述分解单元,用于将待查询的关键字符分解为一个以上单字符;
所述第一查询单元,用于在索引名称库中分别查询所述一个以上单字符出现的次数;
所述记录单元,用于记录包含出现次数最少的单字符的所有索引名称;
所述第二查询单元,用于在所述包含出现次数最少的单字符的所有索引名称中查询与所述待查询的关键字符匹配的索引名称。
其中,所述装置还包括第一计算单元,用于计算所述一个以上单字符之间的梯度值。
其中,所述装置还包括第二计算单元,用于对所述索引名称库中的所有索引名称进行梯度计算,而获取每个索引名称中各单字符之间的梯度值。
其中,所述第二计算单元,还用于对所述索引名称库中的更新的索引名称进行梯度计算,而获取所更新的每个索引名称中各单字符之间的梯度值。
其中,所述装置还包括删除单元,用于删除所述索引名称库中的索引名称时,还将所删除的索引名称中各单字符之间的梯度值进行删除。
其中,所述第二查询单元包括:第一确定子单元、第二确定子单元以及第一匹配子单元;其中,
所述第一确定子单元,用于以待查询的关键字符中所述出现次数最少的单字符为基准,分别确定待查询的关键字符中所述出现次数最少的单字符与其他所有单字符之间的第一梯度值;
所述第二确定子单,用于对于所述包含出现次数最少的单字符的所有索引名称中的每一索引名称,以所述出现次数最少的单字符为基准,分别确定所述出现次数最少的单字符与其他所有单字符之间的第二梯度值;
所述第一匹配子单元,用于将依次确定的第一梯度值与第二梯度值均匹配的所述包含出现次数最少的单字符的所有索引名称作为待查询的关键字符。
其中,所述第二查询单元包括:第三确定子单元、第四确定子单元以及第二匹配子单元;其中,
所述第三确定子单元,用于以待查询的关键字符中任一单字符为基准,分别确定待查询的关键字符中所述任一单字符与其他所有单字符之间的第一梯度值;
所述第四确定子单元,用于对于所述包含出现次数最少的单字符的所有索引名称中的每一索引名称,以与所述待查询的关键字符中对应次序的单字符为基准,分别确定所述对应次序的单字符与其他所有单字符之间的第二梯度值;
所述第二匹配子单元,用于将依次确定的第一梯度值与第二梯度值均匹配的所述包含出现次数最少的单字符的所有索引名称作为待查询的关键字符。
一种查询服务器,所述服务器包括上述查询装置。
本发明提供的查询方法、装置及服务器,将待查询的关键字符分解为一个以上单字符;在索引名称库中分别查询所述一个以上单字符出现的次数,并记录包含出现次数最少的单字符的所有索引名称;在所述包含出现次数最少的单字符的所有索引名称中查询与所述待查询的关键字符匹配的索引名称。如此,缩短了查询时间,提高了查询效率;并且,还保障了查询的精度,从而提高了查询的性能。
附图说明
图1为本发明实施例查询方法的实现流程示意图一;
图2为本发明实施例查询方法的实现流程示意图二;
图3为本发明实施例查询装置的结构组成示意图。
具体实施方式
为了能够更加详尽地了解本发明的特点与技术内容,下面结合附图对本发明的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本发明。
本发明实施例记载了一种查询方法,如图1所示,所述方法包括以下步骤:
步骤101:将待查询的关键字符分解为一个以上单字符。
这里,待查询的关键字符可以是以下字符的任意组合:汉字、数字、符号、字母。例如,查询一个名称为“学习交流”的群组时,需要将“学习交流”四个字符作为待查询的关键字符。
以待查询的关键字符为“学习交流”为例,将待查询的关键字符分解为一个以上单字符为:将“学习交流”分解为四个单字符,分别包括:“学”、“习”、“交”、“流”四个单字符。此处,将待查询的关键字符分解为一个单字符,是为了后续对分别对分解的所述一个以上单字符进行查询。
优选地,所述将待查询的关键字符分解为一个以上单字符之后,所述方法还包括:计算所述一个以上单字符之间的梯度值。
具体地,将所述一个以上单字符按照预设的规则分别进行编码转换,并得到所述一个以上单字符对应的编码值,进而得到所述一个以上单字符之间的梯度值。优选地,所述一个以上单字符之间的梯度值为所述单字符对应的编码值之差。例如,将“学”、“习”、“交”、“流”四个单字符分别进行编码转换,得到这四个单字符对应的编码值分别为:1111、1001、1100、1110。进一步地,一个以上单字符之间的梯度值为:1111-1001、1001-1100、1100-1110。如此,根据“交”字符的梯度值1100以及“习”字符与“交”字符的梯度值1001-1100可以计算得到“习”字符的梯度值。
步骤102:在索引名称库中分别查询所述一个以上单字符出现的次数,并记录包含出现次数最少的单字符的所有索引名称。
这里,索引名称库中包含多个索引名称,通过索引名称可以查找到与所述索引名称对应的信息,例如创建时间、创建地点、级别等。
索引名称库中包含的索引名称按预设的结构(如顺序结构)存储在服务器中,例如,索引名称库中包含有五个索引名称,分别为:“流行文学”、“学习交流”、“学习游戏”、“学习社交”、“流体”。
这里,在索引名称库中分别查询所述一个以上单字符出现的次数可以通过循环查询的方式,例如,首先,查询“学”字符在索引名称库中出现的次数,查询结果为:在“流行文学”索引名称中查询到一次、在“学习交流”索引名称中查询到一次、在“学习游戏”中查询到一次、在“学习社交”中查询到一次,在索引名称库中共查询到四次“学”字符。同理,在索引名称库中共查询到三次“习”字符,两次“交”字符、三次“流”字符。
出现次数最少的单字符为“交”字符,并且“交”字符所在的索引名称为“学习交流”和“学习社交”。在实际情况中,“出现次数最少的单字符所在的索引名称的个数也可以为一个或者多个。
优选地,所述方法还包括:对所述索引名称库中的所有索引名称进行梯度计算,而获取每个索引名称中各单字符之间的梯度值。
这里,可以在服务器开启或重启的情况下,从服务器中存储的已经建立的索引名称数据库中获取已建立的索引名称,进而对所述索引名称库中的所有索引名称进行梯度计算,而获取每个索引名称中各单字符之间的梯度值。
对所述索引名称进行梯度计算包括:将所述索引名称按照预设的规则分别进行编码转换,并得到所述索引名称中的一个以上单字符对应的编码值,进而得到所述一个以上单字符之间的梯度值。
例如,“流行文学”对应的编码值为“1110000100101111”;“学习交流”对应的编码值为“1111100111001110”、“学习游戏”对应的编码值为“1111100100110100”、“学习社交”对应的编码值为“1111100101101100”、“流体”对应的编码值为“11100111”。对应地,“流行文学”中的单字符之间的梯度值为:1110-0001、0001-0010、0010-1111;“学习交流”中的单字符之间的梯度值为:1111-1001、1001-1100、1100-1110;“学习游戏”中的单字符之间的梯度值为:1111-1001、1001-0011、0011-0100;“学习社交”中的单字符之间的梯度值为:1111-1001、1001-0110、0110-1100;“流体”中的单字符之间的梯度值为:1110-0111。
优选地,更新所述已建立的索引名称时,所述方法还包括:
对所述索引名称库中的更新的索引名称进行梯度计算,而获取所更新的每个索引名称中各单字符之间的梯度值。
优选地,所述方法还包括:删除所述索引名称库中的索引名称时,还将所删除的索引名称中各单字符之间的梯度值进行删除。
步骤103:在所述包含出现次数最少的单字符的所有索引名称中查询与所述待查询的关键字符匹配的索引名称。
这里,因为出现次数最少的单字符对应的索引名称的个数最少,因此在所述出现次数最少的单字符所在的索引名称中进行查询大大缩小了查询任务的范围,减少了查询时间。
优选地,所述在所述包含出现次数最少的单字符的所有索引名称中查询与所述关键字符匹配的索引名称,包括:
以待查询的关键字符中所述出现次数最少的单字符为基准,分别确定待查询的关键字符中所述出现次数最少的单字符与其他所有单字符之间的第一梯度值;
对于所述包含出现次数最少的单字符的所有索引名称中的每一索引名称,以所述出现次数最少的单字符为基准,分别确定所述出现次数最少的单字符与其他所有单字符之间的第二梯度值;
将依次确定的第一梯度值与第二梯度值均匹配的所述包含出现次数最少的单字符的所有索引名称作为待查询的关键字符。
例如,出现次数最少的单字符为“交”字符,并且“交”字符所在的索引名称为“学习交流”和“学习社交”,如此,需要在“学习交流”和“学习社交”这两个索引名称中查找,“交”字符周围的单字符为“习”字符和“流”字符,首先,确定“习”字符与“交”字符的第一梯度值为1001-1100;其次,确定索引名称“学习交流”中“交”字符与左边第一个字符的第二梯度值为1001-1100;确定索引名称“学习社交”中“交”字符与左边第一个字符的第二梯度值为0110-1100;最后,确定的第一梯度值与索引名称“学习交流”中的第二梯度值匹配;同理,确定出“学习交流”中其他关键字符与“交”字符的梯度值,并确定出索引名称中其他关键字符与“交”字符的梯度值,两者的梯度值均匹配时,索引名称“学习交流”为待查询的关键字符。
优选地,所述在所述包含出现次数最少的单字符的所有索引名称中查询与所述关键字符匹配的索引名称,包括:
以待查询的关键字符中任一单字符为基准,分别确定待查询的关键字符中所述任一单字符与其他所有单字符之间的第一梯度值;
对于所述包含出现次数最少的单字符的所有索引名称中的每一索引名称,以与所述待查询的关键字符中对应次序的单字符为基准,分别确定所述对应次序的单字符与其他所有单字符之间的第二梯度值;
将依次确定的第一梯度值与第二梯度值均匹配的所述包含出现次数最少的单字符的所有索引名称作为待查询的关键字符。
例如,以待查询的关键字符中的“学”字符为基准,确定关键字符中的“习”字符与“学”字符的第一梯度值为1111-1001;其次,确定索引名称“学习交流”中“学”字符与右边第一个字符的第二梯度值为1111-1001;确定索引名称“学习社交”中“学”字符与左边第一个字符的第二梯度值为1111-1001;最后,确定的第一梯度值与索引名称“学习交流”中的第二梯度值以及“学习社交”中的第二梯度值匹配;继续确定索引名称“学习交流”中“学”字符与右边第二个字符的第二梯度值为1111-1100;确定索引名称“学习社交”中“学”字符与右边第二个字符的第二梯度值为1111-0011;确定的第一梯度值与索引名称“学习交流”中的第二梯度值匹配;同理,确定出“学习交流”中其他关键字符与“交”字符的梯度值,并确定出索引名称中其他关键字符与“交”字符的梯度值,两者的梯度值均匹配时,索引名称“学习交流”为待查询的关键字符。
下面结合具体实施例对本发明实施例记载的查询方法做进一步详细描述,如图2所示,所述方法包括以下步骤:
步骤201:接收客户端发送的将待查询的关键字符。
步骤202:将待查询的关键字符分解为m个单字符。
步骤203:计算所述m个单字符之间的梯度值。
步骤204:从索引名称库中的第N个索引名称开始查找第M个单字符。
这里,索引名称库中有n个索引名称,N初始值为1,M的初始值为1。
步骤205:判断当前索引名称中是否存在所查找的单字符;存在时,执行步骤206;不存在时,执行步骤207。
步骤206:记录当前索引名称,并累计所查找的单字符出现的次数S。
这里,S的初始值为0。
步骤207:判断N的值是否小于或等于n;是时,令N的值加1,并执行步骤204;否时,执行步骤208。
步骤208:判断M的值是否小于或等于m;是时,令M的值的加1,并执行步骤204;否时,执行步骤209。
步骤209:统计出现次数最少的单字符为第X个单字符,并记录出现次数最少的单字符所在的索引名称。
步骤210:令X的值减1或者X的值加1;当前单字符存在时,执行步骤211;当前单字符不存在时,执行步骤213。
这里,当前单字符为X的值减1或者X的值加1之后所对应的单字符。
步骤211:获取当前单字符的梯度值,并在出现次数最少的单字符所在的索引名称中进行梯度值匹配。
步骤212:判断匹配是否成功;成功时,执行步骤210;失败时,执行步骤213。
步骤213:返回查询结果至客户端。
这里,如果在步骤210中,关键字符所对应的全部单字符均在索引名称中查询到时,查询结果为所查找到的索引名称。如果在步骤210中,关键字符所对应的部分单字符或者没有单字符在索引名称中查询到时,查询结果为没有与关键字符对应的索引名称。
针对上述查询方法,本发明实施例还记载了一种查询装置,如图3所示,所述查询装置包括:分解单元31、第一查询单元32、记录单元以33及第二查询单元34;其中,
所述分解单元31,用于将待查询的关键字符分解为一个以上单字符;
所述第一查询单元32,用于在索引名称库中分别查询所述一个以上单字符出现的次数;
所述记录单元33,用于记录包含出现次数最少的单字符的所有索引名称;
所述第二查询单元34,用于在所述包含出现次数最少的单字符的所有索引名称中查询与所述待查询的关键字符匹配的索引名称。
优选地,所述装置还包括第一计算单元35,用于计算所述一个以上单字符之间的梯度值。
优选地,所述装置还包括:第二计算单元36,用于对所述索引名称库中的所有索引名称进行梯度计算,而获取每个索引名称中各单字符之间的梯度值。
优选地,所述第二计算单元36,还用于对所述索引名称库中的更新的索引名称进行梯度计算,而获取所更新的每个索引名称中各单字符之间的梯度值。
优选地,所述装置还包括删除单元37,用于删除所述索引名称库中的索引名称时,还将所删除的索引名称中各单字符之间的梯度值进行删除。
优选地,所述第二查询单元34包括:第一确定子单元、第二确定子单元以及匹配子单元;其中,
所述第一确定子单元,用于以待查询的关键字符中所述出现次数最少的单字符为基准,分别确定待查询的关键字符中所述出现次数最少的单字符与其他所有单字符之间的第一梯度值;
所述第二确定子单元,用于对于所述包含出现次数最少的单字符的所有索引名称中的每一索引名称,以所述出现次数最少的单字符为基准,分别确定所述出现次数最少的单字符与其他所有单字符之间的第二梯度值;
所述匹配子单元,用于将依次确定的第一梯度值与第二梯度值均匹配的所述包含出现次数最少的单字符的所有索引名称作为待查询的关键字符。
优选地,所述第二查询单元34包括:第三确定子单元、第四确定子单元以及第二匹配子单元;其中,
所述第三确定子单元,用于以待查询的关键字符中任一单字符为基准,分别确定待查询的关键字符中所述任一单字符与其他所有单字符之间的第一梯度值;
所述第四确定子单元,用于对于所述包含出现次数最少的单字符的所有索引名称中的每一索引名称,以与所述待查询的关键字符中对应次序的单字符为基准,分别确定所述对应次序的单字符与其他所有单字符之间的第二梯度值;
所述第二匹配子单元,用于将依次确定的第一梯度值与第二梯度值均匹配的所述包含出现次数最少的单字符的所有索引名称作为待查询的关键字符。
本领域技术人员应当理解,图3所示的查询装置中的各单元及其子单元的实现功能可参照前述查询方法的相关描述而理解。图3所示的查询装置中的各单元及其子单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
本发明实施例还记载了一种服务器,所述服务器包括上述查询装置,具体包括:分解单元31、第一查询单元32、记录单元以33及第二查询单元34;其中,
所述分解单元31,用于将待查询的关键字符分解为一个以上单字符;
所述第一查询单元32,用于在索引名称库中分别查询所述一个以上单字符出现的次数;
所述记录单元33,用于记录包含出现次数最少的单字符的所有索引名称;
所述第二查询单元34,用于在所述包含出现次数最少的单字符的所有索引名称中查询与所述待查询的关键字符匹配的索引名称。
这里,上述查询装置中的子单元所实现的功能可参照图2所示的查询装置中的单元及子单元所实现的功能进行理解,此处不再赘述。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (11)

1.一种查询方法,其特征在于,所述方法包括:
将待查询的关键字符分解为一个以上单字符;
计算所述一个以上单字符之间的梯度值;
在索引名称库中分别查询所述一个以上单字符出现的次数,并记录包含出现次数最少的单字符的所有索引名称;
在所述包含出现次数最少的单字符的所有索引名称中查询与所述待查询的关键字符匹配的索引名称;包括:
以待查询的关键字符中任一单字符为基准,分别确定待查询的关键字符中所述任一单字符与其他所有单字符之间的第一梯度值;
对于所述包含出现次数最少的单字符的所有索引名称中的每一索引名称,以与所述待查询的关键字符中对应次序的单字符为基准,分别确定所述对应次序的单字符与其他所有单字符之间的第二梯度值;
将依次确定的第一梯度值与第二梯度值均匹配的所述包含出现次数最少的单字符的所有索引名称作为待查询的关键字符。
2.根据权利要求1所述的查询方法,其特征在于,所述方法还包括:
对所述索引名称库中的所有索引名称进行梯度计算,而获取每个索引名称中各单字符之间的梯度值。
3.根据权利要求2所述的查询方法,其特征在于,更新所述索引名称库时,所述方法还包括:
对所述索引名称库中的更新的索引名称进行梯度计算,而获取所更新的每个索引名称中各单字符之间的梯度值。
4.根据权利要求2所述的查询方法,其特征在于,所述方法还包括:
删除所述索引名称库中的索引名称时,还将所删除的索引名称中各单字符之间的梯度值进行删除。
5.一种查询方法,其特征在于,所述方法包括:
将待查询的关键字符分解为一个以上单字符;
计算所述一个以上单字符之间的梯度值;
在索引名称库中分别查询所述一个以上单字符出现的次数,并记录包含出现次数最少的单字符的所有索引名称;
在所述包含出现次数最少的单字符的所有索引名称中查询与所述待查询的关键字符匹配的索引名称;包括:
以待查询的关键字符中所述出现次数最少的单字符为基准,分别确定待查询的关键字符中所述出现次数最少的单字符与其他所有单字符之间的第一梯度值;
对于所述包含出现次数最少的单字符的所有索引名称中的每一索引名称,以所述出现次数最少的单字符为基准,分别确定所述出现次数最少的单字符与其他所有单字符之间的第二梯度值;
将依次确定的第一梯度值与第二梯度值均匹配的所述包含出现次数最少的单字符的所有索引名称作为待查询的关键字符。
6.一种查询装置,其特征在于,所述装置包括:分解单元、第一查询单元、记录单元、第二查询单元以及第一计算单元;其中,
所述分解单元,用于将待查询的关键字符分解为一个以上单字符;
所述第一查询单元,用于在索引名称库中分别查询所述一个以上单字符出现的次数;
所述记录单元,用于记录包含出现次数最少的单字符的所有索引名称;
所述第二查询单元,用于在所述包含出现次数最少的单字符的所有索引名称中查询与所述待查询的关键字符匹配的索引名称;其中,所述第二查询单元包括:第三确定子单元、第四确定子单元以及第二匹配子单元;
所述第三确定子单元,用于以待查询的关键字符中任一单字符为基准,分别确定待查询的关键字符中所述任一单字符与其他所有单字符之间的第一梯度值;
所述第四确定子单元,用于对于所述包含出现次数最少的单字符的所有索引名称中的每一索引名称,以与所述待查询的关键字符中对应次序的单字符为基准,分别确定所述对应次序的单字符与其他所有单字符之间的第二梯度值;
所述第二匹配子单元,用于将依次确定的第一梯度值与第二梯度值均匹配的所述包含出现次数最少的单字符的所有索引名称作为待查询的关键字符;
所述第一计算单元,用于计算所述一个以上单字符之间的梯度值。
7.根据权利要求6所述的查询装置,其特征在于,所述装置还包括第二计算单元,用于对所述索引名称库中的所有索引名称进行梯度计算,而获取每个索引名称中各单字符之间的梯度值。
8.根据权利要求7所述的查询装置,其特征在于,所述第二计算单元,还用于对所述索引名称库中的更新的索引名称进行梯度计算,而获取所更新的每个索引名称中各单字符之间的梯度值。
9.根据权利要求7所述的查询装置,其特征在于,所述装置还包括删除单元,用于删除所述索引名称库中的索引名称时,还将所删除的索引名称中各单字符之间的梯度值进行删除。
10.一种查询装置,其特征在于,所述装置包括:分解单元、第一查询单元、记录单元、第二查询单元以及第一计算单元;其中,
所述分解单元,用于将待查询的关键字符分解为一个以上单字符;
所述第一查询单元,用于在索引名称库中分别查询所述一个以上单字符出现的次数;
所述记录单元,用于记录包含出现次数最少的单字符的所有索引名称;
所述第二查询单元,用于在所述包含出现次数最少的单字符的所有索引名称中查询与所述待查询的关键字符匹配的索引名称;其中,所述第二查询单元包括:第一确定子单元、第二确定子单元以及第一匹配子单元;其中,
所述第一确定子单元,用于以待查询的关键字符中所述出现次数最少的单字符为基准,分别确定待查询的关键字符中所述出现次数最少的单字符与其他所有单字符之间的第一梯度值;
所述第二确定子单元,用于对于所述包含出现次数最少的单字符的所有索引名称中的每一索引名称,以所述出现次数最少的单字符为基准,分别确定所述出现次数最少的单字符与其他所有单字符之间的第二梯度值;
所述第一匹配子单元,用于将依次确定的第一梯度值与第二梯度值均匹配的所述包含出现次数最少的单字符的所有索引名称作为待查询的关键字符;
所述第一计算单元,用于计算所述一个以上单字符之间的梯度值。
11.一种查询服务器,其特征在于,所述服务器包括权利要求6至10任一项所述的查询装置。
CN201310303339.4A 2013-07-18 2013-07-18 一种查询方法、装置及服务器 Expired - Fee Related CN104298684B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310303339.4A CN104298684B (zh) 2013-07-18 2013-07-18 一种查询方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310303339.4A CN104298684B (zh) 2013-07-18 2013-07-18 一种查询方法、装置及服务器

Publications (2)

Publication Number Publication Date
CN104298684A CN104298684A (zh) 2015-01-21
CN104298684B true CN104298684B (zh) 2018-04-06

Family

ID=52318412

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310303339.4A Expired - Fee Related CN104298684B (zh) 2013-07-18 2013-07-18 一种查询方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN104298684B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008383B (zh) * 2019-04-11 2021-07-27 北京安护环宇科技有限公司 一种基于多索引的黑白名单检索方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101329680A (zh) * 2008-07-17 2008-12-24 安徽科大讯飞信息科技股份有限公司 句子层面的大规模快速匹配方法
CN101452459A (zh) * 2007-11-30 2009-06-10 英业达股份有限公司 利用索引查找相似翻译结果的系统及其方法
CN103034663A (zh) * 2011-09-29 2013-04-10 阿里巴巴集团控股有限公司 一种信息搜索方法和设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4581962B2 (ja) * 2005-10-27 2010-11-17 株式会社日立製作所 情報検索システムとインデクス管理方法およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101452459A (zh) * 2007-11-30 2009-06-10 英业达股份有限公司 利用索引查找相似翻译结果的系统及其方法
CN101329680A (zh) * 2008-07-17 2008-12-24 安徽科大讯飞信息科技股份有限公司 句子层面的大规模快速匹配方法
CN103034663A (zh) * 2011-09-29 2013-04-10 阿里巴巴集团控股有限公司 一种信息搜索方法和设备

Also Published As

Publication number Publication date
CN104298684A (zh) 2015-01-21

Similar Documents

Publication Publication Date Title
CN108038183B (zh) 结构化实体收录方法、装置、服务器和存储介质
CN115563287B (zh) 一种获取关联对象的数据处理系统
CN107239450B (zh) 基于交互上下文处理自然语言方法
CN110457672A (zh) 关键词确定方法、装置、电子设备及存储介质
CN109299235B (zh) 知识库搜索方法、装置及计算机可读存储介质
CN108027817A (zh) 基于用户的组关联建议查询
CN110969517B (zh) 一种招投标生命周期关联方法、系统、存储介质及计算机设备
CN112115232A (zh) 一种数据纠错方法、装置及服务器
CN106354871A (zh) 一种企业名称的相似性检索方法
CN112650858B (zh) 应急协助信息的获取方法、装置、计算机设备及介质
CN115455161A (zh) 对话处理方法、装置、电子设备及存储介质
CN112988753B (zh) 一种数据搜索方法和装置
CN111368697A (zh) 一种信息识别方法和装置
CN113326363B (zh) 搜索方法及装置、预测模型训练方法及装置、电子设备
CN109657060B (zh) 安全生产事故案例推送方法及系统
CN110825919B (zh) Id数据处理方法和装置
CN113722600A (zh) 应用于大数据的数据查询方法、装置、设备及产品
CN113590756A (zh) 信息序列生成方法、装置、终端设备和计算机可读介质
CN104298684B (zh) 一种查询方法、装置及服务器
US11170010B2 (en) Methods and systems for iterative alias extraction
CN110019193A (zh) 相似帐号识别方法、装置、设备、系统及可读介质
CN114417856B (zh) 文本的稀疏编码方法、装置及电子设备
CN109190039B (zh) 确定相似对象的方法、装置及计算机可读存储介质
CN111522941B (zh) 文本聚类方法、装置、电子设备及计算机存储介质
CN111400373A (zh) 一种在联盟链中实现区块信息可视化的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180406

CF01 Termination of patent right due to non-payment of annual fee