CN106021440A - 一种搜索方法及装置 - Google Patents

一种搜索方法及装置 Download PDF

Info

Publication number
CN106021440A
CN106021440A CN201610323573.7A CN201610323573A CN106021440A CN 106021440 A CN106021440 A CN 106021440A CN 201610323573 A CN201610323573 A CN 201610323573A CN 106021440 A CN106021440 A CN 106021440A
Authority
CN
China
Prior art keywords
search
index
field
resource pool
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610323573.7A
Other languages
English (en)
Other versions
CN106021440B (zh
Inventor
王全礼
邵小亮
陈飞
谢隆飞
郑坚钢
杨雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN201610323573.7A priority Critical patent/CN106021440B/zh
Publication of CN106021440A publication Critical patent/CN106021440A/zh
Application granted granted Critical
Publication of CN106021440B publication Critical patent/CN106021440B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9014Indexing; Data structures therefor; Storage structures hash tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种搜索方法及装置。该方法包括:根据搜索条件查询到相应的搜索索引;对所述搜索索引进行拆分,得到搜索目录列表;对所述搜索目录列表中的每个搜索索引文件建立与其相对应的搜索器;根据所述搜索条件的属性,遍历资源池列表,为所述搜索器列表中的每个搜索器匹配与之相对应的所述带有编号的资源池,由所述多个搜索器分别对所述与之相对应的所述带有编号的资源池进行并行搜索,将所述并行搜索的结果进行合并得到搜索结果。通过本发明解决中大型数据量搜索性能问题,进而提高了搜索效率以及搜索结果精准度。

Description

一种搜索方法及装置
技术领域
本发明涉及信息搜索技术领域,特别是涉及一种搜索方法及装置。
背景技术
随着互联网技术的快速发展以及信息量的急剧增加,用户通常通过搜索技术来寻找所需要的信息资源。而搜索效率以及对搜索结果的智能化处理已经成为搜索技术研究的核心内容。
目前,对于小数据量的搜索技术通常是通过单一的索引文件进行搜索,对于海量数据通常是通过分布式搜索进行搜索。而对于中大型数据量例如百万级别到亿万级别数据量,如果采用小数量的搜索方式即采用单一索引文件进行搜索,会存在因索引文件过大而影响搜索效率;如果采用分布式搜索方式,会占用大量的缓存来解决搜索效率的问题,但是这样对硬件资源又造成了浪费。而搜索效率直接影响着搜索性能,如何在避免对硬件资源造成浪费的情况下,又能提高中大型数据量搜索性能已成为现有技术需要解决的问题。
发明内容
针对于上述问题,本发明提供一种搜索方法及装置,用以解决中大型数据量搜索性能问题,提高搜索效率以及搜索结果精准度。
为了实现上述目的,根据本发明的第一方面,提供了一种搜索方法,该方法包括:
接收搜索条件,并根据所述搜索条件查询到相应的搜索索引,其中,所述搜索条件中包含索引拆分字段;
根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
对所述搜索目录列表中的每个搜索索引文件建立与其相对应的搜索器,构成存储所述多个搜索器的搜索器列表,其中,所述搜索器用于读取所述搜索索引文件;
根据所述搜索条件的属性,遍历资源池列表,得到带有编号的资源池,并为所述搜索器列表中的每个搜索器匹配与之相对应的所述带有编号的资源池,由所述多个搜索器分别对所述与之相对应的所述带有编号的资源池进行并行搜索,将所述并行搜索的结果进行合并得到搜索结果;
其中,所述搜索条件的属性包括线程数量和超时时间,所述资源池列表中存储多个资源池,并且每个资源池有与之对应的编号以及超时时间、线程数量。
优选的,该方法还包括:
判断所述搜索结果的搜索结果策略是否与所述搜索条件的搜索策略相匹配;
如果所述搜索结果策略中的词类型与所述搜索策略中的词类型相同,并且对应的上下级词和同义词也相互匹配,则所述搜索结果策略与所述搜索策略相匹配,将所述搜索结果作为目标搜索结果;
其中,所述搜索结果策略和所述搜索策略均是基于层次关系词库及词类别直接关联关系的策略,所述层次关系词库是根据词库的上下级关系建立树状的词库内存结构。
优选的,当所述索引拆分字段包括时间范围字段时,所述根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表,包括:
根据所述时间范围字段,得到所述索引拆分字段的长度、所述索引拆分字段的前缀字符串和拆分后每个搜索文件对应的索引目录个数;
根据所述每个搜索文件对应的索引目录的个数,定义所述每个搜索文件对应的索引目录的起始值和终止值;
判断所述每个搜索文件对应的搜索目录范围是否大于所述起始值,并且小于所述终止值,如果是则所述每个搜索文件对应的索引目录的拆分范围为所述终止值和所述起始值之间的差值;
根据每个搜索文件对应的索引目录的拆分范围,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表。
优选的,当所述索引拆分字段包括分类维度字段时,所述根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表,包括:
根据所述分类维度字段,对所述搜索索引进行维度拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
其中,所述分类维度字段包括根据所述搜索条件中的内容对搜索类型进行分类后所对应的类型字段。
优选的,所述根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表,包括:
根据所述索引拆分字段生成哈希值,根据所述哈希值采用哈希函数对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表。
优选的,当所述索引拆分字段中包括两个不同类型的拆分字段时,所述根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表,包括:
根据所述索引拆分字段的第一拆分字段,对所述搜索索引进行拆分,获得多个所述第一拆分字段对应的搜索索引文件;
根据所述索引拆分字段的第二拆分字段,对所述第一拆分字段对应的搜索索引文件进行拆分,获得所述第二拆分字段对应的搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
或者,根据所述索引拆分字段的第一拆分字段生成第一哈希值,根据所述第一哈希值采用哈希函数对所述搜索索引进行拆分,获得多个所述第一哈希值对应的搜索索引文件;
根据所述索引拆分字段的第二拆分字段生成第二哈希值,根据所述第二哈希值采用哈希函数对所述第一哈希值对应的搜索索引文件进行拆分,获得所述第二哈希值对应的搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表。
优选的,所述根据所述搜索条件的属性,遍历资源池列表,得到带有编号的资源池,并为所述搜索器列表中的每个搜索器匹配与之相对应的所述带有编号的资源池,由所述多个搜索器分别对所述与之相对应的所述带有编号的资源池进行并行搜索,将所述并行搜索的结果进行合并得到搜索结果,包括:
根据搜索条件的属性,遍历资源池列表,其中所述资源池列表中存储多个资源池;
判断所述搜索条件的属性与所述资源池的属性是否匹配;
当所述资源池的超时时间大于等于所述搜索条件的超时时间时,则根据所述搜索条件的线程数量去匹配所述资源池的线程数量,如果所述线程数量匹配,则所述搜索条件的属性与所述资源池的属性匹配,得到所述资源池的编号;
当所述搜索条件的属性与所述资源池的属性是不匹配时,判断所述搜索等待间隔时间是否超过尝试总数,如果不超过则重新执行上述将所述搜索条件的属性与所述资源池的属性进行匹配的过程,其中,所述搜索条件的属性包括线程量和超时时间,所述资源池的属性包括资源池编号、超时时间和线程数量;
由所述多个搜索器分别对所述与之相对应的所述带有编号的资源池进行并行搜索,将所述并行搜索的结果进行合并得到搜索结果。
根据本发明的第二个方面,提供了一种搜索装置,该装置包括:
查询单元,用于接收搜索条件,并根据所述搜索条件查询到相应的搜索索引,其中,所述搜索条件中包含索引拆分字段;
拆分单元,用于根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
搜索器建立单元,用于对所述搜索目录列表中的每个搜索索引文件建立与其相对应的搜索器,构成存储所述多个搜索器的搜索器列表,其中,所述搜索器用于读取所述搜索索引文件;
匹配单元,用于根据所述搜索条件的属性,遍历资源池列表,得到带有编号的资源池,并为所述搜索器列表中的每个搜索器匹配与之相对应的所述带有编号的资源池;
搜索单元,用于控制所述多个搜索器分别对所述与之相对应的所述带有编号的资源池进行并行搜索,将所述并行搜索的结果进行合并得到搜索结果;
其中,所述搜索条件的属性包括线程数量和超时时间,所述资源池列表中存储多个资源池,并且每个资源池有与之对应的编号以及超时时间、线程数量。
优选的,该装置还包括:
策略判断单元,用于判断所述搜索结果的搜索结果策略是否与所述搜索条件的搜索策略相匹配;
第一执行单元,用于如果所述搜索结果策略中的词类型与所述搜索策略中的词类型相同,并且对应的上下级词和同义词也相互匹配,则所述策略判断单元判断的搜索结果策略与所述搜索策略相匹配,将所述搜索结果作为目标搜索结果;
其中,所述搜索结果策略和所述搜索策略均是基于层次关系词库及词类别直接关联关系的策略,所述层次关系词库是根据词库的上下级关系建立树状的词库内存结构。
优选的,所述拆分单元,包括:
第一获取单元,用于当所述索引拆分字段包括时间范围字段时,根据所述时间范围字段,得到所述索引拆分字段的长度、所述索引拆分字段的前缀字符串和拆分后每个搜索文件对应的索引目录个数;
第一定义单元,根据所述每个搜索文件对应的索引目录的个数,定义所述每个搜索文件对应的索引目录的起始值和终止值;
第一判断单元,用于判断所述每个搜索文件对应的搜索目录范围是否大于所述起始值,并且小于所述终止值,如果是,则所述每个搜索文件对应的索引目录的拆分范围为所述终止值和所述起始值之间的差值;
范围拆分单元,根据每个搜索文件对应的索引目录的拆分范围,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表。
优选的,所述拆分单元,包括:
维度拆分单元,用于当所述索引拆分字段包括分类维度字段时,根据所述分类维度字段,对所述搜索索引进行维度拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
其中,所述分类维度字段包括根据所述搜索条件中的内容对搜索类型进行分类后所对应的类型字段;
优选的,所述拆分单元,包括:
哈希拆分单元,用于根据所述索引拆分字段生成哈希值,根据所述哈希值采用哈希函数对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表。
优选的,所述拆分单元,包括:
第一拆分单元,用于当所述搜索索引拆分字段中包括两个不同类型的拆分字段时,根据所述索引拆分字段的第一拆分字段,对所述搜索索引进行拆分,获得多个所述第一拆分字段对应的搜索索引文件;
第二拆分单元,用于当所述搜索索引拆分字段中包括两个不同类型的拆分字段时,根据所述索引拆分字段的第二拆分字段,对所述第一拆分字段对 应的搜索索引文件进行拆分,获得所述第二拆分字段对应的搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
或者,第一哈希拆分单元,用于当所述搜索索引拆分字段中包括两个不同的拆分字段时,根据所述索引拆分字段的第一拆分字段生成第一哈希值,根据所述第一哈希值采用哈希函数对所述搜索索引进行拆分,获得多个所述第一哈希值对应的搜索索引文件;
第二哈希拆分单元,用于当所述搜索索引拆分字段中包括两个不同的拆分字段时,根据所述索引拆分字段的第二拆分字段生成第二哈希值,根据所述第二哈希值采用哈希函数对所述第一哈希值对应的搜索索引文件进行拆分,获得所述第二哈希值对应的搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表。
优选的,所述匹配单元包括:
资源池遍历单元,用于根据搜索条件的属性,遍历资源池列表,其中所述资源池列表中存储多个资源池;
第二判断单元,用于判断所述搜索条件的属性与所述资源池的属性是否匹配;
第二执行单元,用于当所述资源池的超时时间大于等于所述搜索条件的超时时间时,则根据所述搜索条件的线程数量去匹配所述资源池的线程数量,如果所述线程数量匹配,则所述搜索条件的属性与所述资源池的属性匹配,得到所述资源池的编号;
第三判断单元,用于当所述搜索条件的属性与所述资源池的属性是不匹配时,判断所述搜索等待间隔时间是否超过尝试总数,如果不超过则重新执行上述将所述搜索条件的属性与所述资源池的属性进行匹配的过程,其中所述搜索条件的属性包括线程量和超时时间,所述资源池的属性包括资源池编号、超时时间和线程数量。
相较于现有技术,本发明基于搜索条件,对搜索索引进行拆分,并且建立了相应的搜索器,为每个搜索器匹配了相应的资源池,实现了并行搜索得 到搜索结果,解决中大型数据量搜索性能问题,提高搜索效率以及搜索结果精准度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例一提供的一种搜索方法的流程示意图;
图2为本发明实施例二对应的图1所示的搜索方法中的S12步骤中的时间范围拆分的流程示意图;
图3为本发明实施例二对应的图1所示的搜索方法中的S14步骤中的详细处理的流程示意图;
图4为本发明实施例四提供的搜索装置结构示意图;
图5为本发明实施例四中拆分单元的结构示意图;
图6为本发明实施例四中匹配单元的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有设定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
实施例一
参见图1为本发明实施例一提供的一种搜索方法的流程示意图,该方法包括以下步骤:
S11、接收搜索条件,并依据所述搜索条件查询到相应的搜索索引后,执行S12;
其中,所述搜索条件包含索引拆分字段,所述索引拆分字段可以包括时间范围字段、分类维度字段和其他形式的字段的任意一种或几种的组合,同时也可由所述索引拆分字段生成与之对应的哈希值。
S12、根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表后,执行S13;
其中,基于索引拆分字段中包括的内容不同,可以具体分为时间范围模式拆分、分类维度模式拆分和哈希模式拆分。
S13、对所述搜索目录列表中的每个搜索索引文件建立与其相对应的搜索器,构成存储所述多个搜索器的搜索器列表后,执行S14;
其中,所述搜索器用于读取所述搜索索引文件;
S14、根据所述搜索条件的属性,遍历资源池列表,得到带有编号的资源池,并为所述搜索器列表中的每个搜索器匹配与之相对应的所述带有编号的资源池,由所述多个搜索器分别对所述与之相对应的所述带有编号的资源池进行并行搜索,将所述并行搜索的结果进行合并得到搜索结果;
其中,所述搜索条件的属性包括线程数量和超时时间,所述资源池列表中存储多个资源池,并且每个资源池有与之对应的编号以及超时时间、线程数量。
根据本发明的实施例一公开的技术方案,可以得出该搜索方法基于搜索条件,对搜索索引进行拆分,并且建立了相应的搜索器,为每个搜索器匹配了相应的资源池,实现了并行搜索得到搜索结果,解决中大型数据量搜索性能问题,提高搜索效率以及搜索结果精准度。
实施例二
参照本发明实施例一和图1中所描述的S11到S14步骤的具体过程,此处不做赘述,具体的,当为时间范围拆分时,即所述索引拆分字段包括时间范围字段时,如图2所示,根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表索引步骤S12具体包括:
S21、根据所述时间范围字段,得到所述索引拆分字段的长度、所述索引拆分字段的前缀字符串和拆分后每个搜索文件对应的索引目录个数后,执行S22;
S22、根据所述每个搜索文件对应的索引目录的个数,定义所述每个搜索文件对应的索引目录的起始值和终止值后,执行S23;
具体地,当所述搜索文件的数量为两个时,若定义第一个搜索文件的起始值为1,终止值为3,则第二个搜索文件的起始值为4,终止为6,以此类推。
S23、判断所述每个搜索文件对应的搜索目录范围是否大于所述起始值,并且小于所述终止值后,执行S24;
S24、所述每个搜索文件对应的索引目录的拆分范围为所述终止值和所述起始值之间的差值后,执行S25;
S25、根据每个搜索文件对应的索引目录的拆分范围,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
具体例如,当时间范围字段为3个月时,则每个搜索文件对应的索引目录的个数为3个月内的索引目录个数,则可以将所述搜索索引,拆分为四个搜索文件,第一个搜索文件对应的是1-3个月的索引目录个数,第二个搜索文件对应的是4-6个月的索引文件个数,第三个搜索文件对应的是7-9个月的搜索文件个数,第四个搜索文件对应的是10-12个月的搜索文件个数。
当为分类维度模式拆分时,即所述索引拆分字段包括分类维度字段时, 根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表索引步骤S12具体包括:
根据所述分类维度字段,对所述搜索索引进行维度拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
其中,所述分类维度字段包括根据所述搜索条件中的内容对搜索类型进行分类后所对应的类型字段,具体可以例如银行系统中的知识分类为金融、I T和文化等几个维度。
当为哈希模式拆分时,根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表索引步骤S12具体包括:
根据所述索引拆分字段生成哈希值,根据所述哈希值采用哈希函数对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
其中,哈希函数可以采用Hashcode、RShash、JShash、BKRDhash、FNVHash、APhash等函数或者其他可以实现本发明该功能的哈希函数,本发明优选采用了相对稳定并且计算速度相对较快的Java自带hashcode函数。
上述举例说明了三种拆分模式单独存在的情况,即为单层拆分,同样也可以采用双层拆分,即所述索引拆分字段中包括两个不同类型的拆分字段,当为双层拆分时,所述根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表,包括:
根据所述索引拆分字段的第一拆分字段,对所述搜索索引进行拆分,获得多个所述第一拆分字段对应的搜索索引文件;
根据所述索引拆分字段的第二拆分字段,对所述第一拆分字段对应的搜索索引文件进行拆分,获得所述第二拆分字段对应的搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
或者,根据所述索引拆分字段的第一拆分字段生成第一哈希值,根据所述第一哈希值采用哈希函数对所述搜索索引进行拆分,获得多个所述第一哈希值对应的搜索索引文件;
根据所述索引拆分字段的第二拆分字段生成第二哈希值,根据所述第二哈希值采用哈希函数对所述第一哈希值对应的搜索索引文件进行拆分,获得所述第二哈希值对应的搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表。
具体例如,对搜索索引进行时间范围模式和分类维度范围模式拆分时,可以将搜索索引首先按照实践范围模式进行拆分,得到相应的搜索文件,再对所述搜索文件进行分类维度拆分,比如每个搜索文件又可以按照金融、IT和文化等分类维度进行再次拆分,得到最终的搜索索引目录列表。
优选的,如图3所示,参照本发明实施例一,在图1中步骤S14根据所述搜索条件的属性,遍历资源池列表,得到带有编号的资源池,并为所述搜索器列表中的每个搜索器匹配与之相对应的所述带有编号的资源池,由所述多个搜索器分别对所述与之相对应的所述带有编号的资源池进行并行搜索,将所述并行搜索的结果进行合并得到搜索结果具体包括:
S31、根据搜索条件的属性,遍历资源池列表后,执行S32;
其中,所述资源池列表中存储多个资源池。
S32、判断所述搜索条件的属性与所述资源池的属性是否匹配后,如果是执行S33,如果否执行S34;
其中,当所述资源池的超时时间大于等于所述搜索条件的超时时间时,则根据所述搜索条件的线程数量去匹配所述资源池的线程数量,当所述线程数量匹配时,则认为所述搜索条件的属性与所述资源池的属性匹配;
S33、得到所述资源池的编号后,执行S35;
具体例如,当所述搜索条件的线程数量为4个,遍历资源池,1号资源池由于超时时间不能满足搜索条件的超时要求被放弃,然后去匹配2号资源池,如果2号资源池的线程数量为3个,则获取2号资源池线程后搜索条件的线 程剩余数量为1个,然后去匹配3号资源池,直到根据搜索条件的线程数量均匹配到相应的资源池后结束。
S34、判断所述搜索等待间隔时间是否超过尝试总数,如果不超过则重新执行上述将所述搜索条件的属性与所述资源池的属性进行匹配的过程;
其中,所述搜索条件的属性包括线程量和超时时间,所述资源池的属性包括资源池编号、超时时间和线程数量。
S35、由所述多个搜索器分别对所述与之相对应的所述带有编号的资源池进行并行搜索,将所述并行搜索的结果进行合并得到搜索结果。
根据本发明的实施例二公开的技术方案,具体描述对搜索索引进行不同类型的拆分,并且建立了相应的搜索器,为每个搜索器匹配了相应的资源池的具体步骤,实现了并行搜索得到搜索结果,通过对搜索索引进行拆分解决中大型数据量搜索性能问题,进一步提高搜索效率以及搜索结果精准度。
实施例三
参照本发明实施例一和图1中所描述的S11到S14步骤的具体过程,此处不做赘述,进一步的,本发明实施例三可以包括如下步骤:
判断所述搜索结果的搜索结果策略是否与所述搜索条件的搜索策略相匹配,如果匹配将所述搜索结果作为目标搜索结果。
其中,所述搜索结果策略和所述搜索策略均是基于层次关系词库及词类别直接关联关系的策略,所述层次关系词库是根据词库的上下级关系建立树状的词库内存结构;当所述搜索结果策略中的词类型与所述搜索策略中的词类型相同,并且对应的上下级词和同义词也相互匹配,则所述搜索结果策略与所述搜索策略相匹配;
具体例如,当搜索条件为“建行信用卡申请流程”,搜索结果为“建行信用卡办卡申请流程、建行信用卡开卡申请流程、信用卡开卡申请流程、建行白金信用卡办卡申请流程、建行信用卡办卡操作指南”,其中,操作类型中办卡和开卡为同义词,卡类型词信用卡的下级词为建行信用卡和建行白金信用卡,申请流程和操作指南都是流程类的同级词汇,所以匹配策略中词类 型中操作类型、卡类型和流程类型均相同,而对应的上下级词和同义词也相互匹配,所以目标搜索结果为“建行信用卡办卡申请流程、建行信用卡开卡申请流程、信用卡开卡申请流程、建行白金信用卡办卡申请流程、建行信用卡办卡操作指南”。
通过本发明实施例三中的具体实施方式的描述,对搜索条件和搜索结果进行了策略匹配,将策略匹配一致的搜索结果作为了目标搜索结果,这样可以优化搜索结果,使搜索结果更加精准。
实施例四
与本发明实施例一、实施例二和实施例三所公开的搜索方法相对应,本发明的实施例四还提供了一种搜索装置,参见图4到图6为本发明实施例四提供的搜索装置及具体组成单元的结构示意图,该装置具体包括:
查询单元401,用于接收搜索条件,并根据所述搜索条件查询到相应的搜索索引,其中,所述搜索条件中包含索引拆分字段;
拆分单元402,用于根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
搜索器建立单元403,用于对所述搜索目录列表中的每个搜索索引文件建立与其相对应的搜索器,构成存储所述多个搜索器的搜索器列表,其中,所述搜索器用于读取所述搜索索引文件;
匹配单元404,用于根据所述搜索条件的属性,遍历资源池列表,得到带有编号的资源池,并为所述搜索器列表中的每个搜索器匹配与之相对应的所述带有编号的资源池;
搜索单元405,用于控制所述多个搜索器分别对所述与之相对应的所述带有编号的资源池进行并行搜索,将所述并行搜索的结果进行合并得到搜索结果;
其中,所述搜索条件的属性包括线程数量和超时时间,所述资源池列表中存储多个资源池,并且每个资源池有与之对应的编号以及超时时间、线程数量。
其中,参见图5,所述拆分单元,包括:
第一获取单元501,用于当所述索引拆分字段包括时间范围字段时,根据所述时间范围字段,得到所述索引拆分字段的长度、所述索引拆分字段的前缀字符串和拆分后每个搜索文件对应的索引目录个数;
第一定义单元502,根据所述每个搜索文件对应的索引目录的个数,定义所述每个搜索文件对应的索引目录的起始值和终止值;
第一判断单元503,用于判断所述每个搜索文件对应的搜索目录范围是否大于所述起始值,并且小于所述终止值,如果是,则所述每个搜索文件对应的索引目录的拆分范围为所述终止值和所述起始值之间的差值;
范围拆分单元504,根据每个搜索文件对应的索引目录的拆分范围,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表。
所述拆分单元,包括:
维度拆分单元,用于当所述索引拆分字段包括分类维度字段时,根据所述分类维度字段,对所述搜索索引进行维度拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
其中,所述分类维度字段包括根据所述搜索条件中的内容对搜索类型进行分类后所对应的类型字段。
所述拆分单元,包括:
哈希拆分单元,用于根据所述索引拆分字段生成哈希值,根据所述哈希值采用哈希函数对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表。
所述拆分单元,包括:
第一拆分单元,用于当所述搜索引拆分字段中包括两个不同类型的拆分字段时,根据所述索引拆分字段的第一拆分字段,对所述搜索索引进行拆分,获得多个所述第一拆分字段对应的搜索索引文件;
第二拆分单元,用于当所述搜索引拆分字段中包括两个不同类型的拆分字段时,根据所述索引拆分字段的第二拆分字段,对所述第一拆分字段对应的搜索索引文件进行拆分,获得所述第二拆分字段对应的搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
或者,第一哈希拆分单元,用于当所述搜索索引拆分字段中包括两个不同的拆分字段时,根据所述索引拆分字段的第一拆分字段生成第一哈希值,根据所述第一哈希值采用哈希函数对所述搜索索引进行拆分,获得多个所述第一哈希值对应的搜索索引文件;
第二哈希拆分单元,用于当所述搜索索引拆分字段中包括两个不同的拆分字段时,根据所述索引拆分字段的第二拆分字段生成第二哈希值,根据所述第二哈希值采用哈希函数对所述第一哈希值对应的搜索索引文件进行拆分,获得所述第二哈希值对应的搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表。
其中,参见图6,所述匹配单元具体包括:
资源池遍历单元601,用于根据搜索条件的属性,遍历资源池列表,其中所述资源池列表中存储多个资源池;
第二判断单元602,用于判断所述搜索条件的属性与所述资源池的属性是否匹配;
第二执行单元603,用于当所述资源池的超时时间大于等于所述搜索条件的超时时间时,则根据所述搜索条件的线程数量去匹配所述资源池的线程数量,如果所述线程数量匹配,则所述搜索条件的属性与所述资源池的属性匹配,得到所述资源池的编号;
第三判断单元604,用于当所述搜索条件的属性与所述资源池的属性是不匹配时,判断所述搜索等待间隔时间是否超过尝试总数,如果不超过则重新 执行上述将所述搜索条件的属性与所述资源池的属性进行匹配的过程,其中所述搜索条件的属性包括线程量和超时时间,所述资源池的属性包括资源池编号、超时时间和线程数量。
其中,该搜索装置还包括:
策略判断单元406,用于判断所述搜索结果的搜索结果策略是否与所述搜索条件的搜索策略相匹配;
第一执行单元407,用于如果所述搜索结果策略中的词类型与所述搜索策略中的词类型相同,并且对应的上下级词和同义词也相互匹配,则所述策略判断单元判断的搜索结果策略与所述搜索策略相匹配,将所述搜索结果作为目标搜索结果;
其中,所述搜索结果策略和所述搜索策略均是基于层次关系词库及词类别直接关联关系的策略,所述层次关系词库是根据词库的上下级关系建立树状的词库内存结构。
在本发明实施例四中的搜索装置是通过拆分单元对搜索索引进行了拆分,然后通过搜索器建立单元建立了搜索器列表,最后通过匹配单元和搜索单元进行了并行搜索得到了搜索结果,由于采用了索引拆分和并行搜索可以提高搜索效率,从而解决了解决中大型数据量搜索性能问题;同时为了提高搜索结果的精准度,本发明实施例四种采用的策略匹配单元,对搜索条件和搜索结果之间进行了策略匹配,得到了更精准的搜索结果。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (14)

1.一种搜索方法,其特征在于,该方法包括:
接收搜索条件,并根据所述搜索条件查询到相应的搜索索引,其中,所述搜索条件中包含索引拆分字段;
根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
对所述搜索目录列表中的每个搜索索引文件建立与其相对应的搜索器,构成存储所述多个搜索器的搜索器列表,其中,所述搜索器用于读取所述搜索索引文件;
根据所述搜索条件的属性,遍历资源池列表,得到带有编号的资源池,并为所述搜索器列表中的每个搜索器匹配与之相对应的所述带有编号的资源池,由所述多个搜索器分别对所述与之相对应的所述带有编号的资源池进行并行搜索,将所述并行搜索的结果进行合并得到搜索结果;
其中,所述搜索条件的属性包括线程数量和超时时间,所述资源池列表中存储多个资源池,并且每个资源池有与之对应的编号以及超时时间、线程数量。
2.根据权利要求1所述的方法,其特征在于,该方法还包括:
判断所述搜索结果的搜索结果策略是否与所述搜索条件的搜索策略相匹配;
如果所述搜索结果策略中的词类型与所述搜索策略中的词类型相同,并且对应的上下级词和同义词也相互匹配,则所述搜索结果策略与所述搜索策略相匹配,将所述搜索结果作为目标搜索结果;
其中,所述搜索结果策略和所述搜索策略均是基于层次关系词库及词类别直接关联关系的策略,所述层次关系词库是根据词库的上下级关系建立树状的词库内存结构。
3.根据权利要求1所述的方法,其特征在于,当所述索引拆分字段包括时间范围字段时,所述根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表,包括:
根据所述时间范围字段,得到所述索引拆分字段的长度、所述索引拆分字段的前缀字符串和拆分后每个搜索文件对应的索引目录个数;
根据所述每个搜索文件对应的索引目录的个数,定义所述每个搜索文件对应的索引目录的起始值和终止值;
判断所述每个搜索文件对应的搜索目录范围是否大于所述起始值,并且小于所述终止值,如果是则所述每个搜索文件对应的索引目录的拆分范围为所述终止值和所述起始值之间的差值;
根据每个搜索文件对应的索引目录的拆分范围,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表。
4.根据权利要求1所述的方法,其特征在于,当所述索引拆分字段包括分类维度字段时,所述根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表,包括:
根据所述分类维度字段,对所述搜索索引进行维度拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
其中,所述分类维度字段包括根据所述搜索条件中的内容对搜索类型进行分类后所对应的类型字段。
5.根据权利要求1所述的方法,其特征在于,所述根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表,包括:
根据所述索引拆分字段生成哈希值,根据所述哈希值采用哈希函数对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表。
6.根据权利要求1所述的方法,其特征在于,当所述索引拆分字段中包括两个不同类型的拆分字段时,所述根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表,包括:
根据所述索引拆分字段的第一拆分字段,对所述搜索索引进行拆分,获得多个所述第一拆分字段对应的搜索索引文件;
根据所述索引拆分字段的第二拆分字段,对所述第一拆分字段对应的搜索索引文件进行拆分,获得所述第二拆分字段对应的搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
或者,根据所述索引拆分字段的第一拆分字段生成第一哈希值,根据所述第一哈希值采用哈希函数对所述搜索索引进行拆分,获得多个所述第一哈希值对应的搜索索引文件;
根据所述索引拆分字段的第二拆分字段生成第二哈希值,根据所述第二哈希值采用哈希函数对所述第一哈希值对应的搜索索引文件进行拆分,获得所述第二哈希值对应的搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表。
7.根据权利要求1所述的方法,其特征在于,所述根据所述搜索条件的属性,遍历资源池列表,得到带有编号的资源池,并为所述搜索器列表中的每个搜索器匹配与之相对应的所述带有编号的资源池,由所述多个搜索器分别对所述与之相对应的所述带有编号的资源池进行并行搜索,将所述并行搜索的结果进行合并得到搜索结果,包括:
根据搜索条件的属性,遍历资源池列表,其中所述资源池列表中存储多个资源池;
判断所述搜索条件的属性与所述资源池的属性是否匹配;
当所述资源池的超时时间大于等于所述搜索条件的超时时间时,则根据所述搜索条件的线程数量去匹配所述资源池的线程数量,如果所述线程数量匹配,则所述搜索条件的属性与所述资源池的属性匹配,得到所述资源池的编号;
当所述搜索条件的属性与所述资源池的属性是不匹配时,判断所述搜索等待间隔时间是否超过尝试总数,如果不超过则重新执行上述将所述搜索条件的属性与所述资源池的属性进行匹配的过程,其中,所述搜索条件的属性包括线程量和超时时间,所述资源池的属性包括资源池编号、超时时间和线程数量;
由所述多个搜索器分别对所述与之相对应的所述带有编号的资源池进行并行搜索,将所述并行搜索的结果进行合并得到搜索结果。
8.一种搜索装置,其特征在于,该装置包括:
查询单元,用于接收搜索条件,并根据所述搜索条件查询到相应的搜索索引,其中,所述搜索条件中包含索引拆分字段;
拆分单元,用于根据所述搜索条件中包含的索引拆分字段,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
搜索器建立单元,用于对所述搜索目录列表中的每个搜索索引文件建立与其相对应的搜索器,构成存储所述多个搜索器的搜索器列表,其中,所述搜索器用于读取所述搜索索引文件;
匹配单元,用于根据所述搜索条件的属性,遍历资源池列表,得到带有编号的资源池,并为所述搜索器列表中的每个搜索器匹配与之相对应的所述带有编号的资源池;
搜索单元,用于控制所述多个搜索器分别对所述与之相对应的所述带有编号的资源池进行并行搜索,将所述并行搜索的结果进行合并得到搜索结果;
其中,所述搜索条件的属性包括线程数量和超时时间,所述资源池列表中存储多个资源池,并且每个资源池有与之对应的编号以及超时时间、线程数量。
9.根据权利要求8所述的装置,其特征在于,该装置还包括:
策略判断单元,用于判断所述搜索结果的搜索结果策略是否与所述搜索条件的搜索策略相匹配;
第一执行单元,用于如果所述搜索结果策略中的词类型与所述搜索策略中的词类型相同,并且对应的上下级词和同义词也相互匹配,则所述策略判断单元判断的搜索结果策略与所述搜索策略相匹配,将所述搜索结果作为目标搜索结果;
其中,所述搜索结果策略和所述搜索策略均是基于层次关系词库及词类别直接关联关系的策略,所述层次关系词库是根据词库的上下级关系建立树状的词库内存结构。
10.根据权利要求8所述的装置,其特征在于,所述拆分单元,包括:
第一获取单元,用于当所述索引拆分字段包括时间范围字段时,根据所述时间范围字段,得到所述索引拆分字段的长度、所述索引拆分字段的前缀字符串和拆分后每个搜索文件对应的索引目录个数;
第一定义单元,根据所述每个搜索文件对应的索引目录的个数,定义所述每个搜索文件对应的索引目录的起始值和终止值;
第一判断单元,用于判断所述每个搜索文件对应的搜索目录范围是否大于所述起始值,并且小于所述终止值,如果是,则所述每个搜索文件对应的索引目录的拆分范围为所述终止值和所述起始值之间的差值;
范围拆分单元,根据每个搜索文件对应的索引目录的拆分范围,对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表。
11.根据权利要求8所述的装置,其特征在于,所述拆分单元,包括:
维度拆分单元,用于当所述索引拆分字段包括分类维度字段时,根据所述分类维度字段,对所述搜索索引进行维度拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
其中,所述分类维度字段包括根据所述搜索条件中的内容对搜索类型进行分类后所对应的类型字段。
12.根据权利要求8所述的装置,其特征在于,所述拆分单元,包括:
哈希拆分单元,用于根据所述索引拆分字段生成哈希值,根据所述哈希值采用哈希函数对所述搜索索引进行拆分,获得多个搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表。
13.根据权利要求8所述的装置,其特征在于,所述拆分单元,包括:
第一拆分单元,用于当所述搜索引拆分字段中包括两个不同类型的的拆分字段时,根据所述索引拆分字段的第一拆分字段,对所述搜索索引进行拆分,获得多个所述第一拆分字段对应的搜索索引文件;
第二拆分单元,用于当所述搜索引拆分字段中包括两个不同类型的的拆分字段时,根据所述索引拆分字段的第二拆分字段,对所述第一拆分字段对应的搜索索引文件进行拆分,获得所述第二拆分字段对应的搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表;
或者,第一哈希拆分单元,用于当所述搜索索引拆分字段中包括两个不同的拆分字段时,根据所述索引拆分字段的第一拆分字段生成第一哈希值,根据所述第一哈希值采用哈希函数对所述搜索索引进行拆分,获得多个所述第一哈希值对应的搜索索引文件;
第二哈希拆分单元,用于当所述搜索索引拆分字段中包括两个不同的拆分字段时,根据所述索引拆分字段的第二拆分字段生成第二哈希值,根据所述第二哈希值采用哈希函数对所述第一哈希值对应的搜索索引文件进行拆分,获得所述第二哈希值对应的搜索索引文件,构成存储所述多个搜索索引文件的搜索目录列表。
14.根据权利要求8所述的装置,其特征在于,所述匹配单元包括:
资源池遍历单元,用于根据搜索条件的属性,遍历资源池列表,其中所述资源池列表中存储多个资源池;
第二判断单元,用于判断所述搜索条件的属性与所述资源池的属性是否匹配;
第二执行单元,用于当所述资源池的超时时间大于等于所述搜索条件的超时时间时,则根据所述搜索条件的线程数量去匹配所述资源池的线程数量,如果所述线程数量匹配,则所述搜索条件的属性与所述资源池的属性匹配,得到所述资源池的编号;
第三判断单元,用于当所述搜索条件的属性与所述资源池的属性是不匹配时,判断所述搜索等待间隔时间是否超过尝试总数,如果不超过则重新执行上述将所述搜索条件的属性与所述资源池的属性进行匹配的过程,其中所述搜索条件的属性包括线程量和超时时间,所述资源池的属性包括资源池编号、超时时间和线程数量。
CN201610323573.7A 2016-05-16 2016-05-16 一种搜索方法及装置 Active CN106021440B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610323573.7A CN106021440B (zh) 2016-05-16 2016-05-16 一种搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610323573.7A CN106021440B (zh) 2016-05-16 2016-05-16 一种搜索方法及装置

Publications (2)

Publication Number Publication Date
CN106021440A true CN106021440A (zh) 2016-10-12
CN106021440B CN106021440B (zh) 2019-10-18

Family

ID=57098332

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610323573.7A Active CN106021440B (zh) 2016-05-16 2016-05-16 一种搜索方法及装置

Country Status (1)

Country Link
CN (1) CN106021440B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062334A (zh) * 2016-11-08 2018-05-22 百度在线网络技术(北京)有限公司 搜索结果处理方法和装置
CN108536740A (zh) * 2018-03-07 2018-09-14 上海连尚网络科技有限公司 一种确定搜索结果的方法、介质以及设备
CN110196833A (zh) * 2018-03-22 2019-09-03 腾讯科技(深圳)有限公司 应用程序的搜索方法、装置、终端及存储介质
CN111079036A (zh) * 2019-11-25 2020-04-28 罗靖涛 一种字段式搜索方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1987853A (zh) * 2005-12-23 2007-06-27 北大方正集团有限公司 关系型数据库与全文检索相结合的检索方法
WO2013147785A1 (en) * 2012-03-29 2013-10-03 Hitachi Data Systems Corporation Highly available search index with storage node addition and removal
CN103455619A (zh) * 2013-09-12 2013-12-18 焦点科技股份有限公司 一种基于Lucene分片结构的打分处理方法及系统
CN103488687A (zh) * 2013-09-02 2014-01-01 用友软件股份有限公司 用于大数据的搜索系统和搜索方法
CN104170373A (zh) * 2012-01-09 2014-11-26 汤姆逊许可公司 创建和管理子记录
CN105488124A (zh) * 2015-11-24 2016-04-13 浪潮(北京)电子信息产业有限公司 一种创建索引文件的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1987853A (zh) * 2005-12-23 2007-06-27 北大方正集团有限公司 关系型数据库与全文检索相结合的检索方法
CN104170373A (zh) * 2012-01-09 2014-11-26 汤姆逊许可公司 创建和管理子记录
WO2013147785A1 (en) * 2012-03-29 2013-10-03 Hitachi Data Systems Corporation Highly available search index with storage node addition and removal
CN103488687A (zh) * 2013-09-02 2014-01-01 用友软件股份有限公司 用于大数据的搜索系统和搜索方法
CN103455619A (zh) * 2013-09-12 2013-12-18 焦点科技股份有限公司 一种基于Lucene分片结构的打分处理方法及系统
CN105488124A (zh) * 2015-11-24 2016-04-13 浪潮(北京)电子信息产业有限公司 一种创建索引文件的方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062334A (zh) * 2016-11-08 2018-05-22 百度在线网络技术(北京)有限公司 搜索结果处理方法和装置
CN108536740A (zh) * 2018-03-07 2018-09-14 上海连尚网络科技有限公司 一种确定搜索结果的方法、介质以及设备
CN108536740B (zh) * 2018-03-07 2020-06-26 上海连尚网络科技有限公司 一种确定搜索结果的方法、介质以及设备
CN110196833A (zh) * 2018-03-22 2019-09-03 腾讯科技(深圳)有限公司 应用程序的搜索方法、装置、终端及存储介质
CN110196833B (zh) * 2018-03-22 2023-06-09 腾讯科技(深圳)有限公司 应用程序的搜索方法、装置、终端及存储介质
CN111079036A (zh) * 2019-11-25 2020-04-28 罗靖涛 一种字段式搜索方法
CN111079036B (zh) * 2019-11-25 2023-11-07 罗靖涛 一种字段式搜索方法

Also Published As

Publication number Publication date
CN106021440B (zh) 2019-10-18

Similar Documents

Publication Publication Date Title
CN102609458B (zh) 一种图片推荐方法和装置
CN102063476B (zh) 视频搜索方法及系统
CN106021440A (zh) 一种搜索方法及装置
US20120215768A1 (en) Method and Apparatus for Creating Binary Attribute Data Relations
CN102129479B (zh) 一种基于概率潜在语义分析模型的万维网服务发现方法
CN103365992A (zh) 一种基于一维线性空间实现Trie树的词典检索方法
CN111061828B (zh) 一种数字图书馆知识检索方法及装置
CN106528648A (zh) 结合Redis内存数据库的分布式RDF关键词近似搜索方法
Croft et al. Query representation and understanding workshop
CN103914488A (zh) 文档的采集、标识、关联、搜索及展现的系统
CN103226609A (zh) 一种web聚焦搜索系统的搜索方法
CN103914487A (zh) 文档的采集、标识及关联的系统
CN103914486A (zh) 文档的搜索及展现的系统
CN107229714A (zh) 一种基于分布式数据库的全文搜索引擎
CN106649879A (zh) 一种图书馆专业书籍智能推荐方法
CN103514287A (zh) 一种构建索引树的方法、汉语词汇搜索的方法及相关装置
Doan et al. Introduction to the special issue on managing information extraction
Ajoudanian et al. Deep web content mining
Choi et al. Classification and Retrieval of Biomedical Literatures: SNUMedinfo at CLEF QA track BioASQ 2014.
Modoni et al. A semantic framework for graph-based enterprise search
Goyal et al. Concept based query recommendation
Yin et al. Automatic extraction of clickable structured web contents for name entity queries
CN102521239B (zh) 一种基于owl的互联网问答信息匹配系统及其匹配方法
Nunes et al. Exploration of Semi-Structured Data Sources.
Zinin Keyword analysis of Chinese classics:“Thirteen Canons” and Zhuangzi

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant