CN102043834B - 一种客户端实现搜索的方法及搜索客户端 - Google Patents
一种客户端实现搜索的方法及搜索客户端 Download PDFInfo
- Publication number
- CN102043834B CN102043834B CN 201010559231 CN201010559231A CN102043834B CN 102043834 B CN102043834 B CN 102043834B CN 201010559231 CN201010559231 CN 201010559231 CN 201010559231 A CN201010559231 A CN 201010559231A CN 102043834 B CN102043834 B CN 102043834B
- Authority
- CN
- China
- Prior art keywords
- search
- client
- user
- engine
- search engine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种客户端实现搜索的方法和装置,所述方法包括以下步骤:搜索客户端获取用户查询请求;搜索客户端调用至少两个搜索引擎对所述查询请求进行搜索;搜索客户端获得各个所调用的搜索引擎的搜索结果信息;搜索客户端对所述搜索结果信息进行处理,得到最终搜索结果并进行展示。本发明通过在客户端实现分析用户意图、选择搜索引擎、进行链接下载,以及分析处理等操作,将复杂的计算和宽带资源占用转移到用户的操作终端,可以有效的利用用户的终端资源,减少对服务器端资源的占用,提高了搜索速度和效率。
Description
技术领域
本发明涉及互联网信息搜索方法及工具,特别涉及一种客户端实现搜索的方法及实现搜索的客户端。
背景技术
随着网络技术的发展,搜索引擎得到了不断的完善,通过搜索引擎可以从互联网上获取各种信息。
现有的搜索引擎技术使用网络爬虫从互联网抓取网页,建立索引,并为用户提供查询服务。以百度、谷歌的网页搜索为代表。也有的搜索引擎对特定领域的数据进行抓取、索引和搜索,并为用户提供查询服务。
传统的搜索引擎技术通常包括网页抓取、网页处理、搜索服务等几个部分。无论哪一家搜索引擎,都不可能去抓取互联网的全部内容,因此各家搜索引擎通常都是索引整个互联网的一个子集;另外,传统的网络爬虫基于网页之间的链接进行抓取,对于没有链接的页面难以抓取;最后,传统搜索引擎从抓取、建立索引、提供查询服务需要一定周期,对大部分内容无法做到实时更新。
同时,一种搜索引擎可能无法满足所有人或者一个人的所有搜索需求。在某些情况下,如果一个搜索引擎提供给用户的搜索结果达不到用户需求、没有用户想要的内容,则用户还需要更换另外一个搜索引擎再次重新搜索,以便获得期望的搜索结果。可见,这种操作较为繁琐,降低了搜索效率,也提高了搜索的难度。
发明内容
本发明所要解决的技术问题是提供一种在客户端实现搜索的方法和搜索客户端,能够把负载分解到客户端,有效利用客户端的资源,提高搜索的速度和效率。
为了解决上述问题,本发明公开了一种客户端实现搜索的方法,可以包括以下步骤:搜索客户端获取用户查询请求;搜索客户端调用至少两个搜索引擎对所述查询请求进行搜索;搜索客户端获得各个所调用的搜索引擎的搜索结果信息;搜索客户端对所述获得的搜索结果信息进行处理,得到最终搜索结果并进行展示;
所述方法还包括:
在调用各个搜索引擎之前,当判定用户有搜索意图时,对可能发起调用请求的搜索引擎建立一预链接,并保有之;
当搜索行为发生时,从保有的预链接中获取对应搜索引擎的链接,进行具体调用过程。
优选的,所述方法在搜索客户端调用至少两个搜索引擎之前,还包括:检测用户机器的性能配置,如果性能配置符合预设要求,则执行后续步骤。
优选的,所述方法还可以包括:在搜索客户端调用搜索引擎之前,根据当前的查询请求来选择所需的至少两个搜索引擎。
优选的,所述选择至少两个搜索引擎的步骤具体包括:以该查询请求的查询词为输入,结合查询词与各搜索引擎的相关程度,选择所需的至少两个搜索引擎。
优选的,所述搜索客户端获取用户查询请求包括:通过监控浏览器的特定输入框,获取用户查询请求。
优选的,所述搜索客户端通过拦截用户指向一默认搜索引擎的查询请求,而获取用户查询请求。
优选的,所述搜索客户端调用至少两个搜索引擎包括:所述搜索客户端调用包含一默认搜索引擎的至少两个搜索引擎;所述展示包括:在所述默认搜索引擎的搜索结果页上展示经整合后的所述最终搜索结果。
优选的,所述搜索客户端对所述搜索结果信息进行的处理包括解析和整合。优选的,所述搜索客户端对所述搜索结果信息进行的解析包括对不同搜索引擎的搜索结果页进行页面分析和结果抽取。
优选的,所述页面分析及结果抽取包括以下步骤:将搜索结果页转化为DOM;通过路径查询语法在DOM上取出记录列表;取得记录列表每一条记录的标题、摘要、链接相关属性;储存记录列表每一条记录的相关属性及在搜索结果页中的位置。
优选的,所述获取用户查询请求包括:分析所述用户输入查询词的相关动作;在满足预置条件的情况下,在用户正式提交搜索之前确定一预测查询词作为用户查询请求;所述预置条件为用户已经输入了完整的查询词。
依据本发明的可以优选实施例,还公开了一种客户端实现搜索的方法,所述客户端包括浏览器和搜索插件,所述方法包括以下步骤:浏览器模块基于用户查询请求,调用一默认搜索引擎,获得该默认搜索引擎的搜索结果页,并通过该搜索结果页的脚本将搜索结果信息发送给搜索插件;搜索插件基于所述用户查询请求,调用其他搜索引擎,获得其他搜索引擎的搜索结果;搜索插件对所获得的搜索结果信息进行处理,获得最终搜索结果;在该默认搜索引擎的搜索结果页上对所述最终搜索结果进行展示;
所述方法还包括:
在搜索插件调用所述其他搜索引擎之前,当判定用户有搜索意图时,对所述其他搜索引擎建立一预链接,并保有之;
当搜索行为发生时,从保有的预链接中获取对应搜索引擎的链接,进行具体调用过程。
依据本发明的可以优选实施例,还公开了一种搜索客户端,包括:
获取模块,用于获取用户查询请求;
结果取得模块,用于调用至少两个搜索引擎,对所述查询请求进行搜索,以及获得各个所调用的搜索引擎的搜索结果信息;
解析展示模块,对所获得的搜索结果信息进行处理,得到最终搜索结果并进行展示;
所述搜索客户端还包括:
预链接模块,用于当判定用户有搜索意图时,对可能发起调用请求的搜索引擎建立一预链接,并保有之;当搜索行为发生时,所述预链接直接用于结果取得模块的具体调用过程。
优选的,所述搜索客户端还可以包括:性能检测模块,用于检测用户机器的性能配置,如果性能配置符合预设要求,则调用多个搜索引擎。
优选的,所述搜索客户端还可以包括:搜索引擎选择模块,用于以该查询请求的查询词为输入,结合查询词与各搜索引擎的相关程度,选择所需的至少两个搜索引擎。
优选的,所述获取模块通过监控浏览器的特定输入框,以获取用户查询请求。
优选的,所述获取模块通过拦截用户指向一默认搜索引擎的查询请求,而获取用户查询请求。
优选的,所述调用的至少两个搜索引擎包含一默认搜索引擎;所述解析展示模块在所述默认搜索引擎的搜索结果页上展示经整合后的所述最终搜索结果。
优选的,所述解析展示模块对所述搜索结果信息进行的处理包括解析和整合。
优选的,所述获取模块包括:动作捕获子模块,用于捕获用户输入查询词的相关动作;分析子模块,用于分析所述用户输入查询词的相关动作;搜索预启动子模块,用于当分析子模块确定用户输入查询词的相关动作满足预置条件时,则在用户正式提交搜索之前确定一预测查询词作为用户查询请求;所述预置条件为用户已经输入了完整的查询词。
与现有技术相比,本发明具有以下优点:
本发明的客户端实现搜索的方法和搜索客户端,通过在客户端实现分析用户意图、选择搜索引擎、进行链接下载,以及分析处理等操作,将复杂的计算和宽带资源占用转移到用户的操作终端,可以有效的利用用户的终端资源,减少对服务器端资源的占用,提高了搜索速度和效率。
具体的,由于本发明需要对多个搜索引擎的搜索结果进行整合,因此,需要链接多个搜索引擎。而本发明可以从客户端直接向各个搜索引擎发查询请求,比客户端先传查询请求给服务器、然后服务 器再向各搜索引擎发请求更节省时间,实时性更强。而节约时间对于提高搜索效率是非常重要的,尤其是需要整合多个搜索结果时。
同时,如果从服务器发请求,那么各用户的查询请求都由同一服务器的出口出去,相当于从一个节点出去,而且针对每个查询请求需要同时调用多个搜索引擎,那么对这个服务器的压力负担是非常大的,自然也就会造成时间上的延迟,效率较低。而本发明的可以大大减轻服务器的压力,提高搜索效率。
进一步,由于本发明需要调用多个搜索引擎,为了提高搜索速度,在搜索中本发明优选采用了预链接技术(提前与搜索引擎建立一个预链接,当正式开始搜索时,直接通过之前建立的预链接进行链接,从而节省了链接的时间),以提高各搜索引擎的响应速度。但是,如果在服务器端做多个搜索引擎的调用,则是没办法采用预链接技术的,在技术上根本无法实现。因为各个客户端可能需要访问不同的搜索引擎,并且在不同时间点,即使同一个客户端也可能需要调用不同的搜索引擎,因此,如果将这些调用需求统一汇总到服务器端,意味着服务器需要针对各个搜索引擎进行极大规模的并发访问,而服务器端的IP有限,带宽有限,建立预连接到任何一个搜索引擎进行大规模并发的访问,这个搜索引擎都会直接断掉该预链接的,所以在技术应用上无法实现。
其次,本发明的搜索客户端可以基于用户的查询词选择与其相关程度较高的搜索引擎(搜索结果较准确)。本发明通过对用户查询词的意图理解分析,选择与用户需求相关的搜索引擎(或者在用户意图方向上搜索准确性较高的搜索引擎),进行有针对性的连接搜索,不仅可以提高系统的效率,更增加了用户的搜索准确度。
再者,本发明的搜索客户端可以和现有的搜索过程紧密结合,用户仍然是针对现有某个常用搜索引擎提出查询请求,而本发明的搜索客户端可以拦截该查询请求,获取多个搜索引擎的结果,并解析处理后在该常用搜索引擎的搜索结果页展示本发明的最终结果。这 样,用户在交互界面上几乎没有改变,但是搜索结果却更加符合用户的需求,更加准确。
附图说明
图1是本发明实施例的一种客户端实现搜索方法实施例的流程图;
图2是本发明的一种搜索客户端实施例一的示意图;
图3是本发明的一种搜索客户端实施例二的示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
请参照图1,示出了本发明的客户端实现搜索的方法实施例,包括以下步骤:
步骤101,搜索客户端获取用户查询请求。
获取用户查询请求的方式多种多样,本发明仅仅给出以下几个示例。例如,当用户在搜索工具栏的搜索框中输入查询词时,在浏览器地址栏中输入中文词时,都可以认为用户期望开始查询,则本发明的搜索客户端通过检测这些输入框的动作,可以拦截并获取到用户查询请求。
而当本发明的搜索客户端与某一常用的搜索引擎关联时(例如搜索引擎A),则可以直接拦截指向该搜索引擎的查询URL(Universal Resource Locator,网页地址),就可以获得用户查询请求。例如,用户在搜索引擎A的主页上启动搜索,或者在其他页面上启动搜索引擎A搜索(例如从某导航页面上启动搜索引擎A搜索)。
在技术实现上,本发明的搜索客户端可以作为一个独立的客户端软件(独立的搜索入口),对用户查询请求进行获取,也可以在搜索客户端中集成浏览器模块或者其他应用程序模块,例如, IM(InstantMessaging,即时通讯)程序、输入法程序、甚至文本编辑程序word等),获取用户的查询请求。这样,便于用户在使用相关应用时能够方便的使用本发明的搜索功能。
扩展理解,用户所使用的客户端计算机本身也可以看做是本发明所说的搜索客户端,本发明所强调的各个步骤都是由该计算机发起的,即该物理实体也可以理解为本发明所说的搜索客户端。当然,为了方便说明,在下面的描述中直接采用搜索客户端进行说明,并主要强调其软件属性。
可选的,为了保证客户端搜索的顺利进行,在启动客户端搜索之前,首先需要对用户的终端计算机环境进行检测,根据检测的结果来决定是否启用多搜索引擎进行搜索。若用户的终端计算机环境满足客户端搜索的条件,当用户进行搜索时,搜索客户端对用户的的查询请求进行拦截,然后启动多引擎搜索模式。由于本发明的客户端搜索方式,可能占用本地较多的计算资源,如果用户的终端计算机的性能较差,则可能导致搜索结果处理完毕的时间较长,无法及时展示最终搜索结果,因此,当用户的终端计算机性能较差时,优选的,不启动本发明的多引擎搜索模式,而仍然采用常用的单一搜索引擎模式(例如搜狗搜索或百度搜索)。
步骤102,搜索客户端调用至少两个搜索引擎,对该查询请求进行搜索。
搜索客户端可以调用所有的备选搜索引擎对查询词直接进行搜索,也可以选择调用与查询请求相关度较高的至少两个搜索引擎来进行搜索。为了获取较好的搜索质量及减少搜索时间,可选的,选择调用与查询请求相关的搜索引擎。此时,可以在搜索客户端存储引擎参数表,当搜索客户端对查询请求进行解析,获得查询词后,以查询词为输入,结合搜索查询词与各搜索引擎的相关程度选择与查询词匹配的搜索引擎。其中,引擎参数表用于表征各查询词与各搜索引擎的相关程度。例如,购物类的查询和淘宝的相关度最高, 那么搜索客户端就可以从查询词与各搜索引擎的相关程度列表中选择出taobao搜索引擎。
下面的表1给出了一个具体的例子,该表用于表征查询词与各搜索引擎的相关程度信息。
表1
查询词 | 引擎1#相关程度 | 引擎2#相关程度 | … |
手机 | search.taobao.com#0.8 | so.youku.com#0.4 | … |
C++编程思想 | search.dangdang.com#0.7 | search.taobao.com#0.4 | … |
搜狗输入法 | www.gougou.com#0.7 | www.skycn.com#0.5 | … |
由于统计分析得到上面的查询词与各搜索引擎的相关程度表所需的这些信息所需的工作量比较大,故在本发明的优选示例中,可以放在服务器上实现,然后将得到的查询词与各搜索引擎的相关程度表更新至本发明的搜索客户端即可。另外,上面给出的表的形式仅仅是记录相关程度信息的一种,本领域技术人员也可以采用其他各种可行的形式,在此不加以限制。
步骤103,搜索客户端获得各个所调用的搜索引擎的搜索结果信息。
当确定好所需的搜索引擎后,搜索客户端调用各个搜索引擎,对各搜索引擎的搜索结果信息依次进行下载。此处的下载可以是对各搜索引擎的搜索结果逐一下载,即下载完成一个搜索引擎的搜索结果之后再下载另一个搜索引擎的搜索结果;也可以采用异步下载的方式,即并行下载,搜索客户端同时下载多个搜索引擎的搜索结果。
步骤104,搜索客户端对所述搜索结果信息进行处理,得到搜索结果并进行展示。
当搜索客户端下载完成所有的搜索结果后,对搜索结果信息进行解析后,采用合并、滤重、重新排序等处理操作,得到最终搜索结果并通过搜索结果页进行展示。
例如,最终搜索结果页的展示可以通过本发明的搜索客户端直接生成一搜索结果展示页面进行展示,该结果展示页面可以是一新的 网页页面或者一新的展示界面(例如,独立窗口)。也可以借用某个搜索引擎的搜索结果页来进行展示。总之,是将各家的搜索结果整合在同一页面中形成搜索结果页,至于该同一页面可以是某种新的页面,也可以是借助原有的某一搜索引擎结果页面。
进一步地,当搜索客户端集成有浏览器模块,可以直接生成结果展示界面进行展示;搜索客户端也可以对最终搜索结果在浏览器模块的结果展示页面上进行展示。
当然,对于默认搜索引擎的搜索结果,搜索客户端可以采用与其他搜索引擎相同的处理方式,即通过搜索客户端后台调用进行下载。
在本发明的一个优选实施例中,搜索客户端具有浏览器功能,即搜索客户端可以包括主功能模块和浏览器模块,用户可以通过浏览器模块进行网页信息的浏览,当用户通过浏览器模块针对一默认搜索引擎启动查询请求时,对于该搜索引擎,本发明的搜索客户端可以通过浏览器模块进行链接调用(即可以理解为由浏览器模块发送查询请求至该默认搜索引擎,并接收搜索结果)。而对于其他所选的搜索引擎,搜索客户端仍然可以通过其主功能模块进行调用,获取这些搜索引擎的搜索结果信息。
当浏览器模块接收到所述默认搜索引擎返回的结果时,浏览器模块将该搜索结果信息发送至搜索客户端的主功能模块,由主功能模块对所接收的多个搜索引擎的搜索结果进行处理,并加以展示。
在本发明的另一优选实施例中,处理后搜索结果的展示也可以通过前述的浏览器模块进行。具体实现中,当该默认搜索引擎返回结果时,浏览器模块开启该默认搜索引擎的搜索结果页,通过数据接口将搜索结果信息发送给所述搜索客户端的主功能模块。即,此时该默认搜索引擎的服务器端搜索已经完成,并且返回了正常的搜索结果信息,但是其搜索结果页仅仅开启,并不显示结果(例如空白页),而是先将其搜索结果发送给本发明的搜索客户端的主功能模块,由主功能模块对默认搜索引擎和其他所选搜索引擎的搜索结果 进行处理,将处理后的最终搜索结果在该默认搜索引擎的搜索结果页上进行展示。
即可以通过搜索结果页上的脚本程序实现其搜索结果信息的转发和最终搜索结果信息的展示。这样,本发明的搜索过程和结果展示界面与现有的浏览器搜索非常接近,在提高搜索准确度的情况下,不需要改变用户的使用习惯。
在具体实现中,主功能模块也可以通过浏览器插件的方式实现,即搜索客户端可以包括浏览器和浏览器插件,浏览器插件可以完成对多个搜索引擎搜索结果的处理。当然,浏览器插件调用搜索引擎时,也可以通过浏览器的网络接口进行调用。
步骤104中对搜索结果的处理,可以包括对多个搜索引擎的搜索结果的解析和整合。
具体的,所述搜索客户端对所述搜索结果信息进行的解析包括对不同搜索引擎的搜索结果页进行页面分析和结果抽取;对搜索结果的整合可以包括对搜索结果进行合并滤重和/或排序调整等等。具体的处理过程可以基于各个搜索引擎的情况以及最终搜索结果的要求进行选用,本发明在此并不需要加以限制。
在本发明的优选实施例中,对搜索结果的整合可以包括:针对来自于多个搜索引擎的搜索结果进行基础排序;对该基础排序进行修正调整,得到搜索结果的最终排序。
其中,所述针对来自于多个搜索引擎的搜索结果进行基础排序可以包括:确定各搜索引擎的权重;确定搜索引擎上的排序位置权重;根据搜索引擎的权重和排序位置权重,针对来自于多个搜索引擎的搜索结果进行基础排序。
所述确定各搜索引擎的权重的步骤可以进一步包括:确定各搜索引擎的基本权重;分析用户所提交的查询词的类别,并根据分析结果,调整各搜索引擎的基本权重,得到各搜索引擎的权重。或者, 确定各搜索引擎的基本权重;依据查询词与各搜索引擎的相关程度,调整各搜索引擎的基本权重,得到各搜索引擎的权重。
优选的,所述对该基础排序进行修正调整包括:根据搜索结果的共现信息,对该基础排序进行修正调整。其中,所述共现信息可以包括:在多个搜索引擎中出现具有相同网址的搜索结果项;和/或,在多个搜索引擎中出现相同或近似的标题和摘要的搜索结果项;和/或,在多个搜索引擎中出现属于同一站点的搜索结果项;和/或,在多个搜索引擎中出现属于同一域的搜索结果项。
当然,所述对该基础排序进行修正调整还可以包括:执行滤重操作;所述滤重操作通过比对搜索结果的标题、和/或摘要的相似程度、和/或URL来进行。以及,识别并过滤低质量的搜索结果,所述过滤包括降权或删除。其中,所述搜索结果的质量可以通过对查询词的文本覆盖程度来评估。
本发明实施例中客户端实现搜索的方法中的各步骤是从逻辑上描述的,具体的执行主体搜索客户端是什么并没有限制,比如,既可以由浏览器单独实现,也可以由浏览器及插件共同实现,也可以由其他客户端软件单独实现,或者是其他客户端软件及插件共同实现,因此本发明实施例对此并没有限制。
下面进一步结合具体的实例对本发明的客户端实现搜索的方法进行详细的说明。
本实例中,假设:
搜索客户端包括浏览器模块和主功能模块;对应第一搜索引擎作为默认的搜索引擎;
第一搜索引擎的搜索结果通过浏览器模块的数据接口注入到主功能模块;
搜索客户端对其他搜索引擎的搜索结果通过主功能模块采用异 步下载的方式进行;
在所述默认搜索引擎的搜索结果页上展示经处理后的所述最终搜索结果。
下面给出本实施例的一个具体实现过程。
1、当搜索客户端第一次拦截到用户在浏览器模块中使用第一搜索引擎搜索时,调用搜索初始化事件处理器,该函数通过计算用户的内存、CPU(Central Processing Unit,中央处理器)主频等信息,判定是否为用户机器开启客户端的多引擎搜索模式,以及进行性能参数配置。如果用户机器性能配置过低,则不为用户启动多引擎搜索模式,而仍然采用常用的单一搜索引擎模式。
2、当用户在浏览器模块使用第一引擎搜索时,例如搜索“中文”,搜索客户端拦截到用户特定URL模式,启动多引擎搜索,并传递标签页标识、当前地址栏完整URL、转化为UTF-8的查询关键词到搜索客户端搜索环境(主功能模块)。其中,UTF-8是UNICODE的一种变长字符编码,传递标签页是为了便于管理本次的多引擎搜索是针对哪个网页的。因为用户可能同时使用多个网页界面进行搜索。
3、搜索客户端解析用户查询URL,并调用搜索引擎选择模块用以获得当前查询条件需要访问的搜索引擎,例如搜索引擎A、搜索引擎B。此时,浏览器模块仍然通过正常链接请求第一搜索引擎搜索返回搜索结果页面;当第一搜索引擎的搜索结果页面返回时,会通过浏览器模块的数据接口将第一搜索引擎的搜索结果注入搜索客户端的主功能模块;
4、需要访问的搜索引擎A和搜索引擎B进入一个待下载队列。
5、搜索客户端主控流程从队列中取出搜索引擎A,产生完整URL,并开始下载,主流程继续执行,不等待下载完成。其中,具体下载还可以调用浏览器模块提供的异步下载接口完成。
6、搜索客户端主控流程从队列中取出搜索引擎B,生成完整URL,并开始下载,主流程继续执行,不等待下载完成。
7、搜索客户端异步下载完成搜索引擎A或搜索引擎B的搜索结果页后,把该结果页统一转化为UTF-8编码,并通知搜索主控流程。主控流程调用解析模块,进行页面分析和结果抽取过程,包括:
a)搜索结果页被转化为DOM(Document Object Model,文档对象模型);
b)通过路径查询语法在DOM上取出记录列表;
c)取得记录列表每一条记录的标题、摘要、链接等相关属性;
d)储存记录列表每一条记录的相关属性及在搜索结果页中的位置,存储到会话中;
e)如果还有URL没有下载完或者第一搜索引擎的网页搜索结果尚未导入,则什么都不做;
f)如果所有URL已下载完且第一搜索引擎的搜索结果页已导入,则调用合并滤重模块;
g)如果下载超时或者下载失败,则什么都不做。
8、搜索主控流程接收到第一搜索引擎的搜索结果页的JavaScript脚本注入的结果HTML(HyperText Mark-up Language,超文本标记语言),则:
主控流程对第一搜索引擎的搜索结果页进行解析和结果抽取,并写入会话;
如果还有URL没有下载完,则什么都不做;
如果所有URL已下载完,则调用合并滤重模块。
需要说明的是,上述步骤7、8完成的先后顺序不确定。当然,如果不需要对第一搜索引擎的搜索作特殊处理的话,仅仅执行步骤7也是可行的。
上面步骤7、8中的“什么都不做”其实就是等待操作,当然,在本发明的优选实施例中,如果返回结果的时间超时了,则可以忽略某些下载失败、未完成或者超时的URL,仅以下载完成的进行后续分析处理。
9、如果第一搜索引擎的搜索结果、搜索引擎A的搜索结果及搜索引擎B的搜索结果均已下载并解析完成,主控流程调用且合并滤重模块,产生最终搜索结果,并把最终搜索结果发送到第一搜索引擎搜索结果页的JavaScript脚本(当然,该发送过程也可以通过浏览器的数据接口实现)。
10、第一搜索引擎的搜索结果页的JavaScript脚本对最终搜索结果进行展示。即客户看到的仍然是第一搜索引擎的搜索结果页面,但是其搜索结果集合了多个搜索引擎
11、当搜索结束时,释放搜索客户端所占用的计算机资源。
为了进一步提高搜索效率,本发明还可以提高获取用户查询请求的速度。通常的,都是用户点击提交后来确定用户所需的查询词。在本发明的一个优选实施例中,可以提前预判,以便尽早开始搜索调用过程,以进一步提高搜索效率。
具体可以包括:捕获用户输入查询词的相关动作;分析用户输入查询词的相关动作;若满足预置条件,则在用户正式提交之前确定的预测查询词。即本实施例可以通过分析用户的动作,以提前预判获知用户所希望的查询词,提前发给搜索引擎。
对于用户动作的捕获可以通过在搜索页面中嵌入代码来实现,也可以通过在浏览器或者其他软件,如IM(InstantMessaging,即时通讯)程序、输入法程序、甚至文本编辑程序word等软件中安装插件来实现。捕获的可以是用户采用键盘在某一搜索区域,如可以提起搜索请求的输入栏,如浏览器的地址栏,也可以搜索页面的搜索栏、搜索软件的输入栏等中进行的输入、移动、粘贴、复制的操作,也可以是采用鼠标在上述某一区域进行的移动、输入、粘贴、复制等操作,还可以是用户在某一页面选中的字符等。当然,表现在界面,也可以认为是光标的动作情况。
用户输入查询词的相关动作可以包括用户的输入动作,也可以包 括与用户输入行为相关联的动作,例如,移动鼠标并点击“确认”按键的动作。进一步,用户的“输入”可以包括通过键盘对字符的敲入,也可以包括复制粘贴行为,还可以包括鼠标选择后的拖动等。
具体的,本发明所捕获的动作可以是用户操作鼠标和键盘的动作,如直接在搜索框中键入字符、将字符粘贴复制进搜索框中、鼠标的移动或者选中某一页面字符等。因此,当用户点击了搜索框,可以开始对用户在搜索框区域中所进行的动作进行捕获,在用户选中某一页面中的字符时也可以该选中的动作进行捕获。由于用户完成查询词输入和提交搜索的过程,可能不仅仅在输入框中完成,例如还需要移动鼠标到“搜索”按钮等,所以本发明对动作的捕获实际上包括了搜索框及其周边区域。当然,从鼠标键盘或者光标的角度而言,本发明就是当用户开始输入查询词时,就可以对他们的动作进行捕获和监控。
本实施例的目的是分析用户动作,以提前获知用户所需的查询词,提前发送给搜索引擎,从而节约搜索时间。如果从用户输入查询词的动作,可以确定用户已经输入了完整的查询词,正在准备进行提交动作,则就可以提前发送预测查询词至搜索引擎。
也就是说,通过对用户输入查询词的动作进行分析,如果这些动作符合本发明的预置条件,则就可以提前发送预测查询词至搜索引擎。
对于用户是否输入了完整的查询词,可以通过多种方式判断。
例如,如果用户在搜索框中输入了字符后开始移动鼠标,且鼠标进入“搜索”按钮周边预定的范围内,并逐渐靠近“搜索”按钮时,则确定用户输入了完整的查询词。其中,此处的“搜索”按钮周边预定的范围可以根据具体需要来确定,例如,以“搜索”按钮为圆心,半径不大于3厘米的圆形区域,也可以是以“搜索”按钮为中心的矩形或者其他形状的区域。按钮周边预定范围的确定,可以根据实际操作来确定,只要能被识别并确认的范围内都可以。
实际上可以理解为:从鼠标移动的轨迹看,鼠标基本上在不断接近“搜索”按钮。符合以上特征后,判断为“用户已输入完整查询”,提前发送查询词。但是由于此时用户还未正式提交搜索,因此在本发明中采用预测查询词加以说明。
除此之外,还可以采用其他方式进行判断,例如,如果用户在输入查询词的一部分时,移动鼠标到“输入提示”的区域,则确定用户输入了完整的查询词,此时,以“输入提示”的首条提示词作为查询词。具体的,搜索引擎通常有“输入提示”的功能,如输入“周”字后,下方可能提示“周杰伦”、“周星驰”、“周润发”等等,而其中首条提示的点击率比较最高。
如果用户在输入查询词的一部分时,移动鼠标到“输入提示”的区域,并选择了一条提示词,则确定用户输入了完整的查询词,此时,以选择的提示词作为预测查询词。
如果用户将字符粘贴于搜索框中,也可以确定输入了完整的查询词,以该粘贴的字符作为预测查询词。
如果用户的鼠标进入查询纠错词或者相关搜索等提示字样周围区域有停顿,则也确定输入了完整的查询词,此时,以停顿区域的提示字样作为完整的查询词。虽然停顿的时间虽然比较短,但是减少50毫秒到100毫秒对搜索引擎来说,也能减少相当比例的时间。
若用户尚未输入完整的查询词,则继续捕获用户的动作并进行分析,若确定用户输入了完整的查询词后,需要对用户是否正式提交查询请求进行判断。若用户已经提交查询请求,则无需进行任何操作。若用户还未提交查询请求,则在用户提交之前,将上一步骤中确定的预测查询词发送给相应的搜索引擎进行搜索。
“用户正式提交查询词”指用户已经通过正常的步骤,将查询词提交给搜索引擎了。比如,用户点击了“搜索”按钮,或者在输入查询词之后,点击了“回车”按钮,则这个时候,查询词已经提交给搜索引擎了,不需要做提前发送。
因为提前发送的预测查询词是对用户查询意图的预判断,因此提前发送的预测查询词与用户正式提交的查询词可能相同也可能不同。而由于用户习惯性的仍然会点击提交查询词,因此,可能存在预判的查询词和用户点击提交的查询词冲突的情况。
若提前发送的预测查询词与用户正式提交的查询词相同,则会忽略用户正式提交的请求,即不发送该用户正式提交的查询词至搜索引擎,而是将预先发送的预测查询词的搜索结果呈现给用户。
若提前发送的预测查询词与用户正式提交的查询词不同,则会采用用户正式提交的查询词进行搜索,而忽略或者丢弃之前的搜索结果(例如,预测查询词的搜索结果链接)。
进一步地,在判断用户是否输入完整的查询词的过程中,也可能会出现误判的情况,因此需要对后续确认的查询词进行重新发送。例如,当用户输入部分查询词后将鼠标移动到“输入提示”的区域,根据前面所述的确认标准,此时,发送给搜索引擎的搜索结果查询词是“输入提示”的首条提示词。但是用户可能会选择“输入提示”的第二条提示词或者其他的提示词作为正式查询词,因此,此时可以在用户选择查询词后,将选择的正式查询词重新发送给搜索引擎,从而保证查询的准确。即前次的查询过程并不是用户需要的,则当搜索结果返回时,直接忽略或者丢弃即可。
当然,如果之前搜索预启动时发送的预测查询词仍然在本地(例如,仍然基于查询词在选择搜索引擎),则当接到用户正式提交的查询词时,如果发现之前已提前发送过预测查询词且之前提交的预测查询词和用户正式提交的查询词不一致时,则取消上次提交的查询,用新的查询词进行检索。因为即使之前的预启动选择了错误的查询词,整个时间上也没有耽误,而如果之前的预启动选择了正确的查询词,则相当于早一点启动了搜索(或者早一点启动了选择搜索引擎的操作),仍然能够比较好的节约时间。
对于搜索引擎的搜索结果通常采用链接下载的方式获取,在需要 进行http下载时,首先构造链接请求URL(查询词含于其中),然后发起链接进行互联网内容下载,下载结束后关闭链接。本发明可以采用现有的链接下载实现方式,在此不再赘述。
在本发明的优选实施例中,还可以在用户正式提交查询词搜索之前进行预链接。其中,预链接与实施例一中的预发送的先后顺序并不确定,可以与预发送同时进行,也可以在预发送之前或者之后进行。当然,最好在预发送之前或者在预发送捕获用户动作的同时进行。
具体的,预链接过程包括以下步骤:首先判断用户是否有搜索意图,从可能发起链接请求的搜索引擎建立一个预链接,并保有之;当搜索行为发生时,则从保有的预链接中获取对应搜索引擎的链接进行下载。
由于http请求支持keep-alive方式进行链接下载,那么可以在内容下载之前首先发起一次链接请求并保有,而在实际需要下载内容的应用时使用之前保有的keep-alive链接,这样就省去了在实际应用时的链接建立时间消耗。
本发明通过keep-alive方式实现的预链接技术,使得应用在链接下载过程中省却了链接建立的时间。而http请求过程中,链接建立的三次握手协议过程是比较耗时的,极端情况下,三次握手阶段出现网络丢包,TCP协议0栈默认的重新启动三次握手协议的过程为3s,这就意味着应用需要等待至少3s才能开始下载内容。预链接技术将在元搜索等待的非必要阶段首先建立长连接,而后所有针对该服务器的链接请求都可以复用此长连接从而大大降低了元搜索整体过程的时间消耗。
进一步,判断用户是否有搜索意图可以通过较多的方式判断。下面给出本发明的一些可能的实现例子。
例如,当用户打开了搜索页面时,则可以认为用户有搜索意图。例如,当用户在搜索页面的搜索框中输入或者粘贴字符时,则也可 以认为用户有搜索意图。例如,当用户在浏览器的地址栏输入中文字符时,也可以认为用户有搜索意图。
可以理解,预链接和预发送可以为两个独立的步骤,即,两者分别对用户的动作进行独立判断然后进行预链接或者预发送。该两个步骤也可以互相关联,例如,预链接在判断用户是否具有搜索意图时获取的用户的某些动作信息,预发送在进行动作捕获时可以利用。或者预发送在进行动作捕获时获得的信息,预链接在判断用户是否具有搜索意图时也可以利用,通过资源共享,可以节省预链接或者预发送的时间,同时也可以减少对内存等空间的占用。
参照图2,示出了本发明的一种搜索客户端实施例200,其包括获取模块201、结果取得模块202和解析展示模块203。
获取模块201,用于获取用户查询请求。
通常的,获取模块201从搜索框或者地址栏拦截用户查询请求。
当用户针对一默认搜索引擎启动查询请求时,获取模块201也可以通过拦截用户指向一默认搜索引擎的查询请求,而获取用户查询请求。
结果取得模块202,用于调用至少两个搜索引擎,对该查询请求进行搜索;以及获得各个所调用的搜索引擎的搜索结果信息。
解析展示模块203,对搜索结果信息进行处理,得到最终搜索结果并进行展示。
最终搜索结果的展示可以通过解析展示模块直接生成结果展示页面进行展示,结果展示页面可以是新的网页页面或者新的展示界面(例如,独立窗口)。也可以借用某个搜索引擎的搜索结果页来进行展示。需要说明的是,本发明的搜索客户端实施例中的模块划分是基于逻辑而言的,在具体实现时可以任意组合和/或拆分,比如某个功能模块可以由两个以上的实体工程来完成,再比如某两个功能模块也可以由同一实体来完成。具体而言本发明实施例中的搜索客 户端既可以由浏览器单独实现,也可以由浏览器及插件共同实现,也可以由其他客户端软件单独实现,或者是其他客户端软件及插件共同实现,因此本发明实施例对此并没有限制。
在本发明的一个优选实施例中,搜索客户端200还可以包括浏览器模块(或者其他应用模块)。解析展示模块处理各搜索引擎的搜索结果页,提取搜索结果的记录数、执行时间、具体的搜索结果记录等,对于每条搜索结果记录,解析其标题、摘要、链接等关键信息,并通过浏览器模块对最终搜索结果在结果展示页面上进行展示。
搜索客户端还可以包括性能检测模块,用于检测用户终端计算机的性能配置,如果性能配置符合预设要求,则调用多个搜索引擎;否则,采用单一搜索引擎模式。
另外,还可以包括搜索引擎选择模块,用于对搜索引擎进行选择。该模块以该查询请求的查询词为输入,结合引擎参数表,选择所需的多个搜索引擎。引擎参数表用于表征各查询词与各搜索引擎的相关程度,优选的,所述相关程度信息由搜索客户端从服务器更新获得。
进一步地,搜索客户端还可以包括搜索环境初始化模块,包括加载搜索逻辑代码到执行环境,加载各种配置信息及引擎参数表。
进一步地,搜索客户端所包括的浏览器模块还可以支持多标签浏览,若浏览器模块支持多标签浏览时,搜索客户端还包括会话管理模块,用于存储搜索执行过程中所有的临时数据,并对浏览器模块多标签浏览时,各个标签对应搜索的数据进行隔离(可适应于多页面并行搜索的情况)。
为了进一步节约搜索时间,提高搜索效率,在本发明的一个优选实施例中,所述获取模块包括:动作捕获子模块,用于捕获用户输入查询词的相关动作;分析子模块,用于分析所述用户输入查询词的相关动作;搜索预启动子模块,用于当分析子模块确定用户输入 查询词的动作满足预置条件时,则在用户正式提交搜索之前确定预测查询词作为用户查询请求。当然,所述获取模块还可以包括其他模块,例如,URL分析模块或者用户提交行为的接收模块等等,在次不加以限制。
优选的,前述实施例还可以包括:预链接模块,用于当判定用户有搜索意图时,对可能发起链接请求的搜索引擎建立一预链接,并保有之;当搜索行为发生时,所述预链接直接用于结果取得模块的具体调用过程。
下面从装置角度给出本实施例的一个具体实现方案,参见图3。该实现方案中搜索客户端中集成有浏览器模块,其可以包括以下几个部件:
●初始化搜索环境模块
■当浏览器模块启动时,搜索环境被初始化,具体的初始化可以包括加载搜索逻辑代码到执行环境,加载各种配置信息及引擎参数表等(也可以叫词表,因为主要是表征查询词和搜索引擎的相关程度)
●会话管理模块
■会话管理模块存储元搜索执行过程中所有的临时数据,并对浏览器模块多标签浏览时,各个标签对应元搜索的数据进行隔离;主要用于支持多Tab浏览,在某些实施例中,可以不采用;
●URL拦截模块
■在用户使用浏览器模块过程中,如果浏览器模块的地址栏URL满足搜索查询的URL模式,则获取该查询请求,调用多个搜索引擎,否则进行常规浏览;其中,搜索查询的URL模式是指某一搜索引擎对于查询词生成的URL的特定格式,通常为搜索引擎的网页地址与查询词的组合。例如,采用百度进行搜索“patent 360”时,URL为
http://www.baidu.com/s?wd=patent+360,其中URL中的前部是该搜索引擎的网址,后部是查询词“=patent+360”。
●搜索引擎选择模块
■该模块以查询词作为输入,结合查询词与搜索引擎的相关程度,从候选搜索引擎列表中选择最匹配该查询词的搜索引擎;
●连接模块
■连接模块循环处理搜索引擎选择模块产生的待下载搜索引擎列表,产生完整URL,调用异步下载模块进行HTML网页下载;
●异步下载模块
■接收连接模块产生的各个搜索结果页URL,发起HTTP请求并取得结果页HTML,把不同编码的HTML结果页统一转化为UTF-8编码;异步下载主要用于并行下载支持,减少整体执行时间;
●数据接收接口
■数据接收接口为浏览器模块对JavaScript的扩展接口,允许第一搜索引擎的搜索结果页中JavaScript脚本把第一搜索引擎搜索的结果区HTML片段,通过浏览器模块的JavaScript扩展接口,发送到搜索环境中;
■如果第一搜索引擎的搜索结果也是采用下载的方式获得,则不需要该数据接收接口;
●解析模块
■解析模块处理异步下载模块输出的各家搜索结果页HTML以及通过数据接收接口得到的第一搜索引擎的搜索结果页HTML,提取搜索结果的记录数、执行时间、具体的搜索结果记录等,对于每条搜索结果记录,解析其标题、摘要、链接等关键信息;
●合并滤重模块
■合并滤重模块对解析模块产生的各家搜索结果进行处理,进行排序、滤重等操作,产生融合后的最终搜索结果;
●数据发送接口
■融合后的最终搜索结果,通过浏览器模块扩展的JavaScript接口,发送到第一搜索引擎搜索结果的JavaScript函数,JavaScript函数把最终搜索结果以HTML格式输出到结果页面进行展示;
■如果直接通过搜索客户端来产生整个页面,则可以不要数据发送接口;
●销毁元搜索环境
■当搜索结束时,释放搜索客户端所占用的计算机资源;当然,也可以暂时不释放,等待用户下一次的查询请求。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
以上对本发明所提供的一种客户端实现搜索的方法和实现搜索的客户端,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (20)
1.一种客户端实现搜索的方法,其特征在于,包括以下步骤:
搜索客户端获取用户查询请求;
搜索客户端调用至少两个搜索引擎对所述查询请求进行搜索;
搜索客户端获得各个所调用的搜索引擎的搜索结果信息;
搜索客户端对所述获得的搜索结果信息进行处理,得到最终搜索结果并进行展示;
所述方法还包括:
在调用各个搜索引擎之前,当判定用户有搜索意图时,对可能发起调用请求的搜索引擎建立一预链接,并保有之;
当搜索行为发生时,从保有的预链接中获取对应搜索引擎的链接,进行具体调用过程。
2.如权利要求1所述的方法,其特征在于,所述方法在搜索客户端调用至少两个搜索引擎之前,还包括:
检测用户机器的性能配置,如果性能配置符合预设要求,则执行后续步骤。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:在搜索客户端调用搜索引擎之前,根据当前的查询请求来选择所需的至少两个搜索引擎。
4.如权利要求3所述的方法,其特征在于,所述选择至少两个搜索引擎的步骤具体包括:
以该查询请求的查询词为输入,结合查询词与各搜索引擎的相关程度,选择所需的至少两个搜索引擎。
5.如权利要求1所述的方法,其特征在于,所述搜索客户端获取用户查询请求包括:通过监控浏览器的特定输入框,获取用户查询请求。
6.如权利要求1所述的方法,其特征在于,所述搜索客户端通过拦截用户指向一默认搜索引擎的查询请求,而获取用户查询请求。
7.如权利要求1所述的方法,其特征在于,所述搜索客户端调用至少两个搜索引擎包括:所述搜索客户端调用包含一默认搜索引擎的至少两个搜索引擎;
所述展示包括:在所述默认搜索引擎的搜索结果页上展示经整合后的所述最终搜索结果。
8.根据权利要求1所述的方法,其特征在于,所述搜索客户端对所述搜索结果信息进行的处理包括解析和整合。
9.如权利要求8所述的方法,其特征在于,所述搜索客户端对所述搜索结果信息进行的解析包括对不同搜索引擎的搜索结果页进行页面分析和结果抽取。
10.如权利要求9所述的方法,其特征在于,所述页面分析及结果抽取包括以下步骤:
将搜索结果页转化为DOM;
通过路径查询语法在DOM上取出记录列表;
取得记录列表每一条记录的标题、摘要、链接相关属性;
储存记录列表每一条记录的相关属性及在搜索结果页中的位置。
11.如权利要求1所述的方法,其特征在于,所述获取用户查询请求包括:
分析所述用户输入查询词的相关动作;
在满足预置条件的情况下,在用户正式提交搜索之前确定一预测查询词作为用户查询请求;所述预置条件为用户已经输入了完整的查询词。
12.一种客户端实现搜索的方法,其特征在于,所述客户端包括浏览器模块和搜索插件,所述方法包括以下步骤:
浏览器模块基于用户查询请求,调用一默认搜索引擎,获得该默认搜索引擎的搜索结果页,并通过该搜索结果页的脚本将搜索结果信息发送给搜索插件;
搜索插件基于所述用户查询请求,调用其他搜索引擎,获得其他搜索引擎的搜索结果;
搜索插件对所获得的默认搜索引擎的搜索结果信息和所述其他搜索引擎的搜索结果进行处理,获得最终搜索结果;
浏览器模块或搜索插件在该默认搜索引擎的搜索结果页上对所述最终搜索结果进行展示;
所述方法还包括:
在搜索插件调用所述其他搜索引擎之前,当判定用户有搜索意图时,对所述其他搜索引擎建立一预链接,并保有之;
当搜索行为发生时,从保有的预链接中获取对应搜索引擎的链接,进行具体调用过程。
13.一种搜索客户端,其特征在于,包括:
获取模块,用于获取用户查询请求;
结果取得模块,用于调用至少两个搜索引擎,对所述查询请求进行搜索,以及获得各个所调用的搜索引擎的搜索结果信息;
解析展示模块,对所获得的搜索结果信息进行处理,得到最终搜索结果并进行展示;
所述搜索客户端还包括:
预链接模块,用于当判定用户有搜索意图时,对可能发起调用请求的搜索引擎建立一预链接,并保有之;当搜索行为发生时,所述预链接直接用于结果取得模块的具体调用过程。
14.如权利要求13所述的搜索客户端,其特征在于,所述搜索客户端还包括:
性能检测模块,用于检测用户机器的性能配置,如果性能配置符合预设要求,则调用所述至少两个搜索引擎。
15.如权利要求13所述的搜索客户端,其特征在于,所述搜索客户端还包括:
搜索引擎选择模块,用于以该查询请求的查询词为输入,结合查询词与各搜索引擎的相关程度,选择所需的至少两个搜索引擎。
16.如权利要求13所述的搜索客户端,其特征在于,所述获取模块通过监控浏览器的特定输入框,以获取用户查询请求。
17.如权利要求13所述的搜索客户端,其特征在于,所述获取模块通过拦截用户指向一默认搜索引擎的查询请求,而获取用户查询请求。
18.如权利要求13所述的搜索客户端,其特征在于,
所述调用的至少两个搜索引擎包含一默认搜索引擎;
所述解析展示模块在所述默认搜索引擎的搜索结果页上展示经整合后的所述最终搜索结果。
19.如权利要求13所述的搜索客户端,其特征在于,所述解析展示模块对所述搜索结果信息进行的处理包括解析和整合。
20.如权利要求13所述的搜索客户端,其特征在于,所述获取模块包括:
动作捕获子模块,用于捕获用户输入查询词的相关动作;
分析子模块,用于分析所述用户输入查询词的相关动作;
搜索预启动子模块,用于当分析子模块确定用户输入查询词的相关动作满足预置条件时,则在用户正式提交搜索之前确定一预测查询词作为用户查询请求;所述预置条件为用户已经输入了完整的查询词。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010559231 CN102043834B (zh) | 2010-11-25 | 2010-11-25 | 一种客户端实现搜索的方法及搜索客户端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010559231 CN102043834B (zh) | 2010-11-25 | 2010-11-25 | 一种客户端实现搜索的方法及搜索客户端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102043834A CN102043834A (zh) | 2011-05-04 |
CN102043834B true CN102043834B (zh) | 2013-07-31 |
Family
ID=43909972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010559231 Active CN102043834B (zh) | 2010-11-25 | 2010-11-25 | 一种客户端实现搜索的方法及搜索客户端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102043834B (zh) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102184230B (zh) * | 2011-05-11 | 2016-08-17 | 北京百度网讯科技有限公司 | 一种搜索结果的展示方法及装置 |
CN102393858A (zh) * | 2011-11-17 | 2012-03-28 | 陈洪 | 一种基于客户端实时聚合的元搜索引擎系统 |
CN102662957B (zh) * | 2012-03-02 | 2015-02-18 | 百度在线网络技术(北京)有限公司 | 用于优化浏览器的搜索结果页面的装置及方法 |
CN103810049A (zh) * | 2012-11-07 | 2014-05-21 | 江苏仕德伟网络科技股份有限公司 | 通过计算机内存实现计算机处理过程同步页面的方法 |
CN102999609A (zh) * | 2012-11-22 | 2013-03-27 | 北京奇虎科技有限公司 | 网络小说搜索系统 |
CN102982143A (zh) * | 2012-11-22 | 2013-03-20 | 北京奇虎科技有限公司 | 一种网络小说的搜索方法和浏览装置 |
CN102982174B (zh) * | 2012-12-17 | 2016-07-06 | 北京奇虎科技有限公司 | 一种浏览器中进行网页搜索的方法及装置 |
CN103533009A (zh) * | 2013-01-06 | 2014-01-22 | Tcl集团股份有限公司 | 一种基于Web技术实现音视频推荐的方法和系统 |
CN103136342B (zh) * | 2013-02-04 | 2016-06-15 | 百度在线网络技术(北京)有限公司 | 应用程序app的搜索方法、系统以及搜索服务器 |
CN104182401A (zh) * | 2013-05-22 | 2014-12-03 | 腾讯科技(深圳)有限公司 | 在移动终端浏览器中进行搜索的方法及装置 |
CN104636383B (zh) * | 2013-11-14 | 2019-09-20 | 腾讯科技(深圳)有限公司 | 一种实现对比搜索的方法和装置 |
CN104866483B (zh) * | 2014-02-21 | 2020-02-07 | 腾讯科技(深圳)有限公司 | 一种信息检索的方法及装置 |
CN104615621B (zh) * | 2014-06-25 | 2017-11-21 | 腾讯科技(深圳)有限公司 | 搜索中的相关性处理方法和系统 |
CN104281647B (zh) * | 2014-09-01 | 2018-11-20 | 百度在线网络技术(北京)有限公司 | 搜索输入方法和装置 |
CN104376060B (zh) * | 2014-11-10 | 2018-09-04 | 天津三星通信技术研究有限公司 | 用于在终端上浏览网页的方法及设备 |
CN105279212B (zh) * | 2014-11-20 | 2019-02-26 | 北京维久云科技有限公司 | 一种基于编码的网址链接方法 |
CN104484387B (zh) * | 2014-12-10 | 2018-09-04 | 北京奇虎科技有限公司 | 一种浏览器中进行搜索的方法和浏览器装置 |
CN105893390B (zh) * | 2015-01-26 | 2021-06-22 | 北京搜狗科技发展有限公司 | 一种应用程序的处理方法及电子设备 |
CN104898927B (zh) * | 2015-05-29 | 2018-02-06 | 努比亚技术有限公司 | 信息搜索的方法及装置 |
CN105630937A (zh) * | 2015-12-22 | 2016-06-01 | 北京奇虎科技有限公司 | 一种搜索试题答案的方法以及装置 |
CN105404695A (zh) * | 2015-12-23 | 2016-03-16 | 北京奇虎科技有限公司 | 试题查询方法和装置 |
WO2017161578A1 (zh) * | 2016-03-25 | 2017-09-28 | 马岩 | 数据抓取的方法及系统 |
CN106776853A (zh) * | 2016-11-28 | 2017-05-31 | 广州市动景计算机科技有限公司 | 搜索方法、装置、客户端设备和图形用户界面系统 |
CN108804471A (zh) * | 2017-05-04 | 2018-11-13 | 北大方正集团有限公司 | 网页生成方法及装置 |
CN109977259A (zh) * | 2019-03-28 | 2019-07-05 | 北京奇艺世纪科技有限公司 | 一种数据查询方法、装置及电子设备 |
CN110333949B (zh) * | 2019-06-17 | 2022-01-18 | Oppo广东移动通信有限公司 | 搜索引擎处理方法、装置、终端及存储介质 |
CN111401983A (zh) * | 2020-02-21 | 2020-07-10 | 北京九州云动科技有限公司 | 搜索列表个性化平台引导方法和装置 |
CN112163128A (zh) * | 2020-09-28 | 2021-01-01 | 彩讯科技股份有限公司 | 一种邮件检索方法、装置、设备及存储介质 |
CN113626462B (zh) * | 2021-07-15 | 2022-11-15 | 北京百度网讯科技有限公司 | 即时通讯对象的搜索方法、装置、电子设备和存储介质 |
CN114417179A (zh) * | 2021-12-29 | 2022-04-29 | 航天科工网络信息发展有限公司 | 一种面向大规模知识库群的元搜索引擎处理方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101641694A (zh) * | 2007-02-16 | 2010-02-03 | 雅虎公司 | 通过若干搜索引擎实现的联合搜索 |
CN101751428A (zh) * | 2008-12-12 | 2010-06-23 | 汉王科技股份有限公司 | 信息搜索方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10228477A (ja) * | 1997-02-13 | 1998-08-25 | Nec Corp | 一括検索方式 |
US8793265B2 (en) * | 2007-09-12 | 2014-07-29 | Samsung Electronics Co., Ltd. | Method and system for selecting personalized search engines for accessing information |
-
2010
- 2010-11-25 CN CN 201010559231 patent/CN102043834B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101641694A (zh) * | 2007-02-16 | 2010-02-03 | 雅虎公司 | 通过若干搜索引擎实现的联合搜索 |
CN101751428A (zh) * | 2008-12-12 | 2010-06-23 | 汉王科技股份有限公司 | 信息搜索方法及装置 |
Non-Patent Citations (1)
Title |
---|
JP特開平10-228477A 1998.08.25 |
Also Published As
Publication number | Publication date |
---|---|
CN102043834A (zh) | 2011-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102043834B (zh) | 一种客户端实现搜索的方法及搜索客户端 | |
US10839038B2 (en) | Generating configuration information for obtaining web resources | |
RU2522103C2 (ru) | Способ и браузер для уведомления об обновлении | |
US7885950B2 (en) | Creating search enabled web pages | |
US8359371B2 (en) | Input candidate providing device, input candidate providing system, input candidate providing method, and input candidate providing program | |
US9396266B2 (en) | Method and/or system for searching network content | |
US8601120B2 (en) | Update notification method and system | |
US20020103823A1 (en) | Method and system for extending the performance of a web crawler | |
WO2017202255A1 (zh) | 页面展示方法、装置和客户端设备 | |
US8522128B1 (en) | Systems and methods for modifying the order of links presented in a document | |
US20100057695A1 (en) | Post-processing search results on a client computer | |
WO2017124692A1 (zh) | 查找表单页面和目标页面转化关系的方法和装置 | |
CN104090887A (zh) | 歌曲搜索方法及装置 | |
US7970758B2 (en) | Automatic completion with LDAP | |
WO2012071993A1 (zh) | 一种环球信息网www页面处理方法和装置 | |
WO2012155581A1 (zh) | 中间服务器、移动浏览方法及系统 | |
JP2007072596A (ja) | 情報共有システムおよび情報共有方法 | |
CN103294717A (zh) | 一种基于双内核浏览器的网页打开方法和装置 | |
CN1783850A (zh) | 一种基于即时通讯平台的搜索方法和系统 | |
CN103366011A (zh) | 通过浏览器地址栏访问认证网址的方法、及装置 | |
CN102033911A (zh) | 一种搜索预处理方法和搜索预处理器 | |
CN104182402A (zh) | 浏览器界面地址栏输入控制方法及系统 | |
US10095791B2 (en) | Information search method and apparatus | |
CN103838797A (zh) | 一种移动搜索引擎优化方法 | |
CN101154223B (zh) | 查看与系统功能对应的源代码的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |