CN102937977A - 一种搜索服务器及搜索方法 - Google Patents

一种搜索服务器及搜索方法 Download PDF

Info

Publication number
CN102937977A
CN102937977A CN2012103954722A CN201210395472A CN102937977A CN 102937977 A CN102937977 A CN 102937977A CN 2012103954722 A CN2012103954722 A CN 2012103954722A CN 201210395472 A CN201210395472 A CN 201210395472A CN 102937977 A CN102937977 A CN 102937977A
Authority
CN
China
Prior art keywords
search
site information
website
information
info web
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012103954722A
Other languages
English (en)
Inventor
张栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN2012103954722A priority Critical patent/CN102937977A/zh
Publication of CN102937977A publication Critical patent/CN102937977A/zh
Priority to PCT/CN2013/083925 priority patent/WO2014059851A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种搜索服务器,该服务器设置有可信网站存储器,用于存储可信网站的网站信息,至少包括网站名称以及网站的网址,用户在采用该网络搜索服务器进行网站信息搜索时,能够为用户提供可信的搜索结果。而且,采用搜索结果处理器,将在可信网站存储器中搜索到的可信网站信息以有别于其他搜索结果的显示方式,呈现在用户的终端上。与之相应的,本发明还公开了一种搜索方法。

Description

一种搜索服务器及搜索方法
技术领域
本发明涉及网络搜索,尤其涉及一种根据关键词通过网络进行诸如官网的可信网站搜索的搜索服务器及相应的搜索方法。
背景技术
随着互联网的高速发展,各种企业、组织和个人等逐步了解到在互联网上提供信息服务的重要性而纷纷建立各自的网站来发布相应信息。随着在网络上提供网络信息服务的网站日益增多,互联网用户很难记住所有的这些网站甚至是想访问的网站的具体地址。与此同时,互联网所容纳的信息也在呈爆炸式增长,发展到今天,互联网上的各种信息,可谓是浩如烟海。在这种情况下,如何让互联网用户在最短的时间内访问到自己想要访问的网站或者是找到自己想要的信息,成为了当务之急。于是,有别于开始的发布各种消息的网站,一类专事搜索的网站、服务器应运而生。而基于互联网的搜索网站以及衍生出的各种搜索方式,也极大的推动了互联网的发展。目前,互联网用户在很大程度上都依赖于搜索网站来查询这些网站位置,获取自己所需的信息。
一般而言,搜索网站利用搜索引擎来从互联网中提取各个网站的信息(以网页文字为主),建立起数据库。当用户在搜索网站上进行查询时,搜索引擎能检索与用户查询条件相匹配的记录。按照搜索结果与查询条件相匹配的程度,给出搜索结果中每条相应记录的排名score,按照排名score的高低来排序并返回给用户。正常情况下,一些可靠性高、比较知名的网站所提供的信息会被给予较高的排名。当用户进行搜索时,会首先获得排名较高的信息,从而使得用户有可能获得较为可靠的信息。
然而,出于广告、点击率等商业因素的考虑,一些服务提供商会针对各个现有搜索引擎的排名算法进行搜索引擎优化(SEO),使得自己的信息会被给予较高排名,这些信息有可能是不正确甚至是恶意的。用户无法直观地判断自己查询获得的信息是否可信。
另外,虽然搜索引擎会收集一些公司的官方网站,但是在呈现搜索结果时,用户并不知晓所获得的结果是否来自官方网站。当用户搜索词和这些公司的名称稍微不同时,如果有服务提供商针对这些搜索词进行了优化,甚至这些提供商的排名会在这些官方网站之前。
虽然一些搜索引擎会统计用户的搜索行为,针对用户经常搜索的搜索词构建专门的结果显示方式,例如百度的凤巢系统等,为用户提供更为准确可信的信息。然而,这种用户搜索行为的统计,对一些受大众关注程度比较高的网站较为可行,对一些不怎么受关注,或者说相对比较专业的、受众较少的网站,则很难找到其相应的官方网站。因为搜索引擎并不会为大多数的搜索词构建专门显示方式。而且,搜索引擎在构建专门的显示方式时,并不一定以官网信息优先。对于一些刚刚创建、或者访问量较少的官网,搜索引擎并没有进行特别优化,用户难以从搜索结果中获得来自官网的信息。
由此可知,目前的搜索引擎并没有充分考虑官网信息的可靠性对于用户的重要程度,因此在为用户呈现搜索结果时,也没有对来自官网的信息和其它信息进行区分。
因此需要一种新的搜索排序和搜索结果呈现方式,在搜索结果中以较高的排名和显著的方式来显示来自诸如官网的可信网站的信息。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的搜索服务器和相应的搜索方法。
根据本发明的一个方面,提供了一种搜索服务器,该搜索服务器包括:信息存储器、可信网站存储器和搜索引擎。信息存储器适于存储从接入互联网的各网站中收集的网页信息,该网页信息至少包括网页的内容及其URL。可信网站存储器适于存储多个可信网站的网站信息,网站信息至少包括网站名称以及网站的网址。搜索引擎适于接收从用户终端提交的搜索关键词,从信息存储器中检索内容包括搜索关键词的网页信息,从可信网站存储器检索网站名称与搜索关键词相对应的网站信息,组合所检索到的网页信息和网站信息以获得搜索结果。
可选地,根据本发明所述的搜索服务器还包括可信网站信息处理器,适于处理经可信的方式获得的网站信息并将其存储在可信网站存储器中。其中,经可信方式获得的网站信息至少包括从可信的网络站点导入的网站信息、手工输入的网站信息以及从对用户的搜索行为监控中获得的网站信息中的一个或者多个。可选地,对用户的搜索行为监控中获得的网站信息包括用户搜索中频繁点击的网站信息。
可选地,在根据本发明的搜索服务器中,搜索引擎包括搜索预处理器和搜索处理器;其中,搜索预处理器适于对搜索关键词进行预处理,预处理包括剔除掉搜索关键词中的常用词,和/或修改关键词中的明显错误,以生成有效关键词;搜索处理器适于从信息存储器中检索内容包括有效关键词的网页信息,经由可信网站信息处理器从可信网站存储器检索网站名称与有效关键词相对应的网站信息,并组合所检索到的网页信息和网站信息以获得搜索结果。
可选地,搜索处理器组合所检索到的网页信息和网站信息包括:在可信网站信息处理器未返回所述网站信息时,搜索结果即为从信息存储器中检索到的所述网页信息;在可信网站信息处理器返回网站信息时,从网页信息中删除与网站信息相对应的内容以获得新的网页信息,搜索结果包括网站信息和新的网页信息。
可选地,根据本发明的搜索服务器还包括结果处理器,结果处理器适于处理来自搜索处理器的搜索结果并返回用户终端,其中处理搜索结果包括:在搜索结果为网站信息和新的网页信息时,以显著的方式处理网站信息。可选地,以显著的方式处理网站信息为在网站信息的网站名称上添加可信标志,或将网站信息放置在新的网页信息之前并以高亮方式或分割线区分二者。
根据本发明的另一个方面,提供一种搜索方法,该搜索方法在包括信息存储器和可信网站存储器的搜索服务器中运行,其中信息存储器适于存储从接入互联网的各网站中收集的网页信息,该网页信息至少包括网页的内容及其URL;可信网站存储器适于存储多个可信网站的网站信息,网站信息至少包括网站名称以及网站的网址。
该搜索方法包括如下步骤:接收从用户终端提交的搜索关键词;从信息存储器中检索内容包括搜索关键词的网页信息;从可信网站存储器检索网站名称与搜索关键词相对应的网站信息;组合所检索到的网页信息和网站信息以获得搜索结果。
通过本发明提供的搜索处理器和搜索方法,能够更准确地检索诸如官网信息的可信网站信息,并且在呈现搜索结果时,能够对来自可信网站的信息与其他信息进行区分,方便了用户准确获知其所需要的可靠信息。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出具体实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为根据本发明一个实施例的搜索服务器的结构示意图;
图2为根据本发明一个实施例的搜索方法的流程图。
具体实施方式
本发明提供了一种针对诸如官网的可信网站进行搜索的搜索服务器和搜索方法,下面将结合附图详细说明如下。
图1示出了根据本发明一个实施例的搜索服务器,包括信息收集/处理器100、信息存储器101、可信网站存储器110、可信网站信息处理器111,和搜索引擎120。用户通过用户终端140输入搜索关键词,经由本发明的搜索服务器,搜索到标注有诸如官网之类的可信网站的搜索结果,并再通过用户终端140呈现给用户。在本发明中,用户终端可以是计算机终端,也可以是手机、能接入互联网的各种电子设备等。
信息收集/处理器100从接入互联网的各网站服务器1、2......N中收集网页信息,并且将网页信息存储入信息存储器101中。收集的网页信息至少包括网页的内容及其URL,当然还可以根据需要包括其它内容,例如网页的类型,网页是否被嵌入了木马等。信息收集/处理器100从各网站服务器中收集网页信息的方式可以是传统的互联网信息搜索方法,譬如“蜘蛛”、“爬虫”等方式来获得,并且对所获得的网页进行处理,例如提取其中的主题词、关键词、URL、IP地址等等,并且将处理后的网页存储在信息存储器101中。
可信网站存储器110存储了多个可信网站的网站信息。网站信息至少包括网站名称以及网站的网址,当然根据需要还可以包括其它内容,例如网站的简要介绍,一些网站相对应组织的基本情况信息等。
应当注意的是,本发明中所提及的可信网站是指该网站所提供的信息应当是公众可以信任的网站。这种可信网站具体而言可以包括一些组织在网络上建立的官方网站(简称为官网),此外当然还可以包括一些官方认可的其它网站(例如一些组织为了某个专项而单独建立的网站)。在本申请中,为了便于说明,有些地方对官网、官方网站和可信网站进行了可以相互替换的使用,但它们的具体意思都是指可信网站。
还应当注意的是,本发明中所提及的网站名称是指最能够反映网站或者提供网站的组织的名称,因此网站名称不仅可以是网站标题,还可以是网站在内容中提及的组织名称、组织的民间常用名称等,而且网站名称可以有多个。
可信站点处理器111通过各种可靠的数据来源采集官方网站的信息,并将其存储于可信网站存储器110中。可信网站存储器的数据来源包括管理员手工输入、来自可信站点的导入(例如,工信部的网站)以及对用户搜索行为的监控(例如,可以将搜索结果中被用户频繁点击的网站确定为可能的官网,随后审核来确定)以及注册认证后的用户的手工输入等等。
可信网站存储器110中所存储的官网信息可以采用key-va lue对(关键字-值对)的方式进行存储,其中key(关键字)就是官网名称,va l ue(值)就是和这个官网名称相对应的URL。可信站点处理器111在接收到来自搜索处理器121的搜索关键词时,确定该关键词是否与存储在可信网站存储器中的key相对应,如果是则返回官网信息,即key为该关键词,va lue为URL的key-va lue对,否则返回指示不存在官网的消息。
搜索引擎120包括搜索处理器121。搜索处理器121可直接接收用户终端提交的搜索关键词,从信息存储器101中检索含有搜索关键词的网页信息,同时从可信网站存储器110检索网站名称与搜索关键词相对应的网站信息,组合所检索到的网页信息和网站信息以获得搜索结果。
一方面,搜索处理器121基于用户从终端输入的搜索关键词以传统搜索方式对信息存储器101进行检索,以从信息存储器101中获取搜索结果列表。搜索结果列表包括一个或多个搜索结果项,每个搜索结果项为每条被搜索到的包括搜索关键词的网页信息,所述网页信息可以是key-value对,其中key是相应网页的URL地址,value是所述网页的排名score(用于搜索结果排名)。
另一方面,搜索处理器121将用户从终端输入的搜索关键词发送给可信站点处理器111,如果可信站点处理器111未能在可信网站存储器110中检索到含有相应关键词的可信网站信息,则搜索结果即为从信息存储器101中检索到的网页信息。如果可信站点处理器返回了可信网站信息,则将可信网站信息和从信息存储器101中所检索到的网页信息进行合并处理。例如,在从信息存储器101中所检索到的搜索结果列表中,某一搜索结果项的网页信息中的网页URL与从可信网站处理器111返回的可信网站信息中的网站URL相对应,则将搜索结果列表中的所述搜索结果项删除,并且将上述删除动作之后的新搜索结果列表(即新的网页信息)和所述可信网站信息一同作为最后的搜索结果。
应当注意的是,上文提及的有关网页信息中的网页URL和可信网站信息中的网站URL相对应并不是指二者完全一致。一般而言,官网中的网站URL通常仅仅包括主机名称,而不包含主机名称之后的路径和文件名。而网页URL则通常会包括主机名称、路径和文件名等。本发明中上述网页URL与网站URL相对应是指两个URL中的主机名称部分相同,或者主机名称中的根站点名称一致。例如官网的网站URL为www.aaa.com,而网页URL可以是www.aaa.com/b/c.html,二者可以认为是相对应的。又例如,官网的网站URL为aaa.com,而网页URL可以是www.aaa.com/b/c.html,这二者也可以认为是相对应的。
可选地,在搜索引擎120中还可设置搜索预处理器122。预处理器122是传统的搜索引擎部件,适于对用户输入的搜索词进行预处理,剔除掉常用的词,并对一些搜索词进行调整,从而生成搜索引擎认为恰当的搜索词。尤其是当用户输入的关键词接近可信网站名称时,预处理器122将这些搜索关键词修改为与可信网站存储器110中所存储的与可信网站名称一致的词。譬如当用户输入的搜索关键词是“蓟门医院”,预处理器122在对关键词进行预处理时,自动将其调整为更为准确的“蓟门里医院”。用户提交的搜索关键词经预处理器122预处理后,将更为有效的关键词,并提供给搜索处理器121,以便在信息存储器101以及可信网站存储器110中进行更为有效的检索。
如图1所示,搜索服务器还包括结果处理器130。结果处理器130处理来自搜索处理器121的搜索结果并呈现给用户终端140,其中处理搜索结果包括在搜索结果为可信网站信息和新的网页信息时,以显著的方式处理网站信息。其中,以显著的方式处理所述网站信息的方式可以是在用户终端140上显示时,在诸如官网的可信网站的标题上加V或者其他可信标志;或者将页面进行分割,在分割线的上部显示可信网站信息,而在分割线的下部分显示其他搜索结果;或者是高亮显示可信网站信息等方式。
综上所述,根据本发明的搜索处理器基于可信网站存储器和搜索引擎,为用户提供可靠的可信网站信息搜索。而且,采用搜索结果处理器,将在可信网站存储器中搜索到的可靠的可信网站信息以有别于在信息存储器中搜索到的网页信息的方式显示为用户提供了显著且可靠的可信网站信息。
图2示出了根据本发明一个实施例的搜索方法的流程图。该搜索方法适于在图1所示的搜索服务器中运行,该方法始于步骤S210,其中接收从用户终端提交的搜索关键词,优选地,在步骤S210中接收了搜索关键词之后,还可以对该搜索关键词进行预处理以生成对搜索处理器而言更准确的关键词,预处理包括剔除掉所述搜索关键词中诸如虚词“的”之类的常用词,和/或修改所述关键词中的明显错误。
随后在步骤S220,从信息存储器101中检索内容包括搜索关键词的网页信息,并从可信网站存储器110中检索网站名称与搜索关键词相对应的网站信息。一方面,基于用户从终端输入的搜索关键词以传统搜索方式对信息存储器101进行检索,以从信息存储器101中获取搜索结果列表。搜索结果列表包括一个或多个搜索结果项,每个搜索结果项为每条被搜索到的包括搜索关键词的网页信息,所述网页信息可以是key-value对,其中key是相应网页的URL地址,value是所述网页的排名score(用于搜索结果排名)。另一方面,可信网站存储器110中所存储的官网信息可以采用key-va lue对(关键字-值对)的方式进行存储,其中key(关键字)就是官网名称,va lue(值)就是和这个官网名称相对应的URL。可信站点处理器111在接收到所述搜索关键词时,在可信网站存储器110中检索是否有官网信息的key与搜索关键词相对应。可选地,这个步骤是通过搜索引擎的搜索处理器121完成的,或由搜索处理器121经由可信网站信息处理器111来完成的。
在接下来的步骤S230,判断是否返回网站信息;具体地,如果在可信网站存储器110中检索到存在有官网信息的key与搜索关键词相对应,则返回官网信息,即key为该关键词、va lue为URL的key-va lue对,否则返回指示不存在官网的消息。可选地,这个步骤是由可信网站信息处理器111来完成的。
若返回有网站信息,随后在步骤S240,从所述网页信息中删除与所述网站信息相对应的内容以获得新的网页信息,组合所述网站信息和所述新的网页信息生成最后的搜索结果提供给结果处理器130;例如,在从信息存储器101中所检索到的搜索结果列表中,某一搜索结果项的网页信息中的网页URL与从可信网站处理器111返回的可信网站信息中的网站URL相对应,则将搜索结果列表中的所述搜索结果项删除,并且将上述删除动作之后的新搜索结果列表(即新的网页信息)和所述可信网站信息一同作为最后的搜索结果。应当注意的是,上文提及的有关网页信息中的网页URL和可信网站信息中的网站URL相对应并不是指二者完全一致,而是指两个URL中的主机名称部分相同,或者主机名称中的根站点名称一致。可选地,这个步骤是由搜索处理器121完成的。
若未返回网站信息,直接将步骤S220得到的网页信息作为最后的搜索结果。
随后在步骤S250中,处理所述搜索结果并返回给用户终端,其中在所述搜索结果为所述网站信息和所述新的网页信息时,以显著的方式处理所述网站信息,优选地在所述网站信息的网站名称上添加可信标志,或将所述网站信息放置在所述新的网页信息之前并以高亮方式或分割线区分二者。可选地,这个步骤是由结果处理器130完成的。
可选地,根据本发明的搜索方法还包括采用可信网站信息处理器来处理经可信的方式获得的网站信息并将其存储在所述可信网站存储器中,其中所述经可信方式获得的网站信息至少包括从可信的网络站点导入的网站信息、手工输入的网站信息以及从对用户的搜索行为监控中获得的网站信息中的一个或者多个。
综上所述,经由本发明所述的搜索处理器及其方法,完美整合了可信网站存储器/可信网站信息处理器和现有搜索引擎,准确搜索到诸如官方网站的可信网站的信息,并以显著的方式呈现给用户,使得用户能够更加准确地获取可靠的搜索结果。
应当注意的是,在本发明的搜索服务器的各个部件中,根据其要实现的功能而对其中的部件进行了逻辑划分,但是,本发明不受限于此,可以根据需要对各个部件进行重新划分或者组合,例如,可以将一些部件组合为单个部件,或者可以将一些部件进一步分解为更多的子部件。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的搜索服务器中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (15)

1.一种搜索服务器,包括:
信息存储器,适于存储从接入互联网的各网站中收集的网页信息,所述网页信息至少包括网页的内容及其URL;
可信网站存储器,适于存储多个可信网站的网站信息,所述网站信息至少包括网站名称以及网站的网址;
搜索引擎,适于接收从用户终端提交的搜索关键词,从所述信息存储器中检索内容包括搜索关键词的网页信息,从所述可信网站存储器检索网站名称与搜索关键词相对应的网站信息,组合所检索到的网页信息和网站信息以获得搜索结果。
2.根据权利要求1所述的搜索服务器,还包括可信网站信息处理器,适于处理经可信的方式获得的网站信息并将其存储在所述可信网站存储器中。
3.根据权利要求2所述的搜索服务器,其中所述经可信方式获得的网站信息至少包括从可信的网络站点导入的网站信息、手工输入的网站信息以及从对用户的搜索行为监控中获得的网站信息中的一个或者多个。
4.根据权利要求3所述的搜索服务器,其中所述从对用户的搜索行为监控中获得的网站信息包括用户搜索中频繁点击的网站信息。
5.根据权利要求1-4中任一个所述的搜索服务器,所述搜索引擎包括搜索预处理器和搜索处理器;
所述搜索预处理器适于对所述搜索关键词进行预处理,所述预处理包括剔除掉所述搜索关键词中的常用词,和/或修改所述关键词中的明显错误,以生成有效关键词;
所述搜索处理器适于从所述信息存储器中检索内容包括有效关键词的网页信息,经由所述可信网站信息处理器从所述可信网站存储器检索网站名称与有效关键词相对应的网站信息,并组合所检索到的网页信息和网站信息以获得搜索结果。
6.根据权利要求5所述的搜索服务器,其中所述搜索处理器组合所检索到的网页信息和网站信息包括:
在所述可信网站信息处理器未返回所述网站信息时,所述搜索结果即为从所述信息存储器中检索到的所述网页信息;
在所述可信网站信息处理器返回所述网站信息时,从所述网页信息中删除与所述网站信息相对应的内容以获得新的网页信息,所述搜索结果为所述网站信息和所述新的网页信息。
7.根据权利要求1-6之任一所述的搜索服务器,其中所述搜索服务器还包括结果处理器,所述结果处理器适于处理来自所述搜索处理器的所述搜索结果并返回用户终端,其中处理所述搜索结果包括:
在所述搜索结果为所述网站信息和所述新的网页信息时,以显著的方式处理所述网站信息。
8.根据权利要求7所述的搜索服务器,其中,以显著的方式处理所述网站信息为在所述网站信息的网站名称上添加可信标志,或将所述网站信息放置在所述新的网页信息之前并以高亮方式或分割线区分二者。
9.一种搜索方法,在包括信息存储器和可信网站存储器的搜索服务器中运行,其中所述信息存储器适于存储从接入互联网的各网站中收集的网页信息,所述网页信息至少包括网页的内容及其URL;所述可信网站存储器适于存储多个可信网站的网站信息,所述网站信息至少包括网站名称以及网站的网址,所述方法包括如下步骤:
接收从用户终端提交的搜索关键词;
从所述信息存储器中检索内容包括搜索关键词的网页信息;
从所述可信网站存储器检索网站名称与搜索关键词相对应的网站信息;
组合所检索到的网页信息和网站信息以获得搜索结果。
10.根据权利要求9所述的搜索方法,还包括采用可信网站信息处理器来处理经可信的方式获得的网站信息并将其存储在所述可信网站存储器中。
11.根据权利要求10所述的搜索方法,其中所述经可信方式获得的网站信息至少包括从可信的网络站点导入的网站信息、手工输入的网站信息以及从对用户的搜索行为监控中获得的网站信息中的一个或者多个。
12.根据权利要求9-11之任一所述的搜索方法,还包括
对所述搜索关键词进行预处理,所述预处理包括剔除掉所述搜索关键词中的常用词,和/或修改所述关键词中的明显错误,以生成有效关键词;
从所述信息存储器中检索内容包括有效关键词的网页信息,经由所述可信网站信息处理器从所述可信网站存储器检索网站名称与有效关键词相对应的网站信息,并组合所检索到的网页信息和网站信息以获得搜索结果。
13.根据权利要求12所述的搜索方法,其中组合所检索到的网页信息和网站信息包括:
在所述可信网站信息处理器未返回所述网站信息时,所述搜索结果即为从所述信息存储器中检索到的所述网页信息;
在所述可信网站信息处理器返回所述网站信息时,从所述网页信息中删除与所述网站信息相对应的内容以获得新的网页信息,所述搜索结果为所述网站信息和所述新的网页信息。
14.根据权利要求9-13之任一所述的搜索方法,还包括处理来自所述搜索处理器的所述搜索结果并返回用户终端;
其中处理所述搜索结果包括:
在所述搜索结果为所述网站信息和所述新的网页信息时,以显著的方式处理所述网站信息。
15.根据权利要求14所述的搜索方法,其中,以显著的方式处理所述网站信息为在所述网站信息的网站名称上添加可信标志,或将所述网站信息放置在所述新的网页信息之前并以高亮方式或分割线区分二者。
CN2012103954722A 2012-10-17 2012-10-17 一种搜索服务器及搜索方法 Pending CN102937977A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2012103954722A CN102937977A (zh) 2012-10-17 2012-10-17 一种搜索服务器及搜索方法
PCT/CN2013/083925 WO2014059851A1 (zh) 2012-10-17 2013-09-22 一种搜索服务器及搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012103954722A CN102937977A (zh) 2012-10-17 2012-10-17 一种搜索服务器及搜索方法

Publications (1)

Publication Number Publication Date
CN102937977A true CN102937977A (zh) 2013-02-20

Family

ID=47696874

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012103954722A Pending CN102937977A (zh) 2012-10-17 2012-10-17 一种搜索服务器及搜索方法

Country Status (2)

Country Link
CN (1) CN102937977A (zh)
WO (1) WO2014059851A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294789A (zh) * 2013-05-21 2013-09-11 鸿富锦精密工业(深圳)有限公司 信息搜索系统及方法
CN103353900A (zh) * 2013-07-26 2013-10-16 北京奇虎科技有限公司 通过搜索栏访问认证网址的方法、装置及系统
WO2014059851A1 (zh) * 2012-10-17 2014-04-24 北京奇虎科技有限公司 一种搜索服务器及搜索方法
CN104572837A (zh) * 2014-12-10 2015-04-29 百度在线网络技术(北京)有限公司 在网页上提供认证信息的方法及装置
WO2015139500A1 (zh) * 2014-03-18 2015-09-24 北京奇虎科技有限公司 对网址进行分析、标示的方法和装置
CN108090059A (zh) * 2016-11-21 2018-05-29 百度在线网络技术(北京)有限公司 搜索方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059818A (zh) * 2007-06-26 2007-10-24 申屠浩 加强搜索引擎结果安全性的方法
CN101527721A (zh) * 2009-04-22 2009-09-09 中兴通讯股份有限公司 一种基于家庭网关的防病毒方法及相关装置
CN101957845A (zh) * 2010-09-17 2011-01-26 百度在线网络技术(北京)有限公司 一种在线应用系统及其实现方法
CN102375952A (zh) * 2011-10-31 2012-03-14 北龙中网(北京)科技有限责任公司 在搜索引擎结果中显示网站是否为可信验证的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1785895A3 (en) * 2005-11-01 2007-06-20 Lycos, Inc. Method and system for performing a search limited to trusted web sites
CN101827317A (zh) * 2009-09-07 2010-09-08 上海银贵网络科技服务有限公司 一种通过移动终端寻找目标对象的控制方法以及控制装置
CN102937977A (zh) * 2012-10-17 2013-02-20 北京奇虎科技有限公司 一种搜索服务器及搜索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059818A (zh) * 2007-06-26 2007-10-24 申屠浩 加强搜索引擎结果安全性的方法
CN101527721A (zh) * 2009-04-22 2009-09-09 中兴通讯股份有限公司 一种基于家庭网关的防病毒方法及相关装置
CN101957845A (zh) * 2010-09-17 2011-01-26 百度在线网络技术(北京)有限公司 一种在线应用系统及其实现方法
CN102375952A (zh) * 2011-10-31 2012-03-14 北龙中网(北京)科技有限责任公司 在搜索引擎结果中显示网站是否为可信验证的方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014059851A1 (zh) * 2012-10-17 2014-04-24 北京奇虎科技有限公司 一种搜索服务器及搜索方法
CN103294789A (zh) * 2013-05-21 2013-09-11 鸿富锦精密工业(深圳)有限公司 信息搜索系统及方法
CN103353900A (zh) * 2013-07-26 2013-10-16 北京奇虎科技有限公司 通过搜索栏访问认证网址的方法、装置及系统
WO2015139500A1 (zh) * 2014-03-18 2015-09-24 北京奇虎科技有限公司 对网址进行分析、标示的方法和装置
CN104572837A (zh) * 2014-12-10 2015-04-29 百度在线网络技术(北京)有限公司 在网页上提供认证信息的方法及装置
WO2016091002A1 (zh) * 2014-12-10 2016-06-16 百度在线网络技术(北京)有限公司 在网页上提供认证信息的方法及装置
CN104572837B (zh) * 2014-12-10 2019-07-26 百度在线网络技术(北京)有限公司 在网页上提供认证信息的方法及装置
US10686835B2 (en) 2014-12-10 2020-06-16 Baidu Online Network Technology (Beijing) Co., Ltd. Method and device for providing authentication information on web page
CN108090059A (zh) * 2016-11-21 2018-05-29 百度在线网络技术(北京)有限公司 搜索方法和装置

Also Published As

Publication number Publication date
WO2014059851A1 (zh) 2014-04-24

Similar Documents

Publication Publication Date Title
US8903800B2 (en) System and method for indexing food providers and use of the index in search engines
US10025855B2 (en) Federated community search
AU2009276354B2 (en) Providing posts to discussion threads in response to a search query
US8856168B2 (en) Contextual application recommendations
CN102761627B (zh) 基于终端访问统计的云网址推荐方法及系统及相关设备
US8977625B2 (en) Inference indexing
CN102855309B (zh) 一种基于用户行为关联分析的信息推荐方法及装置
KR20140014132A (ko) 컨텐츠 제공자-특이 url 키워드 검색 제공을 위한 방법 및 시스템
CN102937977A (zh) 一种搜索服务器及搜索方法
WO2014082492A1 (zh) 实现搜索的移动终端、服务器、系统和方法
EP2181405A1 (en) Automatic expanded language search
CN103186666A (zh) 基于收藏进行搜索的方法、装置与设备
CN103455758A (zh) 恶意网站的识别方法及装置
US20150058339A1 (en) Method for automating search engine optimization for websites
CN103685606A (zh) 关联域名的获取方法和系统以及网站管理员权限验证方法
CN102955802A (zh) 从数据报表中获取数据的方法和装置
KR20140037751A (ko) 컨텐츠 제공자-특이 url 키워드 검색 제공을 위한 방법 및 시스템
CN103530389A (zh) 一种提高停用词搜索有效性的方法和装置
CN103618742A (zh) 获取子域名的方法和系统以及网站管理员权限验证方法
US20150269268A1 (en) Search server and search method
CN102945253A (zh) 一种搜索服务器及搜索方法
CN103646034A (zh) 一种基于内容可信的Web搜索引擎系统及搜索方法
US9178848B1 (en) Identifying affiliated domains
CN104408156B (zh) 网站页面在搜索引擎中收录数量的检测方法和装置
KR101362090B1 (ko) 통합 데이터베이스를 이용한 검색 서비스 제공 방법 및 그 서버

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130220