CN102937974A - 一种搜索服务器及搜索方法 - Google Patents

一种搜索服务器及搜索方法 Download PDF

Info

Publication number
CN102937974A
CN102937974A CN2012103950007A CN201210395000A CN102937974A CN 102937974 A CN102937974 A CN 102937974A CN 2012103950007 A CN2012103950007 A CN 2012103950007A CN 201210395000 A CN201210395000 A CN 201210395000A CN 102937974 A CN102937974 A CN 102937974A
Authority
CN
China
Prior art keywords
score
search
information security
security degree
webpage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012103950007A
Other languages
English (en)
Inventor
张栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN2012103950007A priority Critical patent/CN102937974A/zh
Publication of CN102937974A publication Critical patent/CN102937974A/zh
Priority to PCT/CN2013/083929 priority patent/WO2014059852A1/zh
Priority to US14/436,335 priority patent/US20150269268A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6227Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/12Applying verification of the received information
    • H04L63/126Applying verification of the received information the source of the received data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • H04L63/1483Countermeasures against malicious traffic service impersonation, e.g. phishing, pharming or web spoofing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2119Authenticating web pages, e.g. with suspicious links

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种搜索服务器,该服务器包括信息安全度存储器和搜索后处理器,信息安全度存储器适于存储一个或者多个网页的信息安全度信息,至少包括网页的URL和该网页的信息安全度;搜索后处理器根据该搜索结果列表的每个搜索结果项中网页的URL从信息安全度存储器获取相应网页的信息安全度信息,根据网页的排序得分和信息安全度生成网页的新排序得分,并以新排序得分更新搜索结果列表中的相应搜索结果项中的排序得分以重新排序生成新搜索结果列表。本发明还公开了一种相应的搜索方法。

Description

一种搜索服务器及搜索方法
技术领域
本发明涉及网络搜索领域,尤其涉及一种考虑到网络内容的信息安全度的搜索服务器及相应的搜索方法。
背景技术
随着互联网的高速发展,各种企业、组织和个人等逐步了解到在互联网上提供信息服务的重要性而纷纷建立各自的网站来发布相应信息。随着在网络上提供网络信息服务的网站日益增多,互联网用户很难记住所有的这些网站甚至是想访问的网站的具体地址。与此同时,互联网所容纳的信息也在呈爆炸式增长,发展到今天,互联网上的各种内容,可谓是浩如烟海。在这种情况下,如何让互联网用户在最短的时间内找到自己想要的内容成为了当务之急。于是,有别于开始的发布各种消息的网站,一类专事搜索的网站、服务器应运而生。而基于互联网的搜索网站以及衍生出的各种搜索方式,也极大的推动了互联网的发展。目前,互联网用户在很大程度上都依赖于搜索网站来查询这些自己需要的内容。
一般而言,搜索网站利用搜索引擎来从互联网中提取各个网站的信息(以网页文字为主),建立起数据库。当用户在搜索网站上进行查询时,搜索引擎能检索与用户查询条件相匹配的记录。按照搜索结果与查询条件相匹配的程度,给出搜索结果中每条相应记录的排名得分score,按照排名得分score的高低来排序并返回给用户。
然而,随着互联网的快速发展,互联网上的信息呈爆炸式增长,各种不良和不正确的信息也越来越多。用户通过搜索网站进行查询时,经常会获得不正确、错误和恶意的信息。一些恶意人员故意构造带有木马、病毒等网页,利用搜索引擎的排名算法缺陷,使这些恶意网页在搜索结果中排名靠前。用户一旦通过搜索引擎搜索到这样的网页并选择浏览这些恶意网页,则很可能会因此使得用户的终端感染木马或者中毒并因此造成损失。另外一些恶意人员会构造类似于真实网站的虚假网站,并且利用搜索引擎的缺陷而在用户进行搜索时,在搜索结果中将虚假网站排名在真实网站之前,这样很可能引导用户前往这些虚假网站而使用户被虚假网站误导而遭受损失。
现有一些搜索引擎会在搜索结果中提醒用户相应的网页可能包含诸如木马、病毒的恶意内容,从而可以阻止用户访问这些网页。然而,现有的搜索引擎仅仅对恶意内容进行甄别,而没有对包含虚假内容的网页进行甄别,不能满足用户的真实需求。
因此,用户如何通过搜索引擎获得准确和安全的信息成为目前的重要挑战。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的搜索服务器和相应的搜索方法。
根据本发明的一个方面,提供了一种搜索服务器,该搜索服务器包括信息存储器、搜索处理器、信息安全度存储器和搜索后处理器。信息存储器,适于存储从接入互联网的各网站中收集的网页信息,其中网页信息至少包括网页的内容及其URL。搜索处理器,适于接收从用户终端提交的搜索关键词,从信息存储器中检索内容包括搜索关键词的各个网页,并生成包括一个或者多个搜索结果项的搜索结果列表,其中每个搜索结果项包括相应网页的URL及其排序得分R_score。信息安全度存储器,适于存储一个或者多个网页的信息安全度信息,每个网页的信息安全度信息至少包括网页的URL和网页的信息安全度IS_score。搜索后处理器,适于从搜索处理器获取搜索结果列表,根据搜索结果列表的每个搜索结果项中网页的URL从信息安全度存储器获取相应网页的信息安全度信息,根据网页的排序得分R_score和信息安全度IS_score生成网页的新排序得分NR_score,并以新排序得分NR_score更新搜索结果列表中的相应搜索结果项中的排序得分R_score以重新排序生成新搜索结果列表。
可选地,在根据本发明的搜索服务器中,根据下述来计算新排序得分:
NR_score=IS_score*x+R_score*(1-x),
其中x是信息安全度权重,在0-1之间,优选为0.7。
可选地,在根据本发明的搜索服务器中,其中当所获取的信息安全度IS_score小于一特定值时,所述搜索后处理器自动从搜索结果列表中删除与所述信息安全度IS_score对应的网页的搜索结果项。特别地,如果本发明所述的信息安全度IS_score取值在1-100之间,当上述所获取的信息安全度IS_score小于30时,所述搜索后处理器自动从搜索结果列表中删除与所述信息安全度IS_score对应的网页的搜索结果项。
可选地,在根据本发明的搜索服务器中,新搜索结果列表的搜索结果项还包括相应网页的信息安全度IS_score。
可选地,在根据本发明的搜索服务器中,如果当搜索后处理器未能从信息安全度存储器获得相应网页的信息安全度信息,则搜索后处理器不计算所述网页的新排序得分NR_score且不更新搜索结果列表中的相应搜索结果项中的排序得分R_score。
可选地,根据本发明的搜索服务器还包括结果处理器,其适于从搜索后处理器获取新搜索结果列表,生成搜索结果并呈现给用户终端;可选地,呈现给用户终端的搜索结果包括相应网页的信息安全度。
根据本发明的另一个方面,还提供一种相应的搜索方法,在包括信息存储器和信息安全度存储器的搜索服务器中运行,信息存储器适于存储从接入互联网的各网站中收集的网页信息,网页信息至少包括网页的内容及其URL,信息安全度存储器适于存储一个或者多个网页的信息安全度信息,每个网页的信息安全度信息至少包括网页的URL和网页的信息安全度IS_score。
该搜索方法包括如下步骤:接收从用户终端提交的搜索关键词;从信息存储器中检索内容中含有搜索关键词的各个网页,并生成包括一个或者多个搜索结果项的搜索结果列表,每个搜索结果项包括相应网页的URL及其排序得分R_score;根据搜索结果列表的每个搜索结果项中网页的URL从信息安全度存储器获取相应网页的信息安全度信息,并根据网页的排序得分R_score和信息安全度IS_score生成网页的新排序得分NR_score,并以新排序得分NR_score来更新搜索结果列表中的相应搜索结果项中的排序得分R_score以重新排序生成新搜索结果列表。
根据本发明的搜索服务器和搜索方法,为用户搜索并显示了表征相应网页内容安全且准确的信息安全度,使得用户能够直接得到更安全、更准确的搜索结果。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出具体实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为根据本发明一个实施例而提供的搜索服务器的结构示意图。
图2为根据本发明一个实施例而提供的搜索方法的流程图。
具体实施方式
本发明提供了一种为网络搜索结果提供信息安全度的搜索服务器和搜索方法,下面将结合附图详细说明如下。
参见图1,根据本发明一个实施例的搜索服务器包括信息收集/处理器100,信息存储器101,信息安全度存储器110,信息安全度处理器111,搜索处理器120,以及搜索后处理器121。用户通过用户终端140输入搜索关键词,经由本发明的搜索服务器,搜索并得到带有网页信息安全度的搜索结果,并通过用户终端140呈现给用户。在本发明中,用户终端可以是计算机终端,也可以是手机、能接入互联网的各种电子设备等。
信息收集/处理器100从接入互联网的各网站服务器1、2……N中收集网页信息(网页信息至少包括网页的内容及其URL,当然还可以根据需要包括其它内容,例如网页的类型,网页是否被嵌入了病毒、木马等)并将该信息存储入信息存储器101中。信息收集/处理器100从各网站服务器中收集网页信息的方式可以是传统的互联网信息搜索方法,譬如“蜘蛛”、“爬虫”等方式来获得,并且对所获得的网页进行处理,例如提取其中的主题词、关键词、URL、IP地址等等,并且将处理后的网页存储在信息存储器101中。
信息安全度存储器110,存储有一个或者多个网页的信息安全度信息,每个网页的信息安全度信息至少包括网页的URL及其信息安全度IS_score。信息安全度IS_score是对与URL相对应的内容是否安全且准确的综合评分,可以用1-100分的方式来表示;例如,如果某网页包含木马等恶意内容,则该网页的信息安全度IS_score为1;如果某网页具有各种潜在漏洞如XSS,SQL注入等漏洞,则其信息安全度IS_score可以根据漏洞的数量而设置在50-80之间;如果某个网页完全没有任何安全问题,则其信息安全度IS_score为100。信息安全度IS_score可以通过各种方式来设置,例如,一些安装在个人计算机上的网络安全设备会监控用户浏览的网页的安全情况,例如是否包含恶意链接,是否包含木马等等,并且为这些网页设置信息安全等级,信息安全度存储器可以从这样的网络安全设备获取网页的信息安全度。然而应当注意的是,本发明不受限于此,所有可以提供网页安全状况的方式都在本发明的保护范围之内,例如一些专门监控网络内容的网络安全设备等。
搜索处理器120接收用户通过终端提交的搜索关键词,并以传统方式对信息存储器101进行检索,以从信息存储器101中获取搜索结果列表,搜索结果列表包括一个或多个搜索结果项,每个搜索结果项为每条被搜索到的包括搜索关键词的网页信息,所述网页信息可以是key-value对(关键字-值对),其中key(关键字)是相应网页的URL,value(值)是所述网页的排名得分R_score(用于搜索结果排名)。
可选地,搜索处理器120还可以对搜索关键词进行预处理以生成对搜索处理器120而言更准确的关键词,并利用该关键词来在信息存储器101中进行检索。
搜索处理器120在完成搜索后,将搜索结果列表传递给搜索后处理器121。根据搜索结果列表的每个搜索结果项中网页的URL,搜索后处理器121经由信息安全度处理器111从信息安全度存储器110获取相应网页的信息安全度信息,并由信息安全度处理器111返回相应网页的信息安全度IS_score。然后,根据所述网页的排序得分R_score和信息安全度IS_score生成所述网页的新的排序得分NR_score。
一般而言,根据下述公式计算网页的新排序得分
NR_score=IS_score*x+R_score*(1-x),
其中x是信息安全度权重,在0-1之间,根据一个实施例,x值可以为0.7。
随后,以新排序得分NR_score更新搜索结果列表中的相应搜索结果项中的排序得分R_score以重新排序生成新搜索结果列表。
可选地,当所获取的信息安全度IS_score小于一特定值(例如小于30)时,搜索后处理器121自动从搜索结果列表中删除与信息安全度IS_score对应的网页的搜索结果项,由此不向用户提供信息安全度过低的搜索结果。
可选地,如果当搜索后处理器121未能从信息安全度存储器110获得某网页的信息安全度IS_score,则搜索后处理器121不计算网页的新排序得分NR_score且不更新搜索结果列表中的相应搜索结果项中的排序得分R_score。
如图1所述,搜索服务器还包括结果处理器130。所述结果处理器130接收来自搜索后处理器121的搜索结果列表生成搜索结果并呈现给用户终端。优选地,在呈现给用户终端的搜索结果包括相应网页的信息安全度,即在按照新排序得分呈现各网页时,还以显著的方式呈现各网页的信息安全度IS_score。
图2示出了根据本发明一个实施例的搜索方法的流程图,该方法适于在图1所示的搜索服务器中运行,该搜索方法始于步骤S210,其中接收从用户终端提交的搜索关键词。可选地,在步骤S210中接收了搜索关键词之后,还可以对该搜索关键词进行预处理以生成对搜索处理器而言更准确的关键词。这例如包括删除搜索关键词中的一些虚词(例如,“的”),纠正一些错别字等。
随后在步骤S220中,从信息存储器中检索内容中含有步骤S210所接收的搜索关键词的各个网页,并生成包括一个或者多个搜索结果项的搜索结果列表,每个搜索结果项包括相应网页的URL及其排序得分R_score。可选地,这个步骤可以由搜索处理器来完成的。
随后,方法进入步骤S230,其中根据步骤S220中获得的搜索结果列表的每个搜索结果项中网页的URL从信息安全度存储器获取相应网页的信息安全度信息,并根据该网页的排序得分R_score和信息安全度IS_score生成网页的新排序得分NR_score,并以新排序得分NR_score来更新搜索结果列表中的相应搜索结果项中的排序得分R_score以重新排序生成新搜索结果列表。这个步骤可以由搜索后处理器121来完成。
一般而言,根据下述公式计算网页的新排序得分
NR_score=IS_score*x+R_score*(1-x),
其中x是信息安全度权重,在0-1之间,根据一个实施例,x值可以为0.7。
可选地,当所获取的信息安全度IS_score小于一特定值(例如小于30)时,在步骤S230中,自动从搜索结果列表中删除与信息安全度IS_score对应的网页的搜索结果项,由此不向用户提供信息安全度过低的搜索结果。
可选地,在步骤S230中,如果当未能获得某网页的信息安全度IS_score,则不计算网页的新排序得分NR_score且不更新搜索结果列表中的相应搜索结果项中的排序得分R_score。
随后,搜索方法进入步骤S240,处理新搜索结果列表并呈现给用户终端,可选地,此步骤可以由结果处理器130完成。
综上所述,根据本发明所述的搜索服务器和搜索方法,在确定搜索结果时引入了表征网络内容安全状况的信息安全度,为用户提供信息安全度更高的搜索内容排名,方便用户更容易地找到安全的网页。
应当注意的是,在本发明的搜索服务器的各个部件中,根据其要实现的功能而对其中的部件进行了逻辑划分,但是,本发明不受限于此,可以根据需要对各个部件进行重新划分或者组合,例如,可以将一些部件组合为单个部件,或者可以将一些部件进一步分解为更多的子部件。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的搜索服务器中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (15)

1.一种搜索服务器,包括
信息存储器,适于存储从接入互联网的各网站中收集的网页信息,所述网页信息至少包括网页的内容及其URL;
搜索处理器,适于接收从用户终端提交的搜索关键词,从所述信息存储器中检索内容包括搜索关键词的各个网页,并生成包括一个或者多个搜索结果项的搜索结果列表,每个搜索结果项包括相应网页的URL及其排序得分R_score;
信息安全度存储器,适于存储一个或者多个网页的信息安全度信息,每个网页的信息安全度信息至少包括网页的URL和所述网页的信息安全度IS_score;
搜索后处理器,适于从搜索处理器获取所述搜索结果列表,根据所述搜索结果列表的每个搜索结果项中网页的URL从信息安全度存储器获取相应网页的信息安全度信息,根据所述网页的排序得分R_score和信息安全度IS_score生成所述网页的新排序得分NR_score,并以所述新排序得分NR_score更新所述搜索结果列表中的相应搜索结果项中的排序得分R_score以重新排序生成新搜索结果列表。
2.根据利要求1所述的搜索服务器,其中所述新排序得分
NR_score=IS_score*x+R_score*(1-x),
其中x是信息安全度权重,在0-1之间。
3.根据权利要求2所述的搜索服务器,其特征在于:所述信息安全度权重x=0.7。
4.根据权利要求1-3中任一个所述的搜索服务器,其中
当所获取的信息安全度IS_score小于一特定值时,所述搜索后处理器自动从搜索结果列表中删除与所述信息安全度IS_score对应的网页的搜索结果项。
5.根据权利要求4所述的搜索处理器,其中
所述信息安全度IS_score在1-100之间;且
当所获取的信息安全度IS_score小于30时,所述搜索后处理器自动从搜索结果列表中删除与所述信息安全度IS_score对应的网页的搜索结果项。
6.根据权利要求1-5中任一个所述的搜索服务器,其中所述新搜索结果列表的搜索结果项还包括相应网页的信息安全度IS_score。
7.根据权利要求1-6中任一个所述的搜索服务器,其中,
如果当所述搜索后处理器未能从所述信息安全度存储器获得相应网页的信息安全度信息,则所述搜索后处理器不计算所述网页的新排序得分NR_score且不更新所述搜索结果列表中的所述相应搜索结果项中的排序得分R_score。
8.根据权利要求1-7之任一所述的搜索服务器,还包括
结果处理器,适于从所述搜索后处理器获取新搜索结果列表,生成搜索结果并呈现给用户终端;优选地,呈现给用户终端的搜索结果包括相应网页的信息安全度。
9.一种搜索方法,在包括信息存储器和信息安全度存储器的搜索服务器中运行,所述信息存储器适于存储从接入互联网的各网站中收集的网页信息,所述网页信息至少包括网页的内容及其URL,所述信息安全度存储器适于存储一个或者多个网页的信息安全度信息,每个网页的信息安全度信息至少包括网页的URL和所述网页的信息安全度IS_score;所述方法包括如下步骤:
接收从用户终端提交的搜索关键词;
从所述信息存储器中检索内容包括搜索关键词的各个网页,并生成包括一个或者多个搜索结果项的搜索结果列表,每个搜索结果项包括相应网页的URL及其排序得分R_score;
根据所述搜索结果列表的每个搜索结果项中网页的URL从信息安全度存储器获取相应网页的信息安全度信息,并根据所述网页的排序得分R_score和信息安全度IS_score生成所述网页的新排序得分NR_score,并以所述新排序得分NR_score更新所述搜索结果列表中的相应搜索结果项中的排序得分R_score以重新排序生成新搜索结果列表。
10.根据利要求9所述的搜索方法,其中所述新排序得分
NR_score=IS_score*x+R_score*(1-x),
其中x是信息安全度权重,在0-1之间;其中x优选为0.7。
11.根据权利要求9或10所述的搜索方法,其中
当所获取的信息安全度IS_score小于一特定值时,所述搜索后处理器自动从搜索结果列表中删除与所述信息安全度IS_score对应的网页的搜索结果项。
12.根据权利要求11所述的搜索方法,其中
所述信息安全度IS_score在1-100之间;且
当所获取的信息安全度IS_score小于30时,所述搜索后处理器自动从搜索结果列表中删除与所述信息安全度IS_score对应的网页的搜索结果项。
13.根据权利要求9-12中任一个所述的搜索方法,其中所述新搜索结果列表的搜索结果项还包括相应网页的信息安全度IS_score。
14.根据权利要求9-13中任一个所述的搜索方法,其中,
如果未能从所述信息安全度存储器获得相应网页的信息安全度信息,则不计算所述网页的新排序得分NR_score且不更新所述搜索结果列表中的所述相应搜索结果项中的排序得分R_score。
15.根据权利要求9-14中任一所述的搜索方法,还包括
获取新搜索结果列表,生成搜索结果并呈现给用户终端;优选地,呈现给用户终端的搜索结果包括相应网页的信息安全度。
CN2012103950007A 2012-10-17 2012-10-17 一种搜索服务器及搜索方法 Pending CN102937974A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN2012103950007A CN102937974A (zh) 2012-10-17 2012-10-17 一种搜索服务器及搜索方法
PCT/CN2013/083929 WO2014059852A1 (zh) 2012-10-17 2013-09-22 一种搜索服务器及搜索方法
US14/436,335 US20150269268A1 (en) 2012-10-17 2013-09-22 Search server and search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012103950007A CN102937974A (zh) 2012-10-17 2012-10-17 一种搜索服务器及搜索方法

Publications (1)

Publication Number Publication Date
CN102937974A true CN102937974A (zh) 2013-02-20

Family

ID=47696871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012103950007A Pending CN102937974A (zh) 2012-10-17 2012-10-17 一种搜索服务器及搜索方法

Country Status (3)

Country Link
US (1) US20150269268A1 (zh)
CN (1) CN102937974A (zh)
WO (1) WO2014059852A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014059852A1 (zh) * 2012-10-17 2014-04-24 北京奇虎科技有限公司 一种搜索服务器及搜索方法
CN103810268A (zh) * 2014-01-27 2014-05-21 北京奇虎科技有限公司 加载搜索结果推荐信息、网址检测的方法、装置和系统
CN109361707A (zh) * 2018-12-13 2019-02-19 北京知道创宇信息技术有限公司 一种批量查询方法、装置、服务器及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11023610B2 (en) * 2019-01-23 2021-06-01 Upguard, Inc. Data breach detection and mitigation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030046098A1 (en) * 2001-09-06 2003-03-06 Seong-Gon Kim Apparatus and method that modifies the ranking of the search results by the number of votes cast by end-users and advertisers
CN101059818A (zh) * 2007-06-26 2007-10-24 申屠浩 加强搜索引擎结果安全性的方法
CN101957845A (zh) * 2010-09-17 2011-01-26 百度在线网络技术(北京)有限公司 一种在线应用系统及其实现方法

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7398271B1 (en) * 2001-04-16 2008-07-08 Yahoo! Inc. Using network traffic logs for search enhancement
WO2005045698A2 (fr) * 2003-10-24 2005-05-19 Enrico Maim Procede mis en oeuvre dans un environnement informatique pour engendrer une vue courante a partir d’au moins un objet d’information source susceptible de varier
US7444327B2 (en) * 2004-01-09 2008-10-28 Microsoft Corporation System and method for automated optimization of search result relevance
GB2412189B (en) * 2004-03-16 2007-04-04 Netcraft Ltd Security component for use with an internet browser application and method and apparatus associated therewith
US7562304B2 (en) * 2005-05-03 2009-07-14 Mcafee, Inc. Indicating website reputations during website manipulation of user information
US8402012B1 (en) * 2005-11-14 2013-03-19 Nvidia Corporation System and method for determining risk of search engine results
US8825657B2 (en) * 2006-01-19 2014-09-02 Netseer, Inc. Systems and methods for creating, navigating, and searching informational web neighborhoods
ITBG20070012A1 (it) * 2007-02-13 2008-08-14 Web Lion Sas Metodo di ricerca e selezione di siti web
US8161040B2 (en) * 2007-04-30 2012-04-17 Piffany, Inc. Criteria-specific authority ranking
WO2009001138A1 (en) * 2007-06-28 2008-12-31 Taptu Ltd Search result ranking
US20100017392A1 (en) * 2008-07-18 2010-01-21 Jianwei Dian Intent match search engine
CN101661474B (zh) * 2008-08-26 2012-07-04 华为技术有限公司 一种搜索方法和系统
US8275766B2 (en) * 2009-01-06 2012-09-25 Tynt Multimedia Inc. Systems and methods for detecting network resource interaction and improved search result reporting
AU2011201043A1 (en) * 2010-03-11 2011-09-29 Mailguard Pty Ltd Web site analysis system and method
US8856545B2 (en) * 2010-07-15 2014-10-07 Stopthehacker Inc. Security level determination of websites
US8843501B2 (en) * 2011-02-18 2014-09-23 International Business Machines Corporation Typed relevance scores in an identity resolution system
US8954423B2 (en) * 2011-09-06 2015-02-10 Microsoft Technology Licensing, Llc Using reading levels in responding to requests
CN102289525B (zh) * 2011-09-27 2018-01-16 要宇轩 一种对搜索结果进行排序的方法及设备
CN102663077B (zh) * 2012-03-31 2014-03-12 福建师范大学 基于Hits算法的Web搜索结果安全性排序方法
US8751530B1 (en) * 2012-08-02 2014-06-10 Google Inc. Visual restrictions for image searches
CN102945253A (zh) * 2012-10-17 2013-02-27 北京奇虎科技有限公司 一种搜索服务器及搜索方法
CN102937974A (zh) * 2012-10-17 2013-02-20 北京奇虎科技有限公司 一种搜索服务器及搜索方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030046098A1 (en) * 2001-09-06 2003-03-06 Seong-Gon Kim Apparatus and method that modifies the ranking of the search results by the number of votes cast by end-users and advertisers
CN101059818A (zh) * 2007-06-26 2007-10-24 申屠浩 加强搜索引擎结果安全性的方法
CN101957845A (zh) * 2010-09-17 2011-01-26 百度在线网络技术(北京)有限公司 一种在线应用系统及其实现方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014059852A1 (zh) * 2012-10-17 2014-04-24 北京奇虎科技有限公司 一种搜索服务器及搜索方法
CN103810268A (zh) * 2014-01-27 2014-05-21 北京奇虎科技有限公司 加载搜索结果推荐信息、网址检测的方法、装置和系统
CN103810268B (zh) * 2014-01-27 2017-04-12 北京奇虎科技有限公司 加载搜索结果推荐信息、网址检测的方法、装置和系统
CN109361707A (zh) * 2018-12-13 2019-02-19 北京知道创宇信息技术有限公司 一种批量查询方法、装置、服务器及存储介质
CN109361707B (zh) * 2018-12-13 2021-07-13 北京知道创宇信息技术股份有限公司 一种批量查询方法、装置、服务器及存储介质

Also Published As

Publication number Publication date
US20150269268A1 (en) 2015-09-24
WO2014059852A1 (zh) 2014-04-24

Similar Documents

Publication Publication Date Title
US10216848B2 (en) Method and system for recommending cloud websites based on terminal access statistics
CN108804532B (zh) 一种查询意图的挖掘和查询意图的识别方法、装置
US20240143679A1 (en) Search result filters from resource content
US8402021B2 (en) Providing posts to discussion threads in response to a search query
US8332393B2 (en) Search session with refinement
US20130282709A1 (en) Method and system for query suggestion
US10025855B2 (en) Federated community search
US8631097B1 (en) Methods and systems for finding a mobile and non-mobile page pair
WO2011011063A2 (en) Method and system for document indexing and data querying
US20160292207A1 (en) Resolving outdated items within curated content
CN108768982B (zh) 钓鱼网站的检测方法、装置、计算设备及计算机存储介质
WO2016209402A1 (en) Utilizing user co-search behavior to identify search queries seeking inappropriate content
CN102937977A (zh) 一种搜索服务器及搜索方法
CN102937974A (zh) 一种搜索服务器及搜索方法
CN103870573A (zh) 对网址进行分析的方法和装置
CN106611029B (zh) 提高网站站内搜索效率的方法和装置
EP3226149A1 (en) Method and device for providing website authentication data for search engine
CN102945253A (zh) 一种搜索服务器及搜索方法
CN108228793A (zh) 数据的获取方法、装置及终端应用
CN103618742A (zh) 获取子域名的方法和系统以及网站管理员权限验证方法
US11080342B2 (en) Method and apparatus for web page content categorization
CN106611022A (zh) 提高网站站内搜索效率的方法和装置
CN105183749A (zh) 一种爬取推广内容并供搜索使用的方法和装置
CN110825976B (zh) 网站页面的检测方法、装置、电子设备及介质
KR101223987B1 (ko) 동적 온톨로지를 이용한 관련어 제공 방법 및 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130220