CN1971555A - 检测和过滤网络搜索引擎返回结果中包含的指向恶意网页的链接的方法 - Google Patents
检测和过滤网络搜索引擎返回结果中包含的指向恶意网页的链接的方法 Download PDFInfo
- Publication number
- CN1971555A CN1971555A CN 200510086981 CN200510086981A CN1971555A CN 1971555 A CN1971555 A CN 1971555A CN 200510086981 CN200510086981 CN 200510086981 CN 200510086981 A CN200510086981 A CN 200510086981A CN 1971555 A CN1971555 A CN 1971555A
- Authority
- CN
- China
- Prior art keywords
- web pages
- malicious
- link
- search
- malicious web
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及一种检测和过滤网络搜索引擎返回结果中包含的指向恶意网页的链接的方法,可以在用户使用搜索引擎时,避免得到和/或者打开指向恶意网页的链接。所述方法通过在搜索引擎服务器端和/或者在搜索客户端分别分析、记录恶意网页的URL和恶意网页包含的恶意代码的类型,在用户使用搜索引擎得到搜索结果时,根据已得到的恶意网页的列表过滤搜索结果中包含的指向恶意网页的链接。
Description
技术领域
本发明涉及网络搜索引擎结果中包含的链接的安全性。具体来说,本发明涉及检测和过滤网络搜索引擎返回结果中包含的指向恶意网页的链接的方法。
背景技术
恶意网页是指那些包含恶意代码的网页,用户计算机打开恶意网页后,恶意代码就会执行,导致访问该网页的用户计算机的安全性和可用性受到损害。恶意网页可能导致的危害的具体表现形式有,下载并执行计算机木马程序或计算机病毒程序、非用户授权的情况下更改用户的浏览器或系统设置,强制用户计算机打开非用户订阅的广告,等等。
随着互联网的发展,越来越多的人开始通过计算机网络搜索引擎在互联网中定位自己需要的信息。常见的网络搜索引擎,例如Google.com,Yahoo.com都是通过网络爬虫获得Internet上的网页,然后由搜索引擎分析网页中的内容,确定并保存搜索条件和这些网页之间的索引关系。网络搜索用户向搜索引擎服务器提交搜索条件后,网络搜索引擎就根据事先分析的结果向网络搜索用户发送搜索结果,这个搜索结果包含和这个搜索条件相关的网页的URL集合的信息,这些URL集合一般是以链接的方式呈现给搜索用户。
传统的搜索引擎专注于提高搜索结果的准确性,它们返回的搜索结果中很可能包含指向恶意网页的链接。用户打开某个指向恶意网页的链接后,恶意网页就会下载到用户的计算机中,然后执行恶意代码,损害用户计算机的安全性和可用性,恶意网页就可以通过搜索引擎进行扩散和传播。
通过计算机病毒检测软件系统、反广告软件系统可以在恶意网页下载到客户端后检测和防止恶意代码的运行。但是,并不是每个用户都安装了计算机病毒检测软件系统、反广告软件系统。另一种解决方案是在用户通过搜索引擎定位到某个网页前,提醒用户这个网页中是否包含恶意代码,或者在搜索引擎返回搜索结果前过滤包含恶意代码的网页的链接,从而避免用户导航到恶意网页。
发明内容
因此,本发明的主要目标是提供一种技术方法,它能检测搜索引擎返回的搜索结果中包含的链接所指向的网页中是否包含恶意代码,通过过滤和/或者标示搜索结果包含的各个链接所指向网页中是否包含恶意代码的方式,提醒和/或者制止用户打开那些搜索结果包含的指向恶意网页的链接。
本发明的目标通过以下技术方案予以实现。
1网络搜索引擎通过网页爬虫或机器人获得网页内容后,利用计算机病毒检测程序和/或者网页安全性分析程序分析网页中包含的代码的是否包含恶意代码,并在存储子系统中记录网页中是否存在恶意代码,和/或者恶意代码的类型。
2在使用网络搜索引擎的搜索服务的计算机中安装计算机程序,监视用户打开某个网页后、该用户的计算机安全性是否受到影响,根据计算机实际受到的影响确定恶意代码的类型,并在存储子系统中,记录该网页中是否存在恶意代码,和/或者恶意代码的类型。
3上述1、2两种判断搜索引擎返回结果的链接是否指向恶意网页的方式,可以采用其中任何一种,也可以同时采用1、2两种方式。
4网络搜索引擎在向用户返回搜索结果之前,在存储子系统中查找搜索结果集合中包含的链接指向的网页中是否包含恶意代码和/或者恶意代码的类型。
5根据4中查找的结果,搜索引擎过滤和/或者标记搜索结果中指向恶意网页的链接。
本发明的有益效果是可以防止计算机用户通过搜索引擎导航到含有恶意代码的网页,避免恶意代码通过搜索引擎扩散和传播。
附图说明
图1是检测和过滤网络搜索引擎返回结果中包含的指向恶意网页的链接的方法的实施的图示。
具体实施方式
下面对本发明的详细描述参考了附图1。详细描述不对本发明做出限制。
在一种本发明具体实施中,包括如下4个子系统:网络搜索服务器端恶意网页检测子系统,网络搜索客户端恶意网页检测子系统,恶意网页信息存储子系统,恶意网页信息检索子系统。
在搜索引擎的网络爬虫获得一个网页内容后,网络搜索服务器端恶意网页检测子系统,利用病毒检测程序和网页安全性分析程序分析该网页的内容,并把该网页的URL和病毒检测结果记录到恶意网页URL及恶意代码类型存储子系统中。网页安全性分析程序用于分析该网页中是否包含脚本代码,是否包含未取得签名的组件,等等。
网络搜索客户端恶意网页检测子系统,作为计算机程序运行在使用搜索引擎的客户端计算机系统中,网络搜索客户端恶意网页检测子系统监视用户打开某个网页后,客户端计算机系统是否发生了恶意代码运行后的特定的表现情况,例如,操作系统的注册表被修改,WWW浏览器程序自动弹出窗口,等等。根据恶意代码类型和恶意代码表现形式的对应表,判断最近打开的网页中是否包含恶意代码,和/或者该恶意代码的类型,如果判断网页中包含恶意代码,则把该网页的URL和恶意代码类型记录到恶意网页信息存储子系统中。
需要说明的是,网络搜索客户端恶意网页检测子系统和网络搜索服务器端恶意网页检测子系统可以单独运行其中任何一种,也可以同时运行。
搜索引擎用户在客户端输入搜索条件后,搜索引擎检索符合用户输入的搜索条件的网页的URL,利用恶意网页信息检索子系统判断URL所指向的网页是否包含恶意代码和/或者恶意代码的类型。
对于恶意网页信息检索子系统判断为包含恶意代码的任何一个网页,搜索引擎可以采用多种方案屏蔽或向搜索用户提示那些指向恶意网页的链接。例如:从搜索结果集合中删除指向该网页的链接,用特殊的格式或者其他方法区别显示指向恶意网页的链接和指向不包含恶意代码的链接,等等。
搜索引擎可以允许搜索用户自己设置包含哪些类型的恶意代码的网页,可以作为和/或者不可以作为搜索引擎搜索的结果返回给用户。
搜索引擎可以允许搜索用户自己设置如何屏蔽或者标记包含恶意网页的链接。
最后,搜索引擎把经过恶意网页信息检索子系统检查后的搜索结果返回给搜索客户。
Claims (5)
1、一种检测和过滤网络搜索引擎返回结果中包含的指向恶意网页的链接的方法,其特征在于,网络搜索引擎通过在服务器端分析网页内容和/或者在搜索客户端计算机监测打开网页前后系统安全性变化的方式,获得恶意网页的URL和/或者恶意网页包含的恶意代码的类型并记录在存储系统中,在向用户返回搜索结果前,根据存储系统中记录的恶意网页的URL和/或者恶意网页包含的恶意代码的类型,检查和过滤搜索结果中是否包含指向恶意网页的链接。
2、根据权利要求1所述的检测和过滤网络搜索引擎返同结果中包含的指向恶意网页的链接的方法,其特征在于根据链接所指向的网页中是否包含恶意代码,判断网络搜索引擎的搜索集合中的链接是否指向恶意网页。
3、根据权利要求1所述的检测和过滤网络搜索引擎返同结果中包含的指向恶意网页的链接的方法,其特征在于根据链接是否指向的恶意网页,对网络搜索引擎的搜索集合中的链接进行过滤和/或者区别表示。
4、根据权利要求1所述的检测和过滤网络搜索引擎返回结果中包含的指向恶意网页的链接的方法,其特征在于判断某个网页是否是恶意网页的方式是,通过在服务器端事先分析网页内容的安全性和/或者在搜索客户端计算机监测打开网页后系统安全性变化情况,获得恶意网页的URL和/或者恶意网页包含的恶意代码的类型,并记录在计算机存储系统中。
5、根据权利要求1所述的检测和过滤网络搜索引擎返回结果中包含的指向恶意网页的链接的方法,其特征在检测搜索结果中包含的链接是否指向恶意网页的方式是,该链接的URL是否包含在计算机存储系统中记录的恶意网页URL集合中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200510086981 CN1971555A (zh) | 2005-11-24 | 2005-11-24 | 检测和过滤网络搜索引擎返回结果中包含的指向恶意网页的链接的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200510086981 CN1971555A (zh) | 2005-11-24 | 2005-11-24 | 检测和过滤网络搜索引擎返回结果中包含的指向恶意网页的链接的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1971555A true CN1971555A (zh) | 2007-05-30 |
Family
ID=38112381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200510086981 Pending CN1971555A (zh) | 2005-11-24 | 2005-11-24 | 检测和过滤网络搜索引擎返回结果中包含的指向恶意网页的链接的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1971555A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102043865A (zh) * | 2011-01-17 | 2011-05-04 | 博视联(苏州)信息科技有限公司 | 基于c/s架构的恶意网页过滤系统及其过滤方法 |
CN102236654A (zh) * | 2010-04-26 | 2011-11-09 | 广东开普互联信息科技有限公司 | 基于内容相关性的Web无效链接过滤方法 |
CN102346780A (zh) * | 2011-10-18 | 2012-02-08 | 北龙中网(北京)科技有限责任公司 | 网页地址的获取方法和获取装置 |
CN102664925A (zh) * | 2012-03-29 | 2012-09-12 | 奇智软件(北京)有限公司 | 一种展现搜索结果的方法及装置 |
CN102663052A (zh) * | 2012-03-29 | 2012-09-12 | 奇智软件(北京)有限公司 | 一种提供搜索引擎搜索结果的方法及装置 |
CN101884047B (zh) * | 2007-10-05 | 2013-07-24 | 谷歌公司 | 侵入软件管理 |
CN101656710B (zh) * | 2008-08-21 | 2013-07-24 | 北京神州绿盟信息安全科技股份有限公司 | 主动审计系统及方法 |
CN103631805A (zh) * | 2012-08-24 | 2014-03-12 | 腾讯科技(深圳)有限公司 | 一种搜索结果的显示方法和装置 |
CN106709353A (zh) * | 2016-10-27 | 2017-05-24 | 腾讯科技(深圳)有限公司 | 搜索引擎的安全性检测方法及装置 |
CN107623666A (zh) * | 2016-07-15 | 2018-01-23 | 阿里巴巴集团控股有限公司 | 信息搜索的方法、装置和系统 |
CN108959565A (zh) * | 2018-07-04 | 2018-12-07 | 广东小天才科技有限公司 | 一种网页内容过滤的方法、装置及服务器 |
-
2005
- 2005-11-24 CN CN 200510086981 patent/CN1971555A/zh active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101884047B (zh) * | 2007-10-05 | 2013-07-24 | 谷歌公司 | 侵入软件管理 |
CN101656710B (zh) * | 2008-08-21 | 2013-07-24 | 北京神州绿盟信息安全科技股份有限公司 | 主动审计系统及方法 |
CN102236654A (zh) * | 2010-04-26 | 2011-11-09 | 广东开普互联信息科技有限公司 | 基于内容相关性的Web无效链接过滤方法 |
CN102043865A (zh) * | 2011-01-17 | 2011-05-04 | 博视联(苏州)信息科技有限公司 | 基于c/s架构的恶意网页过滤系统及其过滤方法 |
CN102346780A (zh) * | 2011-10-18 | 2012-02-08 | 北龙中网(北京)科技有限责任公司 | 网页地址的获取方法和获取装置 |
CN102664925A (zh) * | 2012-03-29 | 2012-09-12 | 奇智软件(北京)有限公司 | 一种展现搜索结果的方法及装置 |
CN102663052A (zh) * | 2012-03-29 | 2012-09-12 | 奇智软件(北京)有限公司 | 一种提供搜索引擎搜索结果的方法及装置 |
CN102664925B (zh) * | 2012-03-29 | 2016-04-20 | 北京奇虎科技有限公司 | 一种展现搜索结果的方法及装置 |
CN105868290A (zh) * | 2012-03-29 | 2016-08-17 | 北京奇虎科技有限公司 | 一种展现搜索结果的方法及装置 |
CN102663052B (zh) * | 2012-03-29 | 2017-05-24 | 三六零科技股份有限公司 | 一种提供搜索引擎搜索结果的方法及装置 |
CN103631805A (zh) * | 2012-08-24 | 2014-03-12 | 腾讯科技(深圳)有限公司 | 一种搜索结果的显示方法和装置 |
CN107623666A (zh) * | 2016-07-15 | 2018-01-23 | 阿里巴巴集团控股有限公司 | 信息搜索的方法、装置和系统 |
CN106709353A (zh) * | 2016-10-27 | 2017-05-24 | 腾讯科技(深圳)有限公司 | 搜索引擎的安全性检测方法及装置 |
CN108959565A (zh) * | 2018-07-04 | 2018-12-07 | 广东小天才科技有限公司 | 一种网页内容过滤的方法、装置及服务器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1971555A (zh) | 检测和过滤网络搜索引擎返回结果中包含的指向恶意网页的链接的方法 | |
US7363282B2 (en) | Search system using user behavior data | |
US7590619B2 (en) | Search system using user behavior data | |
US7702671B2 (en) | Systems and methods for discovery of data that needs improving or authored using user search results diagnostics | |
CN101490685A (zh) | 提高浏览网页的用户机的安全等级的方法 | |
CN101350822B (zh) | 一种Internet恶意代码的发现和追踪方法 | |
CN106095979B (zh) | Url合并处理方法和装置 | |
US20060259867A1 (en) | System and method for automatic generation of browsing favorites | |
CN102663052B (zh) | 一种提供搜索引擎搜索结果的方法及装置 | |
KR100968126B1 (ko) | 웹쉘 탐지 시스템 및 웹쉘 탐지 방법 | |
GB2505410A (en) | Display of hypertext documents grouped according to their affinity | |
CN106022132A (zh) | 一种基于动态内容分析的网页木马实时检测方法 | |
US20160103913A1 (en) | Method and system for calculating a degree of linkage for webpages | |
US20090089415A1 (en) | System and method for keyboard navigation in a search results page | |
US20150302090A1 (en) | Method and System for the Structural Analysis of Websites | |
CN103455758A (zh) | 恶意网站的识别方法及装置 | |
US20030131319A1 (en) | Lexicon-based new idea detector | |
WO2020211130A1 (zh) | 一种网站暗链检测方法和装置 | |
US8521746B1 (en) | Detection of bounce pad sites | |
WO2012135690A1 (en) | Systems and methods for invisible area detection and contextualization | |
WO2012129102A2 (en) | Detection and analysis of backlink activity | |
CN104468459A (zh) | 一种漏洞检测方法及装置 | |
CN107566371B (zh) | 一种面向海量日志的WebShell挖掘方法 | |
CN105930385A (zh) | 一种数据爬取方法及系统 | |
Patil et al. | Web browser analysis for detecting user activities |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |