CN101059818A - 加强搜索引擎结果安全性的方法 - Google Patents
加强搜索引擎结果安全性的方法 Download PDFInfo
- Publication number
- CN101059818A CN101059818A CNA2007101234707A CN200710123470A CN101059818A CN 101059818 A CN101059818 A CN 101059818A CN A2007101234707 A CNA2007101234707 A CN A2007101234707A CN 200710123470 A CN200710123470 A CN 200710123470A CN 101059818 A CN101059818 A CN 101059818A
- Authority
- CN
- China
- Prior art keywords
- safety
- website
- information
- search engine
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明为加强搜索引擎结果安全性的方法。该方法先对搜索引擎收录的网页做基本的安全评级;再根据事先采集的安全网站、恶意网站这两类黑白名单信息,对搜索结果做一个综合的安全评级;然后在结果展示中引入一个安全指数,并根据安全指数的级别对不同结果项做一些不同的处理,从而让用户能清楚的区分不同结果的风险程度。该方法在日益复杂的互联网环境中对提高搜索引擎的安全性具有十分重大的意义,可以有效的降低用户通过搜索引擎进入恶意网站的风险,尤其是对预防用户经济损失风险方面做了出色的设计。
Description
技术领域:
本发明涉及搜索引擎技术,特别是关于加强搜索引擎结果安全性的方法
背景技术:
随着互联网应用的扩展,搜索引擎技术的发展,搜索引擎已经成为继电子邮箱之后的使用最广泛的互联网应用。随着互联网环境的复杂化,用户群体的大众化,搜索引擎在给使用者带来极大便利的同时,也将用户暴露在存在安全性风险(如诈骗、钓鱼、间谍软件、病毒、恶意插件等)的危险站点之中。
在上述的安全性风险中,比较突出的几种情况的有:
一、通过搜索引擎引导用户登陆钓鱼网站,盗取用户信息,尤其是与经济利益有关的帐户、密码之类。比如不法分子通过仿制一个银行、证券、网游之类的网站,然后通过搜索引擎优化等手段使该网站出现在搜索引擎结果的靠前位置,如果用户通过此搜索结果项进入该网站,输入用户、密码就会被不法分子获取,造成经济损失
二、通过搜索引擎引导用户登陆恶意网站,将木马、病毒、恶意插件等下载到受害者电脑,然后通过该软件获取非法利益或破坏。
三、通过搜索引擎引导用户登陆诈骗网站,然后使用各种手段迷惑、引诱用户,以期达到诈骗目的。
本发明的目的就是提供一个简单有效的方法来杜绝或降低搜索引擎用户的安全性风险。
发明内容:
本发明的主要目的是针对当前搜索引擎结果中存在许多安全风险,而普通用户又无法识别区分这个问题,采用一系列简单有效的方法,使用户能够很好的辨别搜索结果安全与否,从而杜绝或降低接触风险的可能。
本发明的具体要点如下:
一、对搜索结果项作安全性分级,据此在结果展现中引入新元素:安全指数。结果分级的依据是系统后台收集的各类数据集合,比如黑白名单、网页安全等级、网站声誉、历史记录、用户反馈、权威资料、第三方评定等;数据的主要采集方法有:人工采集、程序运算、第三方提供等途径。
二、对银行、金融机构、重要企业、常用网站等意义非凡或影响重大的网站,可通过特殊认证手段(比如人工采集验证)保证网站的真实性,然后在安全指数及结果项展现形式中明确的体现出来,让用户能够很清楚的辨别出真伪,从而避免安全风险。
三、对不同等级的搜索结果,在展现形式、点击行为等方面做特殊处理。
四、增加将搜索结果按安全级别排序、过滤等功能。
五、通过用户反馈的信息,充实搜索结果分级的依赖信息。
本发明在搜索引擎系统中应用的流程步骤:
1、采集安全评级依赖数据,计算网页安全等级
2、正常搜索过程,同时获取结果项安全信息
3、根据结果项的安全等级及相关信息组织结果展现形式
附图说明:
图1为应用了本方法的搜索引擎返回结果页的Demo效果图
具体实施方式:
本发明在大型网页搜索引擎中的应用
目前搜索引擎是使用最广泛的互联网服务之一,早期该服务的关键指标是查全率和查准率,从技术角度看,这主要由收录的网页数量和返回结果的相关性来决定。但互联网的开放自由特性带来了新问题,在搜索结果中,很多结果可能指向存在安全性风险的网站。基于这个问题,我们设计了增强搜索引擎结果安全性的系统,本系统是在搜索引擎系统基础上引入强化搜索安全的元素与方法。此处的搜索引擎系统没有特指性,既可以是类似google、yahoo、百度等提供的网页搜索服务系统,也可以是企业搜索系统,或者是新兴的垂直搜索系统。但在本应用例子中以大型网页搜索引擎为参照。
本发明与现有网页搜索系统的具体结合实施步骤如下:
1、人工采集重要网站信息(名称、域名、简介等)。采集方法可以有电话验证、查阅权威资料、登记验证等。比如:招商银行的网站名称为“招商银行——一网通主站”,经查验,其域名为www.cmbchina.com,根据网站的实际内容,编写网站摘要信息如下:
“招商银行官方网站,通过XX人工安全认证。提供网上申请信用卡,手机银行,掌上银行,银证通业务,自有安全客户端软件提供给个人和企业客户查询银行帐户。”
其中XX可以是提供搜索服务的公司名称或者另行命名。
将上述网站信息以域名字段为索引存储,存储方式根据改搜索引擎具体情况自定。比如可放在服务器内存、通用数据库、专用存储系统等。
2、组织系统黑名单。首先,将恶意网站分成以下类别:
a、钓鱼网站:以假冒某网站方式盗取用户帐户、密码等信息的网站。
b、木马网站:在网站中放置木马,病毒的网站。
c、流氓网站:未经用户许可私自改变用户电脑状态的网站,比如安装流氓插件。
d、虚假网站:仿冒、提供虚假信息、有欺诈行为的网站。
e、其它:其它存在安全风险的网站。
其次,根据上述分类导入恶意网站,此信息的主要来源有:
a、历史记录:以往运营过程中自主发现的恶意网站。
b、用户反馈:通过举报网页、邮箱、论坛、电话等途径得到的信息。
c、第三方:从其它合作方获取的信息。
然后,也将上述信息以域名字段为索引存储。
3、网页自动分级。在搜索引擎后台系统的网页分析过程中,根据网页的类型、内容、脚本使用情况等,给每个网页赋予一个0~100的基本安全等级值,0为最不安全,100为最安全;具体评分方法自定。然后将此字段信息存储到搜索引擎索引系统中。
4、检索强化。在实际搜索的后台检索处理过程中,除了获取搜索引擎的常规信息外,同时要取网页安全等级这个新字段。然后根据此字段对搜索结果做安全分级,形成安全指数值。比如本例中,将0~30等级的网页赋予安全指数“低”,31~80等级的为“中”,“81~100”等级的为高。
5、安全过滤。以结果项的域名为关键字依次检索1、2中形成的黑白名单数据。如果它出现在1的白名单集合中,则将安全指数设为“高”,并在结果信息中附加一个通过最高基本认证的信息;如果此结果项是网站首页,将网页摘要信息替换成对应网站的人工编写的摘要。如果它出现在2的黑名单中,则将安全指数设为“低”,并且结果信息中附加一个通过危险认证的信息。
6、结果展示优化。在搜索结果展示页中引入安全指数这个新元素,并根据安全指数的不同等级,对结果使用不同的展现方法,让用户能清楚的认识到不同结果的风险大小,可根据自己的情况选择是否打开相应结果指向的网页。
比如,在图1所示的例子中:使用安全指数(高、中、低)来标识结果项对于网页的安全等级。对于通过最高级别安全认证的结果项,以淡蓝背景色显示,而此类结果的网站首页,在摘要中显示人工编辑的介绍内容。对于第二项这样的“黑名单”网站,会在用户点击后提示安全风险,让用户选择是否进入该网站。
其它说明:
1、在实际应用中,步骤5的操作可以整合到搜索引擎建索引的过程中,加快检索的速度。
2、在搜索结果设置中,用户可以选择将搜索结果按安全等级排序或按一定的级别过滤
3、在结果项中可以设计一个用户评价元素,方便用户反馈信息,提高搜索结果质量。
Claims (10)
1.一种降低搜索结果风险的方法,其特征在于,至少部分搜索结果带有指示该结果安全性的信息。
2.根据权利要求1所述的方法,其特征在于,所述信息将所述安全性分为不同的等级。
3.根据权利要求2所述的方法,其特征在于,所述等级是根据系统后台收集的各类数据集合确定的。
4.根据权利要求3所述的方法,其特征在于,所述数据集合为至少下述数据种类之一:黑白名单、网页安全等级、网站声誉、历史记录、用户反馈、权威资料、第三方评定。
5.根据权利要求2所述的方法,其特征在于,根据实际需要,对于特定的网站,所述等级是通过人工认证的方式确定的。
6.根据权利要求1至5中任意一项所述的方法,其特征在于,所述安全性的信息在搜索结果中以明确的方式展现出来,使用户能够清楚地识别所述结果的安全性。
7.根据权利要求2所述的方法,其特征在于,根据所述等级的不同,对所述搜索结果在展现形式和/或点击行为上进行不同的处理。
8.根据权利要求7所述的方法,其特征在于,所述展现形式为引入“安全指数”信息、对结果项信息的内容、字体、颜色、背景做优化处理。
9.根据权利要求7所述的方法,其特征在于,所述点击行为为对存在重大安全风险的点击做安全确认提示。
10.根据权利要求2至9中任意一项所述的方法,其特征在于,根据所述等级,将所述搜索结果进行排序和/或过滤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007101234707A CN101059818A (zh) | 2007-06-26 | 2007-06-26 | 加强搜索引擎结果安全性的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007101234707A CN101059818A (zh) | 2007-06-26 | 2007-06-26 | 加强搜索引擎结果安全性的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101059818A true CN101059818A (zh) | 2007-10-24 |
Family
ID=38865921
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2007101234707A Pending CN101059818A (zh) | 2007-06-26 | 2007-06-26 | 加强搜索引擎结果安全性的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101059818A (zh) |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010081356A1 (zh) * | 2009-01-14 | 2010-07-22 | 华为技术有限公司 | 一种搜索的方法和服务器 |
CN101834846A (zh) * | 2010-03-30 | 2010-09-15 | 王兴强 | 一种未成年人健康网站认证系统及其认证方法 |
CN102289525A (zh) * | 2011-09-27 | 2011-12-21 | 要宇轩 | 一种对搜索结果进行排序的方法及设备 |
CN102301373A (zh) * | 2009-01-29 | 2011-12-28 | 微软公司 | 对网络资源的基于健康状况的访问 |
CN102375952A (zh) * | 2011-10-31 | 2012-03-14 | 北龙中网(北京)科技有限责任公司 | 在搜索引擎结果中显示网站是否为可信验证的方法 |
CN102385583A (zh) * | 2010-08-31 | 2012-03-21 | 腾讯科技(深圳)有限公司 | 一种控制浏览器打开窗口的方法及网页浏览器 |
CN102402620A (zh) * | 2011-12-26 | 2012-04-04 | 余姚市供电局 | 一种恶意网页防御方法和系统 |
CN102447688A (zh) * | 2010-10-15 | 2012-05-09 | 盛绩信息技术(上海)有限公司 | 网页游戏资源加速器及加速方法 |
CN102467633A (zh) * | 2010-11-19 | 2012-05-23 | 奇智软件(北京)有限公司 | 一种安全浏览网页的方法及其系统 |
CN101500000B (zh) * | 2008-01-30 | 2012-08-08 | 珠海金山软件有限公司 | 互联网网站的安全评估方法及其装置 |
CN102682011A (zh) * | 2011-03-14 | 2012-09-19 | 腾讯科技(深圳)有限公司 | 建立域名描述名称信息表、搜索的方法、装置及系统 |
CN102693384A (zh) * | 2012-05-22 | 2012-09-26 | 清华大学 | 一种浏览器安全自调适方法及装置 |
CN102902722A (zh) * | 2012-09-04 | 2013-01-30 | 北京奇虎科技有限公司 | 一种信息安全性的处理方法和系统 |
CN102937977A (zh) * | 2012-10-17 | 2013-02-20 | 北京奇虎科技有限公司 | 一种搜索服务器及搜索方法 |
CN102937974A (zh) * | 2012-10-17 | 2013-02-20 | 北京奇虎科技有限公司 | 一种搜索服务器及搜索方法 |
CN102945253A (zh) * | 2012-10-17 | 2013-02-27 | 北京奇虎科技有限公司 | 一种搜索服务器及搜索方法 |
CN103092832A (zh) * | 2011-10-27 | 2013-05-08 | 腾讯科技(深圳)有限公司 | 网址风险检测的处理方法及装置 |
CN103631805A (zh) * | 2012-08-24 | 2014-03-12 | 腾讯科技(深圳)有限公司 | 一种搜索结果的显示方法和装置 |
CN103870554A (zh) * | 2009-12-11 | 2014-06-18 | 北京奇虎科技有限公司 | 一种实现浏览器地址栏铭牌的方法 |
CN104090916A (zh) * | 2014-06-12 | 2014-10-08 | 贝壳网际(北京)安全技术有限公司 | 一种危险网页处理方法及装置 |
CN104428787A (zh) * | 2012-07-06 | 2015-03-18 | 微软公司 | 提供一致的安全信息 |
CN104715055A (zh) * | 2015-03-30 | 2015-06-17 | 北京奇虎科技有限公司 | 一种搜索结果中的电话号码处理方法和装置 |
CN105718533A (zh) * | 2016-01-15 | 2016-06-29 | 百度在线网络技术(北京)有限公司 | 信息推送方法和装置 |
CN105868290A (zh) * | 2012-03-29 | 2016-08-17 | 北京奇虎科技有限公司 | 一种展现搜索结果的方法及装置 |
CN106227888A (zh) * | 2016-08-15 | 2016-12-14 | 马岩 | 安全等级在大数据抓取中的应用方法及系统 |
CN106326373A (zh) * | 2016-08-15 | 2017-01-11 | 马岩 | 可信视频在大数据中的抓取方法及系统 |
-
2007
- 2007-06-26 CN CNA2007101234707A patent/CN101059818A/zh active Pending
Cited By (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101500000B (zh) * | 2008-01-30 | 2012-08-08 | 珠海金山软件有限公司 | 互联网网站的安全评估方法及其装置 |
WO2010081356A1 (zh) * | 2009-01-14 | 2010-07-22 | 华为技术有限公司 | 一种搜索的方法和服务器 |
US8561182B2 (en) | 2009-01-29 | 2013-10-15 | Microsoft Corporation | Health-based access to network resources |
CN102301373A (zh) * | 2009-01-29 | 2011-12-28 | 微软公司 | 对网络资源的基于健康状况的访问 |
CN103870554A (zh) * | 2009-12-11 | 2014-06-18 | 北京奇虎科技有限公司 | 一种实现浏览器地址栏铭牌的方法 |
CN101834846B (zh) * | 2010-03-30 | 2012-10-17 | 王兴强 | 一种未成年人健康网站认证系统及其认证方法 |
CN101834846A (zh) * | 2010-03-30 | 2010-09-15 | 王兴强 | 一种未成年人健康网站认证系统及其认证方法 |
CN102385583B (zh) * | 2010-08-31 | 2016-01-20 | 腾讯科技(深圳)有限公司 | 一种控制浏览器打开窗口的方法及网页浏览器 |
CN102385583A (zh) * | 2010-08-31 | 2012-03-21 | 腾讯科技(深圳)有限公司 | 一种控制浏览器打开窗口的方法及网页浏览器 |
CN102447688A (zh) * | 2010-10-15 | 2012-05-09 | 盛绩信息技术(上海)有限公司 | 网页游戏资源加速器及加速方法 |
CN102467633A (zh) * | 2010-11-19 | 2012-05-23 | 奇智软件(北京)有限公司 | 一种安全浏览网页的方法及其系统 |
CN102682011A (zh) * | 2011-03-14 | 2012-09-19 | 腾讯科技(深圳)有限公司 | 建立域名描述名称信息表、搜索的方法、装置及系统 |
CN102289525B (zh) * | 2011-09-27 | 2018-01-16 | 要宇轩 | 一种对搜索结果进行排序的方法及设备 |
CN102289525A (zh) * | 2011-09-27 | 2011-12-21 | 要宇轩 | 一种对搜索结果进行排序的方法及设备 |
CN103092832A (zh) * | 2011-10-27 | 2013-05-08 | 腾讯科技(深圳)有限公司 | 网址风险检测的处理方法及装置 |
CN102375952A (zh) * | 2011-10-31 | 2012-03-14 | 北龙中网(北京)科技有限责任公司 | 在搜索引擎结果中显示网站是否为可信验证的方法 |
CN102402620A (zh) * | 2011-12-26 | 2012-04-04 | 余姚市供电局 | 一种恶意网页防御方法和系统 |
CN105868290A (zh) * | 2012-03-29 | 2016-08-17 | 北京奇虎科技有限公司 | 一种展现搜索结果的方法及装置 |
CN102693384A (zh) * | 2012-05-22 | 2012-09-26 | 清华大学 | 一种浏览器安全自调适方法及装置 |
CN104428787B (zh) * | 2012-07-06 | 2017-09-22 | 微软技术许可有限责任公司 | 用于提供一致的安全信息的方法和系统 |
US9432401B2 (en) | 2012-07-06 | 2016-08-30 | Microsoft Technology Licensing, Llc | Providing consistent security information |
CN104428787A (zh) * | 2012-07-06 | 2015-03-18 | 微软公司 | 提供一致的安全信息 |
CN103631805A (zh) * | 2012-08-24 | 2014-03-12 | 腾讯科技(深圳)有限公司 | 一种搜索结果的显示方法和装置 |
CN102902722A (zh) * | 2012-09-04 | 2013-01-30 | 北京奇虎科技有限公司 | 一种信息安全性的处理方法和系统 |
CN102945253A (zh) * | 2012-10-17 | 2013-02-27 | 北京奇虎科技有限公司 | 一种搜索服务器及搜索方法 |
WO2014059852A1 (zh) * | 2012-10-17 | 2014-04-24 | 北京奇虎科技有限公司 | 一种搜索服务器及搜索方法 |
CN102937974A (zh) * | 2012-10-17 | 2013-02-20 | 北京奇虎科技有限公司 | 一种搜索服务器及搜索方法 |
CN102937977A (zh) * | 2012-10-17 | 2013-02-20 | 北京奇虎科技有限公司 | 一种搜索服务器及搜索方法 |
CN104090916A (zh) * | 2014-06-12 | 2014-10-08 | 贝壳网际(北京)安全技术有限公司 | 一种危险网页处理方法及装置 |
CN104090916B (zh) * | 2014-06-12 | 2018-09-11 | 北京猎豹移动科技有限公司 | 一种危险网页处理方法及装置 |
CN104715055A (zh) * | 2015-03-30 | 2015-06-17 | 北京奇虎科技有限公司 | 一种搜索结果中的电话号码处理方法和装置 |
CN105718533A (zh) * | 2016-01-15 | 2016-06-29 | 百度在线网络技术(北京)有限公司 | 信息推送方法和装置 |
CN106227888A (zh) * | 2016-08-15 | 2016-12-14 | 马岩 | 安全等级在大数据抓取中的应用方法及系统 |
CN106326373A (zh) * | 2016-08-15 | 2017-01-11 | 马岩 | 可信视频在大数据中的抓取方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101059818A (zh) | 加强搜索引擎结果安全性的方法 | |
CN109922052B (zh) | 一种结合多重特征的恶意url检测方法 | |
CN103297435B (zh) | 一种基于web日志的异常访问行为检测方法与系统 | |
CN101218590B (zh) | 处理源自不同后台仓库的对文档的搜索请求的方法和系统 | |
Pouget et al. | Honeypot-based forensics | |
CN103559235B (zh) | 一种在线社交网络恶意网页检测识别方法 | |
Cui et al. | Malicious URL detection with feature extraction based on machine learning | |
CN106453061B (zh) | 一种识别网络诈骗行为的方法及系统 | |
CN108959244A (zh) | 地址分词的方法和装置 | |
CN104580230B (zh) | 网站攻击验证方法及装置 | |
CN110351248B (zh) | 一种基于智能分析和智能限流的安全防护方法及装置 | |
CN110134842B (zh) | 基于信息图谱的信息匹配方法、装置、存储介质和服务器 | |
CN108092963A (zh) | 网页识别方法、装置、计算机设备及存储介质 | |
CN103067387B (zh) | 一种反钓鱼监测系统和方法 | |
CN1949780B (zh) | 网络留言系统及留言过滤方法 | |
CN113132311B (zh) | 异常访问检测方法、装置和设备 | |
CN103235918B (zh) | 可信文件的收集方法及系统 | |
CN114650176A (zh) | 钓鱼网站的检测方法、装置、计算机设备及存储介质 | |
Korkmaz et al. | A hybrid phishing detection system using deep learning-based URL and content analysis | |
CN109558555A (zh) | 基于人工免疫危险理论的微博水军检测方法及检测系统 | |
CN106528805A (zh) | 基于用户的移动互联网恶意程序url智能分析挖掘方法 | |
Roy et al. | A large-scale analysis of phishing websites hosted on free web hosting domains | |
CN114372267A (zh) | 一种基于静态域的恶意网页识别检测方法、计算机及存储介质 | |
CN105653941A (zh) | 一种启发式检测钓鱼网站的方法及系统 | |
CN109672678B (zh) | 一种钓鱼网站识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20071024 |