CN102902722A - 一种信息安全性的处理方法和系统 - Google Patents
一种信息安全性的处理方法和系统 Download PDFInfo
- Publication number
- CN102902722A CN102902722A CN2012103243171A CN201210324317A CN102902722A CN 102902722 A CN102902722 A CN 102902722A CN 2012103243171 A CN2012103243171 A CN 2012103243171A CN 201210324317 A CN201210324317 A CN 201210324317A CN 102902722 A CN102902722 A CN 102902722A
- Authority
- CN
- China
- Prior art keywords
- search results
- utilized
- keyword
- search
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种信息安全性的处理方法和系统,所述方法包括:根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果;根据匹配结果识别所述搜索结果列表中存在的所述被利用的搜索结果;对所述搜索结果列表中存在的被利用的搜索结果进行安全性处理。本发明通过识别发生篡改的搜索结果和/或发生跳转的搜索结果,将存在潜在危险的搜索结果告知用户甚至直接过滤掉,从而大大提高了搜索结果的有效性和安全性。
Description
技术领域
本发明属于信息安全领域,具体地说,涉及一种信息安全性的处理方法和系统。
背景技术
搜索引擎是一种广泛应用的互联网技术,其可以概述为:运用一定的策略从互联网上抓取网页以收集信息,对收集到的信息提取关键词并建立索引文件、去除重复网页等处理后收录到索引数据库中,当用户输入检索关键词时候,搜索引擎从索引数据库中找到匹配该检索关键词的网页,即滤出与检索关键词有关的内容,并展现给用户。
目前,一些网站会篡改其他正常网站的页面内容,把与其本身有关的关键词埋放到其他正常网站页面中,从而利用搜索引擎的上述机制使搜索引擎收录埋放有所述关键词的其他正常网站;还有一些钓鱼网站主动将热门关键词埋放到自己的网站页面,将自己伪装成热门搜索关键词的相关网站,从而可以被搜索引擎收录。当用户在实际搜索时,搜索引擎会显示与用户输入的关键词匹配的结果,这其中可能就包括已被篡改过的正常网站,甚至包括伪装的钓鱼欺诈网站,显然,这样的搜索结果违背了用户的搜索意图,造成了大量的无效搜索结果,而且钓鱼欺诈网站更是为搜索引擎的使用带来极大的安全隐患。
另外,对于上述被篡改过页面内容的正常网站,还可能针对搜索引擎被做了跳转处理,如果用户直接点击搜索引擎中相关的搜索结果,则可能会由被篡改过页面内容的正常网站跳转到其他网站,比如跳转到钓鱼欺诈网站。
综上,由于上述原因导致用户无法获知使用搜索引擎得到的搜索结果的有效性和安全性。
发明内容
本发明所要解决的技术问题是提供一种信息安全性的处理方法和系统,提高了搜索结果的有效性和安全性。
为了解决上述技术问题,本发明提供了一种信息安全性的处理方法,包括:根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果;根据匹配结果识别所述搜索结果列表中存在的所述被利用的搜索结果;对所述搜索结果列表中存在的被利用的搜索结果进行安全性处理。
进一步地,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果,包括:收集所述预置关键词、与所述预置关键词对应的一个或多个搜索结果;抓取每个搜索结果的网页快照以及每个搜索结果的网址链接;根据所述预置关键词与所述网页快照在文字内容进行一致性判断,和/或根据所述预置关键词与所述网址链接的类型进行一致性判断,从而获取所述搜索结果中存在的一个或多个被利用的搜索结果。
进一步地,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果,包括:收集所述预置关键词对应的真实网页网址、与所述预置关键词对应的一个或多个搜索结果;抓取每个搜索结果的网址链接;根据所述真实网页网址与所述网址链接的匹配关系来获取所述搜索结果中存在的一个或多个被利用的搜索结果。
进一步地,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果,包括:收集所述预置关键词对应的一个或多个搜索结果;抓取每个搜索结果的网页快照;根据所述网页快照以及所述搜索结果被访问后开启的页面两者在文字内容上的一致性来获取所述搜索结果中存在的一个或多个被利用的搜索结果。
进一步地,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果,包括:收集所述预置关键词、与所述预置关键词对应的一个或多个搜索结果;抓取每个搜索结果的网页快照以及每个搜索结果的网址链接;根据所述预置关键词与所述网页快照在文字内容上进行一致性判断,和/或根据所述预置关键词与所述网址链接的类型进行一致性判断,从而初步确定所述搜索结果中存在的被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改的搜索结果;当初步确定所述被利用的搜索结果后,根据所述被利用的搜索结果的网页快照以及所述被利用的搜索结果被访问后开启的页面,两者在文字内容上的一致性来最终获取所述被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改且访问页面发生跳转的搜索结果。
进一步地,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果,包括:收集所述预置关键词对应的真实网页网址、与所述预置关键词对应的一个或多个搜索结果;抓取每个搜索结果中的网址链接;根据所述真实网页网址与所述网址链接的匹配关系来初步确定所述搜索结果中存在的被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改的搜索结果;当初步确定出所述被利用的搜索结果后,根据所述网页快照以及所述搜索结果被访问后开启的页面在文字内容上的一致性来最终获取所述被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改且访问页面发生跳转的搜索结果。
进一步地,其中,根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,包括:根据所述检索关键词,与所述数据库中预置关键词进行匹配;当所述检索关键词与所述预置关键词匹配时,根据所述检索关键词对应的搜索结果列表,与所述数据库中所述被利用的搜索结果进行匹配,以识别所述搜索结果列表中存在的被利用的搜索结果。
进一步地,其中,根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,包括:根据所述检索关键词对应的搜索结果列表,与所述数据库中被利用的搜索结果进行匹配;当所述搜索结果列表中匹配到所述被利用的搜索结果时,再根据所述检索关键词,与所述数据库中所述预置关键词进行匹配,以识别所述搜索结果列表中存在的被利用的搜索结果。
进一步地,其中,通过查询接口获取所述搜索引擎中所使用的检索关键词及其对应的搜索结果列表。
进一步地,其中,对存在危险的搜索结果进行安全性处理,包括:在所述检索关键词对应搜索结果中,对包括所述被利用的搜索结果的搜索结果进行安全性提示,所述安全性提示包括:显性提示所述搜索结果不安全、隐形提示所述搜索结果不安全;所述显性提示包括页面窗口提示,所述隐形提示包括屏蔽所述检索关键词对应的被利用的搜索结果。
为了解决上述技术问题,本发明还提供了一种信息安全性的处理系统,包括:服务器,用于根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,根据匹配结果识别所述搜索结果列表中存在的所述被利用的搜索结果,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果;客户端,用于对所述搜索结果列表中存在的被利用的搜索结果进行安全性处理。
进一步地,其中,所述服务器,还包括:收集单元,用于收集所述预置关键词、与所述预置关键词对应的一个或多个搜索结果;抓取单元,用于抓取每个搜索结果的网页快照以及每个搜索结果的网址链接;检测单元,用于根据所述预置关键词与所述网页快照在文字内容进行一致性判断,和/或根据所述预置关键词与所述网址链接的类型进行一致性判断,从而获取所述搜索结果中存在的一个或多个被利用的搜索结果。
进一步地,其中,所述服务器,还包括:收集单元,用于收集所述预置关键词对应的真实网页网址、与所述预置关键词对应的一个或多个搜索结果;抓取单元,用于抓取每个搜索结果的网址链接;检测单元,用于根据所述真实网页网址与所述网址链接的匹配关系来获取所述搜索结果中存在的一个或多个被利用的搜索结果。
进一步地,其中,所述服务器,还包括:收集单元,用于收集所述预置关键词对应的一个或多个搜索结果;抓取单元,用于抓取每个搜索结果的网页快照;检测单元,用于根据所述网页快照以及所述搜索结果被访问后开启的页面两者在文字内容上的一致性来获取所述搜索结果中存在的一个或多个被利用的搜索结果。
进一步地,其中,所述服务器,还包括:收集单元,用于收集所述预置关键词、与所述预置关键词对应的一个或多个搜索结果;抓取单元,用于抓取每个搜索结果的网页快照以及每个搜索结果的网址链接;初步检测单元,用于根据所述预置关键词与所述网页快照在文字内容上进行一致性判断,和/或根据所述预置关键词与所述网址链接的类型进行一致性判断,从而初步确定所述搜索结果中存在的被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改的搜索结果;再次检测单元,用于当初步确定所述被利用的搜索结果后,根据所述被利用的搜索结果的网页快照以及所述被利用的搜索结果被访问后开启的页面,两者在文字内容上的一致性来最终获取所述被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改且访问页面发生跳转的搜索结果。
进一步地,其中,所述服务器,还包括:收集单元,用于收集所述预置关键词对应的真实网页网址、与所述预置关键词对应的一个或多个搜索结果;抓取单元,用于抓取每个搜索结果中的网址链接;初步检测单元,用于根据所述真实网页网址与所述网址链接的匹配关系来初步确定所述搜索结果中存在的被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改的搜索结果;再次检测单元,用于当初步确定出所述被利用的搜索结果后,根据所述网页快照以及所述搜索结果被访问后开启的页面在文字内容上的一致性来最终获取所述被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改且访问页面发生跳转的搜索结果。
进一步地,其中,所述服务器,包括:关键词匹配单元,用于根据所述检索关键词,与所述数据库中预置关键词进行匹配;数据匹配单元,用于当所述检索关键词与所述预置关键词匹配时,根据所述检索关键词对应的搜索结果列表,与所述数据库中所述被利用的搜索结果进行匹配,以识别所述搜索结果列表中存在的被利用的搜索结果。
进一步地,其中,所述服务器,包括:数据匹配单元,用于根据所述检索关键词对应的搜索结果列表,与所述数据库中被利用的搜索结果进行匹配;关键词匹配单元,用于当所述搜索结果列表中匹配到所述被利用的搜索结果时,再根据所述检索关键词,与所述数据库中所述预置关键词进行匹配,以识别所述搜索结果列表中存在的被利用的搜索结果。
进一步地,其中,还包括:查询接口,用于接收所述客户端的验证请求,并根据所述验证请求获取所述搜索引擎中所使用的检索关键词及其对应的搜索结果列表,并发送给所述服务器。
与现有的方案相比,本发明所获得的技术效果:
1)通过识别发生篡改的搜索结果和/或发生跳转的搜索结果,将存在潜在危险的搜索结果告知用户甚至直接过滤掉,从而大大提高了搜索结果的有效性和安全性。
2)依照搜索结果的危害程度不同,根据被篡改和/或被跳转的方式,分层次对搜索结果给予不同级别的安全提示和处理。
附图说明
图1为本发明第一实施例的方法流程图;
图2为关键词之一和对应的被利用的搜索结果;
图3为关键词之二和对应的被利用的搜索结果;
图4为关键词之二和另外一组对应的被利用的搜索结果;
图5为本发明第二实施例的方法流程图;
图6为本发明实施例的第一示意图;
图7为本发明实施例的第二示意图;
图8为本发明实施例的第三示意图;
图9为本发明第三实施例的方法流程图;
图10为本发明第四实施例的方法流程图;
图11为本发明实施例的第四示意图;
图12为本发明实施例的第五示意图;
图13为本发明实施例的第六示意图;
图14为本发明第五实施例的方法流程图;
图15为本发明第六实施例的方法流程图;
图16为本发明第七实施例的系统结构示意图;
图17为本发明第七实施例的又一系统结构示意图;
图18为本发明第七实施例的另一系统结构示意图;
图19为本发明第八实施例的系统结构示意图;
图20为本发明第九实施例的系统结构示意图;
图21为本发明第十实施例的系统结构示意图;
图22为本发明第十一实施例的系统结构示意图;
图23为本发明第十二实施例的系统结构示意图。
具体实施方式
以下将配合图式及实施例来详细说明本发明的实施方式,藉此对本发明如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
本发明的下述实施例中,将容易被利用的关键词作为预置关键词、通过将预置关键词及与所述预置关键词对应的被利用的一个或多个搜索结果存储到云安全数据中,当用户在搜索引擎中实时进行信息搜索时,将搜索引擎中所使用的检索关键词及对应的搜索结果列表,在数据库中进行匹配,在匹配成功后,筛选所述搜索结果列表,对其中存在的被利用的搜索结果进行安全性处理,从而增加了检测搜索结果的有效性和安全性。
如图1所示,为本发明第一实施例的方法流程图。在本实施例中,信息安全性的处理方法包括:
101、建立数据库,其中存储有预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果;
本实施例中,数据库可以设置在云服务端,预置关键词可以包括容易被利用的关键词,而这些容易被利用的关键词一般都具有较高搜索权重,经常在搜索中被用户所使用,比如京东商城、淘宝商城、亚马逊商城、清华大学、政府主页名、高校主页名、飞五游戏等,这些容易被利用的关键词可能包括在如全文搜索引擎、目标搜索引擎、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎、免费链接列表搜索引擎等搜索引擎中。被利用的搜索结果包括:所显示的网页信息被关键词篡改的搜索结果、嵌入了非当前网站网址的搜索结果等等。在存储预置关键词、被利用的搜索结果时,可以通过在这两者之间建立索引的方式来实现对应。
本实施例中,为了获得预置关键词以及对应的被利用的搜索结果,可以采用方案1:先收集预置关键词、对应的一个或多个搜索结果,之后抓取搜索结果的网页快照;根据所述预置关键词与所述网页快照在文字内容上的一致性来获取所述搜索结果中存在的被利用的搜索结果(可参照第二实施例中相关内容),或者根据所述预置关键词与所述搜索结果的网址链接类型进行一致性判断来获取所述搜索结果中存在的被利用的搜索结果(可参照第二实施例中相关内容),所述被利用的搜索结果至少包括显示内容被篡改的搜索结果。和/或,采用方案2:收集所述预置关键词、对应的一个或多个搜索结果,之后,抓取所述搜索结果的网页快照,根据所述网页快照以及访问所述搜索结果跳转后的页面在文字内容上的一致性来获取所述搜索结果中存在的被利用的搜索结果(可参照第四实施例中相关内容),所述被利用的搜索结果至少包括访问页面发生跳转的搜索结果,本方案中还需要保存所述搜索结果被访问后开启的页面的网页快照以及网址作为历史数据,以方便进行回查;另外,在本方案中,在比对所述网页快照以及所述搜索结果被访问后开启的页面两者在文字内容上的一致性时,也可以比对所述网页快照以及所述搜索结果被访问后开启的页面的网页快照,本发明并不限于此。和/或,采用方案3:收集所述预置关键词、对应的真实网页网址、对应的一个或多个搜索结果,之后抓取所述搜索结果的网址链接,根据所述关键词的真实网页网址与网址链接来获取所述搜索结果中存在的被利用的搜索结果(可参照第三实施例中相关内容),所述被利用的搜索结果至少包括显示内容被篡改的搜索结果。为了增加判断的准确度,可以在方案1通过判断是否发生篡改来初步确定被利用的搜索结果,再通过方案2判断是否发生跳转进一步确认所述被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改且访问页面发生跳转的搜索结果,或者,方案3通过判断是否发生篡改来初步确定被利用的搜索结果,再通过方案2判断是否发生跳转进一步确认所述被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改且访问页面发生跳转的搜索结果。
因此,数据库中存储的与所述预置关键词对应的一个或多个被利用的搜索结果,应该包括以下一个或多个的组合:显示内容被篡改的搜索结果、访问页面发生跳转的搜索结果、显示内容被篡改且访问页面发生跳转的搜索结果。如果只发生篡改而未发生跳转,则可以认为所述被利用的搜索结果的危害相对较小,如果同时发生了篡改和跳转,则认为所述被利用的搜索结果的危害较大,如果仅发生了跳转,也认为所述被利用的搜索结果的危害较大。
在确定了哪些关键词属于被易利用的预置关键词,同时,确定了这些预置关键词对应的被利用的搜索结果。为了便于所有用户在信息的实际检索过程对检索的搜索结果进行安全性识别,将确定的预置关键词和被利用的搜索结果存储到在云安全服务端的数据库中,参见图2所示,为关键词之一和对应的被利用的搜索结果。参见图3所示,为关键词之二和对应的被利用的搜索结果。参见图4所示,为关键词之二和另外一组对应的被利用的搜索结果。被利用的搜索结果承载的信息可以包括:网页网址、页面内容、摘要等,当然本发明并不限于此。
102、根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,根据匹配结果识别所述搜索结果列表中存在的所述被利用的搜索结果,其中,所述数据库中预存步骤101收集保存的预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果;
本实施例中,当用户在检索信息时,利用终端在搜索引擎的对话框中检索信息时,输入检索关键词,搜索引擎在其索引数据库中,匹配出与检索关键词对应的网页数据形成搜索结果列表。这个搜索结果列表中可能包括所显示的网页信息被检索关键词篡改过的搜索结果,或者嵌入了其他网站网址的搜索结果,而这些实际并非用户实际需要的搜索结果,因此,通过步骤102进行人工或者机器自动匹配,将检索关键词及对应的搜索结果列表,分别与数据库中的关键词、被利用的搜索结果予以匹配,以识别出非用户实际需要的被利用的搜索结果。
当用户在终端上启动搜索引擎进行信息检索时,输入对应的检索关键词,并获得了对应的搜索结果列表后,可以通过搭建在终端和云安全服务端之间的云安全查询接口向云安全数据发送一验证请求,将所述搜索引擎中所使用的检索关键词及其对应的搜索结果列表发送给数据库以进行匹配。该云安全查询接口定义了终端和云安全数据之间的数据通讯协议,比如数据的格式等,该数据可是包括检索关键词、搜索结果的快照以及安全提示信息等。
在进行匹配时,可以具体采用先进行关键词全局匹配再进行被利用的搜索结果局部匹配,或者先进行被利用的搜索结果全局匹配再进行关键词局部匹配,分别详见下述第五实施例和六。
103、对所述搜索结果列表中存在的被利用的搜索结果进行安全性处理。
本实施例中,在对搜索结果进行安全性提示时,可以采用显性提示,或者隐性提示,在显性提示,比如采用一小窗口来提示,隐形提示时,可以直接隐藏或屏蔽该存在危险的搜索结果。
如图5所示,为本发明第二实施例的方法流程图。本实施例中,信息安全性的处理方法包括:
501、收集所述预置关键词、与所述预置关键词对应的一个或多个搜索结果;
本实施例中,以“飞五游戏”为作为可能的关键词,在搜索引擎BAIDU来获得对应的搜索结果,如图6所示,每一条搜索结果中包括相应的网页摘要信息,网页的文字内容等,比如,第一、二、三、四条搜索结果中,都有对游戏的相关简要介绍等信息。
502、抓取每个搜索结果的网页快照;
以图6中第二条搜索结果为例,第二条搜索结果的网页地址为www.tzyonganzhou.gov.cn,摘要信息中描述了对飞五游戏的相关简要介绍,抓取此条搜索结果相应的网页快照,如图7所示,网页快照的文字内容中显示为一政府网站内容,并且还包含关键词“飞五游戏”。
503、根据所述预置关键词与所述网页快照在文字内容进行一致性判断从而获取所述搜索结果中存在的被利用的搜索结果,这样即得到与所述预置关键词对应的一个或多个被利用的搜索结果。
本实施例中,如果所述预置关键词与所述网页快照在文字内容上一致,则所述预置关键词的搜索结果不包括被利用的搜索结果,否则,则所述预置关键词的搜索结果包括被利用的搜索结果。通过步骤502抓取了预置关键词每一条搜索结果的网页快照,这里通过该预置关键词的含义与该网页快照的文字内容比对即可获取所述搜索结果中存在的被利用的搜索结果。如果预置关键词的含义与该网页快照的文字内容较为接近,则可直接确定该条搜索结果不是被利用的搜索结果;否则,则确定该条搜索结果就是被利用的搜索结果;比如,在本实施例中,如图6和7所示,第二条搜索结果中的网页快照的文字内容中显示为一政府网站内容,但是,关键词却反映的是“飞五游戏”,因此,两者的文字内容相差较大,据此,可以确定第二条搜索结果就是被利用的搜索结果,非法用户已经对该搜索结果的一些标题信息进行了篡改,埋入了关键词“飞五游戏”。
在本发明的另外一个实施例中,步骤503中也可以根据所述预置关键词与所述网址链接的类型进行一致性判断,从而获取所述搜索结果中存在的被利用的搜索结果。如果所述预置关键词与某条搜索结果的网址链接类型匹配,则确定该条搜索结果不是被利用的搜索结果,否则,确定该条搜索结果不是被利用的搜索结果。比如,如图8所示,第二条搜索结果对应的网址链接类型为art.szu.edu.cn、qgzx.sicau.edu.cn,均是以edu.cn结束的,因此可推断网址链接类型为教育网相关内容,但是,关键词“456游戏中心”却是有关游戏的,两者不存在匹配的关系,因此,也可确定出图8中第二条搜索结果中存在被利用的搜索结果。需要说明的是,除了利用所述网页快照的文字内容以外,还可以利用搜索结果或者网页快照中其他可以反应真实页面的信息,这类信息也可以依据本发明的方式,被使用来判断所述搜索结果中是否包括被利用的搜索结果。
504、建立数据库,其中存储有预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果;
505、根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,根据匹配结果识别所述搜索结果列表中存在的所述被利用的搜索结果;
通过对检索关键词对应的搜索结果列表中的每一个搜索结果进行匹配,从而确定出其中被利用的搜索结果。
506、对所述搜索结果列表中存在的被利用的搜索结果进行安全性处理。
本实施例中的步骤504-506可以详见上述实施例一的详细描述,在此不再赘述。
本实施例中的上述步骤501-503可以形成一检测数据被利用的方法,在此不再赘述。
如图9所示,为本发明第三实施例的方法流程图。本实施例中,信息安全性的处理方法包括:
901、收集所述预置关键词对应的真实网页网址、与所述预置关键词对应的一个或多个搜索结果;
本实施例中,收集“456游戏中心”对应的真实网页网址,如www.game456.com和/或www.game456.net和/或www.456gama.com等。以“456游戏中心”为作为可能的预置关键词,在搜索引擎BAIDU来获得对应的搜索结果,如图8所示,为预置关键词对应的5条搜索结果,这5条搜索结果可以作为数据样本,对该数据样本进行分析,来确定在数据库中是否需要收集“456游戏中心”。
902、抓取所述每个搜索结果的网址链接;
在图8中,可看出,每一条搜索结果中包括相应的网页摘要信息,网页的文字内容、网址链接。比如,第一至五条搜索结果中对应的网址链接依次为www.game456.net、art.szu.edu.cn、qgzx.sicau.edu.cn、www.456gama.com、www.game456.com。
903、根据所述真实网页网址与所述网址链接的匹配关系来获取所述搜索结果中存在的被利用的搜索结果,这样即得到与所述预置关键词对应的一个或多个被利用的搜索结果。
所述网址链接与真实网页网址匹配,则所述网址链接对应的搜索结果没有被篡改,不是被利用的搜索结果,否则,对应的搜索结果就是被利用的搜索结果。比如,在本实施例中,如图8所示,搜索结果中art.szu.edu.cn、qgzx.sicau.edu.cn,没有被关键词“456游戏中心”对应的真实网页地址匹配,则由此可判断出相应的第二、三条搜索结果是被利用的搜索结果,它们的标题信息被篡改,被埋入了关键词“456游戏中心”,而其他搜索结果都不是被利用的搜索结果。
904、建立数据库,其中存储有预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果;
905、根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,根据匹配结果识别所述搜索结果列表中存在的所述被利用的搜索结果;
906、对所述搜索结果列表中存在的被利用的搜索结果进行安全性处理。
本实施例中的步骤904-906可参见上述实施例一中相关描述,在此不再赘述。本实施例中的步骤901-903可以形成一检测数据被利用的方法,在此不再赘述。
如图10所示,为本发明第四实施例的方法流程图。本实施例中,信息安全性的处理方法包括:
1001、收集所述预置关键词对应的一个或多个搜索结果;
本实施例中,以“飞五游戏”为作为可能的预置关键词,在搜索引擎BAIDU来获得对应的搜索结果,如图11所示,为本发明实施例中预置关键词对应的搜索结果,这些搜索结果可以作为数据样本,对该数据样本进行分析,来确定在数据库中是否需要收集“飞五游戏”和对应的搜索结果。
1002、抓取每个搜索结果的网页快照;
在图11中,第五条搜索结果的网址链接为www.jxsfj.gov.cn,摘要信息显示这是一个与“飞五游戏”有关的网页,第五条搜索结果的网页快照如图12所示,其文字内容显示第五条搜索结果应该是鸡西市司法局的网站,说明第五条搜索结果被“飞五游戏”篡改,此不是本实施例关注的对象,不再赘述。
1003、根据所述网页快照以及所述搜索结果被访问后开启的页面两者在文字内容上的一致性来获取所述搜索结果中存在的被利用的搜索结果,这样即得到与所述预置关键词对应的一个或多个被利用的搜索结果。
本步骤中还需要保存所述搜索结果被访问后开启的页面的网页快照以及网址作为历史数据,以方便进行回查;另外,在本步骤中,在比对所述网页快照以及所述搜索结果被访问后开启的页面两者在文字内容上的一致性时,也可以比对所述网页快照以及所述搜索结果被访问后开启的页面的网页快照,本发明并不限于此;
通过步骤1002抓取了每一条搜索结果的网页快照,这里通过每一个网页快照的内容与直接访问对应搜索结果后开启的页面比对,即可确定这条搜索结果是否是被利用的搜索结果。如果两者内容一致,说明访问搜索结果后开启的页面没有发生跳转,此时不考虑搜索结果是否被篡改,仅考虑其开启的页面是真实有效的,从这一层面来讲,认为这条搜索结果不是被利用的搜索结果,否则,说明访问搜索结果后开启的页面发生跳转,这条搜索结果是被利用的搜索结果。如图12所示,为本发明实施例中预置关键词的第五条搜索结果的网页快照,如图13所示,为本发明实施例中预置关键词的第五条搜索结果被访问后开启的页面。由图12和图13可知,两者的文字内容相关,都是鸡西市司法局,基于此,在不考虑搜索结果是否被篡改的前提下,可以认为确定第五条搜索结果不是被利用的搜索结果。
1004、建立数据库,其中存储有预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果;
1005、根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,根据匹配结果识别所述搜索结果列表中存在的所述被利用的搜索结果;
本实施例中,在进行匹配时,可以具体采用如下先关键词全局匹配后被利用的搜索结果局部匹配,或者先被利用的搜索结果全局匹配后关键词局部匹配,详细可参见下述第五实施例和六。
1006、对所述搜索结果列表中存在的被利用的搜索结果进行安全性处理。
本实施例中的步骤1004-1006可以详见上述实施例一的相关描述,在此不再赘述。
本实施例中的步骤1001-1003可以形成一检测数据被利用的方法,在此不再赘述。
如图14所示,为本发明第五实施例的方法流程图。本实施例的信息安全性的处理方法,可以参见上述实施例二至四的方式确定出需要存储在数据库中的关键词和对应的被利用的搜索结果,之后,执行如下过程:
1401、建立数据库,其中存储有预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果;
1402、根据搜索引擎中所使用的检索关键词与数据库中的预置关键词进行匹配;
在云安全服务端接收到终端的验证请求后,将以全局遍历的方式,根据检索关键词在数据库中的预置关键词进行匹配,确定检索关键词是否收集在数据库中,即是否与存储的预置关键词匹配,如果检索关键词与数据库中的预置关键词匹配,则进行后续搜索结果与被利用的搜索结果匹配;否则,直接结束整个流程。比如,云安全服务端获取到的检索关键词为“大众汽车”,通过关键词匹配确定出该检索关键词在数据库中并未被收集,则云安全服务终端向终端发送一个空消息,不对任何一个搜索结果进行安全性提示;否则,进行后续该检索关键词对应的每一个搜索结果是否是被利用的搜索结果。
1403、当所述检索关键词与所述预置关键词匹配时,根据所述检索关键词对应的搜索结果列表,与所述数据库中所述被利用的搜索结果进行匹配,以识别所述搜索结果列表中存在的被利用的搜索结果;
在云安全服务端确定出检索关键词与数据库中的预置关键词匹配后,则采用局部遍历的方式进行被利用的搜索结果的匹配,即,由于此时,检索关键词与预置关键词已匹配成功,即两者完全相同或者属于同义关系,此时,根据匹配成功的预置关键词所对应的被利用的搜索结果,与检索关键词对应的搜索结果列表进行匹配,确定搜索结果列表中是否存在被利用的搜索结果。比如,“456游戏中心”属于存储在数据库中的预置关键词,当云安全服务端获取的检索关键词同为“456游戏中心”或者其同义关系词时,此时关键词匹配成功;之后,根据“456游戏中心”对应的搜索结果“art.szu.edu.cn、qgzx.sicau.edu.cn”,在数据库中与“456游戏中心”对应的被利用的搜索结果进行匹配,如果匹配,则确认搜索结果列表中“art.szu.edu.cn、qgzx.sicau.edu.cn”就是被利用的搜索结果。
1404、对所述搜索结果列表中存在的被利用的搜索结果进行安全性处理。
如图15所示,为本发明第六实施例的方法流程图。本实施例的信息安全性的处理方法,可以参见上述实施例二至四的方式确定出需要存储在数据库中的关键词和对应的被利用的搜索结果,之后,执行如下过程:
1501、建立数据库,其中存储有预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果;
1502,根据所述检索关键词对应的搜索结果列表,与所述数据库中被利用的搜索结果进行匹配;
在云安全服务端接收到终端的验证请求后,将以全局遍历的方式,在数据库中进行匹配,确定搜索结果列表中是否存在被利用的搜索结果,如果存在,则进行后续检索关键词与预置关键词匹配;否则,直接结束整个流程。比如,通过该检索关键词对应的搜索结果的数据(例如网页网址,本发明并不限于此)与数据库中收集的被利用网页的网页网址不一致,则云安全服务终端向终端发送一个空消息,不对任何一个搜索结果进行安全性提示;否则,进行后续该检索关键词与预置关键词的匹配。
1503,当所述搜索结果列表中匹配到所述被利用的搜索结果时,再根据所述检索关键词,与所述数据库中所述预置关键词进行匹配,以识别所述搜索结果列表中存在的被利用的搜索结果;
在云安全服务端确定出搜索结果与数据库中被利用的搜索结果匹配,则采用局部遍历的方式进行检索关键词与预置关键词的匹配,检测数据库中被利用的搜索结果的对应预置关键词是否与检索关键词匹配,如果匹配,说明搜索结果列表中被步骤1502中检测出的被利用的搜索结果确实就是被利用的搜索结果。比如,检索关键词“飞五游戏”属于存储在数据库中的预置关键词,如果匹配,则检索关键词“飞五游戏”中对应的搜索结果中有该被利用的搜索结果。
比如“飞五游戏”作为检索关键词的第二条搜索结果中,其对应的网址链接为www.tzyonganzhou.gov.cn,经过与数据库中的被利用的搜索结果匹配后,确定出www.tzyonganzhou.gov.cn在云安全数据中被记录为被利用的搜索结果,即被利用的搜索结果中有www.tzyonganzhou.gov.cn;之后,使用检索关键词“飞五游戏”在数据库中,与该被利用的搜索结果www.tzyonganzhou.gov.cn对应的关键词匹配,该关键词“飞五游戏”与检索关键词“飞五游戏”完全一致。至此,可确定出检索关键词“飞五游戏”和其对应的第二条搜索结果中包括被利用的搜索结果。此处,在确认所述搜索结果中有被利用的搜索结果之后,优选地,可以直接将检索关键词为“飞五游戏”在数据库中进行匹配,只要匹配到数据库保存的关键词中也包括“飞五游戏”,不必考虑所述关键词“飞五游戏”在数据库中是否与www.tzyonganzhou.gov.cn对应,都可以直接确认检索关键词“飞五游戏”和其对应的第二条搜索结果包括被利用的搜索结果。
1504、对所述搜索结果列表中存在的被利用的搜索结果进行安全性处理。
针对上述方法,本发明下述实施例提供了对应的系统,详细如下。如图16所示,为本发明第七实施例的系统结构示意图。本实施例中,信息安全性的处理系统包括:服务器1601、客户端1602,其中,服务器1601用于根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,根据匹配结果识别所述搜索结果列表中存在的所述被利用的搜索结果,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果;客户端1602用于对所述搜索结果列表中存在的被利用的搜索结果进行安全性处理。
如图17所示,为本发明第七实施例的又一系统结构示意图。本实施例中,与图16所示的实施例相同之处在于,包括服务器1701、客户端1702,区别在于,服务器1701还可以包括关键词匹配单元1712以及数据匹配单元1722,其中,关键词匹配单元1712用于根据所述检索关键词,与所述数据库中预置关键词进行匹配;数据匹配单元1722用于当所述检索关键词与所述预置关键词匹配时,根据所述检索关键词对应的搜索结果列表,与所述数据库中所述被利用的搜索结果进行匹配,以识别所述搜索结果列表中存在的被利用的搜索结果。
如图18所示,为本发明第七实施例的另一系统结构示意图。本实施例中,与图16所示的实施例相同之处在于,包括服务器1801、客户端1802,区别在于,服务器1801还可以包括数据匹配单元1812以及关键词匹配单元1822,其中,数据匹配单元1812用于根据所述检索关键词对应的搜索结果列表,与所述数据库中被利用的搜索结果进行匹配;关键词匹配单元1822用于当所述搜索结果列表中匹配到所述被利用的搜索结果时,再根据所述检索关键词,与所述数据库中所述预置关键词进行匹配,以识别所述搜索结果列表中存在的被利用的搜索结果。
在图16-18所示的系统中还可以包括一查询接口(图中未示出),位于客户端与服务器之间,该查询接口用于接收客户端的验证请求,并根据所述验证请求获取所述搜索引擎中所使用的检索关键词及其对应的搜索结果列表,并发送给所述服务器。
在图16-18所示的系统中还可以包括下图19-29的检测数据被利用的系统,详见下述实施例,在此不再赘述。
针对上述检测数据被利用的方法,本发明下实施例提供了相应的系统,详细如下。
如图19所示,为本发明第八实施例的系统结构示意图。该检测数据被利用的系统中的服务器还包括:第一收集单元1901、第一抓取单元1902以及第一检测单元1903,其中,第一收集单元1901用于收集所述预置关键词、与所述预置关键词对应的一个或多个搜索结果;第一抓取单元1902用于抓取每个搜索结果的网页快照以及每个搜索结果的网址链接;第一检测单元1903用于根据所述预置关键词与所述网页快照在文字内容进行一致性判断,和/或根据所述预置关键词与所述网址链接的类型进行一致性判断,从而获取所述搜索结果中存在的被利用的搜索结果。
如图20所示,为本发明第九实施例的系统结构示意图。该检测数据被利用的系统中的服务器还包括:第二收集单元2001、第二抓取单元2002以及第二检测单元2003,其中,第二收集单元2001用于收集所述预置关键词对应的真实网页网址、与所述预置关键词对应的一个或多个搜索结果;第二抓取单元2002用于抓取每个搜索结果的网址链接;第二检测单元2003用于根据所述真实网页网址与所述网址链接的匹配关系来获取所述搜索结果中存在的被利用的搜索结果。
如图21所示,为本发明第十实施例的系统结构示意图。该检测数据被利用的系统中的服务器还包括:第三收集单元2101、第三抓取单元2102以及第三检测单元2103,其中,第三收集单元2101用于收集所述预置关键词对应的一个或多个搜索结果;第三抓取单元2102用于抓取每个搜索结果的网页快照;第三检测单元2103用于根据所述网页快照以及所述搜索结果被访问后开启的页面两者在文字内容上的一致性来获取所述搜索结果中存在的被利用的搜索结果,第三检测单元2103还用于保存所述搜索结果被访问后开启的页面的网页快照以及网址作为历史数据,以方便进行回查;在比对所述网页快照以及所述搜索结果被访问后开启的页面两者在文字内容上的一致性时,也可以比对所述网页快照以及所述搜索结果被访问后开启的页面的网页快照,本发明并不限于此。
如图22所示,为本发明第十一实施例的系统结构示意图。该检测数据被利用的系统中的服务器还包括:第四收集单元2201、第四抓取单元2202、第一初步检测单元2203、第一再次检测单元单元2204,其中,第四收集单元2201用于收集所述预置关键词、与所述预置关键词对应的一个或多个搜索结果;第四抓取单元2202用于抓取每个搜索结果的网页快照以及每个搜索结果的网址链接;第一初步检测单元2203用于根据所述预置关键词与所述网页快照在文字内容上进行一致性判断,和/或根据所述预置关键词与所述网址链接的类型进行一致性判断,从而初步确定所述搜索结果中存在的被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改的搜索结果;第一再次检测单元2204用于当初步确定所述被利用的搜索结果后,根据所述被利用的搜索结果的网页快照以及所述被利用的搜索结果被访问后开启的页面,两者在文字内容上的一致性来最终获取所述被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改且访问页面发生跳转的搜索结果;第一再次检测单元2204还用于保存所述搜索结果被访问后开启的页面的网页快照以及网址作为历史数据,以方便进行回查;在比对所述网页快照以及所述搜索结果被访问后开启的页面两者在文字内容上的一致性时,也可以比对所述网页快照以及所述搜索结果被访问后开启的页面的网页快照,本发明并不限于此。
如图23所示,为本发明第十二实施例的系统结构示意图。该检测数据被利用的系统中的服务器还包括:第五收集单元2301、第五抓取单元2302、第二初步检测单元2303、第二再次检测单元2304,其中,第五收集单元2301用于收集所述预置关键词对应的真实网页网址、与所述预置关键词对应的一个或多个搜索结果;第五抓取单元2302用于抓取每个搜索结果中的网址链接;第二初步检测单元2303用于根据所述真实网页网址与所述网址链接的匹配关系来初步确定所述搜索结果中存在的被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改的搜索结果;第二再次检测单元2304用于当初步确定出所述被利用的搜索结果后,根据所述网页快照以及所述搜索结果被访问后开启的页面在文字内容上的一致性来最终获取所述被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改且访问页面发生跳转的搜索结果;第二再次检测单元2304还用于保存所述搜索结果被访问后开启的页面的网页快照以及网址作为历史数据,以方便进行回查;在比对所述网页快照以及所述搜索结果被访问后开启的页面两者在文字内容上的一致性时,也可以比对所述网页快照以及所述搜索结果被访问后开启的页面的网页快照,本发明并不限于此。
上述说明示出并描述了本发明的若干优选实施例,但如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (19)
1.一种信息安全性的处理方法,包括:
根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果;
根据匹配结果识别所述搜索结果列表中存在的所述被利用的搜索结果;
对所述搜索结果列表中存在的被利用的搜索结果进行安全性处理。
2.根据权利要求1所述的方法,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果,进一步包括:
收集所述预置关键词、与所述预置关键词对应的一个或多个搜索结果;
抓取每个搜索结果的网页快照以及每个搜索结果的网址链接;
根据所述预置关键词与所述网页快照在文字内容进行一致性判断,和/或根据所述预置关键词与所述网址链接的类型进行一致性判断,从而获取所述搜索结果中存在的一个或多个被利用的搜索结果。
3.根据权利要求1或2所述的方法,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果,进一步包括:
收集所述预置关键词对应的真实网页网址、与所述预置关键词对应的一个或多个搜索结果;
抓取每个搜索结果的网址链接;
根据所述真实网页网址与所述网址链接的匹配关系来获取所述搜索结果中存在的一个或多个被利用的搜索结果。
4.根据权利要求1-3中任一项所述的方法,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果,进一步包括:
收集所述预置关键词对应的一个或多个搜索结果;
抓取每个搜索结果的网页快照;
根据所述网页快照以及所述搜索结果被访问后开启的页面两者在文字内容上的一致性来获取所述搜索结果中存在的一个或多个被利用的搜索结果。
5.根据权利要求1-4中任一项所述的方法,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果,进一步包括:
收集所述预置关键词、与所述预置关键词对应的一个或多个搜索结果;
抓取每个搜索结果的网页快照以及每个搜索结果的网址链接;
根据所述预置关键词与所述网页快照在文字内容上进行一致性判断,和/或根据所述预置关键词与所述网址链接的类型进行一致性判断,从而初步确定所述搜索结果中存在的被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改的搜索结果;
当初步确定所述被利用的搜索结果后,根据所述被利用的搜索结果的网页快照以及所述被利用的搜索结果被访问后开启的页面,两者在文字内容上的一致性来最终获取所述被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改且访问页面发生跳转的搜索结果。
6.根据权利要求1-5中任一项所述的方法,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果,进一步包括:
收集所述预置关键词对应的真实网页网址、与所述预置关键词对应的一个或多个搜索结果;
抓取每个搜索结果中的网址链接;
根据所述真实网页网址与所述网址链接的匹配关系来初步确定所述搜索结果中存在的被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改的搜索结果;
当初步确定出所述被利用的搜索结果后,根据所述网页快照以及所述搜索结果被访问后开启的页面在文字内容上的一致性来最终获取所述被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改且访问页面发生跳转的搜索结果。
7.根据权利要求1-6中任一项所述的方法,其中,根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,进一步包括:
根据所述检索关键词,与所述数据库中预置关键词进行匹配;
当所述检索关键词与所述预置关键词匹配时,根据所述检索关键词对应的搜索结果列表,与所述数据库中所述被利用的搜索结果进行匹配,以识别所述搜索结果列表中存在的被利用的搜索结果。
8.根据权利要求1-7中任一项所述的方法,其中,根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,进一步包括:
根据所述检索关键词对应的搜索结果列表,与所述数据库中被利用的搜索结果进行匹配;
当所述搜索结果列表中匹配到所述被利用的搜索结果时,再根据所述检索关键词,与所述数据库中所述预置关键词进行匹配,以识别所述搜索结果列表中存在的被利用的搜索结果。
9.根据权利要求1-8中任一项所述的方法,其中,
通过查询接口获取所述搜索引擎中所使用的检索关键词及其对应的搜索结果列表。
10.根据权利要求1-9中任一项所述方法,其中,对存在危险的搜索结果进行安全性处理,进一步包括:
在所述检索关键词对应搜索结果中,对包括所述被利用的搜索结果的搜索结果进行安全性提示,所述安全性提示包括:显性提示所述搜索结果不安全、隐形提示所述搜索结果不安全;所述显性提示包括页面窗口提示,所述隐形提示包括屏蔽所述检索关键词对应的被利用的搜索结果。
11.一种信息安全性的处理系统,包括:
服务器,用于根据搜索引擎中所使用的检索关键词及其对应的搜索结果列表,分别在所述数据库中进行匹配,根据匹配结果识别所述搜索结果列表中存在的所述被利用的搜索结果,其中,所述数据库中预存预置关键词及与所述预置关键词对应的一个或多个被利用的搜索结果;
客户端,用于对所述搜索结果列表中存在的被利用的搜索结果进行安全性处理。
12.根据权利要求11所述的系统,其中,所述服务器,还包括:
收集单元,用于收集所述预置关键词、与所述预置关键词对应的一个或多个搜索结果;
抓取单元,用于抓取每个搜索结果的网页快照以及每个搜索结果的网址链接;
检测单元,用于根据所述预置关键词与所述网页快照在文字内容进行一致性判断,和/或根据所述预置关键词与所述网址链接的类型进行一致性判断,从而获取所述搜索结果中存在的一个或多个被利用的搜索结果。
13.根据权利要求11或12所述的系统,其中,所述服务器,还包括:
收集单元,用于收集所述预置关键词对应的真实网页网址、与所述预置关键词对应的一个或多个搜索结果;
抓取单元,用于抓取每个搜索结果的网址链接;
检测单元,用于根据所述真实网页网址与所述网址链接的匹配关系来获取所述搜索结果中存在的一个或多个被利用的搜索结果。
14.根据权利要求11-13中任一项所述的系统,其中,所述服务器,还包括:
收集单元,用于收集所述预置关键词对应的一个或多个搜索结果;
抓取单元,用于抓取每个搜索结果的网页快照;
检测单元,用于根据所述网页快照以及所述搜索结果被访问后开启的页面两者在文字内容上的一致性来获取所述搜索结果中存在的一个或多个被利用的搜索结果。
15.根据权利要求11-14中任一项所述的系统,其中,所述服务器,还包括:
收集单元,用于收集所述预置关键词、与所述预置关键词对应的一个或多个搜索结果;
抓取单元,用于抓取每个搜索结果的网页快照以及每个搜索结果的网址链接;
初步检测单元,用于根据所述预置关键词与所述网页快照在文字内容上进行一致性判断,和/或根据所述预置关键词与所述网址链接的类型进行一致性判断,从而初步确定所述搜索结果中存在的被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改的搜索结果;
再次检测单元,用于当初步确定所述被利用的搜索结果后,根据所述被利用的搜索结果的网页快照以及所述被利用的搜索结果被访问后开启的页面,两者在文字内容上的一致性来最终获取所述被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改且访问页面发生跳转的搜索结果。
16.根据权利要求11-15中任一项所述的系统,其中,所述服务器,还包括:
收集单元,用于收集所述预置关键词对应的真实网页网址、与所述预置关键词对应的一个或多个搜索结果;
抓取单元,用于抓取每个搜索结果中的网址链接;
初步检测单元,用于根据所述真实网页网址与所述网址链接的匹配关系来初步确定所述搜索结果中存在的被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改的搜索结果;
再次检测单元,用于当初步确定出所述被利用的搜索结果后,根据所述网页快照以及所述搜索结果被访问后开启的页面在文字内容上的一致性来最终获取所述被利用的搜索结果,所述被利用的搜索结果包括显示内容被篡改且访问页面发生跳转的搜索结果。
17.根据权利要求11-16中任一项所述的系统,其中,所述服务器,进一步包括:
关键词匹配单元,用于根据所述检索关键词,与所述数据库中预置关键词进行匹配;
数据匹配单元,用于当所述检索关键词与所述预置关键词匹配时,根据所述检索关键词对应的搜索结果列表,与所述数据库中所述被利用的搜索结果进行匹配,以识别所述搜索结果列表中存在的被利用的搜索结果。
18.根据权利要求11-17中任一项所述的系统,其中,所述服务器,进一步包括:
数据匹配单元,用于根据所述检索关键词对应的搜索结果列表,与所述数据库中被利用的搜索结果进行匹配;
关键词匹配单元,用于当所述搜索结果列表中匹配到所述被利用的搜索结果时,再根据所述检索关键词,与所述数据库中所述预置关键词进行匹配,以识别所述搜索结果列表中存在的被利用的搜索结果。
19.根据权利要求11-18中任一项所述的系统,其中,还包括:
查询接口,用于接收所述客户端的验证请求,并根据所述验证请求获取所述搜索引擎中所使用的检索关键词及其对应的搜索结果列表,并发送给所述服务器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210324317.1A CN102902722B (zh) | 2012-09-04 | 2012-09-04 | 一种信息安全性的处理方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210324317.1A CN102902722B (zh) | 2012-09-04 | 2012-09-04 | 一种信息安全性的处理方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102902722A true CN102902722A (zh) | 2013-01-30 |
CN102902722B CN102902722B (zh) | 2015-09-02 |
Family
ID=47574955
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210324317.1A Active CN102902722B (zh) | 2012-09-04 | 2012-09-04 | 一种信息安全性的处理方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102902722B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104580093A (zh) * | 2013-10-21 | 2015-04-29 | 腾讯科技(深圳)有限公司 | 网站通知消息的处理方法、装置及系统 |
CN105095464A (zh) * | 2015-07-30 | 2015-11-25 | 北京奇虎科技有限公司 | 一种检索系统的检测方法和装置 |
CN106062747A (zh) * | 2014-02-28 | 2016-10-26 | 微软技术许可有限责任公司 | 信息接口生成 |
CN107623666A (zh) * | 2016-07-15 | 2018-01-23 | 阿里巴巴集团控股有限公司 | 信息搜索的方法、装置和系统 |
CN108170785A (zh) * | 2017-12-26 | 2018-06-15 | 深圳Tcl新技术有限公司 | 终端搜索操作的引导方法、装置及计算机可读存储介质 |
CN115033819A (zh) * | 2022-04-26 | 2022-09-09 | 广东希尔文化传媒投资股份有限公司 | 一种互联网风险监控方法和系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101059818A (zh) * | 2007-06-26 | 2007-10-24 | 申屠浩 | 加强搜索引擎结果安全性的方法 |
CN101145153A (zh) * | 2006-09-13 | 2008-03-19 | 阿里巴巴公司 | 一种搜索信息的方法及系统 |
US7730407B2 (en) * | 2003-02-28 | 2010-06-01 | Fuji Xerox Co., Ltd. | Systems and methods for bookmarking live and recorded multimedia documents |
CN102541937A (zh) * | 2010-12-22 | 2012-07-04 | 北大方正集团有限公司 | 一种网页信息探测方法及系统 |
-
2012
- 2012-09-04 CN CN201210324317.1A patent/CN102902722B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7730407B2 (en) * | 2003-02-28 | 2010-06-01 | Fuji Xerox Co., Ltd. | Systems and methods for bookmarking live and recorded multimedia documents |
CN101145153A (zh) * | 2006-09-13 | 2008-03-19 | 阿里巴巴公司 | 一种搜索信息的方法及系统 |
CN101059818A (zh) * | 2007-06-26 | 2007-10-24 | 申屠浩 | 加强搜索引擎结果安全性的方法 |
CN102541937A (zh) * | 2010-12-22 | 2012-07-04 | 北大方正集团有限公司 | 一种网页信息探测方法及系统 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104580093A (zh) * | 2013-10-21 | 2015-04-29 | 腾讯科技(深圳)有限公司 | 网站通知消息的处理方法、装置及系统 |
CN104580093B (zh) * | 2013-10-21 | 2019-09-20 | 腾讯科技(深圳)有限公司 | 网站通知消息的处理方法、装置及系统 |
CN106062747A (zh) * | 2014-02-28 | 2016-10-26 | 微软技术许可有限责任公司 | 信息接口生成 |
CN106062747B (zh) * | 2014-02-28 | 2020-03-03 | 微软技术许可有限责任公司 | 信息接口生成 |
CN105095464A (zh) * | 2015-07-30 | 2015-11-25 | 北京奇虎科技有限公司 | 一种检索系统的检测方法和装置 |
CN105095464B (zh) * | 2015-07-30 | 2019-03-05 | 北京奇虎科技有限公司 | 一种检索系统的检测方法和装置 |
CN107623666A (zh) * | 2016-07-15 | 2018-01-23 | 阿里巴巴集团控股有限公司 | 信息搜索的方法、装置和系统 |
CN108170785A (zh) * | 2017-12-26 | 2018-06-15 | 深圳Tcl新技术有限公司 | 终端搜索操作的引导方法、装置及计算机可读存储介质 |
CN115033819A (zh) * | 2022-04-26 | 2022-09-09 | 广东希尔文化传媒投资股份有限公司 | 一种互联网风险监控方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN102902722B (zh) | 2015-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9276956B2 (en) | Method for detecting phishing website without depending on samples | |
CN102902722A (zh) | 一种信息安全性的处理方法和系统 | |
Pan et al. | Anomaly based web phishing page detection | |
CN104767757B (zh) | 基于web业务的多维度安全监测方法和系统 | |
CN107360162B (zh) | 一种网络应用防护方法和装置 | |
CN103428189B (zh) | 一种识别恶意网络设备的方法、装置和系统 | |
CN103384242B (zh) | 基于Nginx代理服务器的入侵检测方法及系统 | |
CN110119469A (zh) | 一种面向暗网的数据采集与分析系统及方法 | |
KR101070184B1 (ko) | 멀티스레드 사이트 크롤러를 이용한 악성코드 자동수집, 자동분석시스템과 보안장비 연동을 통한 악성코드접근차단시스템 및 방법 | |
CN103843003A (zh) | 句法指纹识别 | |
CN102710646B (zh) | 一种钓鱼网站的收集方法和系统 | |
CN102685145A (zh) | 一种基于dns数据包的僵尸网络域名发现方法 | |
CN102622553A (zh) | 检测网页安全的方法及装置 | |
CN105376217B (zh) | 一种恶意跳转及恶意嵌套类不良网站的自动判定方法 | |
CN103632084A (zh) | 恶意特征数据库的建立方法、恶意对象检测方法及其装置 | |
CN106713318B (zh) | 一种web站点安全防护方法及系统 | |
CN107688743A (zh) | 一种恶意程序的检测分析方法及系统 | |
CN103067387B (zh) | 一种反钓鱼监测系统和方法 | |
CN108111526A (zh) | 一种基于异常whois信息的非法网站挖掘方法 | |
CN102833262A (zh) | 基于whois信息的钓鱼网站收集、鉴定方法和系统 | |
CN108023868A (zh) | 恶意资源地址检测方法和装置 | |
CN109327451A (zh) | 一种防御文件上传验证绕过的方法、系统、装置及介质 | |
CN104679798B (zh) | 网页检测方法及装置 | |
CN103685606A (zh) | 关联域名的获取方法和系统以及网站管理员权限验证方法 | |
CN110798429A (zh) | 一种网络安全防御中的威胁追捕方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220706 Address after: Room 801, 8th floor, No. 104, floors 1-19, building 2, yard 6, Jiuxianqiao Road, Chaoyang District, Beijing 100015 Patentee after: BEIJING QIHOO TECHNOLOGY Co.,Ltd. Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park) Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd. Patentee before: Qizhi software (Beijing) Co.,Ltd. |