CN102855320A - 一种利用搜索引擎对关键词相关url的收集方法和装置 - Google Patents

一种利用搜索引擎对关键词相关url的收集方法和装置 Download PDF

Info

Publication number
CN102855320A
CN102855320A CN2012103246254A CN201210324625A CN102855320A CN 102855320 A CN102855320 A CN 102855320A CN 2012103246254 A CN2012103246254 A CN 2012103246254A CN 201210324625 A CN201210324625 A CN 201210324625A CN 102855320 A CN102855320 A CN 102855320A
Authority
CN
China
Prior art keywords
url
keyword
trusted
malice
webpage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012103246254A
Other languages
English (en)
Inventor
彭仁诚
潘建波
徐鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Internet Security Software Co Ltd
Shell Internet Beijing Security Technology Co Ltd
Zhuhai Juntian Electronic Technology Co Ltd
Beijing Kingsoft Internet Science and Technology Co Ltd
Original Assignee
Zhuhai Juntian Electronic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Juntian Electronic Technology Co Ltd filed Critical Zhuhai Juntian Electronic Technology Co Ltd
Priority to CN2012103246254A priority Critical patent/CN102855320A/zh
Publication of CN102855320A publication Critical patent/CN102855320A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种利用搜索引擎对关键词相关URL的收集方法和装置,主要步骤如下:搜索关键词,获取与关键词对应的网页的URL;判断所述获取的网页的URL是否为恶意URL或可信任URL,若是恶意URL,提取恶意URL的网页内容;若是可信任URL,提取可信任URL的网页内容;若不是恶意URL或可信任URL,结束;判断任意恶意URL的网页内容之间是否具有相同的关键词,若具有,所述关键词为关联的关键词;重复以上步骤。本发明有效地利用搜索引擎发现恶意URL,利用关联的关键词的主动发现模式,更快速、准确地发现恶意URL,提前识别恶意URL,避免用户在点击后才发现中毒的被动局面,减少用户的损失。

Description

一种利用搜索引擎对关键词相关URL的收集方法和装置
技术领域
本发明涉及计算机领域,尤其是一种利用搜索引擎对关键词相关URL的收集方法和装置。
背景技术
如今,在网络设备和网络应用市场蓬勃发展的带动下,近年来网络安全市场迎来了高速发展期,一方面随着网络的延伸,网络规模迅速扩大,安全问题变得日益复杂,建设可管、可控、可信的网络也是进一步推进网络应用发展的前提;另一方面随着网络所承载的业务日益复杂,保证应用层安全是网络安全发展的新的方向。
随着网络技术的快速发展,传统的被动防御模式已经不能满足人们对于网络安全的需求。构建一个局部安全、全局安全、智能安全的整体安全体系,为用户提供多层次、全方位的立体防护体系显得尤为重要。
网络用户在浏览一些网站的时候,并不能主动分辨出该网站的安全级别,有些甚至是恶意的网站。点击或者从这些恶意网站往往会连合恶意程序一并带入自己的电脑,而用户本人对此丝毫不知情。直到有恶意广告不断弹出或色情网站自动出现时,用户才有可能发觉电脑已“中毒”。在恶意软件未被发现的这段时间,用户网上的所有敏感资料都有可能被盗走,比如银行帐户信息,信用卡密码等。这种情况下,都需要借助安全防护系统分辨浏览的网站是否为安全软件。
目前,计算机安全防护系统多数都是被动式地发现恶意网页。传统的安全防护系统多是经过用户主动杀毒,或者点击发现,或者潜伏发作被安全防护系统拦截等被动模式发现。这种传统的发现模式不利于避免用户的损失,在一定的程度上对用户的安全造成威胁。针对用户习惯使用搜索引擎搜索需要的信息这个习惯,很多恶意网站出现在搜索结果列表中,用户很容易因为点击这些恶意网站而中毒,甚至产生严重的后果。
发明内容
本发明的目的,就是克服现有技术的不足,提供一种主动发现恶意网页的利用搜索引擎对关键词相关URL的收集方法和装置,该方法和装置能快速,有效地利用搜索引擎把恶意网站查找出来,同时持续性利用关联的关键词查找更多恶意网站,提前识别恶意网站,避免用户在点击后才发现恶意网站的被动局面。
为了达到上述目的,采用如下技术方案:
一种利用搜索引擎对关键词相关URL的收集方法,其特征在于其包括以下步骤:
1)搜索关键词,获取与关键词对应的网页的URL;
2)判断所述获取的网页的URL是否为恶意URL或可信任URL,若是恶意URL,提取恶意URL的网页内容;若是可信任URL,提取可信任URL的网页内容;若不是恶意URL或可信任URL,结束;
3)判断任意恶意URL的网页内容之间是否具有相同的关键词,若具有,所述关键词为关联的关键词;
4)重复步骤1)—3)。
进一步地,所述步骤2)的判断方法包括:所述获取的网页的URL与黑名单数据库中的恶意URL以及白名单数据库中的可信任URL比较,若获取的网页的URL是黑名单数据库中的恶意URL,则获取的网页的URL为恶意URL;若获取的网页的URL是白名单数据库中的可信任URL,则为可信任URL;若获取的网页的URL不是黑名单数据库中的恶意URL或白名单数据库中的可信任URL,则为可疑URL,根据预设的判断规则判断可疑URL是否为恶意URL或可信任URL。
进一步地,根据预设的判断规则判断可疑URL为恶意URL,把恶意URL存储至黑名单数据库;可疑URL为可信任URL,把可信任URL存储至白名单数据库;可疑URL仍为可疑URL,结束。
进一步地,所述关联的关键词由一个关联的关键词构成或两个以上关联的关键词组合构成。
进一步地,所述步骤3)中,若任意恶意URL的网页内容之间具有相同的关键词,所述恶意URL拥有所述关键词的数量与所有恶意URL的数量之比大于30%,所述关键词为关联的关键词。
进一步地,若任意恶意URL的网页内容之间具有相同的关键词,且可信任URL的网页内容具有所述关键词,所述关键词所在的可信任URL的数量与所有可信任URL的数量之比小于50%,所述关键词所在的恶意URL的数量与所有恶意URL的数量之比大于30%,则所述关键词为关联的关键词。
一种利用搜索引擎对关键词相关URL的收集装置,包括搜索模块,用于搜索关键词,获取与关键词对应的网页的URL;判断提取模块,用于判断所述获取的网页的URL是否为恶意URL或可信任URL,若是恶意URL,则提取恶意URL的网页内容;若是可信任URL,提取可信任URL的网页内容;若不是恶意URL或可信任URL,结束;关键词判断模块,用于判断任意恶意URL的网页内容之间是否具有相同的关键词;若具有,所述关键词为关联的关键词。
进一步地,所述装置还包括一存储恶意URL的黑名单数据库,一存储可信任URL的白名单数据库。
进一步地,所述装置还包括一匹配模块,所述匹配模块把获得的网页的URL与黑名单数据库中的恶意URL以及白名单数据库中的可信任URL匹配;若获取的网页的URL是黑名单数据库中的恶意URL,则获取的网页的URL为恶意URL;若获取的网页的URL是白名单数据库中的可信任URL,则为可信任URL。
进一步地,所述关联的关键词由一个关联的关键词构成或一个以上关联的关键词组合构成。
与现有技术相比,本发明的有益效果在于:
本发明有效地利用搜索引擎把恶意网站查找出来,同时持续性利用关联的关键词查找更多恶意网站,提前识别恶意网站,避免用户在点击后才发现恶意网站的被动局面,减少用户的损失。另外,本发明设立的黑名单数据库和白名单数据库,可以减少判断量,提高整个装置的运行效率。通过对应列表中记录的用户搜索关键词,以及该关键词对应的网页的URL的对应关系信息,可以获得关联的关键词,进一步通过搜索,发现更大量的恶意网站,保护用户的系统安全。
附图说明
图1是实施例一的流程图;
图2是实施例二的装置框图。
图示:1—搜索模块;2—判断提取模块;3—关键词判断模块;
4—黑名单数据库;5—白名单数据库;6关键词数据库;7—匹配模块。
具体实施方式
下面将结合附图以及具体实施方法来详细说明本发明,在本发明的示意性实施及说明用来解释本发明,但并不作为对本发明的限定。
实施例一:
本实施例公开了一种利用搜索引擎对关键词相关URL的收集方法,主要包括以下步骤:
1)搜索关键词,获取与关键词对应的网页的URL。
具体地,刚开始搜索的关键词为预设的关键词,预设的关键词可通过人工收集输入,收集的关键词一般为网络热词。恶意网站多数通过网络热词提高自身的点击率。例如:手机、充值卡、游戏或当前热门点击的关键词等等。通过输入这些网络热词,利用常用的搜索引擎,用户可以获得多个网页搜索结果。根据搜索结果的匹配度以及各个搜索引擎排名的因素,各个网页的URL的排名位置不一。用户一般在只看前十页的搜索结果。本实施例获取搜索结果的前100条URL。
2)判断所述获取的网页的URL是否为恶意URL或可信任URL,若是恶意URL,则提取恶意URL的网页内容;若是可信任URL,提取可信任URL的网页内容;若不是恶意URL或可信任URL,结束。
具体地,本实施例的判断方法包括:获取的网页的URL与黑名单数据库中的恶意URL以及白名单数据库中的可信任URL比较,若获取的网页的URL是黑名单数据库中的恶意URL,则获取的网页的URL为恶意URL;若获取的网页的URL是白名单数据库中的可信任URL,则为可信任URL;若获取的网页的URL与黑名单数据库中的恶意URL或白名单数据库中的可信任URL都不相同,则为可疑URL。可疑URL根据预设的判断规则,把网页的页面文件下载到虚拟机中,通过网站页面在虚拟机中的运行情况进行分析和检测判断是否为恶意URL或可信任URL。若从运行情况中检测该网页文件具有恶意行为,如盗号、强制运行插件、强制下载文件等等,则判断该网页的URL为恶意URL。把恶意URL存储至黑名单数据库中,并提取恶意URL的网页内容;把可信任URL存储至白名单数据库中,并提取可信任URL的网页内容。所述网页内容指文字内容。若无法区分获取的网页的URL为恶意URL或可信任URL,则结束。
3)判断任意恶意URL的网页内容之间是否具有相同的关键词;若具有,所述关键词为关联的关键词。
具体地说,如果步骤2)判断获取的网页的URL为恶意URL,并提取恶意URL的网页内容。从任意恶意URL的网页内容中找出相同的关键词,则该关键词为关联的关键词。举例说明,假设预设的种子关键词“充值”利用搜索引擎搜索出100个对应的URL,其中10个URL被判定为恶意URL。预设的种子关键词“充值”与100个对应的URL构成1比100的对应关系。“充值”这个关键词对应的100个URL中有10个被判定为恶意URL。在这10个恶意URL中,假设提取的内容中有4个恶意URL的内容中包括“1分钟到账”这个关键词,则这个关键词为关联的关键词。
作为优选,若任意恶意URL的网页内容之间具有相同的关键词,所述恶意URL拥有所述关键词的数量与所有恶意URL的数量之比大于30%,所述关键词为关联的关键词。举例说明,假设预设的种子关键词“充值”利用搜索引擎搜索出100个对应的URL,其中10个URL被判定为恶意URL。在这10个恶意URL中,假设提取的内容中有4个恶意URL的内容中包括“1分钟到账”这个关键词。“1分钟到账”这个关键词的恶意URL的数量为4,占恶意URL总数量10的40%,则“1分钟到账”这个关键词为关联的关键词。如果“1分钟到账”这个关键词所在的恶意URL的数量为2,占恶意URL总数量10的20%(低于30%),则“1分钟到账”这个关键词不是关联的关键词。
作为优选,若任意恶意URL的网页内容之间具有相同的关键词,且可信任URL的网页内容具有所述关键词,所述关键词所在的可信任URL的数量与所有可信任URL的数量之比小于50%,所述关键词所在的恶意URL的数量与所有恶意URL的数量之比大于30%,则所述关键词为关联的关键词。举例说明,假设预设的种子关键词“充值”利用搜索引擎搜索出100个对应的URL,其中10个URL被判定为恶意URL,50个URL被判定为可信任URL,40个URL为可疑URL。在这10个恶意URL中,假设提取的内容中有4个恶意URL的内容中包括“1分钟到账”这个关键词。“1分钟到账”这个关键词的恶意URL的数量为4,占恶意URL总数量10的40%(高于30%)。且“1分钟到账”这个关键词所在的可信任URL的数量为20,占可信任URL总数量50的40%(低于50%),则“1分钟到账”这个关键词是关联的关键词。如果“1分钟到账”这个关键词的恶意URL的数量为4,占恶意URL总数量10的40%(高于30%),且“1分钟到账”这个关键词所在的可信任URL的数量为40,占可信任URL总数量50的80%(高于50%),则“1分钟到账”这个关键词不是关联的关键词。只有同时满足提取的关键词所在的可信任URL的数量与所有可信任URL的数量之比小于50%,关键词所在的恶意URL的数量与所有恶意URL的数量之比大于30%,则所述关键词为关联的关键词。
本实施例从恶意URL中提取的关联的关键词不止一个,可以提取多个不同的关联的关键词。举例,除了上述“1分钟到账”,还包括“移动充值”、“联通充值”等。假设从关键词“充值”可以找到“1分钟到账”、“移动充值”、“联通充值”三个关联的关键词。分别使用搜索引擎搜索“1分钟到账”、“移动充值”、“联通充值”这三个关联的关键词,获得三组不同的关联的关键词与对应网页的URL的对应关系信息。作为优选,这三个可以关键词还可以以“移动充值+联通充值+5分钟到账”或“联通充值+5分钟到账”或“移动充值+5分钟到账”或“移动充值+联通充值”的形式组合构成新的关联的关键词。这种组合并不限于上述举例的限定。
若从恶意URL中无法找出关联的关键词,则结束。
4)重复步骤2)—3)。
把步骤3)利用搜索引擎搜索出来的三组不同的关联的关键词与对应网页的URL根据步骤2)判断对应网页的URL是否为恶意URL或可信任URL,提取网页的网页内容,尤其是文字内容。再通过步骤3)找出恶意URL的关联的关键词,最后再进入步骤4)。通过循环,可以快速,准确地发现不同的关联的关键词,从而更快、更准确地判断搜索获得的网页的URL为可信URL或可疑URL或恶意URL,保护用户的信息安全。
实施例二
本实施例包括一种利用搜索引擎对关键词相关URL的收集装置。该装置包括用于搜索关键词,获取与关键词对应的网页的URL的搜索模块1;用于判断所述获取的网页的URL为恶意URL或可信任URL或可疑URL并提取网页内容的判断提取模块2;用于判断任意恶意URL的网页内容之间是否具有相同的关键词,若具有,所述关键词为关联的关键词的关键词判断模块3。还包括用于存储预恶意URL的黑名单数据库4,存储有可信任URL的白名单数据库5,存储有关键词的关键词数据库6。
关键词数据库6中存储的关键词由人工收集输入或通过搜索所得。预设的关键词一般为网络热词。恶意网站多数通过网络热词提高自身的点击率。例如:手机、充值卡、游戏等等。通过输入这些网络热词,利用常见的搜索引擎,用户可以获得多个网页搜索结果。关键词数据库6中包含预设的关键词和关联的关键词。
搜索模块1把关键词数据库6中的预设的关键词利用常见的搜索引擎搜索,获得与预设的关键词或关联的关键词对应的网页的URL。
本装置还包括匹配模块7。通过搜索模块1搜索,匹配模块7把获得的网页的URL优先与黑名单数据库4中的恶意URL以及白名单数据库5中的可信任URL匹配;若获取的网页的URL是黑名单数据库4中的恶意URL,则获取的网页的URL为恶意URL;若获取的网页的URL是白名单数据库5中的可信任URL,则为可信任URL;若获取的网页的URL与黑名单数据库4中的恶意URL或白名单数据库5中的可信任URL都不相同,则为可疑URL。可疑URL再通过现有的虚拟机技术,通过预设的判断规则由判断提取模块2判断可疑URL为可信任URL或恶意URL,或仍为可疑URL。判断提取模块2从恶意URL和可信任URL中提取网页内容,尤其是文字内容。
判断提取模块2判断搜索模块1搜索出的网页的URL为恶意URL或可信任URL。判断提取模块2的判断依据主要根据现有的虚拟机技术。通过下载需要判断的URL的页面内容至虚拟机中运行,检测和判断该页面内容是否恶意URL或可信任URL。
关联的关键词判断模块3判断不同恶意URL的网页内容之间是否具有相同的关键词。若任意恶意URL的网页内容之间具有相同的关键词,且恶意URL拥有所述关键词的数量与所有恶意URL的数量之比大于30%,所述关键词为关联的关键词。具体的判断方法如实施例一的方法所述,在此不作赘述。找到关联的关键词后,把该关键词发送至关键词数据库6,由关键词数据库6存储。同时利用搜索模块1搜索该关联的关键词,获取与关联的关键词对应的网页的URL。判断提取模块2再判断所述获取的网页的URL是否为恶意URL或可信任URL。通过循环,快速查找相关联的恶意URL。
本实施例的装置通过预设的关键词找出关联的关键词,扩大了查找范围。此外,搜索模块1把预设的关键词、关联的关键词存储至关键词数据库6中。判断提取模块2把获得的网页的URL首先与黑名单数据库4中的恶意URL以及白名单数据库5中的可信任URL匹配。若搜索模块1获得的网页的URL与黑名单数据库4中的恶意URL或白名单数据库5中的可信任URL匹配,节省了判断提取模块2的工作,有利于提高效率。若搜索模块1获得的网页的URL与黑名单数据库4中的恶意URL或白名单数据库5中的可信任URL均不匹配,则判断提取模块2根据现有的技术的判断规则判断其为恶意URL或可信任URL或可疑URL,并把判断结果为恶意URL发送至黑名单数据库4,由黑名单数据库4存储该恶意URL;把判断结果为可信任URL发送至白名单数据库5中,由白名单数据库5存储该可信任URL。通过判断提取模块2的判断,黑名单数据库和白名单数据库均得到更新。
本实施例的关联的关键词由一个关联的关键词构成或两个以上关联的关键词组合构成。如实施例一步骤3)所述的关联的关键词组合模式。
以上对本发明实施例所提供的技术方案进行了详细介绍,本文中应用了具体个例对本发明实施例的原理以及实施方式进行了阐述,以上实施例的说明只适用于帮助理解本发明实施例的原理;同时,对于本领域的一般技术人员,依据本发明实施例,在具体实施方式以及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种利用搜索引擎对关键词相关URL的收集方法,其特征在于其包括以下步骤:
1)搜索关键词,获取与关键词对应的网页的URL;
2)判断所述获取的网页的URL是否为恶意URL或可信任URL,若是恶意URL,提取恶意URL的网页内容;若是可信任URL,提取可信任URL的网页内容;若不是恶意URL或可信任URL,结束;
3)判断任意恶意URL的网页内容之间是否具有相同的关键词,若具有,所述关键词为关联的关键词;
4)重复步骤1)—3)。
2.根据权利要求1所述的利用搜索引擎对关键词相关URL的收集方法,其特征在于所述步骤2)包括:
所述获取的网页的URL与黑名单数据库中的恶意URL以及白名单数据库中的可信任URL比较,若获取的网页的URL是黑名单数据库中的恶意URL,则获取的网页的URL为恶意URL;若获取的网页的URL是白名单数据库中的可信任URL,则为可信任URL;若获取的网页的URL不是黑名单数据库中的恶意URL或白名单数据库中的可信任URL,则为可疑URL,根据预设的判断规则判断可疑URL是否为恶意URL或可信任URL。
3.根据权利要求2所述的利用搜索引擎对关键词相关URL的收集方法,其特征在于:根据预设的判断规则判断可疑URL为恶意URL,把恶意URL存储至黑名单数据库;可疑URL为可信任URL,把可信任URL存储至白名单数据库;可疑URL仍为可疑URL,结束。
4.根据权利要求1所述的利用搜索引擎对关键词相关URL的收集方法,其特征在于:
所述关联的关键词由一个关联的关键词构成或两个以上关联的关键词组合构成。
5.根据权利要求1所述的利用搜索引擎对关键词相关URL的收集方法,其特征在于:所述步骤3)中,若任意恶意URL的网页内容之间具有相同的关键词,所述恶意URL拥有所述关键词的数量与所有恶意URL的数量之比大于30%,所述关键词为关联的关键词。
6.根据权利要求5所述的利用搜索引擎对关键词相关URL的收集方法,其特征在于:若任意恶意URL的网页内容之间具有相同的关键词,且可信任URL的网页内容具有所述关键词,所述关键词所在的可信任URL的数量与所有可信任URL的数量之比小于50%,所述关键词所在的恶意URL的数量与所有恶意URL的数量之比大于30%,则所述关键词为关联的关键词。
7.一种利用搜索引擎对关键词相关URL的收集装置,其特征在于包括:
搜索模块,用于搜索关键词,获取与关键词对应的网页的URL;
判断提取模块,用于判断所述获取的网页的URL是否为恶意URL或可信任URL,若是恶意URL,则提取恶意URL的网页内容;若是可信任URL,提取可信任URL的网页内容;若不是恶意URL或可信任URL,结束;
关键词判断模块,用于判断任意恶意URL的网页内容之间是否具有相同的关键词;若具有,所述关键词为关联的关键词。
8.根据权利要求7所述的利用搜索引擎对关键词相关URL的收集装置,其特征在于:
所述装置还包括一存储恶意URL的黑名单数据库,一存储可信任URL的白名单数据库。
9.根据权利要求7所述的利用搜索引擎对关键词相关URL的收集装置,其特征在于:
所述装置还包括一匹配模块,所述匹配模块把获得的网页的URL与黑名单数据库中的恶意URL以及白名单数据库中的可信任URL匹配;若获取的网页的URL是黑名单数据库中的恶意URL,则获取的网页的URL为恶意URL;若获取的网页的URL是白名单数据库中的可信任URL,则为可信任URL。
10.根据权利要求7所述的利用搜索引擎对关键词相关URL的收集装置,其特征在于:
所述关联的关键词由一个关联的关键词构成或一个以上关联的关键词组合构成。
CN2012103246254A 2012-09-04 2012-09-04 一种利用搜索引擎对关键词相关url的收集方法和装置 Pending CN102855320A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012103246254A CN102855320A (zh) 2012-09-04 2012-09-04 一种利用搜索引擎对关键词相关url的收集方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012103246254A CN102855320A (zh) 2012-09-04 2012-09-04 一种利用搜索引擎对关键词相关url的收集方法和装置

Publications (1)

Publication Number Publication Date
CN102855320A true CN102855320A (zh) 2013-01-02

Family

ID=47401908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012103246254A Pending CN102855320A (zh) 2012-09-04 2012-09-04 一种利用搜索引擎对关键词相关url的收集方法和装置

Country Status (1)

Country Link
CN (1) CN102855320A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530391A (zh) * 2013-10-22 2014-01-22 北京国双科技有限公司 网页广告监测方法和装置
WO2014127653A1 (zh) * 2013-02-21 2014-08-28 腾讯科技(深圳)有限公司 恶意网站的访问方法、装置和系统
CN104615695A (zh) * 2015-01-23 2015-05-13 腾讯科技(深圳)有限公司 一种恶意网址的检测方法及系统
CN105429980A (zh) * 2015-11-17 2016-03-23 中国联合网络通信集团有限公司 网络安全处理方法及装置
CN105653563A (zh) * 2014-12-02 2016-06-08 阿里巴巴集团控股有限公司 对网页抓取的控制方法、动态更新黑名单和白名单的方法及相关装置
CN106528805A (zh) * 2016-11-15 2017-03-22 广东华仝九方科技有限公司 基于用户的移动互联网恶意程序url智能分析挖掘方法
CN108027820A (zh) * 2016-09-02 2018-05-11 百度时代网络技术(北京)有限公司 用于产生短语黑名单以响应于搜索查询来防止某些内容出现在搜索结果中的方法和系统
CN108647225A (zh) * 2018-03-23 2018-10-12 浙江大学 一种电商黑灰产舆情自动挖掘方法和系统
CN109241462A (zh) * 2018-08-13 2019-01-18 中国联合网络通信集团有限公司 网页黑词处理方法、装置、设备及存储介质
CN110290114A (zh) * 2019-06-04 2019-09-27 武汉大学 一种基于预警信息的漏洞自动化防护方法及系统
CN111488512A (zh) * 2019-01-25 2020-08-04 深信服科技股份有限公司 一种待收集目标获取方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006119480A2 (en) * 2005-05-03 2006-11-09 Mcafee, Inc. Website reputation product architecture
CN101035128A (zh) * 2007-04-18 2007-09-12 大连理工大学 基于中文标点符号的三重网页文本内容识别及过滤方法
CN101847161A (zh) * 2010-06-02 2010-09-29 苏州搜图网络技术有限公司 搜索网页的方法和建立数据库的方法
CN102339320A (zh) * 2011-11-04 2012-02-01 成都市华为赛门铁克科技有限公司 恶意网页的识别方法以及识别装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006119480A2 (en) * 2005-05-03 2006-11-09 Mcafee, Inc. Website reputation product architecture
CN101035128A (zh) * 2007-04-18 2007-09-12 大连理工大学 基于中文标点符号的三重网页文本内容识别及过滤方法
CN101847161A (zh) * 2010-06-02 2010-09-29 苏州搜图网络技术有限公司 搜索网页的方法和建立数据库的方法
CN102339320A (zh) * 2011-11-04 2012-02-01 成都市华为赛门铁克科技有限公司 恶意网页的识别方法以及识别装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SANTA BARBARA等: "EVILSEED:A Guided Approach to Finding Malicious Web Pages", 《SECURITY AND PRIVACY 2012 IEEE》, 23 May 2012 (2012-05-23), XP032456302, DOI: doi:10.1109/SP.2012.33 *
彭浩: "基于领域关键词自动扩展的变量主题Hopfield聚焦爬虫的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 January 2009 (2009-01-15), pages 138 - 1292 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10264000B2 (en) 2013-02-21 2019-04-16 Tencent Technology (Shenzhen) Company Limited Malicious website access method and apparatus
WO2014127653A1 (zh) * 2013-02-21 2014-08-28 腾讯科技(深圳)有限公司 恶意网站的访问方法、装置和系统
CN103530391A (zh) * 2013-10-22 2014-01-22 北京国双科技有限公司 网页广告监测方法和装置
CN105653563A (zh) * 2014-12-02 2016-06-08 阿里巴巴集团控股有限公司 对网页抓取的控制方法、动态更新黑名单和白名单的方法及相关装置
CN105653563B (zh) * 2014-12-02 2019-08-02 阿里巴巴集团控股有限公司 对网页抓取的控制方法、动态更新黑名单和白名单的方法及相关装置
CN104615695A (zh) * 2015-01-23 2015-05-13 腾讯科技(深圳)有限公司 一种恶意网址的检测方法及系统
CN104615695B (zh) * 2015-01-23 2018-10-09 腾讯科技(深圳)有限公司 一种恶意网址的检测方法及系统
CN105429980A (zh) * 2015-11-17 2016-03-23 中国联合网络通信集团有限公司 网络安全处理方法及装置
CN105429980B (zh) * 2015-11-17 2018-10-30 中国联合网络通信集团有限公司 网络安全处理方法及装置
US11604843B2 (en) 2016-09-02 2023-03-14 Baidu Usa Llc Method and system for generating phrase blacklist to prevent certain content from appearing in a search result in response to search queries
CN108027820A (zh) * 2016-09-02 2018-05-11 百度时代网络技术(北京)有限公司 用于产生短语黑名单以响应于搜索查询来防止某些内容出现在搜索结果中的方法和系统
CN106528805B (zh) * 2016-11-15 2019-06-28 广东华仝九方科技有限公司 基于用户的移动互联网恶意程序url智能分析挖掘方法
CN106528805A (zh) * 2016-11-15 2017-03-22 广东华仝九方科技有限公司 基于用户的移动互联网恶意程序url智能分析挖掘方法
CN108647225A (zh) * 2018-03-23 2018-10-12 浙江大学 一种电商黑灰产舆情自动挖掘方法和系统
CN109241462A (zh) * 2018-08-13 2019-01-18 中国联合网络通信集团有限公司 网页黑词处理方法、装置、设备及存储介质
CN109241462B (zh) * 2018-08-13 2021-12-14 中国联合网络通信集团有限公司 网页黑词处理方法、装置、设备及存储介质
CN111488512A (zh) * 2019-01-25 2020-08-04 深信服科技股份有限公司 一种待收集目标获取方法、装置、设备及存储介质
CN110290114A (zh) * 2019-06-04 2019-09-27 武汉大学 一种基于预警信息的漏洞自动化防护方法及系统
CN110290114B (zh) * 2019-06-04 2020-09-08 武汉大学 一种基于预警信息的漏洞自动化防护方法及系统

Similar Documents

Publication Publication Date Title
CN102855320A (zh) 一种利用搜索引擎对关键词相关url的收集方法和装置
US10560471B2 (en) Detecting web exploit kits by tree-based structural similarity search
KR101767454B1 (ko) 다양한 웹 서비스 환경에서 사용자의 행위 패턴 분석을 통한 이상행위 탐지 방법과 그를 위한 장치
JP6258553B2 (ja) ブラックリスト生成装置、ブラックリスト生成システム、ブラックリスト生成方法及びブラックリスト生成プログラム
CN102970289B (zh) 基于Web用户行为模式的身份认证方法
Shang et al. Android malware detection method based on naive Bayes and permission correlation algorithm
WO2016201938A1 (zh) 一种多阶段钓鱼网站检测方法与系统
CN103632084A (zh) 恶意特征数据库的建立方法、恶意对象检测方法及其装置
US9639689B1 (en) User authentication
CN103023712A (zh) 网页恶意属性监测方法和系统
CN103136372B (zh) 网络可信性行为管理中url快速定位、分类和过滤方法
CN103500307A (zh) 一种基于行为模型的移动互联网恶意应用软件检测方法
CN101350822A (zh) 一种Internet恶意代码的发现和追踪方法
CN103617393A (zh) 一种基于支持向量机的移动互联网恶意应用软件检测方法
Wei et al. Android privacy
CN102999638A (zh) 基于网络群挖掘的钓鱼网站检测方法
CN106599688A (zh) 一种基于应用类别的安卓恶意软件检测方法
CN102194073A (zh) 一种杀毒软件的扫描方法及装置
CN109922065A (zh) 恶意网站快速识别方法
Li et al. Research of android malware detection based on network traffic monitoring
CN103179164A (zh) 存储页面信息的方法及其通信终端
WO2019114246A1 (zh) 一种身份认证方法、服务器及客户端设备
CN104394158A (zh) 一种信息安全过滤方法
CN104978523A (zh) 一种基于网络热词识别的恶意样本捕获方法及系统
CN105653941A (zh) 一种启发式检测钓鱼网站的方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: KINGSOFT CORPORATION LIMITED BEIKE INTERNET (BEIJI

Effective date: 20130503

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20130503

Address after: Jingshan Hill Road, Lane 519015 Lianshan Jida Guangdong province Zhuhai City No. 8

Applicant after: ZHUHAI JUNTIAN ELECTRONIC TECHNOLOGY Co.,Ltd.

Applicant after: BEIJING KINGSOFT INTERNET SECURITY SOFTWARE Co.,Ltd.

Applicant after: SHELL INTERNET (BEIJING) SECURITY TECHNOLOGY Co.,Ltd.

Applicant after: BEIJING KINGSOFT NETWORK TECHNOLOGY Co.,Ltd.

Address before: Jingshan Hill Road, Lane 519015 Lianshan Jida Guangdong province Zhuhai City No. 8

Applicant before: Zhuhai Juntian Electronic Technology Co.,Ltd.

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130102