CN103324615A - 基于搜索引擎优化的钓鱼网站探测方法及系统 - Google Patents

基于搜索引擎优化的钓鱼网站探测方法及系统 Download PDF

Info

Publication number
CN103324615A
CN103324615A CN2012100723336A CN201210072333A CN103324615A CN 103324615 A CN103324615 A CN 103324615A CN 2012100723336 A CN2012100723336 A CN 2012100723336A CN 201210072333 A CN201210072333 A CN 201210072333A CN 103324615 A CN103324615 A CN 103324615A
Authority
CN
China
Prior art keywords
webpage
title
fishing website
database
suspicious
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100723336A
Other languages
English (en)
Inventor
高坤
康学斌
李柏松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Antiy Technology Co Ltd
Original Assignee
Harbin Antiy Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Antiy Technology Co Ltd filed Critical Harbin Antiy Technology Co Ltd
Priority to CN2012100723336A priority Critical patent/CN103324615A/zh
Publication of CN103324615A publication Critical patent/CN103324615A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种基于搜索引擎优化的钓鱼网站探测方法,包括:分析已知钓鱼网站,将已知钓鱼网站的title作为关键词加入恶意title数据库中;保存网页爬虫获得的网页,对所获得的网页摘要及对应的URL滤重后建立网页索引数据库;用恶意title数据库中的关键词和/或用预先设定的关键词对网页索引数据库中的网页摘要进行检索,将匹配成功的网页保存为可疑网页;使用判断策略对可疑网页进行判断,将判断为钓鱼网站的可疑网页的title加入恶意title数据库中。本发明还提供了一种基于搜索引擎优化的钓鱼网站探测系统。本发明通过提取关键词来缩小检索范围,对网站进行主动爬取和判断不断的对数据库进行更新,减小了误报率,自动化判断获得的钓鱼网站,减小了漏报率。

Description

基于搜索引擎优化的钓鱼网站探测方法及系统
技术领域
本发明涉及计算机网络安全技术领域,尤其涉及一种基于搜索引擎优化主动监测钓鱼网站的方法和系统。
背景技术
由于电子商务的发展,网购已经成为广大网民生活中的一部分,由于经济利益的诱惑,许多不法之徒利用网民希望低价买到商品的心理搭建了很多钓鱼网站,以此来窃取用户账户和进行诈骗。
正对目前钓鱼网站泛滥的问题,比较主流的办法是利用黑名单的方法对访问的网站进行监控,一旦访问的网站网址出现在黑名单数据库中,则报警提醒用户。目前对钓鱼网站进行检测的方法也很多,传统的基于白名单和黑名单的方法由于钓鱼网站生存周期短和海量网站信息的原因则存在工作量巨大,滞后性太大的缺点,已经不太适合现有的网络环境。例如基于SVM主动学习算法的网络钓鱼检测,从URL入手,对不在黑白名单中的网站进行基于URL和WEB的判断,采用支持向量机的主动学习算法,但是需要对训练样本进行分类和筛选。基于匈牙利匹配算法的钓鱼检测则从渲染后的网页中提取信息,利用文本信息和图片信息形成签名,然后进行比较,如果相似度超过了一定的阀值,则认为是钓鱼网站,然而钓鱼网站的生存周期很短,特征变化加快,并且正常网站海量,很容易造成误报;基于分类集成的钓鱼网站检测方法则需要对大量正常网站和钓鱼网站的分析,需要前期良好的条件。中国公安大学周治平等人的钓鱼网站检测系统利用URL的相似性来检测目标单一,只能用于保护特定的网站,方法比较滞后。
发明内容
本发明提供一种基于搜索引擎优化的钓鱼网站探测方法及系统,从SEO(Search Engine Optimization)的角度通过提取关键词来缩小检索范围,对网站进行主动爬取和判断,不断的对数据库进行更新,减小了误报率,自动化判断获得的钓鱼网站,减小了漏报率。
本发明是基于scrapy开源框架的一个网络爬虫系统,首次通过限定关键词的办法缩小检索范围,并在后续的循环爬取中不断地更新钓鱼网页title数据库作为关键词来进一步爬取,然后对网页进行自动化判断的钓鱼网站主动监控系统。
首先介绍本发明一种基于搜索引擎优化的钓鱼网站探测方法,包括:
步骤a、分析已知钓鱼网站,将已知钓鱼网站的title作为关键词加入恶意title数据库中;
步骤b、保存网页爬虫获得的网页,对所获得的网页摘要及对应的URL滤重后建立网页索引数据库;
步骤c、用恶意title数据库中的关键词和/或用预先设定的关键词对网页索引数据库中的网页摘要进行检索,将匹配成功的网页保存为可疑网页;
步骤d、使用判断策略对可疑网页进行判断,将判断为钓鱼网站的可疑网页的title加入恶意title数据库中。
所述判断策略包括:如果所述恶意title数据库不为空,则对可疑网页title进行分词,将分词获得的内容与恶意title数据库中的关键词进行匹配,如果匹配率超过预设的阀值,则所述可疑网页为钓鱼网站。
所述判断策略还包括:如果不能判断所述可疑网页为钓鱼网站,则判断所述可疑网页title中是否包含特定的词汇,如果是则将所述可疑网页title保存为预先设定的关键词。
所述判断策略还包括:如果不能判断所述可疑网页为钓鱼网站,则对所述可疑网页的body 文件内容进行自动化判断,如果所述body 文件中特定语句或者词汇出现的频率超过预设值,则所述可疑网页为钓鱼网站。
所述方法循环执行步骤b至步骤d。
所述方法还包括将所述钓鱼网站添加到URL黑名单库。
本发明一种基于搜索引擎优化的钓鱼网站探测系统,包括:
恶意title数据库,用于保存已知钓鱼网站的title;
网页爬取模块,用于循环不断的进行网页爬虫,并保存网页爬虫获得的网页,对所获得的网页摘要及对应的URL滤重后建立网页索引数据库;
网页过滤模块,用恶意title数据库中的关键词和/或用预先设定的关键词对网页索引数据库中的网页摘要进行检索,将匹配成功的网页保存为可疑网页;
判断模块,使用判断策略对可疑网页进行判断,将判断为钓鱼网站的可疑网页的title加入恶意title数据库中。
所述判断策略包括:如果所述恶意title数据库不为空,则对可疑网页title进行分词,将分词获得的内容与恶意title数据库中的关键词进行匹配,如果匹配率超过预设的阀值,则所述可疑网页为钓鱼网站。
所述判断策略还包括:如果不能判断所述可疑网页为钓鱼网站,则判断所述可疑网页title中是否包含特定的词汇,如果是则将所述可疑网页title保存为预先设定的关键词。
所述判断策略还包括:如果不能判断所述可疑网页为钓鱼网站,则对所述可疑网页的body 文件内容进行自动化判断,如果所述body 文件中特定语句或者词汇出现的频率超过预设值,则所述可疑网页为钓鱼网站。
所述还包括数据处理模块,将将所述钓鱼网站添加到URL黑名单库。
本发明主要是基于搜索引擎优化的方法来实现的,利用钓鱼网站企图获得高的网络排名来欺骗更多的网民的心理来进行检索,因此钓鱼网站在网页的title中会安置合适的关键词,并且在网页中的关键词褒词一定的频率来进行网页优化,提高访问量。本发明从SEO的角度通过提取关键词来缩小检索范围,对网站进行主动爬取和判断,不断对数据库进行更新,减小了误报率,自动化判断获得的钓鱼网站,减小了漏报率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1 为本发明基于搜索引擎优化的钓鱼网站探测方法流程图;
图2为本发明 基于搜索引擎优化的钓鱼网站探测系统结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明中技术方案作进一步详细的说明。
本发明是基于scrapy开源框架的一个网络爬虫系统,首次通过限定关键词的办法缩小检索范围,并在后续的循环爬取中不断地更新钓鱼网页title数据库作为关键词来进一步爬取,然后对网页进行自动化判断的钓鱼网站主动监控系统。
基于上述技术方案,介绍本发明基于搜索引擎优化的钓鱼网站探测方法的一个具体实施例,如图1所示,包括:
S101、手工分析部分钓鱼网站,提取关键词,加入到恶意title数据库中。
S102、通过爬虫技术爬取网页,对所获得的网页摘要及对应的URL滤重后建立网页索引数据库。
S103、用恶意title数据库中的关键词和/或用预先设定的关键词对网页索引数据库中的网页摘要进行检索,获得可疑网页。
接下来对可疑网页进行判断,判断规则如下:
S104、如果存在钓鱼网页title数据库,则对可疑网页title进行分词,将分词获得的内容与恶意title数据库中的关键词进行匹配,如果匹配率超过预设的阀值,则判断为钓鱼网站,转入步骤S107;否则转入步骤S105,或者不执行步骤S105直接进入步骤S106;
S105、对该可疑网页title进行判断,如果包含特定的词汇,则报警,并将该网页title保存,作为下一次预先设定的关键词对网页索引数据库中的网页摘要进行检索来获取可疑网页,然后转入步骤S106;
S106、对该网页的body 文件内容进行自动化判断,判断规则如下:如果网页body中出现了一定频率的特定语句或者词汇,就判断为钓鱼网站(例如,彩票类的钓鱼网站经常出现“彩票预测”等词汇)。
S107、数据处理。将步骤S104和S106中判断为钓鱼网页的网页title添加到恶意title库作为下一次检索的关键词,同时将钓鱼网站的URL添加到黑名单库。
循环执行步骤S102至S107。
本发明还提供了一种基于搜索引擎优化的钓鱼网站探测系统,如图2所示,包括:
恶意title数据库201,用于保存已知钓鱼网站的title;
网页爬取模块202,用于循环不断的进行网页爬虫,并保存网页爬虫获得的网页,对所获得的网页摘要及对应的URL滤重后建立网页索引数据库;
网页过滤模块203,用恶意title数据库中的关键词和/或用预先设定的关键词对网页索引数据库中的网页摘要进行检索,将匹配成功的网页保存为可疑网页;
判断模块204,使用判断策略对可疑网页进行判断,将判断为钓鱼网站的可疑网页的title加入恶意title数据库中。
所述判断策略包括:如果所述恶意title数据库不为空,则对可疑网页title进行分词,将分词获得的内容与恶意title数据库中的关键词进行匹配,如果匹配率超过预设的阀值,则所述可疑网页为钓鱼网站。
所述判断策略还包括:如果不能判断所述可疑网页为钓鱼网站,则判断所述可疑网页title中是否包含特定的词汇,如果是则将所述可疑网页title保存为预先设定的关键词。
所述判断策略还包括:如果不能判断所述可疑网页为钓鱼网站,则对所述可疑网页的body 文件内容进行自动化判断,如果所述body 文件中特定语句或者词汇出现的频率超过预设值,则所述可疑网页为钓鱼网站。
所述系统还包括数据处理模块205,将将所述钓鱼网站添加到URL黑名单库。
由于本说明书中的系统实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
虽然通过实施例描绘了本发明,本领域普通技术人员知道,本发明有许多变形和变化而不脱离本发明的精神,希望所附的权利要求包括这些变形和变化而不脱离本发明的精神。

Claims (11)

1.一种基于搜索引擎优化的钓鱼网站探测方法,其特征在于,包括:
步骤a、分析已知钓鱼网站,将已知钓鱼网站的title作为关键词加入恶意title数据库中;
步骤b、保存网页爬虫获得的网页,对所获得的网页摘要及对应的URL滤重后建立网页索引数据库;
步骤c、用恶意title数据库中的关键词和/或用预先设定的关键词对网页索引数据库中的网页摘要进行检索,将匹配成功的网页保存为可疑网页;
步骤d、使用判断策略对可疑网页进行判断,将判断为钓鱼网站的可疑网页的title加入恶意title数据库中。
2.如权利要求1所述的基于搜索引擎优化的钓鱼网站探测方法,其特征在于,所述判断策略包括:如果所述恶意title数据库不为空,则对可疑网页title进行分词,将分词获得的内容与恶意title数据库中的关键词进行匹配,如果匹配率超过预设的阀值,则所述可疑网页为钓鱼网站。
3.如权利要求2所述的基于搜索引擎优化的钓鱼网站探测方法,其特征在于,所述判断策略还包括:如果不能判断所述可疑网页为钓鱼网站,则判断所述可疑网页title中是否包含特定的词汇,如果是则将所述可疑网页title保存为预先设定的关键词。
4.如权利要求2或3所述的基于搜索引擎优化的钓鱼网站探测方法,其特征在于,所述判断策略还包括:如果不能判断所述可疑网页为钓鱼网站,则对所述可疑网页的body 文件内容进行自动化判断,如果所述body 文件中特定语句或者词汇出现的频率超过预设值,则所述可疑网页为钓鱼网站。
5.如权利要求1所述的基于搜索引擎优化的钓鱼网站探测方法,其特征在于,循环执行步骤b至步骤d。
6.如权利要求1所述的基于搜索引擎优化的钓鱼网站探测方法,其特征在于,还包括将所述钓鱼网站添加到URL黑名单库。
7.一种基于搜索引擎优化的钓鱼网站探测系统,其特征在于,包括:
恶意title数据库,用于保存已知钓鱼网站的title;
网页爬取模块,用于循环不断的进行网页爬虫,并保存网页爬虫获得的网页,对所获得的网页摘要及对应的URL滤重后建立网页索引数据库;
网页过滤模块,用恶意title数据库中的关键词和/或用预先设定的关键词对网页索引数据库中的网页摘要进行检索,将匹配成功的网页保存为可疑网页;
判断模块,使用判断策略对可疑网页进行判断,将判断为钓鱼网站的可疑网页的title加入恶意title数据库中。
8.如权利要求7所述的基于搜索引擎优化的钓鱼网站探测系统,其特征在于,所述判断策略包括:如果所述恶意title数据库不为空,则对可疑网页title进行分词,将分词获得的内容与恶意title数据库中的关键词进行匹配,如果匹配率超过预设的阀值,则所述可疑网页为钓鱼网站。
9.如权利要求8所述的基于搜索引擎优化的钓鱼网站探测系统,其特征在于,所述判断策略还包括:如果不能判断所述可疑网页为钓鱼网站,则判断所述可疑网页title中是否包含特定的词汇,如果是则将所述可疑网页title保存为预先设定的关键词。
10.如权利要求8或9所述的基于搜索引擎优化的钓鱼网站探测系统,其特征在于,所述判断策略还包括:如果不能判断所述可疑网页为钓鱼网站,则对所述可疑网页的body 文件内容进行自动化判断,如果所述body 文件中特定语句或者词汇出现的频率超过预设值,则所述可疑网页为钓鱼网站。
11.如权利要求7所述的基于搜索引擎优化的钓鱼网站探测系统,其特征在于,还包括数据处理模块,将将所述钓鱼网站添加到URL黑名单库。
CN2012100723336A 2012-03-19 2012-03-19 基于搜索引擎优化的钓鱼网站探测方法及系统 Pending CN103324615A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100723336A CN103324615A (zh) 2012-03-19 2012-03-19 基于搜索引擎优化的钓鱼网站探测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100723336A CN103324615A (zh) 2012-03-19 2012-03-19 基于搜索引擎优化的钓鱼网站探测方法及系统

Publications (1)

Publication Number Publication Date
CN103324615A true CN103324615A (zh) 2013-09-25

Family

ID=49193363

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100723336A Pending CN103324615A (zh) 2012-03-19 2012-03-19 基于搜索引擎优化的钓鱼网站探测方法及系统

Country Status (1)

Country Link
CN (1) CN103324615A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484407A (zh) * 2014-12-17 2015-04-01 陆俊 一种识别诈骗信息的方法和系统
CN104580133A (zh) * 2013-10-25 2015-04-29 纬创资通股份有限公司 恶意程序防护方法与系统及其过滤表格更新方法
CN105653563A (zh) * 2014-12-02 2016-06-08 阿里巴巴集团控股有限公司 对网页抓取的控制方法、动态更新黑名单和白名单的方法及相关装置
CN106453351A (zh) * 2016-10-31 2017-02-22 重庆邮电大学 基于Web页面特征的金融类钓鱼网页检测方法
CN106919835A (zh) * 2015-12-24 2017-07-04 中国电信股份有限公司 用于处理恶意网站的方法和装置
CN108156165A (zh) * 2017-12-28 2018-06-12 北京奇虎科技有限公司 一种误报检测的方法以及系统
CN108540490A (zh) * 2018-04-26 2018-09-14 四川长虹电器股份有限公司 一种钓鱼网站的检测和域名备案存储方法
US10097580B2 (en) 2016-04-12 2018-10-09 Microsoft Technology Licensing, Llc Using web search engines to correct domain names used for social engineering
CN108694321A (zh) * 2017-04-07 2018-10-23 武汉安天信息技术有限责任公司 一种钓鱼网站的识别方法及装置
CN109088859A (zh) * 2018-07-16 2018-12-25 北京奇虎科技有限公司 识别可疑目标对象的方法、装置、服务器及可读存储介质
CN109246074A (zh) * 2018-07-23 2019-01-18 北京奇虎科技有限公司 识别可疑域名的方法、装置、服务器及可读存储介质
CN109981529A (zh) * 2017-12-27 2019-07-05 西门子(中国)有限公司 报文获取方法、装置、系统及计算机存储介质
CN109977668A (zh) * 2017-12-27 2019-07-05 哈尔滨安天科技股份有限公司 恶意代码的查询方法及系统
CN110750710A (zh) * 2019-09-03 2020-02-04 深圳壹账通智能科技有限公司 风控协议预警方法、装置、计算机设备和存储介质
CN111222031A (zh) * 2019-11-22 2020-06-02 成都市映潮科技股份有限公司 一种网站判别方法及系统
CN111400705A (zh) * 2020-03-04 2020-07-10 支付宝(杭州)信息技术有限公司 一种应用程序的检测方法、装置及设备
CN111563276A (zh) * 2019-01-25 2020-08-21 深信服科技股份有限公司 一种网页篡改检测方法、检测系统及相关设备
CN111754338A (zh) * 2020-06-30 2020-10-09 上海观安信息技术股份有限公司 一种套路贷网站团伙识别方法及系统
CN114095278A (zh) * 2022-01-19 2022-02-25 南京明博互联网安全创新研究院有限公司 一种基于混合特征选择框架的钓鱼网站检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101820366A (zh) * 2010-01-27 2010-09-01 南京邮电大学 一种基于预取的钓鱼网页检测方法
CN101996203A (zh) * 2009-08-13 2011-03-30 阿里巴巴集团控股有限公司 一种过滤网页信息的方法和系统
CN102170640A (zh) * 2011-06-01 2011-08-31 南通海韵信息技术服务有限公司 基于模式库的智能手机端不良内容网站鉴别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101996203A (zh) * 2009-08-13 2011-03-30 阿里巴巴集团控股有限公司 一种过滤网页信息的方法和系统
CN101820366A (zh) * 2010-01-27 2010-09-01 南京邮电大学 一种基于预取的钓鱼网页检测方法
CN102170640A (zh) * 2011-06-01 2011-08-31 南通海韵信息技术服务有限公司 基于模式库的智能手机端不良内容网站鉴别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
庄蔚蔚等: ""基于分类集成的钓鱼网站智能检测系统"", 《系统工程理论与实践》 *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104580133A (zh) * 2013-10-25 2015-04-29 纬创资通股份有限公司 恶意程序防护方法与系统及其过滤表格更新方法
CN104580133B (zh) * 2013-10-25 2017-11-21 纬创资通股份有限公司 恶意程序防护方法与系统及其过滤表格更新方法
CN105653563A (zh) * 2014-12-02 2016-06-08 阿里巴巴集团控股有限公司 对网页抓取的控制方法、动态更新黑名单和白名单的方法及相关装置
CN105653563B (zh) * 2014-12-02 2019-08-02 阿里巴巴集团控股有限公司 对网页抓取的控制方法、动态更新黑名单和白名单的方法及相关装置
CN104484407A (zh) * 2014-12-17 2015-04-01 陆俊 一种识别诈骗信息的方法和系统
CN104484407B (zh) * 2014-12-17 2018-02-27 深圳前海大数金融服务有限公司 一种识别诈骗信息的方法和系统
CN106919835A (zh) * 2015-12-24 2017-07-04 中国电信股份有限公司 用于处理恶意网站的方法和装置
CN106919835B (zh) * 2015-12-24 2020-11-24 中国电信股份有限公司 用于处理恶意网站的方法和装置
US10097580B2 (en) 2016-04-12 2018-10-09 Microsoft Technology Licensing, Llc Using web search engines to correct domain names used for social engineering
CN106453351A (zh) * 2016-10-31 2017-02-22 重庆邮电大学 基于Web页面特征的金融类钓鱼网页检测方法
CN108694321A (zh) * 2017-04-07 2018-10-23 武汉安天信息技术有限责任公司 一种钓鱼网站的识别方法及装置
CN109977668A (zh) * 2017-12-27 2019-07-05 哈尔滨安天科技股份有限公司 恶意代码的查询方法及系统
CN109977668B (zh) * 2017-12-27 2021-05-04 哈尔滨安天科技集团股份有限公司 恶意代码的查询方法及系统
CN109981529A (zh) * 2017-12-27 2019-07-05 西门子(中国)有限公司 报文获取方法、装置、系统及计算机存储介质
CN109981529B (zh) * 2017-12-27 2021-11-12 西门子(中国)有限公司 报文获取方法、装置、系统及计算机存储介质
CN108156165A (zh) * 2017-12-28 2018-06-12 北京奇虎科技有限公司 一种误报检测的方法以及系统
CN108540490A (zh) * 2018-04-26 2018-09-14 四川长虹电器股份有限公司 一种钓鱼网站的检测和域名备案存储方法
CN109088859A (zh) * 2018-07-16 2018-12-25 北京奇虎科技有限公司 识别可疑目标对象的方法、装置、服务器及可读存储介质
CN109088859B (zh) * 2018-07-16 2021-07-20 北京奇虎科技有限公司 识别可疑目标对象的方法、装置、服务器及可读存储介质
CN109246074A (zh) * 2018-07-23 2019-01-18 北京奇虎科技有限公司 识别可疑域名的方法、装置、服务器及可读存储介质
CN111563276B (zh) * 2019-01-25 2024-04-09 深信服科技股份有限公司 一种网页篡改检测方法、检测系统及相关设备
CN111563276A (zh) * 2019-01-25 2020-08-21 深信服科技股份有限公司 一种网页篡改检测方法、检测系统及相关设备
CN110750710A (zh) * 2019-09-03 2020-02-04 深圳壹账通智能科技有限公司 风控协议预警方法、装置、计算机设备和存储介质
CN111222031A (zh) * 2019-11-22 2020-06-02 成都市映潮科技股份有限公司 一种网站判别方法及系统
CN111400705A (zh) * 2020-03-04 2020-07-10 支付宝(杭州)信息技术有限公司 一种应用程序的检测方法、装置及设备
CN111400705B (zh) * 2020-03-04 2023-03-14 支付宝(杭州)信息技术有限公司 一种应用程序的检测方法、装置及设备
CN111754338A (zh) * 2020-06-30 2020-10-09 上海观安信息技术股份有限公司 一种套路贷网站团伙识别方法及系统
CN111754338B (zh) * 2020-06-30 2024-02-23 上海观安信息技术股份有限公司 一种套路贷网站团伙识别方法及系统
CN114095278A (zh) * 2022-01-19 2022-02-25 南京明博互联网安全创新研究院有限公司 一种基于混合特征选择框架的钓鱼网站检测方法
CN114095278B (zh) * 2022-01-19 2022-05-24 南京明博互联网安全创新研究院有限公司 一种基于混合特征选择框架的钓鱼网站检测方法

Similar Documents

Publication Publication Date Title
CN103324615A (zh) 基于搜索引擎优化的钓鱼网站探测方法及系统
Jerlin et al. A new malware detection system using machine learning techniques for API call sequences
Boididou et al. Challenges of computational verification in social multimedia
Rao et al. Phishshield: a desktop application to detect phishing webpages through heuristic approach
US9544316B2 (en) Method, device and system for detecting security of download link
CN103428196B (zh) 一种基于url白名单的web应用入侵检测方法
CN102004764A (zh) 互联网不良信息检测方法以及系统
US9563770B2 (en) Spammer group extraction apparatus and method
Wu et al. A phishing detection system based on machine learning
CN103577755A (zh) 一种基于支持向量机的恶意脚本静态检测方法
US20220200959A1 (en) Data collection system for effectively processing big data
CN104156490A (zh) 基于文字识别检测可疑钓鱼网页的方法及装置
CN103544436A (zh) 一种钓鱼网站鉴别系统和方法
CN108023868B (zh) 恶意资源地址检测方法和装置
Liu et al. An efficient multistage phishing website detection model based on the CASE feature framework: Aiming at the real web environment
CN107016298B (zh) 一种网页篡改监测方法及装置
US9124623B1 (en) Systems and methods for detecting scam campaigns
CN103455758A (zh) 恶意网站的识别方法及装置
CN103491101A (zh) 钓鱼网站检测方法、装置及客户端
CN107800686A (zh) 一种钓鱼网站识别方法和装置
CN103955644B (zh) 一种基于终端自启动项的静态木马检测方法
CN103488947A (zh) 即时通信客户端盗号木马程序的识别方法及装置
Zeydan et al. Survey of anti-phishing tools with detection capabilities
CN108509794A (zh) 一种基于分类学习算法的恶意网页防御检测方法
KR101631032B1 (ko) 비정형 데이터 필터링 및 공통형태 변환을 통한 저장 시스템 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130925