CN103685174A - 一种不依赖样本的钓鱼网站检测方法 - Google Patents

一种不依赖样本的钓鱼网站检测方法 Download PDF

Info

Publication number
CN103685174A
CN103685174A CN201210333169.XA CN201210333169A CN103685174A CN 103685174 A CN103685174 A CN 103685174A CN 201210333169 A CN201210333169 A CN 201210333169A CN 103685174 A CN103685174 A CN 103685174A
Authority
CN
China
Prior art keywords
web page
title
sample
detection method
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210333169.XA
Other languages
English (en)
Other versions
CN103685174B (zh
Inventor
耿光刚
洪博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Internet Network Information Center
Original Assignee
Computer Network Information Center of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Network Information Center of CAS filed Critical Computer Network Information Center of CAS
Priority to CN201210333169.XA priority Critical patent/CN103685174B/zh
Priority to PCT/CN2012/087040 priority patent/WO2014036801A1/zh
Priority to US14/413,476 priority patent/US9276956B2/en
Publication of CN103685174A publication Critical patent/CN103685174A/zh
Application granted granted Critical
Publication of CN103685174B publication Critical patent/CN103685174B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • H04L63/1483Countermeasures against malicious traffic service impersonation, e.g. phishing, pharming or web spoofing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/51Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems at application loading time, e.g. accepting, rejecting, starting or inhibiting executable software based on integrity or source reliability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2119Authenticating web pages, e.g. with suspicious links

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种不依赖样本的钓鱼网站检测方法本发明钓鱼网站检测方法,1)根据待检测网页的目标统一资源定位符TargetURL提取得到域名,将所述域名进行PageRank和/或Alexa排名值查询;2)对所述待检测网页进行标题抓取,提取出网页标题字符串,根据所述字符串和钓鱼敏感词进行匹配;3)在搜索引擎上以所述网页标题为查询关键字进行检索;4)查询TargetURL和待测网页标题完全相同的网页集合中对应的域名服务器NS和服务器IP地址是否相同,来判断待检测网站为钓鱼网站。本发明充分利用钓鱼网站的共性特点,通过互联网公开资源(PageRank、Alexa排名、网站在通用搜索引擎中收录和排名情况),不仅克服了钓鱼样本收集难的问题,同时对针对新出现目标的钓鱼有良好的适应检测能力。

Description

一种不依赖样本的钓鱼网站检测方法
技术领域
本发明涉及钓鱼网站的检测方法,具体涉及一种利用钓鱼网站的共性特点,通过互联网公开资源对钓鱼网站进行检测的方法,属于互联网安全领域。
背景技术
网络钓鱼,是指通过伪装成与目标网站非常相似的网站,引诱用户访问,并获取收信人在此网站上输入的个人敏感信息的网络犯罪行为。由于电子商务和互联网应用的普及和发展,网络钓鱼造成的损失日益严重。国内最大的安全厂商360安全7月份发布的《2011上半年中国网络安全报告》显示网络钓鱼欺诈成为网络安全的最大威胁。另据国际反钓鱼联盟发布的报告,近年来网络钓鱼攻击的数量大幅上升,寻找有效的钓鱼检测方法变得尤为紧迫。
网络钓鱼是指通过伪装成与目标组织的网站非常相似的网站,引诱用户访问,并获取收信人在此网站上输入的个人敏感信息的网络犯罪行为。网络钓鱼作为一种犯罪行为,与现实社会中的流窜作案相似,一个钓鱼网站从建立到消亡往往在几天内,甚至几小时,这一显著特点决定了互联网公开资源(搜索引擎、排名服务等)对钓鱼网站的索引、评价等都在一个极低的范围内。
另一方面,钓鱼的本质决定了钓鱼网站需要伪装,从表面上看起来与被钓鱼目标具有高度的相似性,以期以假乱真,从而达到谋求不当利益的目标。这种相似性首先体现在页面的相似性,如果拿网站内容与所有目标网站进行匹配,择需要事先收集所有被钓鱼目标,这是一项复杂的工作,特别是新的钓鱼目标不断出现,使得该项工作更会是无休止的继续。退一步,钓鱼伪装的相似性首先体现在标题相似性上,而这种相似性我们可以借助公开的搜索引擎进行比对,免去了钓鱼目标的收集工作。
目前,在检测钓鱼网站的技术领域中主要包括三大类的技术手段:黑名单技术、基于URL特征的检测技术和基于网页内容特征的检测技术。黑名单技术是通过用户举报或评价来维护一个不断更新的钓鱼网站名单列表,从而阻止更多的用户不要访问已发现的钓鱼网站。基于URL特征钓鱼检测,是通过分析URL的元素构成,多辅以注册、解析信息进行钓鱼与否的判断,该方法往往用于初步检测,最终的判定一般也要基于内容。基于网页内容特征的钓鱼检测是通过分析网页与目标网页的内容相似度进行判定的方法。
以上三种常用的检测技术:黑名单技术的滞后性是其最大缺陷。基于URL的放方法需要事先收集被钓鱼网站的URL,对新钓鱼目标无能为力。同样,基于内容分析的方法需要目标网页的先验知识和大量的钓鱼样本收集,该方法对针对新目标的钓鱼攻击也无能为力。
Alexa排名是指网站的世界排名NNT流量,主要分两种:综合排名和分类排名,Alexa提供了包括综合排名、到访量排名、页面访问量排名等多个评价指标信息,大多数人把它当作当前较为权威的网站访问量评价指标。Alexa每三个月公布一次新的网站综合排名。此排名的依据是用户链接数(Users Reach)和页面浏览数(Page Views)三个月累积的几何平均值。
PageRank是Google排名运算法则(排名公式)的一部分,是Google用来标识网页的等级/重要性的一种方法,是Google用来衡量一个网站的好坏的唯一标准。在揉合了诸如(标题)Title标识和(关键词)Keywords标识等所有其它因素之后,Google通过PageRank来调整结果,使那些更具“等级/重要性”的网页在搜索结果中另网站排名获得提升,从而提高搜索结果的相关性和质量。
基于以上情况,本发明提出一种多尺度钓鱼判定方法,该方法不需要任何钓鱼目标网站信息、不需要收集任何钓鱼样本数据,通过Alexa排名和PageRank可以对新出现的针对新目标的钓鱼攻击进行准确检测判定。
发明内容
本发明的目是通过分析钓鱼网站的共性,提供一种不依赖于钓鱼样本库和钓鱼目标信息的简单易用,而有准确率高的钓鱼网站检测判定方法。
针对现有技术的不足,本发明的技术方案如下:一种不依赖样本的钓鱼网站检测方法,其步骤包括:
1)根据待检测网页的目标统一资源定位符TargetURL提取得到域名,将所述域名进行PageRank和/或Alexa排名值查询;
2)对在设定排名范围内的所述待检测网页进行标题抓取,提取出网页标题字符串,根据所述字符串和钓鱼关键词进行匹配;
3)对于匹配的待检测网页,在搜索引擎上以所述网页标题为查询关键字进行检索;
4)若所述搜索引擎返回结果中没有TargetURL且该返回结果中存在与待测网页标题完全相同的网页集合,则查询所述TargetURL和所述待测网页标题完全相同的网页集合中对应的域名服务器NS和服务器IP地址是否相同,将不相同的待检测网站判定为钓鱼网站。
步骤3)还包括对所述TargetURL进行网页抓取并对所述抓取到网页进行解析,判断该网页中是否存在与所述待检测网页标题完全相同的网页集合所指向的域名链接。
所述钓鱼关键词通过统计算法自动统计词频获得。
所述排名范围是PageRank值大于K和/或Alexa排名值大于M,其中,K、M为可调节参数,K取值为1或2,M取0。
所述待检测网页进行抓取在Linux系统下运行Shell命令wget TargetUrl抓取。
所述网页标题的提取方法是对所述抓取得到网页进行字符串匹配,获取<title>和</title>标签内容。
所述搜索引擎检索所述网页标题时,所述搜索引擎返回结果为前L个,其中L不大于30。
所述域名服务器NS和服务器IP地址查询可以通过Linux系统中的dig命令或whois命令或Windows Bind下查询。
所述搜索引擎使用Google或者Bing。
本发明的有益效果:
本发明充分利用了钓鱼攻击的最本质特点,简单易用,不仅克服了钓鱼样本收集难的问题,同时对针对新目标的钓鱼有良好的适应检测能力。该方法不利用任何的钓鱼目标信息和钓鱼样本库。该发明的方法,综合利用互联网资源,包括PageRank查询接口、通用搜索引擎和Alexa排名值等,同时对针对新出现目标的钓鱼有良好的适应检测能力,方法易于使用,对待检测目标的URL和页面标题进行分析,从而确定页面是否钓鱼。
附图说明
图1为本发明不依赖样本的钓鱼网站检测方法具体实施例的流程示意图。
具体实施方式
下面结合附图和具体实施例进一步说明本发明实施例的技术方案。本实施例涉及的搜索引擎,不限于具体哪个,可以为任何通用搜索引擎。本发明随机选择了中国反钓鱼联盟2012年上半年800个钓鱼举报网站和www.dmoz.org上的1300个非钓鱼网站,构建了一个钓鱼数据集。利用该发明的方法进行试验验证,表现出良好的检测性能,其中钓鱼检测的召回率为100%,准确率达到100%,误检率为0,实验结果证明本发明方法的可行性和有效性。
本发明通过获取和分析待检测网站的PageRank值、Alexa排名值、搜索引擎网页收录和排名情况等,做出网站钓鱼与否的综合判断。PageRank和Alexa排名在本文中仅仅是一个粗过滤,可以肯定的是:钓鱼网站PageRank值很小,Alexa排名很低或没有排名。
图1为本发明不依赖样本的钓鱼网站检测方法具体实施例的流程示意图,如图1所示,本发明钓鱼攻击检测方法包括以下步骤:
步骤100、根据待检测网页的统一资源定位符(TargetUrl),提取唯一对应的域名,并基于域名获取PageRank值和Alexa排名值。提取域名指提取目标Url(TargetUrl)的域名部分,例如:“http://item.taobao.com3358.tk/trade/batch payment.htm.asp”的对应域名为“com3358.tk”。获取PageRank值的公开查询接口为:http://toolbarqueries.google.com/,该查询接口需要通过程序获取,任何语言均可,查询接口是Google和Alexa对外公开的且固定不变。获取Alexa排名值的公开查询方式为:″http://data.alexa.com/data?cli=10&dat=snba&url=+TargetUrl。一般情况下,如果PageRank值大于K,并且Alexa排名值大于M,则认为该网站非钓鱼网站,否则进一步检测进入步骤200。一般情况下,K取值为1或2,考虑到钓鱼网站的时效性通常在几天内,M的取值0,即网站存在Alexa排名,K、M为可调节参数。
步骤200、基于给定的待判定网址,进行网页抓取(可使用Linux系统自带的命令wget),并提取网页标题,比如,一个简单的方法,定位<title>标签,<title>和</title>之间的内容即为标题。匹配标题字符串内是否含有钓鱼敏感别词,如果含有则继续,否则直接判定为非钓鱼网站。该步骤基于钓鱼网站都是以期高仿真模仿目标网站,标题醒目位置含有钓鱼关键词关键词。钓鱼关键词指钓鱼针对的类别词和经常被钓鱼的网站关键词,这些关键词基于钓鱼数据库的统计,统计为高频的词汇,可以由统计算法自动统计词频获得。网络钓鱼是以谋利为目的犯罪活动,针对的类别和目标有限,主要是金融支付类和中奖等。本实施例中的关键词可以为:“银行”、“支付”、“登陆”、“中奖”、“证券”、“团购”、“官方网站”、“官网”、“淘宝”、“腾讯”等。
在该步骤中,网页的抓取只抓取待检测页,方法成熟,比如在Linux系统下,运行Shell命令wget TargetUrl即可抓取。网页标题的提取,可以简单对抓取的网页进行字符串匹配,获取<title>和</title>标签内的内容,即为网页标题。
步骤300、在搜索引擎(可使用Google或者Bing)中以网页标题为查询字进行搜索,获取搜索结果。如果待检测网页出现在搜索引擎中,即搜索返回的结果中含有该页面,则该网页判定为正常网页。如果目标统一资源定位符TargetUrl没有出现在返回结果中,且搜索结果中包含与目标统一资源定位符TargetUrl的标题完全相同的网页集合,则该待判定页面作为可疑页面,进入步骤400,以进一步进行判定。否则判定为合法网站。该步骤的依据为钓鱼网站为了欺骗网民,一般会使用与目标网站系统的标题。比如,钓鱼淘宝的虚假网站,其标题也会显示“淘宝网-淘!我喜欢”。步骤300中仅仅是其中一个指标,通过前面有PageRank和Alexa过滤,明显的好网站已经排除了。
步骤300中,以该提取的标题为关键词进行通用搜索的查询,这里查询返回的结果限定取前L个,一般L<30,即一般用户使用通用搜索引擎时最多关注的返回结果数。
步骤400、对步骤200抓取的页面进行解析,查看是否存在指向标题完全相同的网页集合所有域名的链接,如果没有,则认定该待判定页面为正常页面,否则进一步进入步骤500,进行进一步判定。
该步骤的出发点是钓鱼网站往往含有链向目标网站的链接。
步骤500、分别查看TargetUrl和标题完全相同的网页集合对应域名所属NS(Name sever)和服务器IP地址,如果NS或IP相同,则认定该待判定网站非钓鱼,为正常网站,否则判定为钓鱼网站。
步骤500是为了过滤正规的某老品牌推出的新品牌网站,防止误判。该步骤中对NS和IP的查询,可以通过Linux系统中的dig命令。或者可以使用Linux下的whois命令或(http://www.isc.org/software/bind/)。,Bind的Windows版本在windows下查询。
虽然本发明以实施例揭示如上,但其并非用以限定本发明,任何本领域技术人员,在不脱离本发明的精神和范围内,可作任意改动或等同替换,故本发明的保护范围应当以本申请权利要求书所界定的范围为准。

Claims (9)

1.一种不依赖样本的钓鱼网站检测方法,其步骤包括:
1)根据待检测网页的目标统一资源定位符TargetURL提取得到域名,将所述域名进行PageRank和/或Alexa排名值查询;
2)对在设定排名范围内的所述待检测网页进行标题抓取,提取出网页标题字符串,根据所述字符串和钓鱼关键词进行匹配;
3)对于匹配的待检测网页,在搜索引擎上以所述网页标题为查询关键字进行检索;
4)若所述搜索引擎返回结果中没有TargetURL且该返回结果中存在与待测网页标题完全相同的网页集合,则查询所述TargetURL和所述待测网页标题完全相同的网页集合中对应的域名服务器NS和服务器IP地址是否相同,将不相同的待检测网站判定为钓鱼网站。
2.如权利要求1所述的不依赖样本的钓鱼网站检测方法,其特征在于,步骤3)还包括对所述TargetURL进行网页抓取并对所述抓取到网页进行解析,判断该网页中是否存在与所述待检测网页标题完全相同的网页集合所指向的域名链接。
3.如权利要求1所述的不依赖样本的钓鱼网站检测方法,其特征在于,所述钓鱼关键词通过统计算法自动统计词频获得。
4.如权利要求1所述的不依赖样本的钓鱼网站检测方法,其特征在于,所述排名范围是PageRank值大于K和/或Alexa排名值大于M,其中,K、M为可调节参数,K取值为1或2,M取0。
5.如权利要求1所述的不依赖样本的钓鱼网站检测方法,其特征在于,所述待检测网页进行抓取在Linux系统下运行Shell命令wget TargetUrl抓取。
6.如权利要求5所述的不依赖样本的钓鱼网站检测方法,其特征在于,所述网页标题的提取方法是对所述抓取得到网页进行字符串匹配,获取<title>和</title>标签内容。
7.如权利要求1所述的不依赖样本的钓鱼网站检测方法,其特征在于,所述搜索引擎检索所述网页标题时,所述搜索引擎返回结果为前L个,其中L不大于30。
8.如权利要求1所述的不依赖样本的钓鱼网站检测方法,其特征在于,所述域名服务器NS和服务器IP地址查询可以通过Linux系统中的dig命令或whois命令或Windows Bind下查询。
9.如权利要求1所述的不依赖样本的钓鱼网站检测方法,其特征在于,所述搜索引擎使用Google或者Bing。
CN201210333169.XA 2012-09-07 2012-09-07 一种不依赖样本的钓鱼网站检测方法 Active CN103685174B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201210333169.XA CN103685174B (zh) 2012-09-07 2012-09-07 一种不依赖样本的钓鱼网站检测方法
PCT/CN2012/087040 WO2014036801A1 (zh) 2012-09-07 2012-12-20 一种不依赖样本的钓鱼网站检测方法
US14/413,476 US9276956B2 (en) 2012-09-07 2012-12-20 Method for detecting phishing website without depending on samples

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210333169.XA CN103685174B (zh) 2012-09-07 2012-09-07 一种不依赖样本的钓鱼网站检测方法

Publications (2)

Publication Number Publication Date
CN103685174A true CN103685174A (zh) 2014-03-26
CN103685174B CN103685174B (zh) 2016-12-21

Family

ID=50236489

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210333169.XA Active CN103685174B (zh) 2012-09-07 2012-09-07 一种不依赖样本的钓鱼网站检测方法

Country Status (3)

Country Link
US (1) US9276956B2 (zh)
CN (1) CN103685174B (zh)
WO (1) WO2014036801A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106919835A (zh) * 2015-12-24 2017-07-04 中国电信股份有限公司 用于处理恶意网站的方法和装置
CN108768982A (zh) * 2018-05-17 2018-11-06 江苏通付盾信息安全技术有限公司 钓鱼网站的检测方法、装置、计算设备及计算机存储介质
CN109067716A (zh) * 2018-07-18 2018-12-21 杭州安恒信息技术股份有限公司 一种识别暗链的方法与系统
CN109104421A (zh) * 2018-08-01 2018-12-28 深信服科技股份有限公司 一种网站内容篡改检测方法、装置、设备及可读存储介质
CN110059468A (zh) * 2019-04-02 2019-07-26 阿里巴巴集团控股有限公司 一种小程序风险识别方法和装置
CN111107048A (zh) * 2018-10-29 2020-05-05 中移(苏州)软件技术有限公司 一种钓鱼网站检测方法、装置和存储介质

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103368958A (zh) * 2013-07-05 2013-10-23 腾讯科技(深圳)有限公司 一种网页检测方法、装置和系统
CN104125215B (zh) * 2014-06-30 2018-01-05 新浪网技术(中国)有限公司 网站域名劫持检测方法和系统
US9398047B2 (en) 2014-11-17 2016-07-19 Vade Retro Technology, Inc. Methods and systems for phishing detection
EP3125147B1 (en) * 2015-07-27 2020-06-03 Swisscom AG System and method for identifying a phishing website
US9674213B2 (en) 2015-10-29 2017-06-06 Duo Security, Inc. Methods and systems for implementing a phishing assessment
US10142366B2 (en) 2016-03-15 2018-11-27 Vade Secure, Inc. Methods, systems and devices to mitigate the effects of side effect URLs in legitimate and phishing electronic messages
CN107239701B (zh) * 2016-03-29 2020-06-26 腾讯科技(深圳)有限公司 识别恶意网站的方法及装置
US10097580B2 (en) 2016-04-12 2018-10-09 Microsoft Technology Licensing, Llc Using web search engines to correct domain names used for social engineering
US10200383B2 (en) * 2016-06-29 2019-02-05 Rapid7, Inc. Neutralizing malicious locators
RU2634211C1 (ru) 2016-07-06 2017-10-24 Общество с ограниченной ответственностью "Траст" Способ и система анализа протоколов взаимодействия вредоносных программ с центрами управления и выявления компьютерных атак
US10193923B2 (en) 2016-07-20 2019-01-29 Duo Security, Inc. Methods for preventing cyber intrusions and phishing activity
RU2649793C2 (ru) 2016-08-03 2018-04-04 ООО "Группа АйБи" Способ и система выявления удаленного подключения при работе на страницах веб-ресурса
US10498761B2 (en) * 2016-08-23 2019-12-03 Duo Security, Inc. Method for identifying phishing websites and hindering associated activity
KR102582394B1 (ko) 2016-08-30 2023-09-26 삼성디스플레이 주식회사 반도체 장치
RU2634209C1 (ru) 2016-09-19 2017-10-24 Общество с ограниченной ответственностью "Группа АйБи ТДС" Система и способ автогенерации решающих правил для систем обнаружения вторжений с обратной связью
US10791130B2 (en) * 2016-09-28 2020-09-29 Opsec Online Limited Trigger-based harvesting of data associated with malignant content in a networked environment
US10832000B2 (en) * 2016-11-14 2020-11-10 International Business Machines Corporation Identification of textual similarity with references
RU2671991C2 (ru) 2016-12-29 2018-11-08 Общество с ограниченной ответственностью "Траст" Система и способ сбора информации для обнаружения фишинга
RU2637477C1 (ru) * 2016-12-29 2017-12-04 Общество с ограниченной ответственностью "Траст" Система и способ обнаружения фишинговых веб-страниц
US9762612B1 (en) * 2017-05-17 2017-09-12 Farsight Security, Inc. System and method for near real time detection of domain name impersonation
US10594724B2 (en) 2017-07-19 2020-03-17 Cisco Technology, Inc. Network security user interface for domain query volume time series with custom signal modifications
US10601866B2 (en) 2017-08-23 2020-03-24 International Business Machines Corporation Discovering website phishing attacks
CN107807987B (zh) * 2017-10-31 2021-07-02 广东工业大学 一种字符串分类方法、系统及一种字符串分类设备
RU2689816C2 (ru) 2017-11-21 2019-05-29 ООО "Группа АйБи" Способ для классифицирования последовательности действий пользователя (варианты)
RU2676247C1 (ru) 2018-01-17 2018-12-26 Общество С Ограниченной Ответственностью "Группа Айби" Способ и компьютерное устройство для кластеризации веб-ресурсов
RU2677361C1 (ru) 2018-01-17 2019-01-16 Общество с ограниченной ответственностью "Траст" Способ и система децентрализованной идентификации вредоносных программ
RU2668710C1 (ru) 2018-01-17 2018-10-02 Общество с ограниченной ответственностью "Группа АйБи ТДС" Вычислительное устройство и способ для обнаружения вредоносных доменных имен в сетевом трафике
RU2680736C1 (ru) 2018-01-17 2019-02-26 Общество с ограниченной ответственностью "Группа АйБи ТДС" Сервер и способ для определения вредоносных файлов в сетевом трафике
RU2677368C1 (ru) 2018-01-17 2019-01-16 Общество С Ограниченной Ответственностью "Группа Айби" Способ и система для автоматического определения нечетких дубликатов видеоконтента
RU2681699C1 (ru) 2018-02-13 2019-03-12 Общество с ограниченной ответственностью "Траст" Способ и сервер для поиска связанных сетевых ресурсов
US10826935B2 (en) * 2018-04-24 2020-11-03 International Business Machines Corporation Phishing detection through secure testing implementation
CN108664584A (zh) * 2018-05-07 2018-10-16 秦德玉 侵权网站搜索识别方法及装置
RU2708508C1 (ru) 2018-12-17 2019-12-09 Общество с ограниченной ответственностью "Траст" Способ и вычислительное устройство для выявления подозрительных пользователей в системах обмена сообщениями
RU2701040C1 (ru) 2018-12-28 2019-09-24 Общество с ограниченной ответственностью "Траст" Способ и вычислительное устройство для информирования о вредоносных веб-ресурсах
CN111478877B (zh) * 2019-01-24 2022-08-02 安碁资讯股份有限公司 网域名称识别方法及网域名称识别装置
US10452736B1 (en) * 2019-02-21 2019-10-22 Capital One Services, Llc Determining whether an authenticated user session is active for a domain
SG11202101624WA (en) 2019-02-27 2021-03-30 Group Ib Ltd Method and system for user identification by keystroke dynamics
CN110309667B (zh) * 2019-04-16 2022-08-30 网宿科技股份有限公司 一种网站暗链检测方法和装置
KR102051350B1 (ko) * 2019-09-05 2019-12-03 (주)에스투더블유랩 암호화폐 거래를 분석하기 위한 데이터 획득 방법 및 장치
US11334949B2 (en) * 2019-10-11 2022-05-17 S&P Global Inc. Automated news ranking and recommendation system
CN110929185B (zh) * 2019-10-15 2023-11-24 中国平安人寿保险股份有限公司 网站目录检测方法、装置、计算机设备及计算机存储介质
RU2728497C1 (ru) 2019-12-05 2020-07-29 Общество с ограниченной ответственностью "Группа АйБи ТДС" Способ и система определения принадлежности программного обеспечения по его машинному коду
RU2728498C1 (ru) 2019-12-05 2020-07-29 Общество с ограниченной ответственностью "Группа АйБи ТДС" Способ и система определения принадлежности программного обеспечения по его исходному коду
RU2743974C1 (ru) 2019-12-19 2021-03-01 Общество с ограниченной ответственностью "Группа АйБи ТДС" Система и способ сканирования защищенности элементов сетевой архитектуры
CN111143722A (zh) * 2019-12-23 2020-05-12 杭州安恒信息技术股份有限公司 一种网页暗链检测方法、装置、设备及介质
SG10202001963TA (en) 2020-03-04 2021-10-28 Group Ib Global Private Ltd System and method for brand protection based on the search results
CN111447211A (zh) * 2020-03-24 2020-07-24 济南诚方网络科技有限公司 一种网络防诈骗系统
US11985133B1 (en) * 2020-04-28 2024-05-14 Equinix, Inc. Gating access to destinations on a network
US11475090B2 (en) 2020-07-15 2022-10-18 Group-Ib Global Private Limited Method and system for identifying clusters of affiliated web resources
US11494416B2 (en) 2020-07-27 2022-11-08 S&P Global Inc. Automated event processing system
RU2743619C1 (ru) 2020-08-06 2021-02-20 Общество с ограниченной ответственностью "Группа АйБи ТДС" Способ и система генерации списка индикаторов компрометации
FI3972192T3 (fi) * 2020-09-21 2023-04-18 Tata Consultancy Services Ltd Menetelmä ja järjestelmä tietojenkalastelusivustojen kerroksittaiseksi havaitsemiseksi
CN112217815B (zh) * 2020-10-10 2022-09-13 杭州安恒信息技术股份有限公司 钓鱼网站的识别方法、装置和计算机设备
CN113051500B (zh) * 2021-03-25 2022-08-16 武汉大学 一种融合多源数据的钓鱼网站识别方法及系统
US11947572B2 (en) 2021-03-29 2024-04-02 Group IB TDS, Ltd Method and system for clustering executable files
NL2030861B1 (en) 2021-06-01 2023-03-14 Trust Ltd System and method for external monitoring a cyberattack surface
KR102510777B1 (ko) * 2022-05-18 2023-03-16 한국인터넷진흥원 인공지능 기반 웹사이트 변조 탐지 시스템 및 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102316099A (zh) * 2011-07-28 2012-01-11 中国科学院计算机网络信息中心 网络钓鱼检测方法及装置
CN102571768A (zh) * 2011-12-26 2012-07-11 北京大学 一种钓鱼网站检测方法
CN102591965A (zh) * 2011-12-30 2012-07-18 奇智软件(北京)有限公司 一种黑链检测的方法及装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8041769B2 (en) * 2004-05-02 2011-10-18 Markmonitor Inc. Generating phish messages
US7634810B2 (en) * 2004-12-02 2009-12-15 Microsoft Corporation Phishing detection, prevention, and notification
US7680772B2 (en) * 2005-03-09 2010-03-16 Intuit Inc. Search quality detection
US7841003B1 (en) * 2005-05-04 2010-11-23 Capital One Financial Corporation Phishing solution method
US7769820B1 (en) * 2005-06-30 2010-08-03 Voltage Security, Inc. Universal resource locator verification services using web site attributes
ATE470306T1 (de) * 2005-12-23 2010-06-15 Ibm Verfahren für netzwerkadressenevaluierung und zugriff
US9654495B2 (en) * 2006-12-01 2017-05-16 Websense, Llc System and method of analyzing web addresses
US20080172738A1 (en) * 2007-01-11 2008-07-17 Cary Lee Bates Method for Detecting and Remediating Misleading Hyperlinks
US8205255B2 (en) * 2007-05-14 2012-06-19 Cisco Technology, Inc. Anti-content spoofing (ACS)
WO2009061399A1 (en) * 2007-11-05 2009-05-14 Nagaraju Bandaru Method for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
CN101350032A (zh) * 2008-09-23 2009-01-21 胡辉 判断网页内容是否相同的方法
US8448245B2 (en) * 2009-01-17 2013-05-21 Stopthehacker.com, Jaal LLC Automated identification of phishing, phony and malicious web sites
US9461966B2 (en) * 2009-05-08 2016-10-04 F-Secure Oyj Method and apparatus for rating URLs
WO2011142984A1 (en) * 2010-05-13 2011-11-17 Northwestern University Geographic location system and method
CN101894134B (zh) * 2010-06-21 2012-04-11 南京邮电大学 一种基于空间布局的钓鱼网页检测及其实现方法
US8826444B1 (en) * 2010-07-09 2014-09-02 Symantec Corporation Systems and methods for using client reputation data to classify web domains
CN102170447A (zh) * 2011-04-29 2011-08-31 南京邮电大学 一种基于最近邻及相似度测量检测钓鱼网页的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102316099A (zh) * 2011-07-28 2012-01-11 中国科学院计算机网络信息中心 网络钓鱼检测方法及装置
CN102571768A (zh) * 2011-12-26 2012-07-11 北京大学 一种钓鱼网站检测方法
CN102591965A (zh) * 2011-12-30 2012-07-18 奇智软件(北京)有限公司 一种黑链检测的方法及装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106919835A (zh) * 2015-12-24 2017-07-04 中国电信股份有限公司 用于处理恶意网站的方法和装置
CN108768982A (zh) * 2018-05-17 2018-11-06 江苏通付盾信息安全技术有限公司 钓鱼网站的检测方法、装置、计算设备及计算机存储介质
CN109067716A (zh) * 2018-07-18 2018-12-21 杭州安恒信息技术股份有限公司 一种识别暗链的方法与系统
CN109067716B (zh) * 2018-07-18 2021-05-28 杭州安恒信息技术股份有限公司 一种识别暗链的方法与系统
CN109104421A (zh) * 2018-08-01 2018-12-28 深信服科技股份有限公司 一种网站内容篡改检测方法、装置、设备及可读存储介质
CN109104421B (zh) * 2018-08-01 2021-09-17 深信服科技股份有限公司 一种网站内容篡改检测方法、装置、设备及可读存储介质
CN111107048A (zh) * 2018-10-29 2020-05-05 中移(苏州)软件技术有限公司 一种钓鱼网站检测方法、装置和存储介质
CN111107048B (zh) * 2018-10-29 2021-11-30 中移(苏州)软件技术有限公司 一种钓鱼网站检测方法、装置和存储介质
CN110059468A (zh) * 2019-04-02 2019-07-26 阿里巴巴集团控股有限公司 一种小程序风险识别方法和装置
CN110059468B (zh) * 2019-04-02 2023-09-26 创新先进技术有限公司 一种小程序风险识别方法和装置

Also Published As

Publication number Publication date
CN103685174B (zh) 2016-12-21
WO2014036801A1 (zh) 2014-03-13
US20150200963A1 (en) 2015-07-16
US9276956B2 (en) 2016-03-01

Similar Documents

Publication Publication Date Title
CN103685174B (zh) 一种不依赖样本的钓鱼网站检测方法
CN101369276B (zh) 一种Web浏览器缓存数据的取证方法
CN107251037B (zh) 黑名单生成装置、黑名单生成系统、黑名单生成方法和记录介质
CN106685936B (zh) 网页篡改的检测方法及装置
Hara et al. Visual similarity-based phishing detection without victim site information
CN103023712B (zh) 网页恶意属性监测方法和系统
CN102799814B (zh) 一种钓鱼网站查找系统及方法
CN103544436B (zh) 一种钓鱼网站鉴别系统和方法
CN103559235B (zh) 一种在线社交网络恶意网页检测识别方法
CN102663048B (zh) 一种搜索结果提供方法及装置
CN103281320A (zh) 基于网页图标匹配的品牌仿冒网站检测方法
US20140047543A1 (en) Apparatus and method for detecting http botnet based on densities of web transactions
CN106354800A (zh) 一种基于多维度特征的不良网站检测方法
Yuan et al. Detecting phishing websites and targets based on URLs and webpage links
CN108092963A (zh) 网页识别方法、装置、计算机设备及存储介质
CN106453412A (zh) 一种基于频次特征的恶意域名判定方法
Zhang et al. Web phishing detection based on page spatial layout similarity
CN102622445A (zh) 一种基于用户兴趣感知的网页推送系统及方法
CN107888606B (zh) 一种域名信誉度评估方法及系统
CN103067387B (zh) 一种反钓鱼监测系统和方法
CN102375813A (zh) 搜索引擎排重系统及方法
CN110572359A (zh) 基于机器学习的钓鱼网页检测方法
CN107800686A (zh) 一种钓鱼网站识别方法和装置
CN102902722B (zh) 一种信息安全性的处理方法和系统
CN103455754B (zh) 一种基于正则表达式的恶意搜索关键词识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210207

Address after: 100190 room 506, building 2, courtyard 4, South 4th Street, Zhongguancun, Haidian District, Beijing

Patentee after: CHINA INTERNET NETWORK INFORMATION CENTER

Address before: 100190 No. four, 4 South Street, Haidian District, Beijing, Zhongguancun

Patentee before: Computer Network Information Center, Chinese Academy of Sciences

TR01 Transfer of patent right