CN105491033A - 一种钓鱼网站的识别方法及装置 - Google Patents

一种钓鱼网站的识别方法及装置 Download PDF

Info

Publication number
CN105491033A
CN105491033A CN201510857043.6A CN201510857043A CN105491033A CN 105491033 A CN105491033 A CN 105491033A CN 201510857043 A CN201510857043 A CN 201510857043A CN 105491033 A CN105491033 A CN 105491033A
Authority
CN
China
Prior art keywords
website
domain
information
measured
name information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510857043.6A
Other languages
English (en)
Inventor
储来斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rui Feng Network Cloud (beijing) Polytron Technologies Inc
Original Assignee
Rui Feng Network Cloud (beijing) Polytron Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rui Feng Network Cloud (beijing) Polytron Technologies Inc filed Critical Rui Feng Network Cloud (beijing) Polytron Technologies Inc
Priority to CN201510857043.6A priority Critical patent/CN105491033A/zh
Publication of CN105491033A publication Critical patent/CN105491033A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • H04L63/1483Countermeasures against malicious traffic service impersonation, e.g. phishing, pharming or web spoofing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/45Network directories; Name-to-address mapping
    • H04L61/4505Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols
    • H04L61/4511Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols using domain name system [DNS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2119Authenticating web pages, e.g. with suspicious links

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种钓鱼网站的识别方法,包括如下步骤:解析该待测网站的DNS信息和域名信息;生成基准数据库,并且对基准数据库中的域名信息和DNS信息进行黑名单和白名单的标记;将待测网站中的域名信息和基准数据库中的域名信息进行比较,当待测网站中的域名信息在基准数据库中显示为黑名单标记则判断该待测网站为钓鱼网站。本发明的有益效果为:本发明的钓鱼网站识别方法基于域名相似度进行识别,具有良好的实时性,能够应用于多种场合,同时深度检测弥补了基于URL检测的正确率不足的问题,并将深度检测的结果返回到对比数据库,提高了钓鱼网站识别的正确率,同时,通过信息积累,也提高了钓鱼网站识别的正确率。

Description

一种钓鱼网站的识别方法及装置
技术领域
本发明涉及一种钓鱼网站的识别方法及装置。
背景技术
钓鱼网站通常指伪装成银行及电子商务,窃取用户提交的银行帐号、密码等私密信息的网站,可用电脑管家进行查杀。“钓鱼”是一种网络欺诈行为,指不法分子利用各种手段,仿冒真实网站的URL地址以及页面内容,或利用真实网站服务器程序上的漏洞在站点的某些网页中插入危险的HTML代码,以此来骗取用户银行或信用卡账号、密码等私人资料。
“钓鱼网站”的频繁出现,严重地影响了在线金融服务、电子商务的发展危害公众利益,影响公众应用互联网的信心。钓鱼网站通常伪装成为银行网站,窃取访问者提交的账号和密码信息给人们的生活带来了很大的不便,严重威胁了人们的财产安全。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
本发明的目的是提供一种钓鱼网站的识别方法及装置,以克服目前现有技术存在的上述不足。
本发明的目的是通过以下技术方案来实现:
一种钓鱼网站的识别方法,包括如下步骤:
接收所有待测网站的访问请求,解析该待测网站的DNS信息和域名信息;
根据常见支付网站和金融网站的域名信息和DNS信息生成基准数据库,并且对基准数据库中的域名信息和DNS信息进行黑名单和白名单的标记;
将待测网站中的域名信息和基准数据库中的域名信息进行比较,当待测网站中的域名信息在基准数据库中显示为黑名单标记则判断该待测网站为钓鱼网站。
进一步的,在进行钓鱼网站的判断之前还需要确定该待测网站的域名信息是否在基准数据库中,带待测网站的域名信息不在基准数据库中的时候还需要进行如下步骤:
根据常见的英文单词、机构简写、以及各种专业术语生成数据词典,利用编辑距离算法对域名和所述字典的相似性进行的分析,进而确定仿冒域名,并且将该仿冒域名便携到基准数据库中,并且将该域名信息标记为黑名单。
进一步的,利用编辑距离算法的分析包括如下步骤:
查找编辑距离为1的候选词条,对所述待测网站中的异常点数,字符编码、域名申请的时间以及域名过期的时间进行深度检测并且对域名的whois进行分析进而确定该待测网站的域名是否为仿冒域名。
一种钓鱼网站的识别装置,包括信息解析装置、基准数据库处理装置以及钓鱼网站判断装置,其中:
信息解析装置:用于接收所有待测网站的访问请求,解析该待测网站的DNS信息和域名信息;
基准数据库处理装置:用于根据常见支付网站和金融网站的域名信息和DNS信息生成基准数据库,并且对基准数据库中的域名信息和DNS信息进行黑名单和白名单的标记;
钓鱼网站判断装置:用于将待测网站中的域名信息和基准数据库中的域名信息进行比较,当待测网站中的域名信息在基准数据库中显示为黑名单标记则判断该待测网站为钓鱼网站。
本发明的有益效果为:本发明的钓鱼网站识别方法基于域名相似度进行识别,具有良好的实时性,能够应用于多种场合,同时深度检测弥补了基于URL检测的正确率不足的问题,并将深度检测的结果返回到对比数据库,提高了钓鱼网站识别的正确率,同时,通过信息积累,也提高了钓鱼网站识别的正确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的钓鱼网站的识别方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,根据本发明的实施例所述的一种钓鱼网站的识别方法,其特征在于,包括如下步骤:
接收所有待测网站的访问请求,解析该待测网站的DNS信息和域名信息;
根据常见支付网站和金融网站的域名信息和DNS信息生成基准数据库,并且对基准数据库中的域名信息和DNS信息进行黑名单和白名单的标记;
将待测网站中的域名信息和基准数据库中的域名信息进行比较,当待测网站中的域名信息在基准数据库中显示为黑名单标记则判断该待测网站为钓鱼网站。
进一步的;在进行钓鱼网站的判断之前还需要确定该待测网站的域名信息是否在基准数据库中,带待测网站的域名信息不在基准数据库中的时候还需要进行如下步骤:
根据常见的英文单词、机构简写、以及各种专业术语生成数据词典,利用编辑距离算法对域名和所述字典的相似性进行的分析,进而确定仿冒域名,并且将该仿冒域名便携到基准数据库中,并且将该域名信息标记为黑名单。
进一步的,利用编辑距离算法的分析包括如下步骤:
查找编辑距离为1的候选词条,对所述待测网站中的异常点数,字符编码、域名申请的时间以及域名过期的时间进行深度检测并且对域名的whois进行分析进而确定该待测网站的域名是否为仿冒域名。
一种钓鱼网站的识别装置,包括信息解析装置、基准数据库处理装置以及钓鱼网站判断装置,其中:
信息解析装置:用于接收所有待测网站的访问请求,解析该待测网站的DNS信息和域名信息;
基准数据库处理装置:用于根据常见支付网站和金融网站的域名信息和DNS信息生成基准数据库,并且对基准数据库中的域名信息和DNS信息进行黑名单和白名单的标记;
钓鱼网站判断装置:用于将待测网站中的域名信息和基准数据库中的域名信息进行比较,当待测网站中的域名信息在基准数据库中显示为黑名单标记则判断该待测网站为钓鱼网站。
综上所述,借助于本发明的上述技术方案,本发明的钓鱼网站识别方法基于域名相似度进行识别,具有良好的实时性,能够应用于多种场合,同时深度检测弥补了基于URL检测的正确率不足的问题,并将深度检测的结果返回到对比数据库,提高了钓鱼网站识别的正确率,同时,通过信息积累,也提高了钓鱼网站识别的正确率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种钓鱼网站的识别方法,其特征在于,包括如下步骤:
接收所有待测网站的访问请求,解析该待测网站的DNS信息和域名信息;
根据常见支付网站和金融网站的域名信息和DNS信息生成基准数据库,并且对基准数据库中的域名信息和DNS信息进行黑名单和白名单的标记;
将待测网站中的域名信息和基准数据库中的域名信息进行比较,当待测网站中的域名信息在基准数据库中显示为黑名单标记则判断该待测网站为钓鱼网站。
2.根据权利要求1所述的钓鱼网站的识别方法,其特征在于;在进行钓鱼网站的判断之前还需要确定该待测网站的域名信息是否在基准数据库中,带待测网站的域名信息不在基准数据库中的时候还需要进行如下步骤:
根据常见的英文单词、机构简写、以及各种专业术语生成数据词典,利用编辑距离算法对域名和所述字典的相似性进行的分析,进而确定仿冒域名,并且将该仿冒域名便携到基准数据库中,并且将该域名信息标记为黑名单。
3.根据权利要求2所述的钓鱼网站的识别方法,其特征在于,利用编辑距离算法的分析包括如下步骤:
查找编辑距离为1的候选词条,对所述待测网站中的异常点数,字符编码、域名申请的时间以及域名过期的时间进行深度检测并且对域名的whois进行分析进而确定该待测网站的域名是否为仿冒域名。
4.一种钓鱼网站的识别装置,其特征在于,包括信息解析装置、基准数据库处理装置以及钓鱼网站判断装置,其中:
信息解析装置:用于接收所有待测网站的访问请求,解析该待测网站的DNS信息和域名信息;
基准数据库处理装置:用于根据常见支付网站和金融网站的域名信息和DNS信息生成基准数据库,并且对基准数据库中的域名信息和DNS信息进行黑名单和白名单的标记;
钓鱼网站判断装置:用于将待测网站中的域名信息和基准数据库中的域名信息进行比较,当待测网站中的域名信息在基准数据库中显示为黑名单标记则判断该待测网站为钓鱼网站。
CN201510857043.6A 2015-11-30 2015-11-30 一种钓鱼网站的识别方法及装置 Pending CN105491033A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510857043.6A CN105491033A (zh) 2015-11-30 2015-11-30 一种钓鱼网站的识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510857043.6A CN105491033A (zh) 2015-11-30 2015-11-30 一种钓鱼网站的识别方法及装置

Publications (1)

Publication Number Publication Date
CN105491033A true CN105491033A (zh) 2016-04-13

Family

ID=55677749

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510857043.6A Pending CN105491033A (zh) 2015-11-30 2015-11-30 一种钓鱼网站的识别方法及装置

Country Status (1)

Country Link
CN (1) CN105491033A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105491031A (zh) * 2015-11-30 2016-04-13 睿峰网云(北京)科技股份有限公司 一种钓鱼网站的识别方法及装置
CN106302440A (zh) * 2016-08-11 2017-01-04 国家计算机网络与信息安全管理中心 一种多渠道获取可疑钓鱼网站的方法
CN109088876A (zh) * 2018-08-30 2018-12-25 北京金惠新悦科技有限公司 一种互联网加密网站(https)流量的审核方法
CN111385293A (zh) * 2020-03-04 2020-07-07 腾讯科技(深圳)有限公司 一种网络风险检测方法和装置
CN112217815A (zh) * 2020-10-10 2021-01-12 杭州安恒信息技术股份有限公司 钓鱼网站的识别方法、装置和计算机设备
CN112667875A (zh) * 2020-12-24 2021-04-16 恒安嘉新(北京)科技股份公司 一种数据获取、数据分析方法、装置、设备及存储介质
CN116455620A (zh) * 2023-03-31 2023-07-18 华能信息技术有限公司 一种恶意域名访问分析及确定方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090089859A1 (en) * 2007-09-28 2009-04-02 Cook Debra L Method and apparatus for detecting phishing attempts solicited by electronic mail
CN102638448A (zh) * 2012-02-27 2012-08-15 珠海市君天电子科技有限公司 一种基于非内容分析的判断钓鱼网站的方法
CN104077396A (zh) * 2014-07-01 2014-10-01 清华大学深圳研究生院 一种钓鱼网站检测方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090089859A1 (en) * 2007-09-28 2009-04-02 Cook Debra L Method and apparatus for detecting phishing attempts solicited by electronic mail
CN102638448A (zh) * 2012-02-27 2012-08-15 珠海市君天电子科技有限公司 一种基于非内容分析的判断钓鱼网站的方法
CN104077396A (zh) * 2014-07-01 2014-10-01 清华大学深圳研究生院 一种钓鱼网站检测方法及装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105491031A (zh) * 2015-11-30 2016-04-13 睿峰网云(北京)科技股份有限公司 一种钓鱼网站的识别方法及装置
CN106302440A (zh) * 2016-08-11 2017-01-04 国家计算机网络与信息安全管理中心 一种多渠道获取可疑钓鱼网站的方法
CN109088876A (zh) * 2018-08-30 2018-12-25 北京金惠新悦科技有限公司 一种互联网加密网站(https)流量的审核方法
CN111385293A (zh) * 2020-03-04 2020-07-07 腾讯科技(深圳)有限公司 一种网络风险检测方法和装置
CN111385293B (zh) * 2020-03-04 2021-06-22 腾讯科技(深圳)有限公司 一种网络风险检测方法和装置
CN112217815A (zh) * 2020-10-10 2021-01-12 杭州安恒信息技术股份有限公司 钓鱼网站的识别方法、装置和计算机设备
CN112217815B (zh) * 2020-10-10 2022-09-13 杭州安恒信息技术股份有限公司 钓鱼网站的识别方法、装置和计算机设备
CN112667875A (zh) * 2020-12-24 2021-04-16 恒安嘉新(北京)科技股份公司 一种数据获取、数据分析方法、装置、设备及存储介质
CN116455620A (zh) * 2023-03-31 2023-07-18 华能信息技术有限公司 一种恶意域名访问分析及确定方法

Similar Documents

Publication Publication Date Title
CN105491033A (zh) 一种钓鱼网站的识别方法及装置
Ahammad et al. Phishing URL detection using machine learning methods
US20200045067A1 (en) Dynamic phishing detection methods and apparatus
US11580760B2 (en) Visual domain detection systems and methods
CN105718577B (zh) 一种针对新增域名自动检测网络钓鱼的方法与系统
CN101504673B (zh) 一种识别疑似仿冒网站的方法与系统
Suzuki et al. ShamFinder: An automated framework for detecting IDN homographs
CN103179095B (zh) 一种检测钓鱼网站的方法及客户端装置
CN105119909B (zh) 一种基于页面视觉相似性的仿冒网站检测方法和系统
GB2594396A (en) Cryptocurrency based malware and ransomware detection systems and methods
KR101328389B1 (ko) 메신저 피싱을 탐지하는 장치 및 방법
CN111865925A (zh) 基于网络流量的诈骗团伙识别方法、控制器和介质
CN103209177B (zh) 网络钓鱼攻击的检测方法和装置
US9692771B2 (en) System and method for estimating typicality of names and textual data
CN108566399A (zh) 钓鱼网站识别方法及系统
CN113779481B (zh) 诈骗网站的识别方法、装置、设备及存储介质
CN105959330A (zh) 虚假链接拦截方法、装置以及系统
CN109948343A (zh) 漏洞检测方法、漏洞检测装置和计算机可读存储介质
CN116366338B (zh) 一种风险网站识别方法、装置、计算机设备及存储介质
CN103379111A (zh) 一种网络钓鱼智能防御系统
CN106096040A (zh) 基于搜索引擎的机构网站归属地判别方法及其装置
CN105989149A (zh) 一种用户设备指纹的提取和识别方法及系统
CN103856437A (zh) 网站安全性的检测方法和系统
CN105376217A (zh) 一种恶意跳转及恶意嵌套类不良网站的自动判定方法
CN110138758A (zh) 基于域名词汇的误植域名检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160413