CN106357682A - 一种钓鱼网站检测方法 - Google Patents

一种钓鱼网站检测方法 Download PDF

Info

Publication number
CN106357682A
CN106357682A CN201610948226.3A CN201610948226A CN106357682A CN 106357682 A CN106357682 A CN 106357682A CN 201610948226 A CN201610948226 A CN 201610948226A CN 106357682 A CN106357682 A CN 106357682A
Authority
CN
China
Prior art keywords
website
detected
name
detection method
phishing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610948226.3A
Other languages
English (en)
Inventor
王大为
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201610948226.3A priority Critical patent/CN106357682A/zh
Publication of CN106357682A publication Critical patent/CN106357682A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1416Event detection, e.g. attack signature detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种钓鱼网站检测方法,包括如下步骤:首先随机填充待检测网站的表单,当系统随机生成的账号密码验证通过,则判定待检测网站为钓鱼网站;否则,进入下一步骤;获取待检测网站快照并从中提取其logo区域的文字;将logo区域的文字与预设的白名单进行匹配,获取logo区域对应的根域名;将该根域名与白名单中的根域名进行比对,若所述域名的根域名与白名单中的根域名匹配,则判定待检测网站为非钓鱼网站;否则,判定为非钓鱼网站;本发明提供的这种钓鱼网站检测方法,具有准确度高,实时性好的特点,解决了现有钓鱼网站检测方法漏报概率大、实时性差的问题。

Description

一种钓鱼网站检测方法
技术领域
本发明属于计算机网络安全技术领域,更具体地,涉及一种钓鱼网站检测方法。
背景技术
随着网络信息与服务的迅速发展,人们的生活消费以及服务活动逐渐开始由现实向互联网环境转移;钓鱼网站问题随之浮现;钓鱼网站由于页面内容与被假冒的网站的页面内容几乎完全相同,导致用户被欺骗造成巨大的经济财产损失。
现有技术中对于钓鱼网站的检测方法包括人工举报、关键字识别和黑白名单技术;其中,人工举报需要用户主动发现,效果较为被动;关键字识别受限于钓鱼网站文字内容,局限性较大;而黑白名单技术需要管理者不停的更新名单,漏报、错报可能性较大。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种钓鱼网站检测方法,其目的在于解决现有钓鱼网站检测方法漏报概率大、实时性差的问题。
为实现上述目的,按照本发明的一个方面,提供了一种钓鱼网站检测方法,包括如下步骤:
(1)随机填充待检测网站的表单,若表单中随机填充的账号密码通过了验证,则判定待检测网站为钓鱼网站;否则,进入步骤(2);
(2)获取待检测网站快照并从中提取其logo区域的文字;
(3)将所述文字与预设的白名单进行匹配,获取所述logo区域对应的根域名;
(4)将所述根域名与白名单中的根域名进行比对,若所述域名的根域名与白名单中的根域名匹配,则判定待检测网站为非钓鱼网站;否则,判定为非钓鱼网站。
优选地,上述钓鱼网站检测方法,所述表单的内容是根据待检测网站对用户名、密码的长度和字符格式限制随机生成的字符串。
优选地,上述钓鱼网站检测方法,所述步骤(2)中,将网页快照划分为面积相同4块正方形区域,对左上的正方形区域内容进行识别;根据网站布局的统计结果获知网站logo位于页面左上区域的概率大,因此在本步骤中,直接对左上区域内容进行识别,以提高处理的实时性。
优选地,上述钓鱼网站检测方法,所述步骤(3)中,通过去除请求参数,去除控制器与方法字段,对所述域名的当前统一资源定位符(Uniform Resource Locator,URL)进行字符串处理获取根域名。
优选地,上述钓鱼网站检测方法,所述步骤(4)具体为:将根域名与官网域名进行比对,若两者匹配,则判定待检测网站为非钓鱼网站;否则,判定待检测网站为钓鱼网站。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
(1)本发明提供的钓鱼网站检测方法,直接从图片层次进行识别,解决了钓鱼网站将文字内容伪装成图片从而导致误报、漏报的问题;相比较而言,现有的钓鱼网站检测技术的检测初始点为网站的源代码,通过对网站源代码的分析判断出该网站是否为钓鱼网站;这类方法的缺陷在于:由于源代码中看不到图片内容,因此无法识别出用图片伪造内容的钓鱼网站,而产生误报、漏报;
(2)本发明提供的钓鱼网站检测方法,通过分析图片内容与URL的对应性,可以判断待检测网站是否为钓鱼网站,并具有普适性,无论钓鱼网站如何在源代码中隐藏伪造痕迹,其伪造的网站均与白名单中的真实网站内容相似或相同,呈献给用户的视觉信息不会发生改变,由此可由一条白名单数据检测出多条钓鱼网站信息,具有高效检测的特点;相比较而言,现有的钓鱼网站检测技术仅通过源代码中的文字内容进行识别,无法直接与用户所看到的内容产生一致性,可能存在视觉信息与网站内容不相匹配的情况,从而产生漏判、误判;
(3)本发明提供的钓鱼网站检测方法,由于与服务端之间仅仅传递的是待检测网站的URL,再在服务端上对该URL对应的网站进行检测,整个过程传递的都只是文字内容,传递速度快,因此提高了钓鱼网站检测的实时性。
附图说明
图1是本发明实施例提供的钓鱼网站检测方法流程图;
图2是本发明实施例所检测的某购物网站的登录界面示意图;
图3是本发明实施例所检测的某购物网站的登录界面的切分示例图;
图4是本发明实施例所检测的某购物网站的登录界面的左上方logo区域示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明提供的钓鱼网站检查方法,先随机填充待检测网站中的表单,若表单中随机填充的账号密码通过了验证,则判定待检测网站为钓鱼网站;否则继续判断;生成网站快照并用图像识别技术识别logo区域的文字,将文字与白名单数据库中对应数据进行匹配,并取白名单中的根域名与待检测网站根域名进行比对,若比对成功,则判定为非钓鱼网站,若比对不成功,则判定为钓鱼网站;与现有的钓鱼网站检查方法相比,本发明的这种方法利用钓鱼网站的登录系统大多只是虚设,实则为了获取用户账号信息的特点,用虚假的账号密码组合进行试探,从而进行初始判断;对于初始判断不能确定的网站,则直接利用图像识别待测网页的logo,从视觉上判断待测网页是否为钓鱼网站,做到与用户所看到的内容相一致,从而避免误判、漏判。
以下结合对某购物网站进行检测的实施例,来具体阐述本发明提供的钓鱼网站检测方法;实施例提供的钓鱼网站检查方法,其流程如图1所示,具体包括如下步骤:
(1)随机填充表单数据;实施例中,账号填充为asdiw9424uad,密码为23iwsdh824!ad;其填充页面如图2所示;
(2)根据待检测网站返回内容中是否有类似“账户名与密码不匹配”的文本判断是否登录成功来判断待检测网站是否为钓鱼网站;当待检测网站返回内容中不存在该类文本,表明登陆成功,判定待检测网站为钓鱼网站,否则进入步骤(3);
(3)生成待检测网站对应页面的网页快照,提取网页快照左上方内容,并利用光学字符识别技术(Optical Character Recognition,OCR)提取Logo区域的文字;
(4)将检测出的所有文字与预设的白名单进行匹配,找出存在于文字中的白名单域名,获取Logo区域对应的根域名;
(5)将上述根域名与白名单中的根域名进行比对,若所述域名的根域名与白名单中的根域名匹配,则判定待检测网站为非钓鱼网站;否则,判定为非钓鱼网站;
本实施例中,待测网站域名的根域名为www.ks-harq.cn,白名单中的域名为www.taobao.com,两者不匹配;判定待测网站为钓鱼网站。
实施例中,检测到待测网站的源代码进行了加密;对于在这类源代码加密的钓鱼网站,通过现有的通过源代码检测来进行钓鱼网站识别的方法,极易误判,漏判;而采用本实施例提供的这种从提前的网页快照的图片层次进行识别,则解决了漏判、误判的问题。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种钓鱼网站检测方法,其特征在于,包括如下步骤:
(1)随机填充待检测网站的表单,若表单中随机填充的账号密码通过了验证,则判定待检测网站为钓鱼网站;否则,进入步骤(2);
(2)获取待检测网站快照并从中提取其logo区域的文字;
(3)将所述文字与预设的白名单进行匹配,获取所述logo区域对应的根域名;
(4)将所述根域名与白名单中的根域名进行比对,若所述域名的根域名与白名单中的根域名匹配,则判定待检测网站为非钓鱼网站;否则,判定为非钓鱼网站。
2.如权利要求1所述的钓鱼网站检测方法,其特征在于,所述表单的内容是根据待检测网站对用户名、密码的长度和字符格式限制随机生成的字符串。
3.如权利要求1或2所述的钓鱼网站检测方法,其特征在于,所述步骤(2)中,将网页快照划分为面积相同的4块正方形区域,对左上的正方形区域内容进行识别。
4.如权利要求1或2所述的钓鱼网站检测方法,其特征在于,所述步骤(3)中,通过去除请求参数、去除控制器与方法字段,对所述域名的当前统一资源定位符进行字符串处理获取根域名。
5.如权利要求1或2所述的钓鱼网站检测方法,其特征在于,所述步骤(4)中,将根域名与官网域名进行比对,若两者匹配,则判定待检测网站为非钓鱼网站;否则,判定待检测网站为钓鱼网站。
CN201610948226.3A 2016-10-26 2016-10-26 一种钓鱼网站检测方法 Pending CN106357682A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610948226.3A CN106357682A (zh) 2016-10-26 2016-10-26 一种钓鱼网站检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610948226.3A CN106357682A (zh) 2016-10-26 2016-10-26 一种钓鱼网站检测方法

Publications (1)

Publication Number Publication Date
CN106357682A true CN106357682A (zh) 2017-01-25

Family

ID=57864178

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610948226.3A Pending CN106357682A (zh) 2016-10-26 2016-10-26 一种钓鱼网站检测方法

Country Status (1)

Country Link
CN (1) CN106357682A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107800686A (zh) * 2017-09-25 2018-03-13 中国互联网络信息中心 一种钓鱼网站识别方法和装置
CN110309453A (zh) * 2018-03-07 2019-10-08 中移(苏州)软件技术有限公司 一种网页跳转方法及装置
CN111683089A (zh) * 2020-06-08 2020-09-18 绿盟科技集团股份有限公司 一种识别钓鱼网站的方法、服务器、介质及计算机设备
CN113132340A (zh) * 2020-01-16 2021-07-16 中国科学院信息工程研究所 一种基于视觉与主机特征的钓鱼网站识别方法及电子装置
CN113507485A (zh) * 2021-08-12 2021-10-15 河北民族师范学院 一种云端安全访问系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130031630A1 (en) * 2008-05-30 2013-01-31 At&T Intellectual Property I, L.P. Method and Apparatus for Identifying Phishing Websites in Network Traffic Using Generated Regular Expressions
CN104156490A (zh) * 2014-09-01 2014-11-19 北京奇虎科技有限公司 基于文字识别检测可疑钓鱼网页的方法及装置
CN105763543A (zh) * 2016-02-03 2016-07-13 百度在线网络技术(北京)有限公司 一种识别钓鱼网站的方法及装置
CN105978850A (zh) * 2016-04-08 2016-09-28 中国南方电网有限责任公司 一种基于图形匹配的仿冒网站检测系统及检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130031630A1 (en) * 2008-05-30 2013-01-31 At&T Intellectual Property I, L.P. Method and Apparatus for Identifying Phishing Websites in Network Traffic Using Generated Regular Expressions
CN104156490A (zh) * 2014-09-01 2014-11-19 北京奇虎科技有限公司 基于文字识别检测可疑钓鱼网页的方法及装置
CN105763543A (zh) * 2016-02-03 2016-07-13 百度在线网络技术(北京)有限公司 一种识别钓鱼网站的方法及装置
CN105978850A (zh) * 2016-04-08 2016-09-28 中国南方电网有限责任公司 一种基于图形匹配的仿冒网站检测系统及检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨明星: "基于登录页面及Logo图标检测的反钓鱼方案", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107800686A (zh) * 2017-09-25 2018-03-13 中国互联网络信息中心 一种钓鱼网站识别方法和装置
CN107800686B (zh) * 2017-09-25 2020-06-12 中国互联网络信息中心 一种钓鱼网站识别方法和装置
CN110309453A (zh) * 2018-03-07 2019-10-08 中移(苏州)软件技术有限公司 一种网页跳转方法及装置
CN113132340A (zh) * 2020-01-16 2021-07-16 中国科学院信息工程研究所 一种基于视觉与主机特征的钓鱼网站识别方法及电子装置
CN113132340B (zh) * 2020-01-16 2022-06-28 中国科学院信息工程研究所 一种基于视觉与主机特征的钓鱼网站识别方法及电子装置
CN111683089A (zh) * 2020-06-08 2020-09-18 绿盟科技集团股份有限公司 一种识别钓鱼网站的方法、服务器、介质及计算机设备
CN111683089B (zh) * 2020-06-08 2022-12-30 绿盟科技集团股份有限公司 一种识别钓鱼网站的方法、服务器、介质及计算机设备
CN113507485A (zh) * 2021-08-12 2021-10-15 河北民族师范学院 一种云端安全访问系统及方法
CN113507485B (zh) * 2021-08-12 2022-07-29 河北民族师范学院 一种云端安全访问系统及方法

Similar Documents

Publication Publication Date Title
CN106357682A (zh) 一种钓鱼网站检测方法
CN106789939B (zh) 一种钓鱼网站检测方法和装置
US9521161B2 (en) Method and apparatus for detecting computer fraud
CN102622435B (zh) 一种检测黑链的方法和装置
US20180060878A1 (en) Data authenticity identification method and device for safety check of two-dimensional code
CN105119909B (zh) 一种基于页面视觉相似性的仿冒网站检测方法和系统
US9118704B2 (en) Homoglyph monitoring
CN102467633A (zh) 一种安全浏览网页的方法及其系统
CN109922065B (zh) 恶意网站快速识别方法
CN105844140A (zh) 一种可识别验证码的网站登录暴力破解方法及系统
CN103268328B (zh) 二维码的验证方法及搜索引擎服务器
CN109005142B (zh) 网站安全检测方法、装置、系统、计算机设备和存储介质
CN102622553A (zh) 检测网页安全的方法及装置
US20190387024A1 (en) Detection of domain name impersonation
CN105488400A (zh) 一种恶意网页综合检测方法及系统
CN112989348B (zh) 攻击检测方法、模型训练方法、装置、服务器及存储介质
CN106383862B (zh) 一种违规短信检测方法及系统
CN109417471A (zh) 密码生成设备和密码验证设备
CN110020161B (zh) 数据处理方法、日志处理方法和终端
CN104618356B (zh) 身份验证方法及装置
CN112948725A (zh) 基于机器学习的钓鱼网站url检测方法及系统
CN114448664B (zh) 钓鱼网页的识别方法、装置、计算机设备及存储介质
CN108920955B (zh) 一种网页后门检测方法、装置、设备及存储介质
CN111683089B (zh) 一种识别钓鱼网站的方法、服务器、介质及计算机设备
Wen et al. Detecting malicious websites in depth through analyzing topics and web-pages

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170125

WD01 Invention patent application deemed withdrawn after publication