CN105978850A - 一种基于图形匹配的仿冒网站检测系统及检测方法 - Google Patents

一种基于图形匹配的仿冒网站检测系统及检测方法 Download PDF

Info

Publication number
CN105978850A
CN105978850A CN201610213651.8A CN201610213651A CN105978850A CN 105978850 A CN105978850 A CN 105978850A CN 201610213651 A CN201610213651 A CN 201610213651A CN 105978850 A CN105978850 A CN 105978850A
Authority
CN
China
Prior art keywords
website
counterfeit
picture
fritter
counterfeit website
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610213651.8A
Other languages
English (en)
Inventor
樊凯
梁志宏
吕华辉
关泽武
杨航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Southern Power Grid Co Ltd
Original Assignee
China Southern Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Southern Power Grid Co Ltd filed Critical China Southern Power Grid Co Ltd
Priority to CN201610213651.8A priority Critical patent/CN105978850A/zh
Publication of CN105978850A publication Critical patent/CN105978850A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • H04L63/1466Active attacks involving interception, injection, modification, spoofing of data unit addresses, e.g. hijacking, packet injection or TCP sequence number attacks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2119Authenticating web pages, e.g. with suspicious links

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于图形匹配的仿冒网站检测系统及检测方法,本发明涉及信息安全领领域;它包含仿冒网站logo图片识别系统;所述的仿冒网站logo图片识别系统包含仿冒网站域名管理模块、仿冒网站logo图片提取模块和仿冒网站相似度计算模块。解决现有技术中存在的问题,准确率更高,不容易误报。

Description

一种基于图形匹配的仿冒网站检测系统及检测方法
技术领域
本发明涉及信息安全领域,具体涉及一种基于图形匹配的仿冒网站检测系统及检测方法。
背景技术
仿冒网站,指未经授权建立的相似网站,如果是出于恶意目的,称为钓鱼网站。对仿冒网站的检测一直是安全行业的一个重要问题,需要更精确和有效的技术来识别判断仿冒网站。
经对现有技术的文献检索发现,中国专利申请号CN201110402085.2,专利名称“钓鱼网站检测方法及装置”,提供一种钓鱼网站检测方法及装置。该钓鱼网站检测方法包括:获取已知钓鱼网站的互联网协议IP地址;根据与所述已知钓鱼网站的IP地址相邻的预设范围设定可疑IP域;查询所述可疑IP域所包括的可疑IP地址所映射的统一资源定位符URL,并根据所述URL生成可疑钓鱼网站列表;针对所述可疑钓鱼网站列表中的各所述URL进行钓鱼网站检测。根据本发明的钓鱼网站检测方法及装置,实现了从庞大的网站资源中主动发现未知钓鱼网站。
中国专利申请号CN201210220826.X,专利名称“一种钓鱼网站查找系统及方法”,公开了一种钓鱼网站查找系统及方法,涉及网络安全领域。所述系统包括:种子库建立单元,适于将命中已知钓鱼网站的个数大于预定阈值的目标网页的原始链接作为种子链接放入种子库;种子提取器,适于提取出种子库中的种子链接;种子网页分析器,适于根据提取出的种子链接查找对应的种子网页,对种子网页进行分析,得到种子网页中存在的可疑链接;判断单元,适于查找可疑链接对应的可疑网页,判断可疑网页是否是钓鱼网站;输出接口,适于在可疑网页是钓鱼网站时,输出相应的钓鱼网站。所述系统及方法,大幅提高了钓鱼网站的查找速度,降低了网民使用互联网的安全风险。
现有技术准确率低,容易发生误报的情况,亟待改进。
发明内容
本发明的目的在于针对现有技术的缺陷和不足,提供一种设计合理的基于图形匹配的仿冒网站检测系统及检测方法,解决现有技术中存在的问题,准确率更高,不容易误报。
为实现上述目的,本发明采用的技术方案是:它包含仿冒网站logo图片识别系统;所述的仿冒网站logo图片识别系统包含仿冒网站域名管理模块、仿冒网站logo图片提取模块和仿冒网站相似度计算模块。
它的操作步骤如下:
A、使用HTTP协议或HTTPS协议连接目标网站,下载网站首页;
B、提取带有logo字样的图片,如果没有则提前右上角的图片或第一张图片;
C、针对目标网站的logo图片和原始网站的logo图片分别划分为若干小块,一般为64×64个小块,对每一小块生成灰度数组,每一小块的灰度值在0到255之间,原始网站的每一小块灰度值为Sx,y,目标网站每一小块的灰度值为Tx,y;
D、计算两个图片的相似度D,计算方法参照如下公式:
D = Σ i = 0 n ( S x , y - T x , y ) 2 S x , y + T x , y ;
E、相似度的范围在0到无穷大之间,根据测试结论,0为完全相同,0~1为十分相似,1以上可以认为是完全不同的图片,即目标网站不是原始网站的仿冒者。
采用上述结构后,本发明有益效果为:
1、通过使用图形比较的方式可以模拟网站用户的使用体验,通过识别logo图片判断是否是仿冒网站,提供了一种新的仿冒网站的识别方式;
2、图形比较识别仿冒网站比传统的文字识别方式准确率更高,不容易误报,某些仿冒网站可能通过避免使用特征词的方式绕过文字识别,却难以绕开logo相似度的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的结构示意图。
图2是本发明的操作流程图。
附图标记说明:
仿冒网站logo图片识别系统1、仿冒网站域名管理模块2、仿冒网站logo
图片提取模块3、仿冒网站相似度计算模块4。
具体实施方式
下面结合附图对本发明作进一步的说明。
参看如图1和图2所示,本具体实施方式采用的技术方案是:它包含仿冒网站logo图片识别系统1;所述的仿冒网站logo图片识别系统1包含仿冒网站域名管理模块2、仿冒网站logo图片提取模块3和仿冒网站相似度计算模块4。
它的操作步骤如下:
A、使用HTTP协议或HTTPS协议连接目标网站,下载网站首页;
B、提取带有logo字样的图片,如果没有则提前右上角的图片或第一张图片;
C、针对目标网站的logo图片和原始网站的logo图片分别划分为若干小块,一般为64×64个小块,对每一小块生成灰度数组,每一小块的灰度值在0到255之间,原始网站的每一小块灰度值为Sx,y,目标网站每一小块的灰度值为Tx,y;
D、计算两个图片的相似度D,计算方法参照如下公式:
D = Σ i = 0 n ( S x , y - T x , y ) 2 S x , y + T x , y ;
E、相似度的范围在0到无穷大之间,根据测试结论,0为完全相同,0~1为十分相似,1以上可以认为是完全不同的图片,即目标网站不是原始网站的仿冒者。
采用上述结构后,本具体实施方式有益效果为:解决现有技术中存在的问题,准确率更高,不容易误报,通过识别logo图片判断是否是仿冒网站,提供了一种新的仿冒网站的识别方式。
以上所述,仅用以说明本发明的技术方案而非限制,本领域普通技术人员对本发明的技术方案所做的其它修改或者等同替换,只要不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。

Claims (2)

1.一种基于图形匹配的仿冒网站检测系统,其特征在于:它包含仿冒网站logo图片识别系统;所述的仿冒网站logo图片识别系统包含仿冒网站域名管理模块、仿冒网站logo图片提取模块和仿冒网站相似度计算模块。
2.一种基于图形匹配的仿冒网站检测方法,其特征在于:它的操作步骤如下:
(A)、使用HTTP协议或HTTPS协议连接目标网站,下载网站首页;
(B)、提取带有logo字样的图片,如果没有则提前右上角的图片或第一张图片;
(C)、针对目标网站的logo图片和原始网站的logo图片分别划分为若干小块,一般为64×64个小块,对每一小块生成灰度数组,每一小块的灰度值在0到255之间,原始网站的每一小块灰度值为Sx,y,目标网站每一小块的灰度值为Tx,y;
(D)、计算两个图片的相似度D,计算方法参照如下公式:
D = Σ i = 0 n ( S x , y - T x , y ) 2 S x , y + T x , y ;
(E)、相似度的范围在0到无穷大之间,根据测试结论,0为完全相同,0~1为十分相似,1以上可以认为是完全不同的图片,即目标网站不是原始网站的仿冒者。
CN201610213651.8A 2016-04-08 2016-04-08 一种基于图形匹配的仿冒网站检测系统及检测方法 Pending CN105978850A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610213651.8A CN105978850A (zh) 2016-04-08 2016-04-08 一种基于图形匹配的仿冒网站检测系统及检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610213651.8A CN105978850A (zh) 2016-04-08 2016-04-08 一种基于图形匹配的仿冒网站检测系统及检测方法

Publications (1)

Publication Number Publication Date
CN105978850A true CN105978850A (zh) 2016-09-28

Family

ID=56989251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610213651.8A Pending CN105978850A (zh) 2016-04-08 2016-04-08 一种基于图形匹配的仿冒网站检测系统及检测方法

Country Status (1)

Country Link
CN (1) CN105978850A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106357682A (zh) * 2016-10-26 2017-01-25 华中科技大学 一种钓鱼网站检测方法
CN107798649A (zh) * 2017-09-05 2018-03-13 北京五八信息技术有限公司 图片的识别方法和装置
CN110784462A (zh) * 2019-10-23 2020-02-11 北京邮电大学 基于混合方法的三层钓鱼网站检测系统
CN112989155A (zh) * 2021-04-15 2021-06-18 远江盛邦(北京)网络安全科技股份有限公司 基于网页图标的设备识别方法及装置
CN114124564A (zh) * 2021-12-03 2022-03-01 北京天融信网络安全技术有限公司 一种仿冒网站检测方法、装置、电子设备及存储介质
CN115051817A (zh) * 2022-01-05 2022-09-13 中国互联网络信息中心 一种基于多模态融合特征的网络钓鱼检测方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103136251A (zh) * 2011-11-29 2013-06-05 星云融创(北京)科技有限公司 识别网页的方法和装置
CN103281320A (zh) * 2013-05-23 2013-09-04 中国科学院计算机网络信息中心 基于网页图标匹配的品牌仿冒网站检测方法
CN103442014A (zh) * 2013-09-03 2013-12-11 中国科学院信息工程研究所 一种自动检测疑似仿冒网站的方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103136251A (zh) * 2011-11-29 2013-06-05 星云融创(北京)科技有限公司 识别网页的方法和装置
CN103281320A (zh) * 2013-05-23 2013-09-04 中国科学院计算机网络信息中心 基于网页图标匹配的品牌仿冒网站检测方法
CN103442014A (zh) * 2013-09-03 2013-12-11 中国科学院信息工程研究所 一种自动检测疑似仿冒网站的方法及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106357682A (zh) * 2016-10-26 2017-01-25 华中科技大学 一种钓鱼网站检测方法
CN107798649A (zh) * 2017-09-05 2018-03-13 北京五八信息技术有限公司 图片的识别方法和装置
CN110784462A (zh) * 2019-10-23 2020-02-11 北京邮电大学 基于混合方法的三层钓鱼网站检测系统
CN112989155A (zh) * 2021-04-15 2021-06-18 远江盛邦(北京)网络安全科技股份有限公司 基于网页图标的设备识别方法及装置
CN114124564A (zh) * 2021-12-03 2022-03-01 北京天融信网络安全技术有限公司 一种仿冒网站检测方法、装置、电子设备及存储介质
CN114124564B (zh) * 2021-12-03 2023-11-28 北京天融信网络安全技术有限公司 一种仿冒网站检测方法、装置、电子设备及存储介质
CN115051817A (zh) * 2022-01-05 2022-09-13 中国互联网络信息中心 一种基于多模态融合特征的网络钓鱼检测方法和系统
CN115051817B (zh) * 2022-01-05 2023-11-24 中国互联网络信息中心 一种基于多模态融合特征的网络钓鱼检测方法和系统

Similar Documents

Publication Publication Date Title
CN105978850A (zh) 一种基于图形匹配的仿冒网站检测系统及检测方法
CN106789939B (zh) 一种钓鱼网站检测方法和装置
CN105184159B (zh) 网页篡改的识别方法和装置
SG11201907355XA (en) Method and apparatus for detecting object, method and apparatus for training neural network, and electronic device
CN103281320B (zh) 基于网页图标匹配的品牌仿冒网站检测方法
CN103179095B (zh) 一种检测钓鱼网站的方法及客户端装置
CN106685936B (zh) 网页篡改的检测方法及装置
CN102098235B (zh) 一种基于文本特征分析的钓鱼邮件检测方法
CN109922065B (zh) 恶意网站快速识别方法
CN108111478A (zh) 一种基于语义理解的网络钓鱼识别方法和装置
CN107392016A (zh) 一种基于代理的Web数据库攻击行为检测系统
CN103607413B (zh) 一种网站后门程序检测的方法及装置
CN103577755A (zh) 一种基于支持向量机的恶意脚本静态检测方法
CN104462152A (zh) 一种网页的识别方法及装置
CN102467633A (zh) 一种安全浏览网页的方法及其系统
CN102170446A (zh) 一种基于空间布局与视觉特征的钓鱼网页检测方法
CN102799814A (zh) 一种钓鱼网站查找系统及方法
CN106779278A (zh) 资产信息的评价系统及其信息的处理方法和装置
CN108566399A (zh) 钓鱼网站识别方法及系统
CN109657470A (zh) 恶意网页检测模型训练方法、恶意网页检测方法及系统
CN104901962B (zh) 一种网页攻击数据的检测方法及装置
CN104468459B (zh) 一种漏洞检测方法及装置
CN105938531A (zh) 识别恶意网络基础设施
CN110474889A (zh) 一种基于网站图标的钓鱼网站识别方法及装置
CN106357682A (zh) 一种钓鱼网站检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160928

WD01 Invention patent application deemed withdrawn after publication