CN105187415A - 钓鱼网页检测方法 - Google Patents

钓鱼网页检测方法 Download PDF

Info

Publication number
CN105187415A
CN105187415A CN201510521589.4A CN201510521589A CN105187415A CN 105187415 A CN105187415 A CN 105187415A CN 201510521589 A CN201510521589 A CN 201510521589A CN 105187415 A CN105187415 A CN 105187415A
Authority
CN
China
Prior art keywords
webpage
server
phishing
webpages
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510521589.4A
Other languages
English (en)
Inventor
黄雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Qiulei Technology Co Ltd
Original Assignee
Chengdu Qiulei Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Qiulei Technology Co Ltd filed Critical Chengdu Qiulei Technology Co Ltd
Priority to CN201510521589.4A priority Critical patent/CN105187415A/zh
Publication of CN105187415A publication Critical patent/CN105187415A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1416Event detection, e.g. attack signature detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及一种钓鱼网页检测方法,包括以下步骤:服务器全网搜集钓鱼网站域名,建立钓鱼网站数据库,并进行数据处理分析,构建钓鱼网站域名特征集;服务器监测每个用户端网页状态,从所述网页中提取特定信息,并进行网页相似度计算;若发现网页有与钓鱼网站数据库相同或相似的信息,则将网页进行标记,并将特定信息传输至服务器,服务器对本域名以及所在网页的其他链接进行进一步全面分析,确定为钓鱼网页后,则纳入钓鱼网站数据库。本发明对全网进行监控,数据库更新快,实时更新钓鱼网页数据库,能够高效的检测钓鱼网站,让用户端网页更加安全;能全面搜集钓鱼网站,建立更全面的数据库。

Description

钓鱼网页检测方法
技术领域
本发明涉及一种钓鱼网页检测方法。
背景技术
随着互联网技术的飞速发展,互联网用户的不断增多,网民主要是通过网页来接触各种网络信息。但会有许多不法分子采用钓鱼网站来获取用户隐私,由于许多用户不够专业,容易上当,导致隐私泄露,给用户带来严重损失。一些钓鱼网站也可能让计算机中毒,导致打开网页的速度快,给电脑带来大量垃圾信息。所以亟需一种钓鱼网页检测方法。
发明内容
针对上述现有技术不足,本发明提供一种钓鱼网页检测方法。
本发明提供的钓鱼网页检测方法是通过以下技术方案实现的:
一种钓鱼网页检测方法,其特征在于,包括以下步骤:
服务器全网搜集钓鱼网站域名,建立钓鱼网站数据库,并进行数据处理分析,构建钓鱼网站域名特征集;
服务器监测每个用户端网页状态,从所述网页中提取特定信息,并进行网页相似度计算,所述特定信息包括:域名、编码格式、文档对象模型、词汇;
若发现网页有与钓鱼网站数据库相同或相似的信息,则将网页进行标记,并将特定信息传输至服务器,服务器对本域名以及所在网页的其他链接进行进一步全面分析,确定为钓鱼网页后,则纳入钓鱼网站数据库;
每检测出一个新钓鱼网站,服务器则自动获取网页特征和链接信息,并对网页内嵌的所有链接进行审核分析;完成审核分析后,将更新后的钓鱼网站数据库推送至客户端。
所述服务器与用户端采用加密方式进行数据传输。
本发明的有益效果是:
1、对全网进行监控,数据库更新快,实时更新钓鱼网页数据库,能够高效的检测钓鱼网站,让用户端网页更加安全;
2、对钓鱼网站内嵌的所有链接进行分析,并对与钓鱼网站相关的链接进行分析,全面搜集钓鱼网站,建立更全面的数据库。
具体实施方式
下面将通过实施例对本发明的技术方案进行更清楚地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明具体实施方式如下:
一种钓鱼网页检测方法,其特征在于,包括以下步骤:
服务器全网搜集钓鱼网站域名,建立钓鱼网站数据库,并进行数据处理分析,构建钓鱼网站域名特征集;
服务器监测每个用户端网页状态,从所述网页中提取特定信息,并进行网页相似度计算,所述特定信息包括:域名、编码格式、文档对象模型、词汇;
若发现网页有与钓鱼网站数据库相同或相似的信息,则将网页进行标记,并将特定信息传输至服务器,服务器对本域名以及所在网页的其他链接进行进一步全面分析,确定为钓鱼网页后,则纳入钓鱼网站数据库;
每检测出一个新钓鱼网站,服务器则自动获取网页特征和链接信息,并对网页内嵌的所有链接进行审核分析;完成审核分析后,将更新后的钓鱼网站数据库推送至客户端。
进一步地,所述服务器与用户端采用加密方式进行数据传输。
以上所述实施例仅表示本发明的实施方式,其描述较为具体和详细,但并不能理解为对本发明范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明保护范围。

Claims (2)

1.一种钓鱼网页检测方法,其特征在于,包括以下步骤:
服务器全网搜集钓鱼网站域名,建立钓鱼网站数据库,并进行数据处理分析,构建钓鱼网站域名特征集;
服务器监测每个用户端网页状态,从所述网页中提取特定信息,并进行网页相似度计算,所述特定信息包括:域名、编码格式、文档对象模型、词汇;
若发现网页有与钓鱼网站数据库相同或相似的信息,则将网页进行标记,并将特定信息传输至服务器,服务器对本域名以及所在网页的其他链接进行进一步全面分析,确定为钓鱼网页后,则纳入钓鱼网站数据库;
每检测出一个新钓鱼网站,服务器则自动获取网页特征和链接信息,并对网页内嵌的所有链接进行审核分析;完成审核分析后,将更新后的钓鱼网站数据库推送至客户端。
2.根据权利要求1所述的一种钓鱼网页检测方法,其特征在于:所述服务器与用户端采用加密方式进行数据传输。
CN201510521589.4A 2015-08-24 2015-08-24 钓鱼网页检测方法 Pending CN105187415A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510521589.4A CN105187415A (zh) 2015-08-24 2015-08-24 钓鱼网页检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510521589.4A CN105187415A (zh) 2015-08-24 2015-08-24 钓鱼网页检测方法

Publications (1)

Publication Number Publication Date
CN105187415A true CN105187415A (zh) 2015-12-23

Family

ID=54909259

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510521589.4A Pending CN105187415A (zh) 2015-08-24 2015-08-24 钓鱼网页检测方法

Country Status (1)

Country Link
CN (1) CN105187415A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106789958A (zh) * 2016-12-01 2017-05-31 张振中 一种检测链接的方法及系统
GB2555801A (en) * 2016-11-09 2018-05-16 F Secure Corp Identifying fraudulent and malicious websites, domain and subdomain names
CN108600247A (zh) * 2018-05-02 2018-09-28 尚谷科技(天津)有限公司 一种网站钓鱼伪装识别方法
CN111917723A (zh) * 2020-06-29 2020-11-10 中信银行股份有限公司 一种钓鱼网站监控方法、系统、设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102082792A (zh) * 2010-12-31 2011-06-01 成都市华为赛门铁克科技有限公司 钓鱼网页检测方法及设备
CN103023874A (zh) * 2012-11-21 2013-04-03 北京航空航天大学 一种钓鱼网站检测方法
US8578499B1 (en) * 2011-10-24 2013-11-05 Trend Micro Incorporated Script-based scan engine embedded in a webpage for protecting computers against web threats
CN104050257A (zh) * 2014-06-13 2014-09-17 百度国际科技(深圳)有限公司 钓鱼网页的检测方法和装置
CN104168293A (zh) * 2014-09-05 2014-11-26 北京奇虎科技有限公司 结合本地内容规则库识别可疑钓鱼网页的方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102082792A (zh) * 2010-12-31 2011-06-01 成都市华为赛门铁克科技有限公司 钓鱼网页检测方法及设备
US8578499B1 (en) * 2011-10-24 2013-11-05 Trend Micro Incorporated Script-based scan engine embedded in a webpage for protecting computers against web threats
CN103023874A (zh) * 2012-11-21 2013-04-03 北京航空航天大学 一种钓鱼网站检测方法
CN104050257A (zh) * 2014-06-13 2014-09-17 百度国际科技(深圳)有限公司 钓鱼网页的检测方法和装置
CN104168293A (zh) * 2014-09-05 2014-11-26 北京奇虎科技有限公司 结合本地内容规则库识别可疑钓鱼网页的方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2555801A (en) * 2016-11-09 2018-05-16 F Secure Corp Identifying fraudulent and malicious websites, domain and subdomain names
CN106789958A (zh) * 2016-12-01 2017-05-31 张振中 一种检测链接的方法及系统
CN108600247A (zh) * 2018-05-02 2018-09-28 尚谷科技(天津)有限公司 一种网站钓鱼伪装识别方法
CN111917723A (zh) * 2020-06-29 2020-11-10 中信银行股份有限公司 一种钓鱼网站监控方法、系统、设备和存储介质

Similar Documents

Publication Publication Date Title
CN103559235B (zh) 一种在线社交网络恶意网页检测识别方法
CN103955842B (zh) 一种面向大规模媒体数据的在线广告推荐系统及方法
CN105187415A (zh) 钓鱼网页检测方法
CN103458042A (zh) 一种微博广告用户检测方法
CN104346480A (zh) 信息挖掘方法和装置
CN103605738A (zh) 网页访问数据统计方法及装置
CN108416034B (zh) 基于金融异构大数据的信息采集系统及其控制方法
CN104462547A (zh) 一种可配置的网页数据采集的方法及系统
MY177362A (en) Network information display method, system and terminal, and information display processing device
CN104298782B (zh) 互联网用户主动访问行为轨迹的分析方法
CN102984161A (zh) 一种可信网站的识别方法和装置
CN105262812A (zh) 一种基于云计算平台的日志数据处理方法、装置及系统
CN107818132A (zh) 一种基于机器学习的网页代理发现方法
Li et al. PhishBox: An approach for phishing validation and detection
CN111654504B (zh) 一种dga域名检测方法及装置
CN105978850A (zh) 一种基于图形匹配的仿冒网站检测系统及检测方法
CN105528357A (zh) 一种基于url和网页文档结构的相似性的网页内容提取方法
CN112395513A (zh) 一种舆情传播力分析方法
CN113360895B (zh) 站群检测方法、装置及电子设备
US20160277422A9 (en) System and method for detecting final distribution site and landing site of malicious code
CN103825772A (zh) 识别用户点击行为的方法及网关设备
CN103309851B (zh) 短文本的垃圾识别方法及系统
CN113204695B (zh) 网站识别方法和装置
CN105208002A (zh) 钓鱼网站拦截方法
US20180165369A1 (en) User estimation apparatus, user estimation method, and user estimation program

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151223