CN102523202A - 钓鱼网页的深度学习智能检测方法 - Google Patents

钓鱼网页的深度学习智能检测方法 Download PDF

Info

Publication number
CN102523202A
CN102523202A CN2011103939592A CN201110393959A CN102523202A CN 102523202 A CN102523202 A CN 102523202A CN 2011103939592 A CN2011103939592 A CN 2011103939592A CN 201110393959 A CN201110393959 A CN 201110393959A CN 102523202 A CN102523202 A CN 102523202A
Authority
CN
China
Prior art keywords
webpage
web page
dbn
characteristic vector
fishing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011103939592A
Other languages
English (en)
Other versions
CN102523202B (zh
Inventor
李元诚
沈尚方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Original Assignee
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University filed Critical North China Electric Power University
Priority to CN201110393959.2A priority Critical patent/CN102523202B/zh
Publication of CN102523202A publication Critical patent/CN102523202A/zh
Application granted granted Critical
Publication of CN102523202B publication Critical patent/CN102523202B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了属于网络信息安全技术领域的钓鱼网页的深度学习智能检测方法。包括以下步骤:1)对网页文档模型进行分析,生成网页文档特征向量F;2)将待测网页转化为图像,并采用谱聚类方法对所得图像进行分割;3)提取网页图像特征,从而获得网页内容特征向量N;4)使用流形学习Isomap算法对网页内容特征向量N降维得到特征空间Vnew;5)用DBN分类器对特征空间Vnew进行训练和测试,根据DBN分类器结果判别待检测的网页是否为钓鱼网页。本发明的有益效果为:检测的特征参数覆盖更加全面,相比文本特征提取方法,DBN深度信任网络算法具有较高的检测精度和较快的检测速度,提高了钓鱼式攻击检测率。

Description

钓鱼网页的深度学习智能检测方法
技术领域
本发明属于网络信息安全技术领域,尤其涉及钓鱼网页的深度学习智能检测方法。
背景技术
近年来网络“钓鱼”攻击频频出现,严重地影响了电子商务的发展,也给公众造成了很大的危害。国内常见的“钓鱼”式攻击(Phishing),如仿冒各大银行等金融机构和大型交易门户的钓鱼网站,危害非常严重。当前针对钓鱼网页的检测技术一般是单独基于文档模型或网页图像的检测方法。由于HTML语言的灵活性和网页元素的动态性,仿冒者能做出看上去一样但结构完全不同的网页,因而单独基于文档模型的钓鱼网页检测方法存有很大缺陷;同样,目前基于图像的网页相似检测方法主要是根据人的视觉原理,对网页的视觉相似度进行判定,虽然难度较大,攻击发起者对被仿冒的网页的模仿也可以做到以假乱真的程度。综上所述,以往钓鱼网页检测方法中存在的检测识别特征不全面、智能检测精度不足等缺点。
发明内容
本发明针对上述缺陷公开了钓鱼网页的深度学习智能检测方法,该方法用于解决目前单纯基于文档型或图像型钓鱼网页检测技术对图片网页处理的不足,以及钓鱼网页检测精度不高的问题。
钓鱼网页的深度学习智能检测方法,包括以下步骤:
1)对网页文档模型进行分析,生成网页文档特征向量F;
2)将待测网页转化为图像,并采用谱聚类方法对所得图像进行分割;
3)提取网页图像特征,从而获得网页内容特征向量N;
4)使用流形学习Isomap算法对网页内容特征向量N降维得到特征空间Vnew
5)用DBN分类器对特征空间Vnew进行训练和测试,根据DBN分类器结果判别待检测的网页是否为钓鱼网页。
所述步骤2)具体包括以下步骤:
21)将待测网页保存为网页图像;
22)将网页图像由RGB空间变换为HSI空间;
23)采用谱聚类方法,确定网页图像的聚类数目k;
24)生成k个子图。
所述步骤3)具体包括以下步骤:
31)提取分割后的各个子图的特征向量Vi
32)提取分割后的各个子图间的位置关系特征向量C;
33)将以上特征组合成网页图像特征向量A,并与网页文档特征向量F一起合成为网页内容特征向量N。
所述步骤4)具体包括以下步骤:
41)选择邻域参数,构造邻域图;
42)在步骤41)所选择的邻域参数K下,求出产生的子邻域图个数以及每个子邻域图是由哪些数据点组成;
43)求出子邻域图数据集间最短的γ条欧式距离分别对应的数据点;
44)对WMi,WMj中相互连接的数据点对应的邻域集合进行修正
45)求出数据点间的最短路径;
46)构建m维的低维嵌入,获得降维后的特征空间Vnew
所述步骤5)具体包括以下步骤:
51)从网页内容特征空间Vnew中,给出部分有标签的训练样本;
52)使用网页图像特征空间Vnew中给出的有标签的训练样本,对DBN进行训练;
53)对DBN实施修正训练,进行参数微调,得到DBN分类器;
54)用得到的DBN分类器对特征空间Vnew中的无标签样本进行测试,输出钓鱼网页检测结果。
本发明的有益效果为:使用本发明提供的方法进行钓鱼网页检测,综合网页文档和图像特征,检测的特征参数覆盖更加全面。在检测方法方面,相比文本特征提取方法,DBN深度信任网络算法具有较高的检测精度和较快的检测速度,提高了钓鱼式攻击检测率。
附图说明
图1是钓鱼网页的深度学习智能检测方法流程图。
具体实施方式
下面结合附图,对优选实施例作详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
如图1所示为本发明所提供的钓鱼网页的智能检测方法的检测过程示意图。该方法包括如下步骤:
1)对网页文档模型进行分析,生成网页文档特征向量F;
2)将待测网页转化为图像,并采用谱聚类方法对所得图像进行分割;
3)提取网页图像特征,从而获得网页内容特征向量N;
4)使用流形学习Isomap算法对网页内容特征向量N降维得到特征空间Vnew
5)用DBN分类器对特征空间Vnew进行训练和测试,根据DBN分类器结果判别待检测的网页是否为钓鱼网页。
步骤1)具体包括下列步骤:
11)对网页文档模型进行分析:从Web页面的文档对象模型(DOM模型)和HTTP协议方面进行特征分析;
12)对网页文档特征进行提取:
根据HTTP协议和文档对象模型(DOM模型),基于相关性,提取以下五种类别钓鱼网页敏感身份信息特征:Web页面URL地址、链接对象、表单元素、SSL证书和域名DNS信息。使用特征函数Fi(i=1,2,3,4,5)来分别表示上述五种类别钓鱼网页敏感身份信息特征,每个特征函数的输出为实数值,表示Web网页中对应的敏感身份信息特征的状态,定义F={F1,F2,F3,F4,F5}为生成的网页文档特征向量。
其中特征函数F1(Web页面URL地址)的具体定义如下:
Figure BDA0000115100940000041
式(1)中,R1是在本域内请求URL数,Ra是网页请求URL的总数。
特征函数F2的具体定义如下:
F 2 = ( L null + L real ) / L all L null + L real ≥ L local > 0 0 L all = 0 - L local / L all L local > L null + L real > 0 - - - ( 2 )
其中,Lall代表Web页面中链接对象的总数,Lnull代表Web页面中空链接个数,Lreal代表Web页面中指向合法真实站点链接个数,Llocal代表Web页面中指向本域的链接个数。
特征函数F3的具体定义如下:
特征函数F4的具体定义如下:
Figure BDA0000115100940000053
特征函数F5为DNS域名记录特征函数。F5的具体定义如下:
Figure BDA0000115100940000054
对于大部分的合法DNS域名注册信息,Google Whitelist都有记载,而钓鱼网页中通常包含有不同域名的欺骗URL,因此可以在whistelist中查寻当前URL的域名,或其域名子串是否存有一致的结果。
最终得到网页文档特征向量F=<F1,F2,F3,F4,F5>。
步骤2)包括以下步骤:
21)将待测网页保存为网页图像:把打开的待测网页保存为图像,图像的分辨率为1024×768,并通过图像处理软件获取图像每个像素的RGB值。
22)将网页图像由RGB空间变换为HSI空间,以便于图像分割和分析,RGB空间到HSI空间的转化公式如下:
I = 1 3 ( R + G + B ) - - - ( 6 )
S = 1 - 3 min ( R , G , B ) R + G + B - - - ( 7 )
H = &theta; G &GreaterEqual; B 2 &pi;&theta; G &le; B - - - ( 8 )
&theta; = cos - 1 [ 1 2 [ ( R - G ) + ( R - B ) ] ( R - G ) 2 + ( R - B ) ( G - B ) ] - - - ( 9 )
式(6)-式(9)中,H表示色度(通过角度表示),S表示饱和度,I表示亮度;R、G和B为每个像素的RGB值。
23)确定网页图像的聚类数目k。
使用谱聚类方法对网页图像进行分割:设图像原始数据集{x1,x2,...,xn}是待聚类的数据集,其中,x1-xn代表图像中的第1-n个像素点,即所有像素点(本实施例中设定图像像素点的个数为n)。计算网页图像数据集{x1,x2,...,xn}的相似矩阵A,由相似矩阵A得到拉普拉斯矩阵L及其特征向量,根据拉普拉斯矩阵L得到n个特征值(λ1、λ2...λn,λ1≥λ2≥...≥λn)和相应的特征向量(l1、l2...ln),按照特征值的大小顺序将相应的特征向量排列构成矩阵Y(将每个特征向量作为矩阵Y的一列)。
引入自适应确定聚类数目k的方法,期望以最佳的划分组数确保误差最小。初始化k=2,并令m=k,取矩阵Y的前m个列向量构成矩阵Y’,归一化矩阵Y’为矩阵Y”。在m维空间里,每个坐标轴的正负方向分别标记一个聚类。把矩阵Y”的行向量标记为距离最近的坐标轴所标记的聚类,得到新聚类数(小于或等于2m)。比较新聚类数和m的值,如果二者不相等,则令新聚类数赋值给m,继续执行以上过程;如果二者相等,则此时所得到的k就是确定的最佳聚类数。
24)生成k个子图:将步骤23)中得到的矩阵Y”的各行视为k维空间的点,用k-means算法聚类成k个子图。标记步骤23)中的图像原始数据集{x1,x2,...,xn},当且仅当矩阵Y”的第i行标记为聚类j时,把第i像素点xi标记为聚类j。
步骤3)具体包括下列步骤:
31)提取分割后的各个子图的特征向量Vi
提取第i子图的边界形状特征向量Si=(wi,hi,ci),wi表示第i子图的宽度,hi表示第i子图的长度,ci表示第i子图的周长;
将第i子图由HSI空间还原为RGB空间,再由RGB空间转化为灰度空间,提取灰度直方图的特征向量Gi
提取第i子图色彩直方图特征向量Hi
利用第i子图的边界形状特征向量Si、第i子图的灰度直方图特征向量Gi、第i子图的色彩直方图特征向量Hi,构成第i子图的特征向量Vi=<Si,Hi,Gi>,其中,i为1-k;k为子图的个数。
32)提取分割后的各个子图间的位置关系特征向量C。
计算各个子图HSI空间颜色的质心;
由每个子图颜色的质心在整个网页图像中的位置生成位置关系特征向量C;
33)将第i子图的特征向量Vi和各个子图间的位置关系特征向量C组合成网页图像特征向量A,具体是A=<V1,V2...Vk,C>,k为子图的个数。
将网页图像特征向量A与网页文档特征向量F组合为网页内容特征向量N,N=<V1,V2,...,Vk,C,F1,F2,...,F5>。
本发明同时提取网页的文档特征和图像特征用于检测,可以最大限度的减少对钓鱼网页的漏判误判,提高检测效果。
步骤4)具体包括下列步骤:
41)设网页内容特征向量N=<V1,V2,...,Vk,C,F1,F2,...,F5>={x1,x2,...,xn},其中xi∈Rn。对于输入空间中的样本点xi和xj,其欧式距离为dx(i,j),将xi点与所有的点进行比较,当点xj是xi的k-邻域(两点之间的距离小于固定的半径K,其中K是预先给定的值),就认为它们是相邻的,从而得到xi对应的邻域点集合NE(xi)。将xi与其所有相邻的点xj连接起来,边长为dx(i,j),从而得到子邻域图,从而得到网页内容特征向量空间对应的邻域图。
42)在步骤41)所选择的邻域参数K下,求出产生的子邻域图个数以及每个子邻域图是由哪些数据点组成;
以SG1,SG2...SGL表示所产生的子邻域图,其中L表示所生成的邻域图个数,NSGi表示构成第i子邻域图SGi的数据集,|NSGi|为构成第i子邻域图的数据元素个数,显然
&Sigma; i = 1 L | NSG i | = N &cup; 1 &le; i &le; L NSG i = { x 1 , x 2 , . . . , x n } , - - - ( 10 )
NSGi∩NSGj=φ(1≤i≤L,1≤j≤L且i≠j)(11)
43)求出子邻域图数据集间最短的γ条欧式距离分别对应的数据点。
用γ表示所要求得的最短欧式距离条数,亦即两两子邻域图间所要连接的数据点最大个数。设两子邻域图间所要连接的数据点的集合分别为WMi,WMj,则求得WMi,WMj的公式表述为:
WM i , WM j = arg w i , w j min 1 &le; i , j &le; L i < j ( dist ( NSG i , NSG j ) ) - - - ( 12 )
式(12)中, WM i &SubsetEqual; NSG i , WM j &SubsetEqual; NSG j , |WMi|≤γ,|WMj|≤γ,WMi,WMj分别表示NSGi与NSGj间最短的γ条欧式距离所对应的两端数据点所形成的集合,|WMi|,|WMj|分别表示相应的数据集合元素个数。
44)对WMi,WMj中相互连接的数据点对应的邻域集合进行修正。
设Xt∈WMi则Xt对应的邻域点集合NE(Xt)被更新为NE(Xt)∪WMi,同理,对Xp∈WMj的邻域集合更新为NE(Xp)∪WMj
45)求出数据点间的最短路径。
步骤44)结束后形成了整个数据集上的单个邻域图,求一个以欧式距离加权的无向邻域图中,数据点间的最短路径可以使用经典的Floyd算法或Dijkstra算法。
46)构建m维的低维嵌入,获得降维后的特征空间Vnew
以步骤45)中所得到的点对点之间的最短路径作为经典的MDS算法的输入,得到m维的低维嵌入{v1,v2,...,vm},其中vi∈Rm(一般m<<n),特征空间Vnew={v1,v2,...,vm}即为DBN将要分类识别的样本,从而实现了将网页内容特征向量B转化为m维特征空间Vnew
步骤5)具体包括以下步骤:
51)从网页图像特征空间Vnew中,给出部分有标签的训练样本。
情况已知的网页称为有标签的样本;而情况未知的网页称为无标签的样本;无论有标签的样本或无标签的样本,当使用这些样本进行训练或测试时,即称为训练或测试样本。在本例中将已知的钓鱼网页标记为1,合法正当的网页标记为-1。网页特征空间Vnew={v1,v2,...,vm},其中vi是第i子图的特征向量。首先给出有标签的部分训练样本点(v1,y1),...,(vl,yl),vi∈Rn,yi∈Y,Y={-1,+1}。由于我们只对给定的网页判断,所以定义Y={-1,+1},当已知网页不是钓鱼网页时,定义网页钓鱼标志参数y=1,当已知网页是假冒网页时,定义网页钓鱼标志参数y=-1。
52)使用网页图像特征空间Vnew中给出的有标签的训练样本,对DBN进行训练。
DBN(Deep Belief Network,深度信任网络)由很多层RBM(Restricted Boltzmann Machines)组成,RBM是一种神经网络。除了最高两层(形成一个联想记忆)以外,DBN层与层之间使用加权连接。
在DBN中的每层RBM被限制为一个单一的可见单元层t和一个单一的隐藏单元层h(共两层)。其中,由可见单元层t接收随机的二进制数据,并由隐藏单元层h送出随机的二进制数据,二层之间的条件分布满足:每一个可见层i的状态ti被设置为1的概率为σ(ci+∑jwjihj),每一个隐藏层j的状态hj被设置为1的概率为σ(ci+∑jwjihj),,即式(13)和式(14):
P(ti=1|h)=σ(bi+∑jwjihj)=1/[1+exp(bi+∑jwjihj)]  (13)
P(hj=1|t)=σ(cj+∑iwjiti)=1/[1+exp(cj+∑iwjiti)]  (14)
RBM包含三个参数:W,b,c,其中W为可见单元层t和隐藏单元层h之间的权重,b,c分别为为可见单元层t和隐藏单元层h的偏差值,因而对DBN分类器训练过程转化为对RBM参数的求解:
ΔWji=η(<tihj>data-<tihj>confabulation)(15)
Δbi=η(<ti>data-<ti>confabulation)(16)
Δcj=η(<hj>data-<hj>confabulation)(17)
在式(15)、式(16)和式(17)中,ti为第i层可见层,hj为第j层隐藏层,Wji为DBN中第i层与第j层RBM之间的权重,bi为第i层RBM中的可见单元层的偏差值,cj为第j层RBM中的隐藏单元层的偏差值;ΔWji、Δbi、Δcj分别为训练过程中产生的Wji、bi、cj的更新值;<tihj>data表示第i层RBM中可见层和第j层RBM中隐藏层之间传递的数据、<tihj>confabulation表示第i层RBM中可见层和第j层RBM中隐藏层之间产生的数据、<ti>data、<hj>data分别表示第i层RBM中可见层、第j层RBM中隐藏层传递的数据;<vi>confabulation、<hj>confabulation分别表示第i层RBM中可见层、第j层RBM中隐藏层产生的数据。
53)对DBN实施修正训练,进行参数微调,得到分类器。
将RBM训练方法应用于除最高层外的每一层,其中第一层(最底层)的输入为训练样本,其余较高一层的输入来自于前一层隐藏单元的输出。通过使用B-P网络中的均方差方法,微调确定DBN中的参数:权值W和偏差b,从而得到DBN分类器。
54)用得到的DBN分类器对特征空间Vnew中的无标签样本进行测试,输出钓鱼网页检测结果。
使用DBN分类器对待测网页进行检测判断,其方法实质是二值分类间题。经过分类学习之后,DBN分类器就会产生一个分类决策函数判断钓鱼网页(y=1)和合法网页(y=-1)。对特征空间Vnew中的无标签样本进行分类判断时,对照输出结果,如果DBN分类器对其中任一网页测试样本分类输出为1,就认为该网页为钓鱼网页;如果输出为-1,则认为该网页为正常网页。
根据使用Isomap方法降维后得到的特征空间,本发明引入DBN(Deep Belief Network,深度信任网络)深度学习方法对特征数据进行训练,根据DBN分类器分类的结果判别待检测的网页是否为钓鱼网页。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (5)

1.钓鱼网页的深度学习智能检测方法,其特征在于,分为以下步骤:
1)对网页文档模型进行分析,生成网页文档特征向量F;
2)将待测网页转化为图像,并采用谱聚类方法对所得图像进行分割;
3)提取网页图像特征,从而获得网页内容特征向量N;
4)使用流形学习Isomap算法对网页内容特征向量N降维得到特征空间Vnew
5)用DBN分类器对特征空间Vnew进行训练和测试,根据DBN分类器结果判别待检测的网页是否为钓鱼网页。
2.根据权利要求1所述的钓鱼网页的深度学习智能检测方法,其特征在于,所述步骤2)具体分为以下步骤:
21)将待测网页保存为网页图像;
22)将网页图像由RGB空间变换为HSI空间;
23)采用谱聚类方法,确定网页图像的聚类数目k;
24)生成k个子图。
3.根据权利要求1所述的钓鱼网页的深度学习智能检测方法,其特征在于,所述步骤3)具体分为以下步骤:
31)提取分割后的各个子图的特征向量Vi
32)提取分割后的各个子图间的位置关系特征向量C;
33)将以上特征组合成网页图像特征向量A,并与网页文档特征 向量F一起合成为网页内容特征向量N。
4.根据权利要求1所述的钓鱼网页的深度学习智能检测方法,其特征在于,所述步骤4)具体分为以下步骤:
41)选择邻域参数,构造邻域图;
42)在步骤41)所选择的邻域参数K下,求出产生的子邻域图个数以及每个子邻域图是由哪些数据点组成;
43)求出子邻域图数据集间最短的γ条欧式距离分别对应的数据点;
44)对WMi,WMj中相互连接的数据点对应的邻域集合进行修正
45)求出数据点间的最短路径;
46)构建m维的低维嵌入,获得降维后的特征空间Vnew
5.根据权利要求1所述的钓鱼网页的深度学习智能检测方法,其特征在于,所述步骤5)具体分为以下步骤:
51)从网页内容特征空间Vnew中,给出部分有标签的训练样本;
52)使用网页图像特征空间Vnew中给出的有标签的训练样本,对DBN进行训练;
53)对DBN实施修正训练,进行参数微调,得到DBN分类器;
54)用得到的DBN分类器对特征空间Vnew中的无标签样本进行测试,输出钓鱼网页检测结果。 
CN201110393959.2A 2011-12-01 2011-12-01 钓鱼网页的深度学习智能检测方法 Expired - Fee Related CN102523202B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110393959.2A CN102523202B (zh) 2011-12-01 2011-12-01 钓鱼网页的深度学习智能检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110393959.2A CN102523202B (zh) 2011-12-01 2011-12-01 钓鱼网页的深度学习智能检测方法

Publications (2)

Publication Number Publication Date
CN102523202A true CN102523202A (zh) 2012-06-27
CN102523202B CN102523202B (zh) 2014-10-08

Family

ID=46293994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110393959.2A Expired - Fee Related CN102523202B (zh) 2011-12-01 2011-12-01 钓鱼网页的深度学习智能检测方法

Country Status (1)

Country Link
CN (1) CN102523202B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530689A (zh) * 2013-10-31 2014-01-22 中国科学院自动化研究所 一种基于深度学习的聚类方法
CN103729678A (zh) * 2013-12-12 2014-04-16 中国科学院信息工程研究所 一种基于改进dbn模型的水军检测方法及系统
CN103745002A (zh) * 2014-01-24 2014-04-23 中国科学院信息工程研究所 一种基于行为特征与内容特征融合的水军识别方法及系统
CN104182621A (zh) * 2014-08-08 2014-12-03 同济大学 基于深度信念网络的adhd判别分析方法
CN105591832A (zh) * 2014-11-13 2016-05-18 腾讯数码(天津)有限公司 应用层慢速攻击检测方法和相关装置
CN105959270A (zh) * 2016-04-25 2016-09-21 盐城工学院 一种基于谱聚类算法的网络攻击检测方法
CN106446124A (zh) * 2016-09-19 2017-02-22 成都知道创宇信息技术有限公司 一种基于网络关系图的网站分类方法
CN106817364A (zh) * 2016-12-29 2017-06-09 北京神州绿盟信息安全科技股份有限公司 一种暴力破解的检测方法及装置
CN104123500B (zh) * 2014-07-22 2017-07-28 北京知多星科技有限公司 一种基于深度学习的Android平台恶意应用检测方法及装置
CN107204956A (zh) * 2016-03-16 2017-09-26 腾讯科技(深圳)有限公司 网站识别方法及装置
CN108337255A (zh) * 2018-01-30 2018-07-27 华中科技大学 一种基于web自动化测试和宽度学习的钓鱼网站检测方法
CN109829433A (zh) * 2019-01-31 2019-05-31 北京市商汤科技开发有限公司 人脸图像识别方法、装置、电子设备及存储介质
CN111107048A (zh) * 2018-10-29 2020-05-05 中移(苏州)软件技术有限公司 一种钓鱼网站检测方法、装置和存储介质
CN111314109A (zh) * 2020-01-15 2020-06-19 太原理工大学 一种基于弱密钥的大规模物联网设备固件识别方法
CN111669353A (zh) * 2019-03-08 2020-09-15 顺丰科技有限公司 钓鱼网站检测方法及系统
CN114978624A (zh) * 2022-05-09 2022-08-30 深圳大学 钓鱼网页检测方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100583738C (zh) * 2007-08-17 2010-01-20 东南大学 基于图像处理的钓鱼网页检测方法
US20100095375A1 (en) * 2008-10-14 2010-04-15 Balachander Krishnamurthy Method for locating fraudulent replicas of web sites
CN101968813A (zh) * 2010-10-25 2011-02-09 华北电力大学 一种假冒网页检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100583738C (zh) * 2007-08-17 2010-01-20 东南大学 基于图像处理的钓鱼网页检测方法
US20100095375A1 (en) * 2008-10-14 2010-04-15 Balachander Krishnamurthy Method for locating fraudulent replicas of web sites
CN101968813A (zh) * 2010-10-25 2011-02-09 华北电力大学 一种假冒网页检测方法

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530689A (zh) * 2013-10-31 2014-01-22 中国科学院自动化研究所 一种基于深度学习的聚类方法
CN103729678A (zh) * 2013-12-12 2014-04-16 中国科学院信息工程研究所 一种基于改进dbn模型的水军检测方法及系统
CN103729678B (zh) * 2013-12-12 2016-10-05 中国科学院信息工程研究所 一种基于改进dbn模型的水军检测方法及系统
CN103745002A (zh) * 2014-01-24 2014-04-23 中国科学院信息工程研究所 一种基于行为特征与内容特征融合的水军识别方法及系统
CN103745002B (zh) * 2014-01-24 2017-01-18 中国科学院信息工程研究所 一种基于行为特征与内容特征融合的水军识别方法及系统
CN104123500B (zh) * 2014-07-22 2017-07-28 北京知多星科技有限公司 一种基于深度学习的Android平台恶意应用检测方法及装置
CN104182621B (zh) * 2014-08-08 2017-06-13 同济大学 基于深度信念网络的adhd判别分析方法
CN104182621A (zh) * 2014-08-08 2014-12-03 同济大学 基于深度信念网络的adhd判别分析方法
CN105591832A (zh) * 2014-11-13 2016-05-18 腾讯数码(天津)有限公司 应用层慢速攻击检测方法和相关装置
CN107204956A (zh) * 2016-03-16 2017-09-26 腾讯科技(深圳)有限公司 网站识别方法及装置
CN107204956B (zh) * 2016-03-16 2020-06-23 腾讯科技(深圳)有限公司 网站识别方法及装置
CN105959270A (zh) * 2016-04-25 2016-09-21 盐城工学院 一种基于谱聚类算法的网络攻击检测方法
CN106446124A (zh) * 2016-09-19 2017-02-22 成都知道创宇信息技术有限公司 一种基于网络关系图的网站分类方法
CN106446124B (zh) * 2016-09-19 2019-11-15 成都知道创宇信息技术有限公司 一种基于网络关系图的网站分类方法
CN106817364B (zh) * 2016-12-29 2020-02-07 北京神州绿盟信息安全科技股份有限公司 一种暴力破解的检测方法及装置
CN106817364A (zh) * 2016-12-29 2017-06-09 北京神州绿盟信息安全科技股份有限公司 一种暴力破解的检测方法及装置
CN108337255B (zh) * 2018-01-30 2020-08-04 华中科技大学 一种基于web自动化测试和宽度学习的钓鱼网站检测方法
CN108337255A (zh) * 2018-01-30 2018-07-27 华中科技大学 一种基于web自动化测试和宽度学习的钓鱼网站检测方法
CN111107048B (zh) * 2018-10-29 2021-11-30 中移(苏州)软件技术有限公司 一种钓鱼网站检测方法、装置和存储介质
CN111107048A (zh) * 2018-10-29 2020-05-05 中移(苏州)软件技术有限公司 一种钓鱼网站检测方法、装置和存储介质
CN109829433B (zh) * 2019-01-31 2021-06-25 北京市商汤科技开发有限公司 人脸图像识别方法、装置、电子设备及存储介质
CN109829433A (zh) * 2019-01-31 2019-05-31 北京市商汤科技开发有限公司 人脸图像识别方法、装置、电子设备及存储介质
CN111669353A (zh) * 2019-03-08 2020-09-15 顺丰科技有限公司 钓鱼网站检测方法及系统
CN111314109A (zh) * 2020-01-15 2020-06-19 太原理工大学 一种基于弱密钥的大规模物联网设备固件识别方法
CN114978624A (zh) * 2022-05-09 2022-08-30 深圳大学 钓鱼网页检测方法、装置、设备及存储介质
CN114978624B (zh) * 2022-05-09 2023-11-03 深圳大学 钓鱼网页检测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN102523202B (zh) 2014-10-08

Similar Documents

Publication Publication Date Title
CN102523202B (zh) 钓鱼网页的深度学习智能检测方法
Kiran et al. Offline signature recognition using image processing techniques and back propagation neuron network system
US9406030B2 (en) System and methods for computerized machine-learning based authentication of electronic documents including use of linear programming for classification
CN111191695B (zh) 一种基于深度学习的网站图片篡改检测方法
CN101968813B (zh) 一种假冒网页检测方法
CN104298989B (zh) 基于斑马线红外图像特征的鉴伪方法及其系统
CN104969268B (zh) 安全文件鉴别及执行鉴别的移动装置
Wang et al. Robust and accurate detection of image copy-move forgery using PCET-SVD and histogram of block similarity measures
Zhang Off‐line signature verification and identification by pyramid histogram of oriented gradients
CN102170447A (zh) 一种基于最近邻及相似度测量检测钓鱼网页的方法
CN103246874B (zh) 一种基于联合稀疏模型和稀疏保持映射的人脸识别方法
Brink et al. Towards robust writer verification by correcting unnatural slant
CN111259219A (zh) 恶意网页识别模型、识别模型建立方法、识别方法及系统
CN110830489B (zh) 基于内容抽象表示的对抗式欺诈网站检测方法及系统
CN103927539A (zh) 离线式维吾尔文手写签名识别的一种高效的特征提取方法
Pal et al. Off-line Bangla signature verification
CN107895171A (zh) 一种基于k均值与深度置信网络的入侵检测方法
CN103714340B (zh) 基于图像分块的自适应特征提取方法
US20230147685A1 (en) Generalized anomaly detection
CN106599795A (zh) 一种基于尺度距离渐变函数分界面学习的动态低分辨率行人重识别方法
Ibrahim et al. Global vs. local features for gender identification using Arabic and English handwriting
Ji et al. Site classification using deep‐learning‐based image recognition techniques
CN104899551B (zh) 一种表单图像分类方法
Jadhav et al. Symbolic representation model for off-line signature verification
CN105046286A (zh) 基于自动视图生成和联合l1,2范数最小化的监督多视图特征选择方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20141008

Termination date: 20151201

EXPY Termination of patent right or utility model