CN106170002A - 一种中文仿冒域名检测方法及系统 - Google Patents

一种中文仿冒域名检测方法及系统 Download PDF

Info

Publication number
CN106170002A
CN106170002A CN201610809596.9A CN201610809596A CN106170002A CN 106170002 A CN106170002 A CN 106170002A CN 201610809596 A CN201610809596 A CN 201610809596A CN 106170002 A CN106170002 A CN 106170002A
Authority
CN
China
Prior art keywords
domain name
character
counterfeit
chinese
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610809596.9A
Other languages
English (en)
Other versions
CN106170002B (zh
Inventor
王利明
李丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Information Engineering of CAS
Original Assignee
Institute of Information Engineering of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Information Engineering of CAS filed Critical Institute of Information Engineering of CAS
Priority to CN201610809596.9A priority Critical patent/CN106170002B/zh
Publication of CN106170002A publication Critical patent/CN106170002A/zh
Application granted granted Critical
Publication of CN106170002B publication Critical patent/CN106170002B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • H04L63/1491Countermeasures against malicious traffic using deception as countermeasure, e.g. honeypots, honeynets, decoys or entrapment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1416Event detection, e.g. attack signature detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种中文仿冒域名检测方法及系统,适用于检测利用形近字构造的中文仿冒域名。主要包括:用于统计每个输入域名的长度和总笔画数的域名预处理模块;对比待检测域名与目标域名的长度和总笔画数,过滤出可能被仿冒的目标域名集合的目标域名过滤模块;将待检测域名与过滤出的目标域名对应拆分为单个汉字的域名拆分模块;将汉字转化为笔画顺序的字符串并基于字符串编辑距离计算单字相似度的单字相似度计算模块;基于单字相似度计算整体域名相似度的域名相似度计算模块;基于域名相似度判定并输出最可能被仿冒的目标域名的仿冒域名决策模块。通过以上方法及系统可有效识别利用形近字构造的中文仿冒域名,在网络安全领域具有广泛的应用前景。

Description

一种中文仿冒域名检测方法及系统
技术领域
本发明属于网络安全技术领域,具体涉及一种中文仿冒域名的检测方法及系统。
背景技术
近年来随着在线金融、电子商务的发展,钓鱼网站呈爆发式增长,严重威胁公共财产安全和信息安全。域名仿冒是网络钓鱼中一种常见的技术,攻击者通过注册一个与目标域名相似的域名来欺骗用户,进而盗取用户的个人敏感信息。
传统的域名系统只能使用63个ASCII字符("a-z","A-Z","0-9","-")。随着互联网在非英语国家的迅速发展,国际化域名日渐兴起,域名可使用的字符集已扩展到上百种语言字符。中文域名是国际化域名的重要组成部分。
汉字作为一种象形文字,其笔画类型及书写顺序可表征该文字的视觉特征,特殊的造字规则使其产生了大量的形近字。但目前的仿冒域名检测方法主要针对英文域名,难以适用于字形复杂多变的中文域名。
发明内容
本发明针对利用中文形近字在视觉上的相似性进行的域名仿冒,提出一种中文仿冒域名检测方法及系统,基于汉字的笔画顺序字符串的相似度计算单个汉字的相似度,并基于单字相似度计算整体域名相似度,从而能够有效地检测出被仿冒的中文域名。
为了实现上述目的,本发明采用以下技术方案:
一种中文仿冒域名检测方法,包括以下步骤:
1)分别统计待测域名Domaindet和目标域名集合DomainSet1中每个域名的域名长度和总笔画数;
2)通过对比待测域名与目标域名集合DomainSet1中每个目标域名的域名长度和总笔画数,过滤出与待测域名长度相同且总笔画数差值百分比小于设定阈值T1的可能被仿冒的目标域名集合DomainSet2
3)将待测域名与可能被仿冒的目标域名集合DomainSet2中的每个目标域名分别对应拆分为单个汉字,将单个汉字按照其书写的笔画顺序转化为字符串,并基于该字符串的编辑距离计算单字相似度;
4)基于步骤3)得到的单字相似度计算对应的整体域名的相似度,判定与待测域名相似度最高且相似度值超过设定阈值T2的目标域名为被仿冒域名,输出被仿冒域名。
进一步地,步骤1)中,通过从汉字笔画数据库中请求每个域名中每个汉字的笔画数,求和得每个域名的总笔画数。
进一步地,步骤2)中,总笔画数差值百分比(Dpct)的计算方法如下:
D p c t = a b s ( StrokeTotalNum det , StrokeTotalNum t arg e t ) StrokeTotalNum det
其中,StrokeTotalNumdet为待测域名的总笔画数,StrokeTotalNumtarget为目标域名的总笔画数。
进一步地,步骤2)中,阈值T1设置得越小,则在该步骤中被过滤掉的目标域名数量越多,后续的计算量越小。但若该阈值设置过小,可能导致最终检测结果的漏报率增大,即被仿冒域名在该步骤中直接被过滤掉。因此,该阈值的设定可根据实际需要设定,例如统计当前已知的仿冒域名与目标域名的总笔画数差值百分比,将阈值设置为统计结果的均值或最大值。
进一步地,步骤3)中首先去除待测域名与可能被仿冒的目标域名集合DomainSet2中的每个目标域名中的非汉字字符,再将待测域名与可能被仿冒的目标域名集合DomainSet2中的每个目标域名分别对应拆分为单个汉字。
进一步地,步骤3)中所述字符串使用英文字符表示汉字的每个基本笔画类别。
进一步地,步骤3)中,计算单字相似度(CharSim(c1,c2))的方法为:
C h a r S i m ( c 1 , c 2 ) = 1 - E d i t D i s ( c 1 , c 2 ) StrokeNum 1 + StrokeNum 2
其中c1,c2为待计算的两单字对应的笔画顺序字符串,EditDis(c1,c2)为字符串c1,c2的编辑距离,StrokeNum1,StrokeNum2为单字的笔画数,即字符串c1,c2的长度。
进一步地,步骤4)中,基于单字的相似度(CharSim(c1,c2))计算整体域名的相似度(DomainSim(s1,s2))的方法为:
D o m a i n S i m ( s 1 , s 2 ) = 1 n Σ 1 n CharSim i
其中待测域名与目标域名的长度均为n,CharSimi表示域名对应的单字字符的相似度,i为1~n的整数。即CharSimi依次为CharSim1,CharSim2,…,CharSimn
进一步地,步骤4)中,阈值T2设置过大,将导致最终检测结果的漏报率增加,若设置过小,将导致误报率增加。因此,该阈值的设定可根据实际需要设定,例如统计当前已知的仿冒域名与目标域名的相似度值,将阈值设置为统计结果的均值或最小值。
一种中文仿冒域名检测系统,包括:
域名预处理模块,用于统计输入的待测域名Domaindet和目标域名集合DomainSet1中每个域名的域名长度和总笔画数;
目标域名过滤模块,用于通过对比待测域名和目标域名集合DomainSet1中每个目标域名的域名长度和总笔画数,过滤出与待测域名长度相同且总笔画数差值百分比小于设定阈值T1的可能被仿冒的目标域名集合DomainSet2
域名拆分模块,用于将待测域名与可能被仿冒的目标域名集合DomainSet2中的每个目标域名分别对应拆分为单个汉字;
单字相似度计算模块,用于将单个汉字按照其书写的笔画顺序转化为字符串,并基于该字符串的编辑距离计算单字相似度;
域名相似度计算模块,用于根据单字相似度计算对应的整体域名的相似度;
仿冒域名决策模块,用于将与待测域名相似度最高且相似度值超过设定阈值T2的目标域名判定为被仿冒域名并输出被仿冒域名。
进一步地,所述域名预处理模块又包括:
域名长度统计子模块,用于统计输入的待测域名Domaindet和目标域名集合DomainSet1中每个域名的域名长度,即每个域名包含的汉字个数。
域名总笔画数统计子模块,用于统计输入的待测域名和目标域名集合DomainSet1中每个域名的总笔画数。该子模块从汉字笔画数据库中请求域名中每个汉字的笔画数,求和得域名的总笔画数。
进一步地,所述可能被仿冒的目标域名集合DomainSet2的元素个数小于等于DomainSet1的元素个数。
进一步地,所述目标域名过滤模块又包括:
长度过滤子模块,用于依次对比待测域名和目标域名集合DomainSet1中各域名的长度,输出包含与待测域名长度相同的所有目标域名的集合DomainSettmp
总笔画数过滤子模块,用于依次对比待测域名和经长度过滤得到的集合DomainSettmp中各域名的总笔画数,输出包含与待测域名的域名总笔画数的差值百分比小于设定阈值T1的所有目标域名的集合DomainSet2。总笔画数的差值百分比Dpct的计算方法如下:
D p c t = a b s ( StrokeTotalNum det , StrokeTotalNum t arg e t ) StrokeTotalNum det
其中,StrokeTotalNumdet为待测域名的总笔画数,StrokeTotalNumtarget为目标域名的总笔画数。
进一步地,所述域名拆分模块用于先去除待测域名与目标域名中的非汉字字符,再将待测域名与目标域名分别对应拆分为单个汉字。由于DomainSet2中各域名的长度与待测域名的长度相同,故拆分后的汉字可一一对应以作为单字相似度计算模块的输入。
进一步地,所述单字相似度计算模块又包括:
单字转换笔画子模块,用于输入一个汉字,输出其对应的笔画顺序字符串,该字符串使用英文字符表示汉字的每个基本笔画类别。
字符串相似度计算子模块,用于根据单字笔画顺序字符串的编辑距离计算单字相似度,单字相似度CharSim(c1,c2)具体计算方法为:
C h a r S i m ( c 1 , c 2 ) = 1 - E d i t D i s ( c 1 , c 2 ) StrokeNum 1 + StrokeNum 2
其中c1,c2为待计算的两单字对应的笔画顺序字符串,EditDis(c1,c2)为字符串c1,c2的编辑距离,StrokeNum1,StrokeNum2为单字的笔画数,即字符串c1,c2的长度。
进一步地,所述域名相似度计算模块用于根据单字的相似度计算整体域名的相似度,域名相似度DomainSim(s1,s2)的具体计算方法为:
D o m a i n S i m ( s 1 , s 2 ) = 1 n Σ 1 n CharSim i
其中待测域名与目标域名的长度均为n,对应字符的相似度依次为CharSim1,CharSim2,…,CharSimn
本发明的有益效果在于:
本发明针对利用形近字构造中文仿冒域名,提出了基于汉字笔画判断单字相似度,并基于单字相似度计算整体域名相似度的检测方法。本发明的核心是利用组成汉字的笔画基本类型及其书写顺序来计算单个汉字的相似度。该中文域名仿冒检测方法通过实验验证,表明了其有效性。该中文域名仿冒检测系统易于通过计算机实现,其中所需汉字笔画数、笔顺字符串可直接从现有的汉字笔画数据库获取。
附图说明
图1为本发明的流程示意图;
图2为所述域名预处理模块结构示意图;
图3为目标域名过滤模块结构示意图;
图4为单字相似度计算模块结构示意图。
具体实施方式
下面结合附图和实施示例,对本发明的具体实施方式作进一步详细描述。以下实施示例用于说明本发明,但不限制本发明的范围。
本发明首先对中文域名仿冒可能出现的方式进行了研究和分类,共分三大类十小类,如表1。
表1中文域名仿冒方式分类
本发明针对的是视觉仿冒中的形近字仿冒。
如图1,本发明包括域名预处理模块10、目标域名过滤模块20、域名拆分模块30、单字相似度计算模块40、域名相似度计算模块50和仿冒域名决策模块60。
所述域名预处理模块10的输入为待测域名Domaindet和目标域名集合DomainSet1,该模块统计输入的每个域名的域名长度和每个域名的总笔画数。
如图2,所述域名预处理模块10包含域名长度统计子模块11和域名总笔画数统计子模块12。
所述域名长度统计子模块11,统计输入的待测域名和目标域名集合中每个域名的域名长度,即每个域名包含的汉字个数。
所述域名总笔画数统计子模块12,统计输入的待测域名和目标域名集合中每个域名的总笔画数。该子模块从汉字笔画数据库中请求域名中每个汉字的笔画数,求和得域名的总笔画数。
例如:待测域名Domaindet=“屈臣氏”,目标域名集合DomainSet1={“洽洽香瓜子”,“中国移动”,“屈臣氏”,“心相印”}。统计结果如表2:
表2域名预处理结果
所述目标域名过滤模块20输出可能被仿冒的目标域名集合DomainSet2,DomainSet2的元素个数小于等于DomainSet1的元素个数。
如图3,所述目标域名过滤模块20包括长度过滤子模块21和总笔画数过滤子模块22。
所述长度过滤子模块21,依次对比待测域名和目标域名集合中各域名的长度,将与待测域名的域名长度相同的目标域名写入集合DomainSettmp,最后输出DomainSettmp
所述总笔画数过滤了模块22,依次对比待测域名和集合DomainSettmp中各域名的总笔画数,将与待测域名的域名总笔画数的差值百分比小于阈值T1的目标域名写入集合DomainSet2,最后输出DomainSet2。其中差值百分比的计算方法如下:
D p c t = a b s ( StrokeTotalNum det , StrokeTotalNum t arg e t ) StrokeTotalNum det
其中,StrokeTotalNumdet为待测域名的总笔画数,StrokeTotalNumtarget为目标域名的总笔画数。
例如:差值百分比阈值T1设置为0.5,则经目标域名过滤模块处理可得DomainSet2={“屈臣氏”,“心相印”}
所述域名拆分模块30,首光去除待测域名与目标域名集合DomainSet2中的非汉字字符,如“.”、“-”等;再将待测域名与目标域名拆分为单个汉字并一一对应。
例如:
待测域名Domaindet=“屈巨氏”,目标域名集合DomainSet2={“屈臣氏”,“心相印”}。
将待测域名与目标域名对应拆分,即分别拆分得(“屈屈”、“巨臣”、“氏氏”)、(“屈心”、“巨相”、“氏印”)。
所述单字相似度计算模块40,将汉字按照其书写的笔画顺序转化为字符串,并基于该字符串的编辑距离计算单字相似度。
如图4,所述单字相似度计算模块40包括单字转换笔画子模块41和字符串相似度计算子模块42。
所述单字转换笔画子模块41,该子模块输入一个汉字,输出其对应的笔画顺序字符串,该字符串使用英文字符表示汉字的每个基本笔画类别。
笔画作为汉字的最小构成单位,可分为横、竖、撇、点、捺、提、折共七个基本类别,并可对应使用英文字符表示各类别名,具体对应规则如表3。
表3笔画基本类别名与字符的对应关系表
基本类别名
英文字符 A B C D E F G
例如“巨”的笔画顺序为“横–折–横–折”,“臣”的笔画顺序为“横–竖–折–横–竖–折”。则根据表3,“巨”可转换为字符串“AGAG”,“臣”可转换为字符串“ABGABG”。在具体实施时,可直接通过查询汉字笔画数据库获取每个汉字对应的笔画字符串。
所述字符串相似度计算子模块42,该子模块基于单字笔画顺序字符串的编辑距离计算单字相似度,具体计算方法为:
C h a r S i m ( c 1 , c 2 ) = 1 - E d i t D i s ( c 1 , c 2 ) StrokeNum 1 + StrokeNum 2
其中c1,c2为待计算的两单字对应的笔画顺序字符串,EditDis(c1,c2)为字符串c1,c2的编辑距离,StrokeNum1,StrokeNum2为单字的笔画数,即字符串c1,c2的长度。
例如:示例计算结果如表4。
表4单字相似度
所述域名相似度计算模块50,基于单字的相似度计算整体域名的相似度,具体计算方法为:
D o m a i n S i m ( s 1 , s 2 ) = 1 n Σ 1 n CharSim i
其中待测域名与目标域名的长度均为n,对应字符的相似度依次为CharSim1,CharSim2,…,CharSimn
例如:示例计算结果如表5。
表5整体域名相似度
所述仿冒域名决策模块60,该模块判定与待检测相似度最高且相似度值超过阈值的目标域名为被仿冒域名。
例如:预设相似度阈值为0.8,则可判定目标域名“屈臣氏”被待测域名“屈巨氏”仿冒,输出被仿冒域名“屈臣氏”。
综上所述,本发明针对利用形近字构造中文仿冒域名,提出了基于汉字笔画判断单字相似度,并基于单字相似度计算整体域名相似度的检测方法。该方法通过实验验证,表明了其有效性。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴。

Claims (10)

1.一种中文仿冒域名检测方法,包括以下步骤:
1)分别统计待测域名Domaindet和目标域名集合DomainSet1中每个域名的域名长度和总笔画数;
2)通过对比待测域名与目标域名集合DomainSet1中每个目标域名的域名长度和总笔画数,过滤出与待测域名长度相同且总笔画数差值百分比小于设定阈值T1的可能被仿冒的目标域名集合DomainSet2
3)将待测域名与可能被仿冒的目标域名集合DomainSet2中的每个目标域名分别对应拆分为单个汉字,将单个汉字按照其书写的笔画顺序转化为字符串,并基于该字符串的编辑距离计算单字相似度;
4)基于步骤3)得到的单字相似度计算对应的整体域名的相似度,判定与待测域名相似度最高且相似度值超过设定阈值T2的目标域名为被仿冒域名,输出被仿冒域名。
2.如权利要求1所述的中文仿冒域名检测方法,其特征在于,步骤1)中,通过从汉字笔画数据库中请求每个域名中每个汉字的笔画数,求和得每个域名的总笔画数。
3.如权利要求1所述的中文仿冒域名检测方法,其特征在于,步骤2)中,总笔画数差值百分比的计算方法如下:
D p c t = a b s ( StrokeTotalNum det , StrokeTotalNum t arg e t ) StrokeTotalNum det
其中,StrokeTotalNumdet为待测域名的总笔画数,StrokeTotalNumtarget为目标域名的总笔画数。
4.如权利要求1所述的中文仿冒域名检测方法,其特征在于,步骤3)中首先去除待测域名与可能被仿冒的目标域名集合DomainSet2中的每个目标域名中的非汉字字符,再将待测域名与可能被仿冒的目标域名集合DomainSet2中的每个目标域名分别对应拆分为单个汉字;所述字符串使用英文字符表示汉字的每个基本笔画类别。
5.如权利要求1所述的中文仿冒域名检测方法,其特征在于,步骤3)中,计算单字相似度的方法为:
C h a r S i m ( c 1 , c 2 ) = 1 - E d i t D i s ( c 1 , c 2 ) StrokeNum 1 + StrokeNum 2
其中c1,c2为待计算的两单字对应的笔画顺序字符串,EditDis(c1,c2)为字符串c1,c2的编辑距离,StrokeNum1,StrokeNum2为单字的笔画数。
6.如权利要求1所述的中文仿冒域名检测方法,其特征在于,步骤4)中,基于单字的相似度计算整体域名的相似度的方法为:
D o m a i n S i m ( s 1 , s 2 ) = 1 n Σ 1 n CharSim i
其中待测域名与目标域名的长度均为n,CharSimi表示域名对应的单字字符的相似度,i为1~n的整数。
7.一种中文仿冒域名检测系统,包括:
域名预处珲模块,用于统计输入的待测域名Domaindet和目标域名集合DomainSet1中每个域名的域名长度和总笔画数;
目标域名过滤模块,用于通过对比待测域名和目标域名集合DomainSet1中每个目标域名的域名长皮和总笔画数,过滤出与待测域名长度相同且总笔画数差值百分比小于设定阈值T1的可能被仿冒的目标域名集合DomainSet2
域名拆分模块,用于将待测域名与可能被仿冒的目标域名集合DomainSet2中的每个目标域名分别对应拆分为单个汉字;
单字相似度计算模块,用于将单个汉字按照其书写的笔画顺序转化为字符串,并基于该字符串的编辑距离计算单字相似度;
域名相似度计算模块,用于根据单字相似度计算对应的整体域名的相似度;
仿冒域名决策模块,用于将与待测域名相似度最高且相似度值超过设定阈值T2的目标域名判定为被仿冒域名并输出被仿冒域名。
8.如权利要求7所述的中文仿冒域名检测系统,其特征在于,所述域名预处理模块又包括:
域名长度统计子模块,用于统计输入的待测域名Domaindet和目标域名集合DomainSet1中每个域名的域名长度;
域名总笔画数统计子模块,用于统计输入的待测域名和目标域名集合DomainSet1中每个域名的总笔画数。
9.如权利要求7所述的中文仿冒域名检测系统,其特征在于,所述目标域名过滤模块又包括:
长度过滤子模块,用于依次对比待测域名利目标域名集合DomainSet1中各域名的长度,输出包含与待测域名长度相同的所有目标域名的集合DomainSettmp
总笔画数过滤子模块,用于依次对比待测域名和经长度过滤得到的集合DomainSettmp中各域名的总笔画数,输出包含与待测域名的域名总笔画数的差值百分比小于设定阈值T1的所有目标域名的集合DomainSet2
10.如权利要求7所述的中文仿冒域名检测系统,其特征在于,所述单字相似度计算模块又包括:
单字转换笔画子模块,用于输入一个汉字,输出其对应的笔画顺序字符串,该字符串使用英文字符表示汉字的每个基本笔画类别;
字符串相似度计算了模块,用于根据单字笔画顺序字符串的编辑距离计算单字相似度,单字相似度CharSim(c1,c2)具体计算方法为:
C h a r S i m ( c 1 , c 2 ) = 1 - E d i t D i s ( c 1 , c 2 ) StrokeNum 1 + StrokeNum 2
其中c1,c2为待计算的两单字对应的笔画顺序字符串,EditDis(c1,c2)为字符串c1,c2的编辑距离,StrokeNum1,StrokeNum2为单字的笔画数。
CN201610809596.9A 2016-09-08 2016-09-08 一种中文仿冒域名检测方法及系统 Active CN106170002B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610809596.9A CN106170002B (zh) 2016-09-08 2016-09-08 一种中文仿冒域名检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610809596.9A CN106170002B (zh) 2016-09-08 2016-09-08 一种中文仿冒域名检测方法及系统

Publications (2)

Publication Number Publication Date
CN106170002A true CN106170002A (zh) 2016-11-30
CN106170002B CN106170002B (zh) 2019-07-02

Family

ID=57376177

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610809596.9A Active CN106170002B (zh) 2016-09-08 2016-09-08 一种中文仿冒域名检测方法及系统

Country Status (1)

Country Link
CN (1) CN106170002B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609059A (zh) * 2017-08-28 2018-01-19 昆明理工大学 一种基于j‑w距离的中文域名相似度量方法
CN107679029A (zh) * 2017-08-28 2018-02-09 昆明理工大学 一种高准确性英文域名相似度检测方法
CN108768954A (zh) * 2018-05-04 2018-11-06 中国科学院信息工程研究所 一种dga恶意软件识别方法
CN109272025A (zh) * 2018-08-29 2019-01-25 昆明理工大学 一种相似常用汉字查找方法
CN110083808A (zh) * 2019-03-18 2019-08-02 平安科技(深圳)有限公司 基于用户答案的作弊判定方法、装置、设备及存储介质
CN110781876A (zh) * 2019-10-15 2020-02-11 北京工业大学 一种基于视觉特征的仿冒域名轻量级检测方法及系统
CN110785979A (zh) * 2017-05-17 2020-02-11 法赛特安全公司 用于域名假冒检测的系统、方法和域名令牌化
CN110855716A (zh) * 2019-11-29 2020-02-28 北京邮电大学 一种面向仿冒域名的自适应安全威胁分析方法及系统
CN111654472A (zh) * 2020-05-14 2020-09-11 亚信科技(成都)有限公司 一种域名检测方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1367417A (zh) * 2001-01-21 2002-09-04 黄宏权 一种通用中英文数码网址或域名
CN103399907A (zh) * 2013-07-31 2013-11-20 深圳市华傲数据技术有限公司 一种基于编辑距离计算中文字符串相似度的方法及装置
CN103428307A (zh) * 2013-08-09 2013-12-04 中国科学院计算机网络信息中心 仿冒域名检测方法及设备
CN103957191A (zh) * 2014-04-03 2014-07-30 中国科学院计算机网络信息中心 一种中文域名仿冒攻击的检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1367417A (zh) * 2001-01-21 2002-09-04 黄宏权 一种通用中英文数码网址或域名
CN103399907A (zh) * 2013-07-31 2013-11-20 深圳市华傲数据技术有限公司 一种基于编辑距离计算中文字符串相似度的方法及装置
CN103428307A (zh) * 2013-08-09 2013-12-04 中国科学院计算机网络信息中心 仿冒域名检测方法及设备
CN103957191A (zh) * 2014-04-03 2014-07-30 中国科学院计算机网络信息中心 一种中文域名仿冒攻击的检测方法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110785979A (zh) * 2017-05-17 2020-02-11 法赛特安全公司 用于域名假冒检测的系统、方法和域名令牌化
CN110785979B (zh) * 2017-05-17 2021-02-05 法赛特安全公司 用于域名假冒检测的系统、方法和域名令牌化
CN107679029A (zh) * 2017-08-28 2018-02-09 昆明理工大学 一种高准确性英文域名相似度检测方法
CN107609059B (zh) * 2017-08-28 2020-10-20 昆明理工大学 一种基于j-w距离的中文域名相似度量方法
CN107609059A (zh) * 2017-08-28 2018-01-19 昆明理工大学 一种基于j‑w距离的中文域名相似度量方法
CN108768954B (zh) * 2018-05-04 2020-07-10 中国科学院信息工程研究所 一种dga恶意软件识别方法
CN108768954A (zh) * 2018-05-04 2018-11-06 中国科学院信息工程研究所 一种dga恶意软件识别方法
CN109272025A (zh) * 2018-08-29 2019-01-25 昆明理工大学 一种相似常用汉字查找方法
CN110083808A (zh) * 2019-03-18 2019-08-02 平安科技(深圳)有限公司 基于用户答案的作弊判定方法、装置、设备及存储介质
CN110083808B (zh) * 2019-03-18 2024-04-02 平安科技(深圳)有限公司 基于用户答案的作弊判定方法、装置、设备及存储介质
CN110781876A (zh) * 2019-10-15 2020-02-11 北京工业大学 一种基于视觉特征的仿冒域名轻量级检测方法及系统
CN110781876B (zh) * 2019-10-15 2023-11-24 北京工业大学 一种基于视觉特征的仿冒域名轻量级检测方法及系统
CN110855716A (zh) * 2019-11-29 2020-02-28 北京邮电大学 一种面向仿冒域名的自适应安全威胁分析方法及系统
CN110855716B (zh) * 2019-11-29 2020-11-06 北京邮电大学 一种面向仿冒域名的自适应安全威胁分析方法及系统
CN111654472A (zh) * 2020-05-14 2020-09-11 亚信科技(成都)有限公司 一种域名检测方法及装置
CN111654472B (zh) * 2020-05-14 2022-05-24 亚信科技(成都)有限公司 一种域名检测方法及装置

Also Published As

Publication number Publication date
CN106170002B (zh) 2019-07-02

Similar Documents

Publication Publication Date Title
CN106170002A (zh) 一种中文仿冒域名检测方法及系统
Schleussner et al. Armed-conflict risks enhanced by climate-related disasters in ethnically fractionalized countries
CN104899508B (zh) 一种多阶段钓鱼网站检测方法与系统
CN104966031B (zh) 安卓应用程序中非权限相关隐私数据的识别方法
CN106557462A (zh) 命名实体识别方法和系统
CN110781308B (zh) 一种基于大数据构建知识图谱的反欺诈系统
CN103544436A (zh) 一种钓鱼网站鉴别系统和方法
CN102170446A (zh) 一种基于空间布局与视觉特征的钓鱼网页检测方法
Cai et al. Asymmetric persistence in convergence for carbon dioxide emissions based on quantile unit root test with Fourier function
CN105447206A (zh) 基于word2vec算法的新评论对象识别方法及系统
CN108337255B (zh) 一种基于web自动化测试和宽度学习的钓鱼网站检测方法
CN106294619A (zh) 舆情智能监管方法
CN105224600B (zh) 一种样本相似度的检测方法及装置
CN104361102A (zh) 一种基于群组匹配的专家推荐方法及系统
CN102750552B (zh) 一种手写识别方法、系统及手写识别终端
CN110427628A (zh) 基于神经网络算法的web资产分类检测方法及装置
CN109918648B (zh) 一种基于动态滑动窗口特征评分的谣言深度检测方法
CN105609116A (zh) 一种语音情感维度区域的自动识别方法
CN106127222A (zh) 一种基于视觉的字符串相似度计算方法及相似性判断方法
CN109829302A (zh) Android恶意应用家族分类方法、装置与电子设备
CN104346408A (zh) 一种对网络用户进行标注的方法与设备
CN116757164A (zh) 一种gpt生成语言识别与检测系统
CN107193930A (zh) 一种网站敏感词屏蔽方法
CN110008473A (zh) 一种基于迭代方法的医疗文本命名实体识别标注方法
CN105426379A (zh) 基于词语位置的关键字权值计算方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant