CN106170002B - 一种中文仿冒域名检测方法及系统 - Google Patents
一种中文仿冒域名检测方法及系统 Download PDFInfo
- Publication number
- CN106170002B CN106170002B CN201610809596.9A CN201610809596A CN106170002B CN 106170002 B CN106170002 B CN 106170002B CN 201610809596 A CN201610809596 A CN 201610809596A CN 106170002 B CN106170002 B CN 106170002B
- Authority
- CN
- China
- Prior art keywords
- domain name
- character
- counterfeit
- chinese
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1441—Countermeasures against malicious traffic
- H04L63/1491—Countermeasures against malicious traffic using deception as countermeasure, e.g. honeypots, honeynets, decoys or entrapment
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1408—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
- H04L63/1416—Event detection, e.g. attack signature detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1441—Countermeasures against malicious traffic
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种中文仿冒域名检测方法及系统,适用于检测利用形近字构造的中文仿冒域名。主要包括:用于统计每个输入域名的长度和总笔画数的域名预处理模块;对比待检测域名与目标域名的长度和总笔画数,过滤出可能被仿冒的目标域名集合的目标域名过滤模块;将待检测域名与过滤出的目标域名对应拆分为单个汉字的域名拆分模块;将汉字转化为笔画顺序的字符串并基于字符串编辑距离计算单字相似度的单字相似度计算模块;基于单字相似度计算整体域名相似度的域名相似度计算模块;基于域名相似度判定并输出最可能被仿冒的目标域名的仿冒域名决策模块。通过以上方法及系统可有效识别利用形近字构造的中文仿冒域名,在网络安全领域具有广泛的应用前景。
Description
技术领域
本发明属于网络安全技术领域,具体涉及一种中文仿冒域名的检测方法及系统。
背景技术
近年来随着在线金融、电子商务的发展,钓鱼网站呈爆发式增长,严重威胁公共财产安全和信息安全。域名仿冒是网络钓鱼中一种常见的技术,攻击者通过注册一个与目标域名相似的域名来欺骗用户,进而盗取用户的个人敏感信息。
传统的域名系统只能使用63个ASCII字符("a-z","A-Z","0-9","-")。随着互联网在非英语国家的迅速发展,国际化域名日渐兴起,域名可使用的字符集已扩展到上百种语言字符。中文域名是国际化域名的重要组成部分。
汉字作为一种象形文字,其笔画类型及书写顺序可表征该文字的视觉特征,特殊的造字规则使其产生了大量的形近字。但目前的仿冒域名检测方法主要针对英文域名,难以适用于字形复杂多变的中文域名。
发明内容
本发明针对利用中文形近字在视觉上的相似性进行的域名仿冒,提出一种中文仿冒域名检测方法及系统,基于汉字的笔画顺序字符串的相似度计算单个汉字的相似度,并基于单字相似度计算整体域名相似度,从而能够有效地检测出被仿冒的中文域名。
为了实现上述目的,本发明采用以下技术方案:
一种中文仿冒域名检测方法,包括以下步骤:
1)分别统计待测域名Domaindet和目标域名集合DomainSet1中每个域名的域名长度和总笔画数;
2)通过对比待测域名与目标域名集合DomainSet1中每个目标域名的域名长度和总笔画数,过滤出与待测域名长度相同且总笔画数差值百分比小于设定阈值T1的可能被仿冒的目标域名集合DomainSet2;
3)将待测域名与可能被仿冒的目标域名集合DomainSet2中的每个目标域名分别对应拆分为单个汉字,将单个汉字按照其书写的笔画顺序转化为字符串,并基于该字符串的编辑距离计算单字相似度;
4)基于步骤3)得到的单字相似度计算对应的整体域名的相似度,判定与待测域名相似度最高且相似度值超过设定阈值T2的目标域名为被仿冒域名,输出被仿冒域名。
进一步地,步骤1)中,通过从汉字笔画数据库中请求每个域名中每个汉字的笔画数,求和得每个域名的总笔画数。
进一步地,步骤2)中,总笔画数差值百分比(Dpct)的计算方法如下:
其中,StrokeTotalNumdet为待测域名的总笔画数,StrokeTotalNumtarget为目标域名的总笔画数。
进一步地,步骤2)中,阈值T1设置得越小,则在该步骤中被过滤掉的目标域名数量越多,后续的计算量越小。但若该阈值设置过小,可能导致最终检测结果的漏报率增大,即被仿冒域名在该步骤中直接被过滤掉。因此,该阈值的设定可根据实际需要设定,例如统计当前已知的仿冒域名与目标域名的总笔画数差值百分比,将阈值设置为统计结果的均值或最大值。
进一步地,步骤3)中首先去除待测域名与可能被仿冒的目标域名集合DomainSet2中的每个目标域名中的非汉字字符,再将待测域名与可能被仿冒的目标域名集合DomainSet2中的每个目标域名分别对应拆分为单个汉字。
进一步地,步骤3)中所述字符串使用英文字符表示汉字的每个基本笔画类别。
进一步地,步骤3)中,计算单字相似度(CharSim(c1,c2))的方法为:
其中c1,c2为待计算的两单字对应的笔画顺序字符串,EditDis(c1,c2)为字符串c1,c2的编辑距离,StrokeNum1,StrokeNum2为单字的笔画数,即字符串c1,c2的长度。
进一步地,步骤4)中,基于单字的相似度(CharSim(c1,c2))计算整体域名的相似度(DomainDim(s1,s2))的方法为:
其中待测域名与目标域名的长度均为n,CharSimi表示域名对应的单字字符的相似度,i为1~n的整数。即CharSimi依次为CharSim1,CharSim2,…,CharSimn。
进一步地,步骤4)中,阈值T2设置过大,将导致最终检测结果的漏报率增加,若设置过小,将导致误报率增加。因此,该阈值的设定可根据实际需要设定,例如统计当前已知的仿冒域名与目标域名的相似度值,将阈值设置为统计结果的均值或最小值。
一种中文仿冒域名检测系统,包括:
域名预处理模块,用于统计输入的待测域名Domaindet和目标域名集合DomainSet1中每个域名的域名长度和总笔画数;
目标域名过滤模块,用于通过对比待测域名和目标域名集合DomainSet1中每个目标域名的域名长度和总笔画数,过滤出与待测域名长度相同且总笔画数差值百分比小于设定阈值T1的可能被仿冒的目标域名集合DomainSet2;
域名拆分模块,用于将待测域名与可能被仿冒的目标域名集合DomainSet2中的每个目标域名分别对应拆分为单个汉字;
单字相似度计算模块,用于将单个汉字按照其书写的笔画顺序转化为字符串,并基于该字符串的编辑距离计算单字相似度;
域名相似度计算模块,用于根据单字相似度计算对应的整体域名的相似度;
仿冒域名决策模块,用于将与待测域名相似度最高且相似度值超过设定阈值T2的目标域名判定为被仿冒域名并输出被仿冒域名。
进一步地,所述域名预处理模块又包括:
域名长度统计子模块,用于统计输入的待测域名Domaindet和目标域名集合DomainSet1中每个域名的域名长度,即每个域名包含的汉字个数。
域名总笔画数统计子模块,用于统计输入的待测域名和目标域名集合DomainSet1中每个域名的总笔画数。该子模块从汉字笔画数据库中请求域名中每个汉字的笔画数,求和得域名的总笔画数。
进一步地,所述可能被仿冒的目标域名集合DomainSet2的元素个数小于等于DomainSet1的元素个数。
进一步地,所述目标域名过滤模块又包括:
长度过滤子模块,用于依次对比待测域名和目标域名集合DomainSet1中各域名的长度,输出包含与待测域名长度相同的所有目标域名的集合DomainSettmp。
总笔画数过滤子模块,用于依次对比待测域名和经长度过滤得到的集合DomainSettmp中各域名的总笔画数,输出包含与待测域名的域名总笔画数的差值百分比小于设定阈值T1的所有目标域名的集合DomainSet2。总笔画数的差值百分比Dpct的计算方法如下:
其中,SrokeTotalNumdet为待测域名的总笔画数,SrokeTotalNumtarget为目标域名的总笔画数。
进一步地,所述域名拆分模块用于先去除待测域名与目标域名中的非汉字字符,再将待测域名与目标域名分别对应拆分为单个汉字。由于DomainSet2中各域名的长度与待测域名的长度相同,故拆分后的汉字可一一对应以作为单字相似度计算模块的输入。
进一步地,所述单字相似度计算模块又包括:
单字转换笔画子模块,用于输入一个汉字,输出其对应的笔画顺序字符串,该字符串使用英文字符表示汉字的每个基本笔画类别。
字符串相似度计算子模块,用于根据单字笔画顺序字符串的编辑距离计算单字相似度,单字相似度CharSim(c1,c2)具体计算方法为:
其中c1,c2为待计算的两单字对应的笔画顺序字符串,EditDis(c1,c2)为字符串c1,c2的编辑距离,StrokeNum1,StrokeNum2为单字的笔画数,即字符串c1,c2的长度。
进一步地,所述域名相似度计算模块用于根据单字的相似度计算整体域名的相似度,域名相似度DomainSim(s1,s2)的具体计算方法为:
其中待测域名与目标域名的长度均为n,对应字符的相似度依次为CharSim1,CharSim2,…,CharSimn。
本发明的有益效果在于:
本发明针对利用形近字构造中文仿冒域名,提出了基于汉字笔画判断单字相似度,并基于单字相似度计算整体域名相似度的检测方法。本发明的核心是利用组成汉字的笔画基本类型及其书写顺序来计算单个汉字的相似度。该中文域名仿冒检测方法通过实验验证,表明了其有效性。该中文域名仿冒检测系统易于通过计算机实现,其中所需汉字笔画数、笔顺字符串可直接从现有的汉字笔画数据库获取。
附图说明
图1为本发明的流程示意图;
图2为所述域名预处理模块结构示意图;
图3为目标域名过滤模块结构示意图;
图4为单字相似度计算模块结构示意图。
具体实施方式
下面结合附图和实施示例,对本发明的具体实施方式作进一步详细描述。以下实施示例用于说明本发明,但不限制本发明的范围。
本发明首先对中文域名仿冒可能出现的方式进行了研究和分类,共分三大类十小类,如表1。
表1中文域名仿冒方式分类
本发明针对的是视觉仿冒中的形近字仿冒。
如图1,本发明包括域名预处理模块10、目标域名过滤模块20、域名拆分模块30、单字相似度计算模块40、域名相似度计算模块50和仿冒域名决策模块60。
所述域名预处理模块10的输入为待测域名Domaindet和目标域名集合DomainSet1,该模块统计输入的每个域名的域名长度和每个域名的总笔画数。
如图2,所述域名预处理模块10包含域名长度统计子模块11和域名总笔画数统计子模块12。
所述域名长度统计子模块11,统计输入的待测域名和目标域名集合中每个域名的域名长度,即每个域名包含的汉字个数。
所述域名总笔画数统计子模块12,统计输入的待测域名和目标域名集合中每个域名的总笔画数。该子模块从汉字笔画数据库中请求域名中每个汉字的笔画数,求和得域名的总笔画数。
例如:待测域名Domaindet=“屈臣氏”,目标域名集合DomainSet1={“洽洽香瓜子”,“中国移动”,“屈臣氏”,“心相印”}。统计结果如表2:
表2域名预处理结果
所述目标域名过滤模块20输出可能被仿冒的目标域名集合DomainSet2,DomainSet2的元素个数小于等于DomainSet1的元素个数。
如图3,所述目标域名过滤模块20包括长度过滤子模块21和总笔画数过滤子模块22。
所述长度过滤子模块21,依次对比待测域名和目标域名集合中各域名的长度,将与待测域名的域名长度相同的目标域名写入集合DomainSettmp,最后输出DomainSettmp。
所述总笔画数过滤子模块22,依次对比待测域名和集合DomainSettmp中各域名的总笔画数,将与待测域名的域名总笔画数的差值百分比小于阈值T1的目标域名写入集合DomainSet2,最后输出DomainSet2。其中差值百分比的计算方法如下:
其中,StrokeTotalNumdet为待测域名的总笔画数,StrokeTotalNumtarget为目标域名的总笔画数。
例如:差值百分比阈值T1设置为0.5,则经目标域名过滤模块处理可得DomainSet2={“屈臣氏”,“心相印”}
所述域名拆分模块30,首先去除待测域名与目标域名集合DomainSet2中的非汉字字符,如“.”、“-”等;再将待测域名与目标域名拆分为单个汉字并一一对应。
例如:
待测域名Domaindet=“屈巨氏”,目标域名集合DomainSet2={“屈臣氏”,“心相印”}。
将待测域名与目标域名对应拆分,即分别拆分得(“屈屈”、“巨臣”、“氏氏”)、(“屈心”、“巨相”、“氏印”)。
所述单字相似度计算模块40,将汉字按照其书写的笔画顺序转化为字符串,并基于该字符串的编辑距离计算单字相似度。
如图4,所述单字相似度计算模块40包括单字转换笔画子模块41和字符串相似度计算子模块42。
所述单字转换笔画子模块41,该子模块输入一个汉字,输出其对应的笔画顺序字符串,该字符串使用英文字符表示汉字的每个基本笔画类别。
笔画作为汉字的最小构成单位,可分为横、竖、撇、点、捺、提、折共七个基本类别,并可对应使用英文字符表示各类别名,具体对应规则如表3。
表3笔画基本类别名与字符的对应关系表
基本类别名 | 横 | 竖 | 撇 | 点 | 捺 | 提 | 折 |
英文字符 | A | B | C | D | E | F | G |
例如“巨”的笔画顺序为“横–折–横–折”,“臣”的笔画顺序为“横–竖–折–横–竖–折”。则根据表3,“巨”可转换为字符串“AGAG”,“臣”可转换为字符串“ABGABG”。在具体实施时,可直接通过查询汉字笔画数据库获取每个汉字对应的笔画字符串。
所述字符串相似度计算子模块42,该子模块基于单字笔画顺序字符串的编辑距离计算单字相似度,具体计算方法为:
其中c1,c2为待计算的两单字对应的笔画顺序字符串,EditDis(c1,c2)为字符串c1,c2的编辑距离,SrokeNum1,StrokeNum2为单字的笔画数,即字符串c1,c2的长度。
例如:示例计算结果如表4。
表4单字相似度
所述域名相似度计算模块50,基于单字的相似度计算整体域名的相似度,具体计算方法为:
其中待测域名与目标域名的长度均为n,对应字符的相似度依次为CharSim1,CharSim2,…,CharSimn。
例如:示例计算结果如表5。
表5整体域名相似度
所述仿冒域名决策模块60,该模块判定与待检测相似度最高且相似度值超过阈值的目标域名为被仿冒域名。
例如:预设相似度阈值为0.8,则可判定目标域名“屈臣氏”被待测域名“屈巨氏”仿冒,输出被仿冒域名“屈臣氏”。
综上所述,本发明针对利用形近字构造中文仿冒域名,提出了基于汉字笔画判断单字相似度,并基于单字相似度计算整体域名相似度的检测方法。该方法通过实验验证,表明了其有效性。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴。
Claims (5)
1.一种中文仿冒域名检测方法,包括以下步骤:
1)分别统计待测域名Domaindet和目标域名集合DomainSet1中每个域名的域名长度和总笔画数;
2)通过对比待测域名与目标域名集合DomainSet1中每个目标域名的域名长度和总笔画数,过滤出与待测域名长度相同且总笔画数差值百分比小于设定阈值T1的可能被仿冒的目标域名集合DomainSet2;
3)去除待测域名与可能被仿冒的目标域名集合DomainSet2中的每个目标域名中的非汉字字符,然后将待测域名与可能被仿冒的目标域名集合DomainSet2中的每个目标域名分别对应拆分为单个汉字,将单个汉字按照其书写的笔画顺序转化为字符串,并基于该字符串的编辑距离计算单字相似度;所述字符串使用英文字符表示汉字的每个基本笔画类别;其中,单字相似度为c1,c2为待计算的两单字对应的笔画顺序字符串,EditDis(c1,c2)为字符串c1,c2的编辑距离,StrokeNum1,StrokeNum2为单字的笔画数;
4)基于步骤3)得到的单字相似度计算对应的整体域名的相似度,判定与待测域名相似度最高且相似度值超过设定阈值T2的目标域名为被仿冒域名,输出被仿冒域名;其中,整体域名的相似度为待测域名与目标域名的长度均为n,CharSimi表示域名对应的单字字符的相似度,i为1~n的整数。
2.如权利要求1所述的中文仿冒域名检测方法,其特征在于,步骤1)中,通过从汉字笔画数据库中请求每个域名中每个汉字的笔画数,求和得每个域名的总笔画数。
3.如权利要求1所述的中文仿冒域名检测方法,其特征在于,步骤2)中,总笔画数差值百分比的计算方法如下:
其中,StrokeTotalNumdet为待测域名的总笔画数,StrokeTotalNumtarget为目标域名的总笔画数。
4.一种中文仿冒域名检测系统,包括:
域名预处理模块,用于统计输入的待测域名Domaindet和目标域名集合DomainSet1中每个域名的域名长度和总笔画数;
目标域名过滤模块,包括长度过滤子模块和总笔画数过滤子模块,其中,长度过滤子模块,用于依次对比待测域名和目标域名集合DomainSet1中各域名的长度,输出包含与待测域名长度相同的所有目标域名的集合DomainSettmp;总笔画数过滤子模块,用于依次对比待测域名和经长度过滤得到的集合DomainSettmp中各域名的总笔画数,输出包含与待测域名的域名总笔画数的差值百分比小于设定阈值T1的所有目标域名的集合DomainSet2;
域名拆分模块,用于将待测域名与可能被仿冒的目标域名集合DomainSet2中的每个目标域名分别对应拆分为单个汉字;
单字相似度计算模块,包括单字转换笔画子模块和字符串相似度计算子模块;其中,单字转换笔画子模块,用于输入一个汉字,输出其对应的笔画顺序字符串,该字符串使用英文字符表示汉字的每个基本笔画类别;字符串相似度计算子模块,用于根据单字笔画顺序字符串的编辑距离计算单字相似度,单字相似度CharSim(c1,c2)具体计算方法为:
c1,c2为待计算的两单字对应的笔画顺序字符串,EditDis(c1,c2)为字符串c1,c2的编辑距离,StrokeNum1,StrokeNum2为单字的笔画数;
域名相似度计算模块,用于根据单字相似度计算对应的整体域名的相似度;
仿冒域名决策模块,用于将与待测域名相似度最高且相似度值超过设定阈值T2的目标域名判定为被仿冒域名并输出被仿冒域名。
5.如权利要求4所述的中文仿冒域名检测系统,其特征在于,所述域名预处理模块又包括:
域名长度统计子模块,用于统计输入的待测域名Domaindet和目标域名集合DomainSet1中每个域名的域名长度;
域名总笔画数统计子模块,用于统计输入的待测域名和目标域名集合DomainSet1中每个域名的总笔画数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610809596.9A CN106170002B (zh) | 2016-09-08 | 2016-09-08 | 一种中文仿冒域名检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610809596.9A CN106170002B (zh) | 2016-09-08 | 2016-09-08 | 一种中文仿冒域名检测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106170002A CN106170002A (zh) | 2016-11-30 |
CN106170002B true CN106170002B (zh) | 2019-07-02 |
Family
ID=57376177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610809596.9A Active CN106170002B (zh) | 2016-09-08 | 2016-09-08 | 一种中文仿冒域名检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106170002B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018213574A1 (en) * | 2017-05-17 | 2018-11-22 | Farsight Security, Inc. | System, method and domain name tokenization for domain name impersonation detection |
CN107679029B (zh) * | 2017-08-28 | 2021-07-16 | 昆明理工大学 | 一种英文域名相似度检测方法 |
CN107609059B (zh) * | 2017-08-28 | 2020-10-20 | 昆明理工大学 | 一种基于j-w距离的中文域名相似度量方法 |
CN108768954B (zh) * | 2018-05-04 | 2020-07-10 | 中国科学院信息工程研究所 | 一种dga恶意软件识别方法 |
CN109272025B (zh) * | 2018-08-29 | 2021-07-16 | 昆明理工大学 | 一种相似常用汉字查找方法 |
CN110083808B (zh) * | 2019-03-18 | 2024-04-02 | 平安科技(深圳)有限公司 | 基于用户答案的作弊判定方法、装置、设备及存储介质 |
CN110781876B (zh) * | 2019-10-15 | 2023-11-24 | 北京工业大学 | 一种基于视觉特征的仿冒域名轻量级检测方法及系统 |
CN110855716B (zh) * | 2019-11-29 | 2020-11-06 | 北京邮电大学 | 一种面向仿冒域名的自适应安全威胁分析方法及系统 |
CN111654472B (zh) * | 2020-05-14 | 2022-05-24 | 亚信科技(成都)有限公司 | 一种域名检测方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1367417A (zh) * | 2001-01-21 | 2002-09-04 | 黄宏权 | 一种通用中英文数码网址或域名 |
CN103399907A (zh) * | 2013-07-31 | 2013-11-20 | 深圳市华傲数据技术有限公司 | 一种基于编辑距离计算中文字符串相似度的方法及装置 |
CN103428307A (zh) * | 2013-08-09 | 2013-12-04 | 中国科学院计算机网络信息中心 | 仿冒域名检测方法及设备 |
CN103957191A (zh) * | 2014-04-03 | 2014-07-30 | 中国科学院计算机网络信息中心 | 一种中文域名仿冒攻击的检测方法 |
-
2016
- 2016-09-08 CN CN201610809596.9A patent/CN106170002B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1367417A (zh) * | 2001-01-21 | 2002-09-04 | 黄宏权 | 一种通用中英文数码网址或域名 |
CN103399907A (zh) * | 2013-07-31 | 2013-11-20 | 深圳市华傲数据技术有限公司 | 一种基于编辑距离计算中文字符串相似度的方法及装置 |
CN103428307A (zh) * | 2013-08-09 | 2013-12-04 | 中国科学院计算机网络信息中心 | 仿冒域名检测方法及设备 |
CN103957191A (zh) * | 2014-04-03 | 2014-07-30 | 中国科学院计算机网络信息中心 | 一种中文域名仿冒攻击的检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106170002A (zh) | 2016-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106170002B (zh) | 一种中文仿冒域名检测方法及系统 | |
US20230013306A1 (en) | Sensitive Data Classification | |
WO2019153604A1 (zh) | 人机识别模型的建立装置、方法及计算机可读存储介质 | |
CN108229130B (zh) | 一种验证方法及装置 | |
US20190349399A1 (en) | Character string classification method and system, and character string classification device | |
CN102591854B (zh) | 针对文本特征的广告过滤系统及其过滤方法 | |
CN105224600B (zh) | 一种样本相似度的检测方法及装置 | |
CN104008363B (zh) | 手写轨迹的检测、规范化和在线识别以及异常字根的收集 | |
CN106056407A (zh) | 基于用户行为分析的网银用户画像方法及设备 | |
CN109005145A (zh) | 一种基于自动特征抽取的恶意url检测系统及其方法 | |
CN102170446A (zh) | 一种基于空间布局与视觉特征的钓鱼网页检测方法 | |
CN109450845A (zh) | 一种基于深度神经网络的算法生成恶意域名检测方法 | |
CN107358075A (zh) | 一种基于层次聚类的虚假用户检测方法 | |
CN111866004B (zh) | 安全评估方法、装置、计算机系统和介质 | |
CN111488732B (zh) | 一种变形关键词检测方法、系统及相关设备 | |
Boubaker et al. | Online Arabic databases and applications | |
CN109918648B (zh) | 一种基于动态滑动窗口特征评分的谣言深度检测方法 | |
US20160283582A1 (en) | Device and method for detecting similar text, and application | |
CN107895117A (zh) | 恶意代码标注方法和装置 | |
CN112241458B (zh) | 文本的知识结构化处理方法、装置、设备和可读存储介质 | |
CN103957191A (zh) | 一种中文域名仿冒攻击的检测方法 | |
CN109829302A (zh) | Android恶意应用家族分类方法、装置与电子设备 | |
CN116311214B (zh) | 车牌识别方法和装置 | |
CN110807183A (zh) | 一种多维度特征体系的滑动验证码人机行为识别方法 | |
Liu et al. | Interpretable multimodal misinformation detection with logic reasoning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |