CN106375288A - 一种中文域名相似度计算方法及仿冒域名检测方法 - Google Patents

一种中文域名相似度计算方法及仿冒域名检测方法 Download PDF

Info

Publication number
CN106375288A
CN106375288A CN201610751260.1A CN201610751260A CN106375288A CN 106375288 A CN106375288 A CN 106375288A CN 201610751260 A CN201610751260 A CN 201610751260A CN 106375288 A CN106375288 A CN 106375288A
Authority
CN
China
Prior art keywords
domain name
similarity
character
measured
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610751260.1A
Other languages
English (en)
Other versions
CN106375288B (zh
Inventor
王利明
李丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Information Engineering of CAS
Original Assignee
Institute of Information Engineering of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Information Engineering of CAS filed Critical Institute of Information Engineering of CAS
Priority to CN201610751260.1A priority Critical patent/CN106375288B/zh
Publication of CN106375288A publication Critical patent/CN106375288A/zh
Application granted granted Critical
Publication of CN106375288B publication Critical patent/CN106375288B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • H04L63/1491Countermeasures against malicious traffic using deception as countermeasure, e.g. honeypots, honeynets, decoys or entrapment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/45Network directories; Name-to-address mapping
    • H04L61/4505Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols
    • H04L61/4511Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols using domain name system [DNS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • H04L63/1483Countermeasures against malicious traffic service impersonation, e.g. phishing, pharming or web spoofing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种中文域名相似度计算方法及仿冒域名检测方法。本方法为:1)分别生成待测域名d1、目标域名d2的中文字符集合set1、set2;2)根据集合set1、set2中字符数的比较结果确定计算标志flag的值并确定集合set1、set2中所包含的n组相似字符对以及每组相似字符对的相似度;3)根据形近字变换对待测域名d1、目标域名d2的影响值,以及字序交换对待测域名d1、目标域名d2的影响值,计算域名d1与域名d2的整体相似度值。如果整体相似度值大于设定阈值,则判定域名d1为域名d2的仿冒域名。本发明可有效检测出基于形近字替换、基于字序交换的中文仿冒域名,在网络安全领域具有广泛的应用前景。

Description

一种中文域名相似度计算方法及仿冒域名检测方法
技术领域
本发明属于网络安全技术领域,具体涉及一种中文域名相似度计算方法及仿冒域名检测方法。
背景技术
中文域名作为国际化域名的重要组成部分,针对中文域名的域名仿冒攻击日渐增多、域名仿冒形式也日益复杂。汉字的造字规则使其产生了大量的形近字,且因为人的阅读惯性,一定程度上的字序错乱并不影响整体视觉效果。
传统的域名检测技术只适用于字符体系较为简单英文域名,不能有效检测字符库庞大、字形复杂的中文域名,目前针对该领域的研究还比较欠缺。
专利申请CN103957191A《一种中文域名仿冒攻击的检测方法》提出的检测方法是首先基于字符点阵计算待测域名与目标域名对应位置字符的相似度,再由此计算整体域名相似度。该方法可有效识别利用形近字构造的仿冒域名,但如果攻击者在使用形近字的基础上对域名中的字符顺序进行了交换,上述检测方法将不再适用。
发明内容
本发明针对利用中文形近字替换和字序交换构造的中文仿冒域名,提出一种中文域名相似度计算方法及仿冒域名检测方法。
该方法包括域名预处理模块、相似字符对构造模块、单字相似度计算模块和整体域名相似度计算模块。
域名预处理模块:该模块输入待测域名与从预设的若干目标域名中选取的一目标域名,输出两域名对应的中文字符集合set1、set2
相似字符对构造模块:该模块输入set1、set2,输出计算标志flag、n组字符对以及每组字符对的相似度,其中每个字符对的相似度调用单字相似度计算模块计算。
单字相似度计算模块:该模块基于中文字符的五笔编码以及笔画数计算每组字符对中两中文字符的相似度。
整体域名相似度计算模块:该模块综合考虑两域名中形近字替换和字序交换带来的影响,计算并输出待测域名与目标域名的相似度值。
所述域名预处理模块输入为待测域名和目标域名,输出为两域名对应的字符集合set1、set2。具体步骤为:
第一步,去除输入域名中的非中文字符。
第二步,去除每个域名中重复的中文字符,并将剩余字符对应写入集合set1、set2
所述相似字符对构造模块输入集合set1、set2,输出计算标志flag、n组相似字符对以及每组相似字符对的相似度。具体步骤为:
第一步,计算得集合set1、set2的元素个数setNum1、setNum2
第二步,若setNum1大于或等于setNum2,则flag=1,否则flag=2。
第三步,构造一个setNum1*setNum2的矩阵,其中行元素为列元素为
第四步,若flag=1,则按行计算字符对的相似度如下:首先判断列元素中是否存在与xi相同的元素,若存在相同元素yi,则字符对(xi,yi)的相似度为1;若不存在相同元素,则调用所述单字相似度计算xi中每个元素的相似度值,取其中的最大值对应的元素yj与xi的构成相似字符对(xi,yj),对应的相似度值作为字符对(xi,yi)的相似度值。若flag=2,则按列计算字符对的相似度,计算方法同上。
第五步,输出计算标志flag、字符对及其相似度值。
所述单字相似度基于中文字符的五笔编码的编辑距离计算两字符的相似度,具体步骤为:
第一步,从五笔编码数据库中获取两输入字符的五笔编码code1、code2
第二步,从汉字笔画数据库中获取两输入字符的笔画数StrokeL1、StrokeL2
第三步,计算两输入字符的相似度,具体计算方法为:
C h a r S i m ( c 1 , c 2 ) = W C o d e × ( 1 - E d i t D i s ( Code 1 , Code 2 ) max ( CodeL 1 , CodeL 2 ) ) + ( 1 - W C o d e ) × ( 1 - a b s ( StrokeL 1 - StrokeL 2 ) m a x ( StrokeL 1 , StrokeL 2 ) )
其中,Wcode是根据五笔编码异同对单字相似度的影响而分配的权值,其取值区间为[0,1];EditDis(Code1,Code2)为两字符的五笔编码的编辑距离(参考http://baike.baidu.com/link?url=2aAgp7kOpKvFDBRmUNxJFPBQ4sgSkMgNN2JmjP9VztciyXLZ6GpjocXHDbha9-YBxQb70sy7eGKLMCPql4GhWK);codeL1、codeL2为两字符的五笔编码的编码长度;StrokeL1、StrokeL2为两字符的笔画数;abs()函数为取绝对值函数,max()函数为取最大值函数。
所述整体域名相似度计算模块包含形近字域名相似度计算子模块、字序交换域名相似度计算子模块和整体域名相似度计算子模块。
所述形近字域名相似度计算子模块:该子模块只考虑形近字变换对整体域名相似度带来的影响,而不考虑字序交换的影响,具体计算方法为:
DSim c h a r ( d 1 , d 2 ) = 1 N Σ 1 N CharSim i
其中,待测域名d1与目标域名d2的长度均为N;若flag=1,则CharSim1,CharSim2,…,CharSimN是以待测域名中的中文字符为基准,取各字符对的相似度值,若flag=2,则CharSim1,CharSim2,…,CharSimN是以目标域名中的中文字符为基准,取各字符对的相似度值。
所述字序交换域名相似度计算子模块:该子模块只考虑字序交换对整体域名相似度带来的影响,而不考虑形近字的影响。该子模块首先基于所述相似字符对构造模块输出的n对相似字符对对域名字符进行替换。若flag=1,则替换待测域名中的字符得新域名d1’,目标域名不变即d2’=d2;若flag=2,则替换目标域名中的字符得新域名d2’,待测域名不变即d1’=d1。替换完成后,两域名d1’、d2’中的所有字符相同,只是顺序可能不同。最后计算相似度如下:
DSim o r d e r ( d 1 , d 2 ) = 1 - E d i t D i s ( d 1 ′ , d 2 ′ ) N
其中,EditDis(d′1,d′2)为替换后域名d1’、d2’的编辑距离,两域名的域名长度均为N。
所述整体域名相似度计算子模块:该子模块综合形近字替换和字序交换对整体域名相似度带来的影响,最终得出待测域名与目标域名的相似度值,计算方法如下:
DSim(d1,d2)=Wchar×DSimchar(d1,d2)+(1-Wchar)×DSimorder(d1,d2)
其中,Wchar是根据形近字替换对整体域名相似度的影响而分配的权值,其取值区间为[0,1]。
仿冒域名判断模块,根据待测域名d1与目标域名d2的整体相似度值进行判断,如果整体相似度大于设定阈值,则判定该待测域名d1为目标域名d2的仿冒域名。
与现有技术相比,本发明的积极效果为:
针对传统域名检测技术只适用于传统的英文域名而不能有效检测中文仿冒域名的问题,本发明提出一种中文域名相似度计算方法及仿冒域名检测方法。该方法可有效检测出基于形近字替换、基于字序交换或基于两者结合构造的中文仿冒域名,在网络安全领域具有广泛的应用前景。
附图说明
图1为本发明的流程示意图;
图2整体域名相似度计算模块结构示意图。
具体实施方式
下面结合附图和实施示例,对本发明的具体实施方式作进一步详细描述。以下实施示例用于说明本发明,但不限制本发明的范围。
本发明主要针对利用形近字替换和字序交换构造的中文仿冒域名,计算此类仿冒域名与目标域名的相似度。
如图1,本发明包括域名预处理模块10、相似字符对构造模块20、单字相似度计算模块30和整体域名相似度计算模块40。
所述域名预处理模块10的输入为待测域名与目标域名,输出为两域名对应的中文字符集合Set1、Set2,其具体步骤为:
第一步,去除输入域名中的非中文字符。
第二步,去除每个域名中重复的中文字符,并将剩余字符对应写入集合Set1、Set2
例如,待测域名为“中国茅洒合业集团”,目标域名为“中国茅台酒业集团”。集合Set1={中,国,茅,洒,合,业,集,团},集合Set2={中,国,茅,台,酒,业,集,团}。
所述相似字符对构造模块20的输入为集合Set1、Set2,输出为计算标志flag、n组字符对以及每组字符对的相似度,其中每个字符对的相似度调用单字相似度计算模块30计算,其具体步骤如下:
第一步,计算得集合set1、set2的元素个数setNum1、setNum2
第二步,若setNum1大于或等于setNum2,则flag=1,否则flag=2。
第三步,构造一个setNum1*setNum2的矩阵,其中行元素为列元素为
第四步,若flag=1,则按行计算字符对的相似度如下:首先判断列元素中是否存在与xi相同的元素,若存在相同元素yi,则字符对(xi,yi)的相似度为1;若不存在相同元素,则调用所述单字相似度计算xi中每个元素的相似度值,取其中的最大值作为字符对(xi,yi)的相似度值。若flag=2,则按列计算字符对的相似度,计算方法同上。
第五步,输出计算标志flag、字符对及其相似度值。
例如,输入集合为集合Set1={中,国,茅,酒,合,业,集,团},集合Set2={中,国,茅,台,酒,业,集,团}。构造一个8*8的矩阵,并按行计算得字符对相似度值如下。
1 - - - - - - -
- 1 - - - - - -
- - 1 - - - - -
0.27 0.53 0.53 0.33 0.84 0.33 0.55 0.4
0.5 0.45 0.45 0.7 0.46 0.6 0.4 0.6
- - - - - 1 - -
- - - - - - 1 -
- - - - - - - 1
根据上述计算结果,输出“(中 中 1)(国 国 1)(茅 茅 1)(洒 酒 0.84)(合 台0.7)(业 业 1)(集 集 1)(团 团 1)flag=1”。
所述单字相似度计算模块30基于中文字符的五笔编码以及笔画数计算两字符的相似度值,具体计算步骤如下:
第一步,从五笔编码数据库中获取两输入字符的五笔编码code1、code2
第二步,从汉字笔画数据库中获取两输入字符的笔画数StrokeL1、StrokeL2
第三步,计算两输入字符的相似度,具体计算方法为:
C h a r S i m ( c 1 , c 2 ) = W C o d e × ( 1 - E d i t D i s ( Code 1 , Code 2 ) max ( CodeL 1 , CodeL 2 ) ) + ( 1 - W C o d e ) × ( 1 - a b s ( StrokeL 1 - StrokeL 2 ) m a x ( StrokeL 1 , StrokeL 2 ) )
其中,Wcode是根据五笔编码异同对单字相似度的影响而分配的权值,其取值区间为[0,1];EditDis(Code1,Code2)为两字符的五笔编码的编辑距离;codeL1、codeL2为两字符的五笔编码的编码长度;StrokeL1、StrokeL2为两字符的笔画数;abs()函数为取绝对值函数,max()函数为取最大值函数。
例如,输入字符为“洒、酒”。两字符的五笔编码分别为code1=“isg”,code2=“isgg”,笔画数分别为StrokeL1=9、StrokeL2=10;设定Wcode=0.4,根据上述公式计算得两字的相似度为0.84。
所述整体域名相似度计算模块40综合考虑两域名中形近字替换和字序交换带来的影响,计算并输出待测域名与目标域名的相似度值。
如图2,所述整体域名相似度计算模块40包括形近字域名相似度计算子模块41、字序交换域名相似度计算子模块42和整体域名相似度计算子模块43。
所述形近字域名相似度计算子模块41只考虑形近字变换对整体域名相似度带来的影响,而不考虑字序交换的影响,具体计算方法为:
DSim c h a r ( d 1 , d 2 ) = 1 N Σ 1 N CharSim i
其中,待测域名与目标域名的长度均为N;若flag=1,则CharSim1,CharSim2,…,CharSimN是以待测域名中的中文字符为基准,取各字符对的相似度值,若flag=2,则CharSim1,CharSim2,…,CharSimN是以目标域名中的中文字符为基准,取各字符对的相似度值。
所述字序交换域名相似度计算子模块42只考虑字序交换对整体域名相似度带来的影响,而不考虑形近字的影响。该子模块首先基于所述相似字符对构造模块输出的相似字符对(即(洒、酒),(合、台))对域名字符进行替换。若flag=1,则替换待测域名中的字符得新域名d1’(即“中国茅酒台业集团”),目标域名不变即d2’=d2;若flag=2,则替换目标域名中的字符得新域名d2’,待测域名不变即d1’=d1。替换完成后,两域名d1’、d2’中的所有字符相同,只是顺序可能不同。最后计算相似度如下:
DSim o r d e r ( d 1 , d 2 ) = 1 - E d i t D i s ( d 1 ′ , d 2 ′ ) N
其中,EditDis(d′1,d′2)为替换后域名d1’、d2’的编辑距离,两域名的域名长度均为N。
所述整体域名相似度计算子模块43综合形近字替换和字序交换对整体域名相似度带来的影响,最终得出待测域名与目标域名的相似度值,计算方法如下:
DSim(d1,d2)=Wchar×DSimchar(d1,d2)+(1-Wchar)×DSimorder(d1,d2)
其中,Wchar是根据形近字替换对整体域名相似度的影响而分配的权值,其取值区间为[0,1]。
例如,“中国茅洒合业集团”与“中国茅台酒业集团”的DSimchar=(1+1+1+0.84+0.7+1+1+1)/8=0.94,DSimorder=1-2/8=0.75。取Wchar=0.8,则计算得整体域名相似度DSim=0.8×0.94+0.2×0.75=0.90。
仿冒域名判断模块,由于“中国茅洒合业集团”与“中国茅台酒业集团”的整体相似度大于设定阈值0.85,则判定“中国茅洒合业集团”为“中国茅台酒业集团”的仿冒域名。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴。

Claims (8)

1.一种中文域名相似度计算方法,其步骤为:
1)分别生成待测域名d1、目标域名d2的中文字符集合set1、set2;其中,set1为待测域名d1的中文字符集合,set2为目标域名d2的中文字符集合;待测域名d1、目标域名d2的长度均为N;
2)根据集合set1、set2中字符数的比较结果确定计算标志flag的值并确定集合set1、set2中所包含的n组相似字符对以及每组相似字符对的相似度;其中,n≤N;
3)根据形近字变换对待测域名d1、目标域名d2的影响值,以及字序交换对待测域名d1、目标域名d2的影响值,计算待测域名d1与目标域名d2的整体相似度值。
2.如权利要求1所述的方法,其特征在于,其特征在于,根据公式 计算形近字变换对待测域名d1、目标域名d2的影响值DSimchar(d1,d2);其中,若flag的值代表set1中字符数大于或等于set2中字符数,则以待测域名d1中的中文字符为基准,取各字符对的相似度值;否则以目标域名d2中的中文字符为基准,取各字符对的相似度值;CharSimi是待测域名d1、目标域名d2中第i对字符对的相似度值。
3.如权利要求1所述的方法,其特征在于,计算字序交换对待测域名d1、目标域名d2的影响值DSimorder(d1,d2)的方法为:若flag的值代表set1中字符数大于或等于set2中字符数,则根据n组相似字符将待测域名d1中与目标域名相似的字符替换为目标域名中对应的字符,替换得新域名d1’,目标域名不变,即d2’=d2;否则根据n组相似字符将目标域名d2中与待测域名相似的字符替换为待测域名中对应的字符,得新域名d2’,待测域名不变,即d1’=d1;然后计算d1’与d2’的相似度作为该影响值DSimorder(d1,d2)。
4.如权利要求3所述的方法,其特征在于,根据公式计算该影响值DSimorder(d1,d2);其中,EditDis(d′1,d′2)为替换后域名d1’、d2’的编辑距离。
5.如权利要求1所述的方法,其特征在于,生成待测域名d1、目标域名d2的中文字符集合set1、set2的方法为:首先去除待测域名d1、目标域名d2中的非中文字符;然后去除每个域名中重复的中文字符,并将剩余字符对应写入集合set1、set2
6.如权利要求5所述的方法,其特征在于,步骤2)中,确定集合set1、set2中所包含的n组相似字符对以及每组相似字符对的相似度的方法为:
61)计算得集合set1、set2的元素个数setNum1、setNum2
62)若setNum1≥setNum2,则flag=1,否则flag=2;
63)构造一setNum1*setNum2的矩阵,其中行元素为,列元素为
64)若flag=1,则按行计算字符对的相似度:首先判断列元素中是否存在与行元素xi相同的元素,若存在相同元素yi,则字符对(xi,yi)的相似度为1;若不存在相同元素,则计算xi与列元素中每个元素的相似度值,取其中的最大值对应的元素yj与xi的构成相似字符对(xi,yj),对应的相似度值作为该相似字符对(xi,yj)的相似度;若flag=2,则按列计算字符对的相似度,首先判断行元素中是否存在与列元素yi相同的元素,若存在相同元素xi,则字符对(xi,yi)的相似度为1;若不存在相同元素,则计算yi与行元素中每个元素的相似度值,取其中的最大值对应的元素xj与yi的构成相似字符对(xj,yi),对应的相似度值作为该相似字符对(xj,yi)的相似度。
7.如权利要求1或6所述的方法,其特征在于,基于中文字符的五笔编码的编辑距离计算所述相似度CharSim(c1,c2),其公式为:
C h a r S i m ( c 1 , c 2 ) = W C o d e × ( 1 - E d i t D i s ( Code 1 , Code 2 ) max ( CodeL 1 , CodeL 2 ) ) + ( 1 - W C o d e ) × ( 1 - a b s ( StrokeL 1 - StrokeL 2 ) max ( StrokeL 1 , StrokeL 2 ) )
其中,c1,c2为两待计算字符,c1的五笔编码为code1、笔画数为StrokeL1,c2的五笔编码为code2、笔画数为StrokeL2;Wcode为权值,取值区间为[0,1];EditDis(Code1,Code2)为两字符c1,c2的五笔编码的编辑距离,codeL1为c1的五笔编码的编码长度,codeL2为c2的五笔编码的编码长度;abs()函数为取绝对值函数,max()函数为取最大值函数。
8.一种基于权利要求1所述中文域名相似度计算方法的仿冒域名检测方法,其步骤为:根据待测域名d1与目标域名d2的整体相似度值进行判断,如果整体相似度大于设定阈值,则判定该待测域名d1为目标域名d2的仿冒域名。
CN201610751260.1A 2016-08-29 2016-08-29 一种中文域名相似度计算方法及仿冒域名检测方法 Active CN106375288B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610751260.1A CN106375288B (zh) 2016-08-29 2016-08-29 一种中文域名相似度计算方法及仿冒域名检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610751260.1A CN106375288B (zh) 2016-08-29 2016-08-29 一种中文域名相似度计算方法及仿冒域名检测方法

Publications (2)

Publication Number Publication Date
CN106375288A true CN106375288A (zh) 2017-02-01
CN106375288B CN106375288B (zh) 2019-06-25

Family

ID=57903151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610751260.1A Active CN106375288B (zh) 2016-08-29 2016-08-29 一种中文域名相似度计算方法及仿冒域名检测方法

Country Status (1)

Country Link
CN (1) CN106375288B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247790A (zh) * 2017-06-16 2017-10-13 北京小米移动软件有限公司 新建邮件的方法和装置
CN107609059A (zh) * 2017-08-28 2018-01-19 昆明理工大学 一种基于j‑w距离的中文域名相似度量方法
CN108154167A (zh) * 2017-12-04 2018-06-12 昆明理工大学 一种汉字字形相似度计算方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102664878A (zh) * 2012-04-10 2012-09-12 中国科学院计算机网络信息中心 仿冒域名检测方法及设备
CN103428307A (zh) * 2013-08-09 2013-12-04 中国科学院计算机网络信息中心 仿冒域名检测方法及设备
CN103957191A (zh) * 2014-04-03 2014-07-30 中国科学院计算机网络信息中心 一种中文域名仿冒攻击的检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102664878A (zh) * 2012-04-10 2012-09-12 中国科学院计算机网络信息中心 仿冒域名检测方法及设备
CN103428307A (zh) * 2013-08-09 2013-12-04 中国科学院计算机网络信息中心 仿冒域名检测方法及设备
CN103957191A (zh) * 2014-04-03 2014-07-30 中国科学院计算机网络信息中心 一种中文域名仿冒攻击的检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
洪博等: "一种中文域名仿冒攻击的检测方法", 《计算机应用研究》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247790A (zh) * 2017-06-16 2017-10-13 北京小米移动软件有限公司 新建邮件的方法和装置
CN107247790B (zh) * 2017-06-16 2020-06-02 北京小米移动软件有限公司 新建邮件的方法和装置
CN107609059A (zh) * 2017-08-28 2018-01-19 昆明理工大学 一种基于j‑w距离的中文域名相似度量方法
CN107609059B (zh) * 2017-08-28 2020-10-20 昆明理工大学 一种基于j-w距离的中文域名相似度量方法
CN108154167A (zh) * 2017-12-04 2018-06-12 昆明理工大学 一种汉字字形相似度计算方法
CN108154167B (zh) * 2017-12-04 2021-08-20 昆明理工大学 一种汉字字形相似度计算方法

Also Published As

Publication number Publication date
CN106375288B (zh) 2019-06-25

Similar Documents

Publication Publication Date Title
CN106170002B (zh) 一种中文仿冒域名检测方法及系统
CN107786575B (zh) 一种基于dns流量的自适应恶意域名检测方法
CN107566376B (zh) 一种威胁情报生成方法、装置及系统
CN111488582B (zh) 一种基于图神经网络的智能合约重入性漏洞检测的方法
CN110266675B (zh) 一种基于深度学习的xss攻击自动化检测方法
CN102708186A (zh) 一种钓鱼网站的识别方法
CN103428307A (zh) 仿冒域名检测方法及设备
CN102170446A (zh) 一种基于空间布局与视觉特征的钓鱼网页检测方法
CN111726460B (zh) 一种基于时空图的诈骗号码识别方法
CN106375288A (zh) 一种中文域名相似度计算方法及仿冒域名检测方法
CN110519128A (zh) 一种基于随机森林的操作系统识别方法
CN101534306A (zh) 一种钓鱼网站的检测方法及装置
CN107145523A (zh) 基于迭代匹配的大型异构知识库对齐方法
WO2015149552A1 (zh) 一种中文域名仿冒攻击的检测方法
CN103823890A (zh) 一种针对特定群体的微博热点话题检测方法及装置
CN104765882B (zh) 一种基于网页特征字符串的互联网网站统计方法
CN111709244A (zh) 一种用于矛盾纠纷事件因果关系识别的深度学习方法
CN107295023A (zh) 一种网络安全漏洞扫描系统及方法
CN109033322A (zh) 一种多维数据的测试方法和装置
CN106156823B (zh) 一种彩色数字序列二维码及其防伪方法
CN109088744A (zh) 电力通信网络异常入侵检测方法、装置、设备及存储介质
CN105119876A (zh) 一种自动生成的域名的检测方法及系统
CN109977131A (zh) 一种房型匹配系统
CN105938547A (zh) 一种纸质水文年鉴数字化方法
CN104021184B (zh) 一种定位方法与系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant