CN108696599A - 一种去除冗余域名的方法、系统和防火墙设备 - Google Patents

一种去除冗余域名的方法、系统和防火墙设备 Download PDF

Info

Publication number
CN108696599A
CN108696599A CN201710225386.XA CN201710225386A CN108696599A CN 108696599 A CN108696599 A CN 108696599A CN 201710225386 A CN201710225386 A CN 201710225386A CN 108696599 A CN108696599 A CN 108696599A
Authority
CN
China
Prior art keywords
domain name
domain
grades
name
inverted order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710225386.XA
Other languages
English (en)
Other versions
CN108696599B (zh
Inventor
滕俊风
崔涛涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xin'an Spring Technology Co Ltd
Original Assignee
Beijing Xin'an Spring Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xin'an Spring Technology Co Ltd filed Critical Beijing Xin'an Spring Technology Co Ltd
Priority to CN201710225386.XA priority Critical patent/CN108696599B/zh
Publication of CN108696599A publication Critical patent/CN108696599A/zh
Application granted granted Critical
Publication of CN108696599B publication Critical patent/CN108696599B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/50Address allocation
    • H04L61/5076Update or notification mechanisms, e.g. DynDNS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/45Network directories; Name-to-address mapping
    • H04L61/4505Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols
    • H04L61/4511Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols using domain name system [DNS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/02Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/02Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
    • H04L63/0227Filtering policies
    • H04L63/0236Filtering by address, protocol, port number or service, e.g. IP-address or URL

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种去除冗余域名的方法、系统和防火墙设备,属于防火墙技术领域。其中,该方法包括:获取域名信息,域名信息包括域名及其分类信息。将域名进行倒序形成倒序域名。遍历倒序域名,当遍历到的域名为N级域名时,若N等于2,将二级域名作为根节点的子节点。若N大于2,将N级域名的分类信息与其上级父节点N‑1级组成的域名的分类信息进行比对。若二者类别一致,则删除该域名信息;否则,保留该域名信息,将N级字段作为所述N‑1级字段的子节点。本发明实现了对冗余域名进行自动化的去除,解决了手动去除冗余效率低且处理效果差的技术问题。

Description

一种去除冗余域名的方法、系统和防火墙设备
技术领域
本发明涉及防火墙技术领域,特别涉及一种去除冗余域名的方法、系统和防火墙设备。
背景技术
域名分类特征库是下一代防火墙设备中的一个模块,拥有数量庞大的域名及其分类信息,有数百万级甚至更多,用于支持域名及其分类信息的查询。是下一代防火墙设备中的一个重要组成部分,当前市场对此功能的需求急剧增大,并呈现进一步发展态势。在现有技术中,域名分类特征库存在一定的信息的冗余情况,例如:www.sina.com和sina.com位于同一域名分类库中,但实际上,www.sina.com和sinsa.com属于同一域名分类,也就是说,在域名分类库中存在冗余。且随着域名分类特征库内域名数量的不断增加,在上述的发展现状的情况下,域名分类特征库中存在大量的无用信息,对下一代防火墙设备造成了一定的资源浪费和性能影响。在对于相同域名的冗余问题可以通过哈希处理去重,但是在处理上述类似不同冗余的问题上,一直没有较为有效的方式。
在实现本发明的过程中,发明人发现至少存在如下问题:
1、基于哈希算法只能去除相同的冗余;
2、通过手动去除冗余的方式效率低,处理效果不佳,且成本高。
发明内容
本发明的目的是实现一种既然去除相同冗余也能同时去除不同冗余的方法和系统,且相对现有技术相比,本发明去除冗余的效率更高,效果更好。
为了实现上述目的,根据本发明实施例的一个方面,本发明实施例提供了一种去除冗余域名的方法,该方法包括:获取域名信息,域名信息包括域名及其分类信息。将域名进行倒序形成倒序域名。遍历倒序域名,当遍历到的域名为N级域名时,若N等于2,将二级域名作为根节点的子节点。若N大于2,将N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对。若二者类别一致,则删除该域名信息;否则,保留该域名信息,将N级字段作为所述N-1级字段的子节点。
进一步地,若N等于2,将域名作为根节点的子节点,二级域名包括一级字段和二级字段,其包括:将一级字段作为根节点的子节点。将二级字段作为一级字段的子节点;或
将二级字段作为一级字段的子节点,形成组合子节点。将组合子节点作为根节点的子节点。
进一步地,将N级域名作为N-1级的分支节点,N级域名包括:一级字段,……,N-n-1级字段,N-n级字段,N级字段,N≥3,n≥0,N≥n,其包括:将倒序后的N-n级字段作为N-n-1级字段的子节点。
进一步地,将域名进行倒序形成倒序域名之后,还包括:按照倒序域名的字符数量从少到多的顺序对倒序域名进行排列,得到排序后的倒序域名。
进一步地,当N=1时,删除域名信息。
根据本发明实施例的另一个方面,本发明实施例提供了与上述方法对应的一种去除冗余域名的系统,该系统包括:获取模块,用于获取域名信息,域名信息包括域名及其分类信息。倒序模块,用于将域名进行倒序形成倒序域名。遍历模块,用于遍历倒序域名,当遍历到的域名为N级域名时,若N等于2,将域名作为根节点的子节点。对比模块,用于当N大于2时,将N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对。删除模块,用于二者类别一致,则删除该域名信息。保留模块,用于二者类别不一致时,保留该域名信息,将N级字段作为N-1级字段的子节点。
进一步地,保留模块还包括:用于将倒序后的一级字段作为根节点的子节点进行保留。用于将倒序后的二级字段作为一级域名的子节点进行保留。将二级字段作为一级字段的子节点,形成组合子节点。将组合子节点作为根节点的子节点进行保留。
进一步地,保留模块还包括:用于将倒序后的N-n级字段作为N-n-1级字段的子节点进行保留。
进一步地,本发明实施例系统还包括:排序模块,用于倒序模块将域名进行倒序域名形成倒序域名后,按照域名的字符数量从少到多的顺序进行排列,形成排序后的倒序域名。
根据本发明实施例的又一方面,本发明实施例还提供了一种防火墙设备,该防火墙设备包括上述去除冗余域名的系统。
本发明实施例的有益效果在于,因为将获取到的域名进行倒序形成倒序域名,遍历倒序域名,当遍历到的域名为N级域名时,若N等于2,将二级域名作为根节点的子节点;若N大于2,将N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对;若二者类别一致,则删除该域名信息;否则,保留该域名信息,将N级字段作为所述N-1级字段的子节点的技术手段,所以克服了在域名分类库中存在冗余的技术问题,进而达到去除相同和/或不同的冗余,且效率高,处理效果好的技术效果。
附图说明
图1是域名分类特征库存在冗余域名的示意图;
图2是本发明第一实施例提供的一种去除冗余域名的方法流程示意图;
图3是当N=2时,本发明第一实施例提供的一种去除冗余域名的方法流程示意图;
图4是当N≥3时,本发明第一实施例提供的一种去除冗余域名的方法流程示意图;
图5是本发明第二实施例提供的一种去除冗余域名的方法流程示意图;
图6是当N=1时,本发明第一、二实施例提供的一种去除冗余域名的方法流程示意图;
图7是本发明实施例提供的遍历并去除冗余域名的流程图;
图8是本发明第三实施例提供的一种去除冗余域名的系统的结构示意图;
图9是本发明第四实施例提供的一种去除冗余域名的系统的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
随着域名分类特征库内域名数量的不断增加,域名分类库中堆积的无用的信息也就越来越多。由于冗余问题的不断攀升,对下一代防火墙设备造成了一定的资源浪费和性能影响。在现有技术中,对于相同域名的冗余问题是通过哈希处理去重,以删除掉相同域名的冗余问题。但在处理不同冗余的问题上,通常是通过手动的方式进行处理,以至于处理效率低,且处理效果不佳,而且成本很高。
请参阅图1,图1是域名分类特征库存在冗余域名的示意图。
如图1所示,在现有技术中,在对图1所示的域名分类特征库进行冗余信息处理时,是通过哈希算法去除相同的冗余信息,例如,www.sina.com和www.sina.com为同一域名,可以通过哈希算法去除其中某一个www.sina.com从而达到去除冗余的技术效果。但对复杂的冗余问题,例如,www.sina.com和sina.com虽也为同一域名,但通过哈希算法并不能将其中的某一个重复域名进行删除,而需要通过人为进行删除其中之一。基于此,发明人提出了本发明的一种去除冗余域名的方法。这种方法既可以有效去除相同的冗余域名信息又能够去除复杂的不同的冗余域名信息的对冗余的域名分类特种库的进行自动化的处理,解决了手动低效且处理效果较差的问题。将此项技术运用到域名分类特征库,将极好的解决冗余问题,减少资源浪费,提高设备性能。
请参阅图2,图2是本发明第一实施例提供的一种去除冗余域名的方法流程示意图。
如图2所示,在本发明第一实施例提供了一种去除冗余域名的方法,该方法包括:
步骤S10,获取域名信息,域名信息包括域名及其分类信息。
步骤S20,将域名进行倒序形成倒序域名。
步骤S30,遍历倒序域名,当遍历到的域名为N级域名时,判断N的大小。
步骤S40,若N等于2,将二级域名作为根节点的子节点。
步骤S50,若N大于2,将N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对。
步骤S60,若二者类别一致,则删除该域名信息。
步骤S70,若二者类别不一致,则保留该域名信息,将N级字段作为N-1级字段的子节点。
需要说明的是,在域名分类特征库中存储有域名和分类信息,域名分类特征库参见下表1:
表1
域名 分类信息
www.sina.com 门户网站
music.sina.com 音乐
sport.sina.com 体育
sina.com 门户网站
taobao.com 购物
shop1.taobao.com 购物
shop2.taobao.com 购物
shop3.taobao.com 购物
在本实施例中,通过步骤S10,获取域名信息,再通过步骤S20,将域名进行倒序形成倒序域名。以上述表1为例,倒序后形成如下表表2所示的倒序域名表2:
表2
域名 分类信息
com.sina.www 门户网站
com.sina.music 音乐
com.sina.sport 体育
com.sina 门户网站
com.taobao 购物
com.taobao.shop1 购物
com.taobao.shop2 购物
com.taobao.shop3 购物
在形成倒序域名后,通过步骤S30遍历倒序域名,当遍历到的域名为N级域名时,判断N的大小。需要说明的是,一个正常的域名以分割点为单位,必然会有两级或者两级以上,也就是说,N的取值范围大于等于2。当N等于2时,如,sina.com是一个正常的域名,以其分割点(即sina与com之间的点)将其进行分割,那么就会分割成两级域名,第一级域名为sina,第二级域名为com。同样,对于sina.com的倒序域名com.sina以分割点为单位进行分割后,com为第一级域名,sina为第二级域名。在本实施例中,当N等于2时,通过步骤S40,将二级域名作为根节点的子节点。即,将com.sina作为root的子节点。
当N大于2时,通过步骤S50将N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对。现以com.sina.music为例进行说明。以分割点进行分割后,形成三级域名,第一级域名为com,第二级域名为com.sina,第三级域名为com.sina.music。将第三级域名对应的分类信息与第二级域名对应的分类信息进行对比。在本例中,第三级域名对应的分类信息为“音乐”,而第二级域名对应的分类信息为“门户网站”,二者明显不一致。再通过步骤S70保留该域名,将3级字段作为2级字段的子节点,即将music作为sina的子节点进行保存。现以com.sina.www为例进行说明另一种情形。与上述方法相同,以分割点为单位进行分割后,也形成三级域名,第一级域名为com,第二级域名为com.sina,第三级域名为com.sina.www。依然将第三级域名对应的分类信息与第二级域名对应的分类信息进行对比。在本例中,第三级域名对应的分类信息为“门户网站”,第二级域名对应的分类信息也为“门户网站”。也就是说,第三级域名与第二级域名相同。则通过步骤S60将该域名信息删除,即将com.sina.www删除。需要说明的是,本实施例给出的只是示范性的说明,并不构成对本发明的限制。
通过上述实施例中给出的技术方案,实现了对冗余域名自动化的去除,解决了现有技术中手动去除冗余效率低且效果差的技术问题。
请参阅图3,图3是当N=2时,本发明第一实施例提供的一种去除冗余域名的方法流程示意图。
如图3所示,若N等于2,将域名作为根节点的子节点,所二级域名包括一级字段和二级字段,其包括:步骤S41:将一级字段作为根节点的子节点。步骤S42:将二级字段作为一级字段的子节点。或步骤S43:将二级字段作为一级字段的子节点,形成组合子节点,将组合子节点作为根节点的子节点。
在本实施例中,当N等于2时,即当域名为2级域名时,包括一级字段和二级字段。现以com.sina为例进行说明,一级字段为com,sina为二级字段。通过步骤S41将一级字段com作为根节点的子节点,即将其作为root节点的子节点。通过步骤S42将二级字段sina作为一级节点的子节点,即将其作为com的子节点。当然也可以通过步骤S43先将二级字段sina作为一级节点com的子节点形成组合子节点,然后将组合子节点作为根节点(root节点)的子节点。
请参阅图4,图4是当N≥3时,本发明第一实施例提供的一种去除冗余域名的方法流程示意图。
如图4所示,将N级域名作为所述N-1级的分支节点,N级域名包括:一级字段,……,N-n-1级字段,N-n级字段,N级字段,N≥3,n≥0,N≥n。具体地,在本实施例中,将倒序后的N-n级字段作为N-n-1级字段的子节点。
当N等于3,n等于1时,现以com.sina.sport为例进行说明。将二级字段作为一级字段的子节点,即将sina作为com的子节点。当N等于3,n等于0时,现以com.sina.music为例进行说明。将三级字段作为二级字段的子节点,即将music作为sina的子节点。
请参阅图5,图5是本发明第二实施例提供的一种去除冗余域名的方法流程示意图。
本实施例是对第一实施例的进一步优化。在本实施例中,在步骤S20将域名进行倒序形成倒序域名之后,增加了一个步骤,即步骤S21按照倒序域名的字符数量从少到多的顺序对所述倒序域名进行排列,得到排序后的倒序域名。通过即步骤S21将倒序域名进行排序后,使得遍历倒序域名列表更为方便,节约了时间。
请参阅图6,图6是当N=1时,本发明第一、二实施例提供的一种去除冗余域名的方法流程示意图。
在上述实施例中,并没有对当N等于1时进行阐述。若为一个正常的域名,N必然会是大于等于2。但不排除出现当N等于1时的情况,所以,在本实施例中,给出了当N等于1时的解决方法。具体为:当N=1时,删除该域名信息。
通过上述实施例,本发明同时实现了对域名的去冗余操作,解决了手动去冗余耗时耗力且效果差的问题,既实现了哈希去重的效果,又进一步解决了冗余问题。
请参阅图7,图7是本发明实施例提供的遍历并去除冗余域名的流程图。
为加深对本发明的理解,发明人结合图1至图7及上述文字做出更为具体贴切的如下说明(以表2中的域名分类特征库为例)。
当遍历到的倒序域名为二级域名时,例如:com.sina,com.sina以分割点分割后成为两个字段,分别为:com和sina。将com作为root的根节点的子节点进行保留,以sina作为com的子节点进行保留。当遍历到倒序域名com.sina.www时,由于com.sina.www的分类信息和com.sina的分类信息相同,皆为“门户网站”,则直接将com.sina.www对应的域名信息直接进行删除,即图7中虚线框内,并在相应域名信息下画×的部分。当遍历到倒序域名为com.sina.music时,由于com.sina.music的域名分类信息为“音乐”,而com.sina的域名分类信息为“门户网站”,即二者为不同的域名信息,则将music作为sina的子节点进行保留。同理,当遍历到倒序域名com.taobao时,将com作为root根节点的子节点进行保留,将taobao作为com的子节点进行保留。而当遍历到倒序域名com.taobao.shop1时,由于com.taobao.shop1的域名分类信息与com.taobao的域名分类信息相同,皆为“购物”,所以将com.taobao.shop1域名信息删除,即图7中虚线框内,并在相应域名信息下画×的部分。需要说明的是,由于是对倒序后的域名进行遍历,即对倒序前的域名而言,是从最后一级开始遍历,即从最深层遍历至次深层,以此类推。将表2中所有的域名信息进行上述步骤后,得到表3中所述的域名分类特征库:
表3
域名 分类信息
music.sina.com 音乐
sport.sina.com 体育
sina.com 门户网站
taobao.com 购物
在本实施例中,通过比对下级子节点的域名分类信息与其上级父节点的域名分类信息,既能够删除相同的冗余域名又能够删除复杂的冗余域名。
以上只是为了方便理解而给出的示范性的说明,而不构成对本发明的限制。
根据本发明的另一方面,本发明还提供了与上述方法相对应的一种去除冗余域名的系统。
请参阅图8,图8是本发明第三实施例提供的一种去除冗余域名的系统的结构示意图。
如图8所示,该系统包括:获取模块10,用于获取域名信息,域名信息包括域名及其分类信息。倒序模块20,用于将域名进行倒序形成倒序域名。遍历模块30,用于遍历倒序域名,当遍历到的域名为N级域名时,若N等于2,将所述域名作为根节点的子节点。对比模块40,用于当N大于2时,将N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对。删除模块50,用于二者类别一致,则删除该域名信息。保留模块60,用于二者类别不一致时,保留该域名信息,将N级字段作为所述N-1级字段的子节点。
在本实施例中,通过对比该域名N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行对比。当比对结果一致时,说明两个域名信息为同一域名信息,则将该域名信息进行删除。当比对结果不一致时,说明该域名信息为另一域名信息,则将该域名信息的N级字段作为N-1级字段的子节点进行保留。本实施例通过分级比较,既能够删除相同的冗余域名又能够删除复杂的不相同的冗余域名。
具体地,保留模块60还包括:用于将倒序后的一级字段作为根节点的子节点进行保留。用于将倒序后的二级字段作为一级域名的子节点进行保留。将二级字段作为一级字段的子节点,形成组合子节点,将组合子节点作为根节点的子节点进行保留。
现以com.tao.shop为例进行说明。保留模块60将shop作为tao的子节点进行保留,tao作为com的子节点进行保留,将com作为根节点(即root节点)的子节点进行保留。需要说明的是,也可以将shop作为tao的子节点,形成组合子节点,然后将组成形成的子节点作为根节点(即root节点)进行保留。
具体地,保留模块60还包括:用于将倒序后的N-n级字段作为N-n-1级字段的子节点进行保留。也就是说,但N等于4,n等于1时,将三级字段作为二级的子节点进行保留。
请参阅图9,图9是本发明第四实施例提供的一种去除冗余域名的系统的结构示意图。
如图9所示,本实施例是对本发明的一种优化实施方式,在倒序模块20将域名进行倒序域名形成倒序域名后增加了一个排序模块21,排序模块21用于按照域名的字符数量从少到多的顺序进行排列,形成排序后的倒序域名。通过排序模块21将倒序域名进行排序后,使得遍历倒序域名列表时更为方便,节约了成本和时间。
根据本发明的另一方面,本发明还提供了一种防火墙设备,具体地,该防火墙包括上述的去除冗余域名的系统。
本发明通过:步骤S10,获取域名信息;步骤S20,将域名进行倒序形成倒序域名;步骤S30,遍历倒序域名,当遍历到的域名为N级域名时,判断N的大小;步骤S40,若N等于2,将二级域名作为根节点的子节点;步骤S50,若N大于2,将N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对;步骤S60,若二者类别一致,则删除该域名信息;步骤S70,若二者类别不一致,则保留该域名信息,将N级字段作为N-1级字段的子节点的技术方案,不仅可以实现相同冗余域名的去除,而且还对复杂的冗余域名进行去除,相对于手动处理更为便捷迅速,在提高了处理效率的同时增加了去除冗余域名的质量。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (10)

1.一种去除冗余域名的方法,其特征在于,所述方法包括:
获取域名信息,所述域名信息包括域名及其分类信息;
将所述域名进行倒序形成倒序域名;
遍历所述倒序域名,当遍历到的域名为N级域名时,若N等于2,将所述二级域名作为根节点的子节点;
若N大于2,将所述N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对;
若二者类别一致,则删除该域名信息;否则,保留该域名信息,将所述N级字段作为所述N-1级字段的子节点。
2.根据权利要求1所述的方法,其特征在于,若N等于2,将所述域名作为根节点的子节点,所述二级域名包括一级字段和二级字段,其包括:
将一级字段作为所述根节点的子节点;
将二级字段作为所述一级字段的子节点;或
将二级字段作为所述一级字段的子节点,形成组合子节点;
将组合子节点作为所述根节点的子节点。
3.根据权利要求1或2所述的方法,其特征在于,将所述N级域名作为所述N-1级的分支节点,所述N级域名包括:一级字段,……,N-n-1级字段,N-n级字段,N级字段,N≥3,n≥0,N≥n,其包括:
将倒序后的N-n级字段作为N-n-1级字段的子节点。
4.根据权利要求1所述的方法,其特征在于,将域名进行倒序形成倒序域名之后,还包括:
按照所述倒序域名的字符数量从少到多的顺序对所述倒序域名进行排列,得到排序后的倒序域名。
5.根据权利要求1所述的方法,其特征在于,
当N=1时,删除所述域名信息。
6.一种去除冗余域名的系统,其特征在于,所述系统包括:
获取模块,用于获取域名信息,所述域名信息包括域名及其分类信息;
倒序模块,用于将所述域名进行倒序形成倒序域名;
遍历模块,用于遍历所述倒序域名,当遍历到的所述域名为N级域名时,若N等于2,将所述域名作为根节点的子节点;
对比模块,用于当N大于2时,将N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对;
删除模块,用于二者类别一致,则删除该域名信息;
保留模块,用于二者类别不一致时,保留该域名信息,将所述N级字段作为所述N-1级字段的子节点。
7.根据权利要求6所述的系统,其特征在于,保留模块还包括:
用于将倒序后的一级字段作为所述根节点的子节点进行保留;
用于将倒序后的二级字段作为一级域名的子节点进行保留;
将二级字段作为所述一级字段的子节点,形成组合子节点;
将组合子节点作为所述根节点的子节点进行保留。
8.根据权利要求6或7所述的系统,其特征在于,保留模块还包括:
用于将倒序后的N-n级字段作为N-n-1级字段的子节点进行保留。
9.根据权利要求6所述的系统,其特征在于,该系统还包括:
排序模块,用于倒序模块将所述域名进行倒序域名形成倒序域名后,按照所述域名的字符数量从少到多的顺序进行排列,形成排序后的倒序域名。
10.一种防火墙设备,其特征在于,包括权利要求6-9中任一项所述的去除冗余域名的系统。
CN201710225386.XA 2017-04-07 2017-04-07 域名分类特征库中去除冗余域名的方法、系统、防火墙设备 Active CN108696599B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710225386.XA CN108696599B (zh) 2017-04-07 2017-04-07 域名分类特征库中去除冗余域名的方法、系统、防火墙设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710225386.XA CN108696599B (zh) 2017-04-07 2017-04-07 域名分类特征库中去除冗余域名的方法、系统、防火墙设备

Publications (2)

Publication Number Publication Date
CN108696599A true CN108696599A (zh) 2018-10-23
CN108696599B CN108696599B (zh) 2021-02-19

Family

ID=63842977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710225386.XA Active CN108696599B (zh) 2017-04-07 2017-04-07 域名分类特征库中去除冗余域名的方法、系统、防火墙设备

Country Status (1)

Country Link
CN (1) CN108696599B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109542854A (zh) * 2018-11-14 2019-03-29 网易(杭州)网络有限公司 数据压缩方法、装置、介质及电子设备
CN112506877A (zh) * 2020-12-03 2021-03-16 深圳市木浪云数据有限公司 基于重删域的数据重删方法、装置、系统及存储设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103399912A (zh) * 2013-07-30 2013-11-20 腾讯科技(深圳)有限公司 一种钓鱼网页聚类方法和装置
US8621556B1 (en) * 2011-05-25 2013-12-31 Palo Alto Networks, Inc. Dynamic resolution of fully qualified domain name (FQDN) address objects in policy definitions
CN104145472A (zh) * 2012-02-29 2014-11-12 瑞典爱立信有限公司 存储数据记录的方法和装置
CN104750849A (zh) * 2015-04-13 2015-07-01 北京京东尚科信息技术有限公司 用于维护基于树形结构的目录关系的方法和系统
CN104750704A (zh) * 2013-12-26 2015-07-01 中国移动通信集团河南有限公司 一种网页url地址分类识别方法及装置
CN105611000A (zh) * 2016-03-31 2016-05-25 中国互联网络信息中心 一种域名服务器的dns域名快速检索方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8621556B1 (en) * 2011-05-25 2013-12-31 Palo Alto Networks, Inc. Dynamic resolution of fully qualified domain name (FQDN) address objects in policy definitions
CN104145472A (zh) * 2012-02-29 2014-11-12 瑞典爱立信有限公司 存储数据记录的方法和装置
CN103399912A (zh) * 2013-07-30 2013-11-20 腾讯科技(深圳)有限公司 一种钓鱼网页聚类方法和装置
CN104750704A (zh) * 2013-12-26 2015-07-01 中国移动通信集团河南有限公司 一种网页url地址分类识别方法及装置
CN104750849A (zh) * 2015-04-13 2015-07-01 北京京东尚科信息技术有限公司 用于维护基于树形结构的目录关系的方法和系统
CN105611000A (zh) * 2016-03-31 2016-05-25 中国互联网络信息中心 一种域名服务器的dns域名快速检索方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109542854A (zh) * 2018-11-14 2019-03-29 网易(杭州)网络有限公司 数据压缩方法、装置、介质及电子设备
CN109542854B (zh) * 2018-11-14 2020-11-24 网易(杭州)网络有限公司 数据压缩方法、装置、介质及电子设备
CN112506877A (zh) * 2020-12-03 2021-03-16 深圳市木浪云数据有限公司 基于重删域的数据重删方法、装置、系统及存储设备
CN112506877B (zh) * 2020-12-03 2024-04-19 深圳市木浪云科技有限公司 基于重删域的数据重删方法、装置、系统及存储设备

Also Published As

Publication number Publication date
CN108696599B (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
US20140214796A1 (en) Efficient join with one or more large dimension tables
US20150356444A1 (en) Method and system of discovering and analyzing structures of user groups in microblog
CN108197296B (zh) 基于Elasticsearch索引的数据存储方法
CN109325032B (zh) 一种索引数据存储及检索方法、装置及存储介质
CN109635276B (zh) 一种信息匹配方法及终端
CN103678583B (zh) 结构化数据比较的方法及系统
CN102929906B (zh) 基于内容特征和主题特征的文本分组聚类方法
CN106780579B (zh) 一种超大规模图像特征点匹配方法及系统
CN108696599A (zh) 一种去除冗余域名的方法、系统和防火墙设备
CN104217011B (zh) HBase二级索引表的查询方法和装置
CN104794189A (zh) 一种图像筛选方法及筛选系统
CN106599091A (zh) 基于键值存储的rdf图结构存储和索引方法
CN106844089A (zh) 一种用于恢复树形数据存储的方法与设备
CN105260446A (zh) 一种数据查询系统及方法
CN105302869A (zh) 一种HBase二级索引查询和存储系统及其查询方法
CN110162716B (zh) 一种基于社区检索的影响力社区搜索方法和系统
CN116521956A (zh) 一种图数据库查询方法、装置、电子设备及存储介质
CN109218211A (zh) 数据流的控制策略中阈值的调整方法、装置和设备
CN104699815A (zh) 数据处理方法和系统
CN110505322A (zh) 一种ip地址段查找方法及装置
CN107239568B (zh) 分布式索引实现方法及装置
US9846713B2 (en) Index-only multi-index access
CN107918675A (zh) 一种搜索方法及搜索系统
CN107315829A (zh) 一种实时数据库中基于规则集的快速压缩方法
CN110471764A (zh) 一种内存清理的处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method, system and firewall equipment for removing redundant domain names from domain name classification feature library

Effective date of registration: 20220929

Granted publication date: 20210219

Pledgee: Haidian Beijing science and technology enterprise financing Company limited by guarantee

Pledgor: BEIJING SUNYAINFO TECHNOLOGY CO.,LTD.

Registration number: Y2022110000241

PE01 Entry into force of the registration of the contract for pledge of patent right