CN108696599B - 域名分类特征库中去除冗余域名的方法、系统、防火墙设备 - Google Patents
域名分类特征库中去除冗余域名的方法、系统、防火墙设备 Download PDFInfo
- Publication number
- CN108696599B CN108696599B CN201710225386.XA CN201710225386A CN108696599B CN 108696599 B CN108696599 B CN 108696599B CN 201710225386 A CN201710225386 A CN 201710225386A CN 108696599 B CN108696599 B CN 108696599B
- Authority
- CN
- China
- Prior art keywords
- domain name
- level
- domain
- child node
- field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L61/00—Network arrangements, protocols or services for addressing or naming
- H04L61/50—Address allocation
- H04L61/5076—Update or notification mechanisms, e.g. DynDNS
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L61/00—Network arrangements, protocols or services for addressing or naming
- H04L61/45—Network directories; Name-to-address mapping
- H04L61/4505—Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols
- H04L61/4511—Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols using domain name system [DNS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/02—Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/02—Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
- H04L63/0227—Filtering policies
- H04L63/0236—Filtering by address, protocol, port number or service, e.g. IP-address or URL
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种域名分类特征库中去除冗余域名的方法、系统和防火墙设备,属于防火墙技术领域。其中,该方法包括:获取域名信息,域名信息包括域名及其分类信息。将域名进行倒序形成倒序域名。遍历倒序域名,当遍历到的域名为N级域名时,若N等于2,将二级域名作为根节点的子节点。若N大于2,将N级域名的分类信息与其上级父节点N‑1级组成的域名的分类信息进行比对。若二者类别一致,则删除该域名信息;否则,保留该域名信息,将N级字段作为所述N‑1级字段的子节点。本发明实现了对域名分类特征库中冗余域名进行自动化的去除,解决了手动去除冗余效率低且处理效果差的技术问题。
Description
技术领域
本发明涉及防火墙技术领域,特别涉及一种域名分类特征库中去除冗余域名的方法、系统和防火墙设备。
背景技术
域名分类特征库是下一代防火墙设备中的一个模块,拥有数量庞大的域名及其分类信息,有数百万级甚至更多,用于支持域名及其分类信息的查询。是下一代防火墙设备中的一个重要组成部分,当前市场对此功能的需求急剧增大,并呈现进一步发展态势。在现有技术中,域名分类特征库存在一定的信息的冗余情况,例如:www.sina.com和sina.com位于同一域名分类库中,但实际上,www.sina.com和sina.com属于同一域名分类,也就是说,在域名分类库中存在冗余。且随着域名分类特征库内域名数量的不断增加,在上述的发展现状的情况下,域名分类特征库中存在大量的无用信息,对下一代防火墙设备造成了一定的资源浪费和性能影响。在对于相同域名的冗余问题可以通过哈希处理去重,但是在处理上述类似不同冗余的问题上,一直没有较为有效的方式。
在实现本发明的过程中,发明人发现至少存在如下问题:
1、基于哈希算法只能去除相同的冗余;
2、通过手动去除冗余的方式效率低,处理效果不佳,且成本高。
发明内容
本发明的目的是实现一种既然去除相同冗余也能同时去除不同冗余的方法和系统,且相对现有技术相比,本发明去除冗余的效率更高,效果更好。
为了实现上述目的,根据本发明实施例的一个方面,本发明实施例提供了一种域名分类特征库中去除冗余域名的方法,该方法包括:获取域名信息,域名信息包括域名及其分类信息。将域名进行倒序形成倒序域名。遍历倒序域名,当遍历到的域名为N级域名时,若N等于2,将二级域名作为根节点的子节点。若N大于2,将N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对。若二者类别一致,则删除该域名信息;否则,保留该域名信息,将N级字段作为所述N-1级字段的子节点。
进一步地,若N等于2,将域名作为根节点的子节点,二级域名包括一级字段和二级字段,其包括:将一级字段作为根节点的子节点。将二级字段作为一级字段的子节点;或
将二级字段作为一级字段的子节点,形成组合子节点。将组合子节点作为根节点的子节点。
进一步地,将N级域名作为N-1级的分支节点,N级域名包括:一级字段,……,N-n-1级字段,N-n级字段,N级字段,N≥3,n≥0,N≥n,其包括:将倒序后的N-n级字段作为N-n-1级字段的子节点。
进一步地,将域名进行倒序形成倒序域名之后,还包括:按照倒序域名的字符数量从少到多的顺序对倒序域名进行排列,得到排序后的倒序域名。
进一步地,当N=1时,删除域名信息。
根据本发明实施例的另一个方面,本发明实施例提供了与上述方法对应的一种域名分类特征库中去除冗余域名的系统,该系统包括:获取模块,用于获取域名信息,域名信息包括域名及其分类信息。倒序模块,用于将域名进行倒序形成倒序域名。遍历模块,用于遍历倒序域名,当遍历到的域名为N级域名时,若N等于2,将域名作为根节点的子节点。对比模块,用于当N大于2时,将N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对。删除模块,用于二者类别一致,则删除该域名信息。保留模块,用于二者类别不一致时,保留该域名信息,将N级字段作为N-1级字段的子节点。
进一步地,保留模块还包括:用于将倒序后的一级字段作为根节点的子节点进行保留。用于将倒序后的二级字段作为一级域名的子节点进行保留。将二级字段作为一级字段的子节点,形成组合子节点。将组合子节点作为根节点的子节点进行保留。
进一步地,保留模块还包括:用于将倒序后的N-n级字段作为N-n-1级字段的子节点进行保留。
进一步地,本发明实施例系统还包括:排序模块,用于倒序模块将域名进行倒序域名形成倒序域名后,按照域名的字符数量从少到多的顺序进行排列,形成排序后的倒序域名。
根据本发明实施例的又一方面,本发明实施例还提供了一种防火墙设备,该防火墙设备包括上述域名分类特征库中去除冗余域名的系统。
本发明实施例的有益效果在于,因为将获取到的域名进行倒序形成倒序域名,遍历倒序域名,当遍历到的域名为N级域名时,若N等于2,将二级域名作为根节点的子节点;若N大于2,将N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对;若二者类别一致,则删除该域名信息;否则,保留该域名信息,将N级字段作为所述N-1级字段的子节点的技术手段,所以克服了在域名分类库中存在冗余的技术问题,进而达到去除相同和/或不同的冗余,且效率高,处理效果好的技术效果。
附图说明
图1是域名分类特征库存在冗余域名的示意图;
图2是本发明第一实施例提供的一种域名分类特征库中去除冗余域名的方法流程示意图;
图3是当N=2时,本发明第一实施例提供的一种域名分类特征库中去除冗余域名的方法流程示意图;
图4是当N≥3时,本发明第一实施例提供的一种域名分类特征库中去除冗余域名的方法流程示意图;
图5是本发明第二实施例提供的一种域名分类特征库中去除冗余域名的方法流程示意图;
图6是当N=1时,本发明第一、二实施例提供的一种域名分类特征库中去除冗余域名的方法流程示意图;
图7是本发明实施例提供的遍历并去除冗余域名的流程图;
图8是本发明第三实施例提供的一种域名分类特征库中去除冗余域名的系统的结构示意图;
图9是本发明第四实施例提供的一种域名分类特征库中去除冗余域名的系统的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
随着域名分类特征库内域名数量的不断增加,域名分类库中堆积的无用的信息也就越来越多。由于冗余问题的不断攀升,对下一代防火墙设备造成了一定的资源浪费和性能影响。在现有技术中,对于相同域名的冗余问题是通过哈希处理去重,以删除掉相同域名的冗余问题。但在处理不同冗余的问题上,通常是通过手动的方式进行处理,以至于处理效率低,且处理效果不佳,而且成本很高。
请参阅图1,图1是域名分类特征库存在冗余域名的示意图。
如图1所示,在现有技术中,在对图1所示的域名分类特征库进行冗余信息处理时,是通过哈希算法去除相同的冗余信息,例如,www.sina.com和www.sina.com为同一域名,可以通过哈希算法去除其中某一个www.sina.com从而达到去除冗余的技术效果。但对复杂的冗余问题,例如,www.sina.com和sina.com虽也为同一域名,但通过哈希算法并不能将其中的某一个重复域名进行删除,而需要通过人为进行删除其中之一。基于此,发明人提出了本发明的一种域名分类特征库中去除冗余域名的方法。这种方法既可以有效去除相同的冗余域名信息又能够去除复杂的不同的冗余域名信息的对冗余的域名分类特种库的进行自动化的处理,解决了手动低效且处理效果较差的问题。将此项技术运用到域名分类特征库,将极好的解决冗余问题,减少资源浪费,提高设备性能。
请参阅图2,图2是本发明第一实施例提供的一种域名分类特征库中去除冗余域名的方法流程示意图。
如图2所示,在本发明第一实施例提供了一种域名分类特征库中去除冗余域名的方法,该方法包括:
步骤S10,获取域名信息,域名信息包括域名及其分类信息。
步骤S20,将域名进行倒序形成倒序域名。
步骤S30,遍历倒序域名,当遍历到的域名为N级域名时,判断N的大小。
步骤S40,若N等于2,将二级域名作为根节点的子节点。
步骤S50,若N大于2,将N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对。
步骤S60,若二者类别一致,则删除该域名信息。
步骤S70,若二者类别不一致,则保留该域名信息,将N级字段作为N-1级字段的子节点。
需要说明的是,在域名分类特征库中存储有域名和分类信息,域名分类特征库参见下表1:
表1
在本实施例中,通过步骤S10,获取域名信息,再通过步骤S20,将域名进行倒序形成倒序域名。以上述表1为例,倒序后形成如下表表2所示的倒序域名表2:
表2
域名 | 分类信息 |
com.sina.www | 门户网站 |
com.sina.music | 音乐 |
com.sina.sport | 体育 |
com.sina | 门户网站 |
com.taobao | 购物 |
com.taobao.shop1 | 购物 |
com.taobao.shop2 | 购物 |
com.taobao.shop3 | 购物 |
在形成倒序域名后,通过步骤S30遍历倒序域名,当遍历到的域名为N级域名时,判断N的大小。需要说明的是,一个正常的域名以分割点为单位,必然会有两级或者两级以上,也就是说,N的取值范围大于等于2。当N等于2时,如,sina.com是一个正常的域名,以其分割点(即sina与com之间的点)将其进行分割,那么就会分割成两级域名,第一级域名为sina,第二级域名为com。同样,对于sina.com的倒序域名com.sina以分割点为单位进行分割后,com为第一级域名,sina为第二级域名。在本实施例中,当N等于2时,通过步骤S40,将二级域名作为根节点的子节点。即,将com.sina作为root的子节点。
当N大于2时,通过步骤S50将N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对。现以com.sina.music为例进行说明。以分割点进行分割后,形成三级域名,第一级域名为com,第二级域名为com.sina,第三级域名为com.sina.music。将第三级域名对应的分类信息与第二级域名对应的分类信息进行对比。在本例中,第三级域名对应的分类信息为“音乐”,而第二级域名对应的分类信息为“门户网站”,二者明显不一致。再通过步骤S70保留该域名,将3级字段作为2级字段的子节点,即将music作为sina的子节点进行保存。现以com.sina.www为例进行说明另一种情形。与上述方法相同,以分割点为单位进行分割后,也形成三级域名,第一级域名为com,第二级域名为com.sina,第三级域名为com.sina.www。依然将第三级域名对应的分类信息与第二级域名对应的分类信息进行对比。在本例中,第三级域名对应的分类信息为“门户网站”,第二级域名对应的分类信息也为“门户网站”。也就是说,第三级域名与第二级域名相同。则通过步骤S60将该域名信息删除,即将com.sina.www删除。需要说明的是,本实施例给出的只是示范性的说明,并不构成对本发明的限制。
通过上述实施例中给出的技术方案,实现了对域名分类特征库中冗余域名自动化的去除,解决了现有技术中手动域名分类特征库中去除冗余效率低且效果差的技术问题。
请参阅图3,图3是当N=2时,本发明第一实施例提供的一种域名分类特征库中去除冗余域名的方法流程示意图。
如图3所示,若N等于2,将域名作为根节点的子节点,所二级域名包括一级字段和二级字段,其包括:步骤S41:将一级字段作为根节点的子节点。步骤S42:将二级字段作为一级字段的子节点。或步骤S43:将二级字段作为一级字段的子节点,形成组合子节点,将组合子节点作为根节点的子节点。
在本实施例中,当N等于2时,即当域名为2级域名时,包括一级字段和二级字段。现以com.sina为例进行说明,一级字段为com,sina为二级字段。通过步骤S41将一级字段com作为根节点的子节点,即将其作为root节点的子节点。通过步骤S42将二级字段sina作为一级节点的子节点,即将其作为com的子节点。当然也可以通过步骤S43先将二级字段sina作为一级节点com的子节点形成组合子节点,然后将组合子节点作为根节点(root节点)的子节点。
请参阅图4,图4是当N≥3时,本发明第一实施例提供的一种域名分类特征库中去除冗余域名的方法流程示意图。
如图4所示,将N级域名作为所述N-1级的分支节点,N级域名包括:一级字段,……,N-n-1级字段,N-n级字段,N级字段,N≥3,n≥0,N≥n。具体地,在本实施例中,将倒序后的N-n级字段作为N-n-1级字段的子节点。
当N等于3,n等于1时,现以com.sina.sport为例进行说明。将二级字段作为一级字段的子节点,即将sina作为com的子节点。当N等于3,n等于0时,现以com.sina.music为例进行说明。将三级字段作为二级字段的子节点,即将music作为sina的子节点。
请参阅图5,图5是本发明第二实施例提供的一种域名分类特征库中去除冗余域名的方法流程示意图。
本实施例是对第一实施例的进一步优化。在本实施例中,在步骤S20将域名进行倒序形成倒序域名之后,增加了一个步骤,即步骤S21按照倒序域名的字符数量从少到多的顺序对所述倒序域名进行排列,得到排序后的倒序域名。通过即步骤S21将倒序域名进行排序后,使得遍历倒序域名列表更为方便,节约了时间。
请参阅图6,图6是当N=1时,本发明第一、二实施例提供的一种域名分类特征库中去除冗余域名的方法流程示意图。
在上述实施例中,并没有对当N等于1时进行阐述。若为一个正常的域名,N必然会是大于等于2。但不排除出现当N等于1时的情况,所以,在本实施例中,给出了当N等于1时的解决方法。具体为:当N=1时,删除该域名信息。
通过上述实施例,本发明同时实现了对域名的去冗余操作,解决了手动去冗余耗时耗力且效果差的问题,既实现了哈希去重的效果,又进一步解决了冗余问题。
请参阅图7,图7是本发明实施例提供的遍历并去除冗余域名的流程图。
为加深对本发明的理解,发明人结合图1至图7及上述文字做出更为具体贴切的如下说明(以表2中的域名分类特征库为例)。
当遍历到的倒序域名为二级域名时,例如:com.sina,com.sina以分割点分割后成为两个字段,分别为:com和sina。将com作为root的根节点的子节点进行保留,以sina作为com的子节点进行保留。当遍历到倒序域名com.sina.www时,由于com.sina.www的分类信息和com.sina的分类信息相同,皆为“门户网站”,则直接将com.sina.www对应的域名信息直接进行删除,即图7中虚线框内,并在相应域名信息下画×的部分。当遍历到倒序域名为com.sina.music时,由于com.sina.music的域名分类信息为“音乐”,而com.sina的域名分类信息为“门户网站”,即二者为不同的域名信息,则将music作为sina的子节点进行保留。同理,当遍历到倒序域名com.taobao时,将com作为root根节点的子节点进行保留,将taobao作为com的子节点进行保留。而当遍历到倒序域名com.taobao.shop1时,由于com.taobao.shop1的域名分类信息与com.taobao的域名分类信息相同,皆为“购物”,所以将com.taobao.shop1域名信息删除,即图7中虚线框内,并在相应域名信息下画×的部分。需要说明的是,由于是对倒序后的域名进行遍历,即对倒序前的域名而言,是从最后一级开始遍历,即从最深层遍历至次深层,以此类推。将表2中所有的域名信息进行上述步骤后,得到表3中所述的域名分类特征库:
表3
在本实施例中,通过比对下级子节点的域名分类信息与其上级父节点的域名分类信息,既能够删除相同的冗余域名又能够删除复杂的冗余域名。
以上只是为了方便理解而给出的示范性的说明,而不构成对本发明的限制。
根据本发明的另一方面,本发明还提供了与上述方法相对应的一种域名分类特征库中去除冗余域名的系统。
请参阅图8,图8是本发明第三实施例提供的一种域名分类特征库中去除冗余域名的系统的结构示意图。
如图8所示,该系统包括:获取模块10,用于获取域名信息,域名信息包括域名及其分类信息。倒序模块20,用于将域名进行倒序形成倒序域名。遍历模块30,用于遍历倒序域名,当遍历到的域名为N级域名时,若N等于2,将所述域名作为根节点的子节点。对比模块40,用于当N大于2时,将N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对。删除模块50,用于二者类别一致,则删除该域名信息。保留模块60,用于二者类别不一致时,保留该域名信息,将N级字段作为所述N-1级字段的子节点。
在本实施例中,通过对比该域名N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行对比。当比对结果一致时,说明两个域名信息为同一域名信息,则将该域名信息进行删除。当比对结果不一致时,说明该域名信息为另一域名信息,则将该域名信息的N级字段作为N-1级字段的子节点进行保留。本实施例通过分级比较,既能够删除相同的冗余域名又能够删除复杂的不相同的冗余域名。
具体地,保留模块60还包括:用于将倒序后的一级字段作为根节点的子节点进行保留。用于将倒序后的二级字段作为一级域名的子节点进行保留。将二级字段作为一级字段的子节点,形成组合子节点,将组合子节点作为根节点的子节点进行保留。
现以com.tao.shop为例进行说明。保留模块60将shop作为tao的子节点进行保留,tao作为com的子节点进行保留,将com作为根节点(即root节点)的子节点进行保留。需要说明的是,也可以将shop作为tao的子节点,形成组合子节点,然后将组成形成的子节点作为根节点(即root节点)进行保留。
具体地,保留模块60还包括:用于将倒序后的N-n级字段作为N-n-1级字段的子节点进行保留。也就是说,但N等于4,n等于1时,将三级字段作为二级的子节点进行保留。
请参阅图9,图9是本发明第四实施例提供的一种域名分类特征库中去除冗余域名的系统的结构示意图。
如图9所示,本实施例是对本发明的一种优化实施方式,在倒序模块20将域名进行倒序域名形成倒序域名后增加了一个排序模块21,排序模块21用于按照域名的字符数量从少到多的顺序进行排列,形成排序后的倒序域名。通过排序模块21将倒序域名进行排序后,使得遍历倒序域名列表时更为方便,节约了成本和时间。
根据本发明的另一方面,本发明还提供了一种防火墙设备,具体地,该防火墙包括上述的域名分类特征库中去除冗余域名的系统。
本发明通过:步骤S10,获取域名信息;步骤S20,将域名进行倒序形成倒序域名;步骤S30,遍历倒序域名,当遍历到的域名为N级域名时,判断N的大小;步骤S40,若N等于2,将二级域名作为根节点的子节点;步骤S50,若N大于2,将N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对;步骤S60,若二者类别一致,则删除该域名信息;步骤S70,若二者类别不一致,则保留该域名信息,将N级字段作为N-1级字段的子节点的技术方案,不仅可以实现相同冗余域名的去除,而且还对复杂的冗余域名进行去除,相对于手动处理更为便捷迅速,在提高了处理效率的同时增加了去除冗余域名的质量。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
Claims (10)
1.一种域名分类特征库中去除冗余域名的方法,其特征在于,所述方法包括:
获取域名信息,所述域名信息包括域名及其分类信息;
将所述域名进行倒序形成倒序域名;
遍历所述倒序域名,当遍历到的域名为N级域名时,若N等于2,将所述二级域名作为根节点的子节点;
若N大于2,将所述N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对;
若二者类别一致,则删除该域名信息;否则,保留该域名信息,将所述N级字段作为所述N-1级字段的子节点。
2.根据权利要求1所述的方法,其特征在于,若N等于2,将所述域名作为根节点的子节点,所述二级域名包括一级字段和二级字段,其包括:
将一级字段作为所述根节点的子节点;
将二级字段作为所述一级字段的子节点;或
将二级字段作为所述一级字段的子节点,形成组合子节点;
将组合子节点作为所述根节点的子节点。
3.根据权利要求1或2所述的方法,其特征在于,将所述N级域名作为所述N-1级的分支节点,所述N级域名包括:一级字段,……,N-n-1级字段,N-n级字段,N级字段,N≥3,n≥0,N≥n,其包括:
将倒序后的N-n级字段作为N-n-1级字段的子节点。
4.根据权利要求1所述的方法,其特征在于,将域名进行倒序形成倒序域名之后,还包括:
按照所述倒序域名的字符数量从少到多的顺序对所述倒序域名进行排列,得到排序后的倒序域名。
5.根据权利要求1所述的方法,其特征在于,
当N=1时,删除所述域名信息。
6.一种域名分类特征库中去除冗余域名的系统,其特征在于,所述系统包括:
获取模块,用于获取域名信息,所述域名信息包括域名及其分类信息;
倒序模块,用于将所述域名进行倒序形成倒序域名;
遍历模块,用于遍历所述倒序域名,当遍历到的所述域名为N级域名时,若N等于2,将所述域名作为根节点的子节点;
对比模块,用于当N大于2时,将N级域名的分类信息与其上级父节点N-1级组成的域名的分类信息进行比对;
删除模块,用于二者类别一致,则删除该域名信息;
保留模块,用于二者类别不一致时,保留该域名信息,将所述N级字段作为所述N-1级字段的子节点。
7.根据权利要求6所述的系统,其特征在于,保留模块还包括:
用于将倒序后的一级字段作为所述根节点的子节点进行保留;
用于将倒序后的二级字段作为一级域名的子节点进行保留;
将二级字段作为所述一级字段的子节点,形成组合子节点;
将组合子节点作为所述根节点的子节点进行保留。
8.根据权利要求6或7所述的系统,其特征在于,保留模块还包括:
用于将倒序后的N-n级字段作为N-n-1级字段的子节点进行保留。
9.根据权利要求6所述的系统,其特征在于,该系统还包括:
排序模块,用于倒序模块将所述域名进行倒序域名形成倒序域名后,按照所述域名的字符数量从少到多的顺序进行排列,形成排序后的倒序域名。
10.一种防火墙设备,其特征在于,包括权利要求6-9中任一项所述的域名分类特征库中去除冗余域名的系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710225386.XA CN108696599B (zh) | 2017-04-07 | 2017-04-07 | 域名分类特征库中去除冗余域名的方法、系统、防火墙设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710225386.XA CN108696599B (zh) | 2017-04-07 | 2017-04-07 | 域名分类特征库中去除冗余域名的方法、系统、防火墙设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108696599A CN108696599A (zh) | 2018-10-23 |
CN108696599B true CN108696599B (zh) | 2021-02-19 |
Family
ID=63842977
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710225386.XA Active CN108696599B (zh) | 2017-04-07 | 2017-04-07 | 域名分类特征库中去除冗余域名的方法、系统、防火墙设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108696599B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109542854B (zh) * | 2018-11-14 | 2020-11-24 | 网易(杭州)网络有限公司 | 数据压缩方法、装置、介质及电子设备 |
CN112506877B (zh) * | 2020-12-03 | 2024-04-19 | 深圳市木浪云科技有限公司 | 基于重删域的数据重删方法、装置、系统及存储设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103399912A (zh) * | 2013-07-30 | 2013-11-20 | 腾讯科技(深圳)有限公司 | 一种钓鱼网页聚类方法和装置 |
US8621556B1 (en) * | 2011-05-25 | 2013-12-31 | Palo Alto Networks, Inc. | Dynamic resolution of fully qualified domain name (FQDN) address objects in policy definitions |
CN104145472A (zh) * | 2012-02-29 | 2014-11-12 | 瑞典爱立信有限公司 | 存储数据记录的方法和装置 |
CN104750849A (zh) * | 2015-04-13 | 2015-07-01 | 北京京东尚科信息技术有限公司 | 用于维护基于树形结构的目录关系的方法和系统 |
CN104750704A (zh) * | 2013-12-26 | 2015-07-01 | 中国移动通信集团河南有限公司 | 一种网页url地址分类识别方法及装置 |
CN105611000A (zh) * | 2016-03-31 | 2016-05-25 | 中国互联网络信息中心 | 一种域名服务器的dns域名快速检索方法 |
-
2017
- 2017-04-07 CN CN201710225386.XA patent/CN108696599B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8621556B1 (en) * | 2011-05-25 | 2013-12-31 | Palo Alto Networks, Inc. | Dynamic resolution of fully qualified domain name (FQDN) address objects in policy definitions |
CN104145472A (zh) * | 2012-02-29 | 2014-11-12 | 瑞典爱立信有限公司 | 存储数据记录的方法和装置 |
CN103399912A (zh) * | 2013-07-30 | 2013-11-20 | 腾讯科技(深圳)有限公司 | 一种钓鱼网页聚类方法和装置 |
CN104750704A (zh) * | 2013-12-26 | 2015-07-01 | 中国移动通信集团河南有限公司 | 一种网页url地址分类识别方法及装置 |
CN104750849A (zh) * | 2015-04-13 | 2015-07-01 | 北京京东尚科信息技术有限公司 | 用于维护基于树形结构的目录关系的方法和系统 |
CN105611000A (zh) * | 2016-03-31 | 2016-05-25 | 中国互联网络信息中心 | 一种域名服务器的dns域名快速检索方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108696599A (zh) | 2018-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104462260B (zh) | 一种基于k-核的社交网络中的社区搜索方法 | |
US20090193044A1 (en) | Web graph compression through scalable pattern mining | |
CN108696599B (zh) | 域名分类特征库中去除冗余域名的方法、系统、防火墙设备 | |
CN108959359B (zh) | 一种统一资源定位符语义去重方法、装置、设备和介质 | |
CN104598517A (zh) | 基于普通数据库的树型结构表的存储与查询技术 | |
CN108228656B (zh) | 基于cart决策树的url分类方法及装置 | |
US10250550B2 (en) | Social message monitoring method and apparatus | |
CN105790967B (zh) | 一种网络日志处理方法和装置 | |
CN107145568A (zh) | 一种快速的新闻事件聚类系统及方法 | |
CN105260446A (zh) | 一种数据查询系统及方法 | |
CN107193870B (zh) | 网页内容的提取方法和系统 | |
CN107562762A (zh) | 数据索引构建方法及装置 | |
CN105357118A (zh) | 一种基于规则的流量分类方法和系统 | |
Schlitter et al. | Dengraph-ho: Density-based hierarchical community detection for explorative visual network analysis | |
CN103164533A (zh) | 基于信息理论的复杂网络社团检测方法 | |
CN109769027A (zh) | 一种消息推送方法、装置及设备 | |
CN115291793A (zh) | 属性数据的转换方法和装置、存储介质及电子装置 | |
CN108073607B (zh) | Url处理方法及装置 | |
CN114817234A (zh) | 用于管理存储系统的索引的方法、设备和程序产品 | |
CN107203635B (zh) | 一种基于最小略图的流模式下有向标签图的略图构建方法 | |
CN114697322B (zh) | 一种基于云端业务处理的数据筛选方法 | |
CN110765236A (zh) | 一种非结构化海量数据的预处理方法及系统 | |
CN108875086A (zh) | 一种uri路径资源的匹配方法及系统 | |
KR101089294B1 (ko) | 구조적 p2p 네트워크를 위한 데이터 매핑 방법 및 장치 | |
CN114679471B (zh) | 一种基于云端业务处理的数据匹配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: Method, system and firewall equipment for removing redundant domain names from domain name classification feature library Effective date of registration: 20220929 Granted publication date: 20210219 Pledgee: Haidian Beijing science and technology enterprise financing Company limited by guarantee Pledgor: BEIJING SUNYAINFO TECHNOLOGY CO.,LTD. Registration number: Y2022110000241 |