CN113282805A - IPv6地址模式挖掘方法、装置、电子设备及存储介质 - Google Patents
IPv6地址模式挖掘方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113282805A CN113282805A CN202110705312.2A CN202110705312A CN113282805A CN 113282805 A CN113282805 A CN 113282805A CN 202110705312 A CN202110705312 A CN 202110705312A CN 113282805 A CN113282805 A CN 113282805A
- Authority
- CN
- China
- Prior art keywords
- address
- seed
- ipv6
- sub
- undirected graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2101/00—Indexing scheme associated with group H04L61/00
- H04L2101/60—Types of network addresses
- H04L2101/618—Details of network addresses
- H04L2101/659—Internet protocol version 6 [IPv6] addresses
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请涉及一种IPv6地址模式挖掘方法、装置、电子设备及存储介质。所述方法利用已知的IPv6种子地址来划分地址空间,并将每个区域的种子地址映射为无向图,并通过不断切割最长边以聚类种子地址并检测出异常地址,从而发掘出地址模式;基于地址模式,能够生成大量探测目标地址。本方法可在互联网范围内发掘活跃IPv6地址模式并探测活跃IPV6地址,与其他地址探测方法相比,该方法具有更高的命中率。
Description
技术领域
本申请涉及互联网技术领域,特别是涉及一种IPv6地址模式挖掘方法、装置、电子设备及存储介质。
背景技术
随着IPv4地址空间分配殆尽,互联网正在不可避免地向IPv6过度。新一代互联网协议IPv6拥有巨大的地址空间,近年来得到了广泛的关注和迅速的普及。然而,IPv6其巨量的地址空间范围在互联网测量方面也提出了新的挑战。在IPv4网络,受益于现代硬件和计算能力的进步,使得互联网全网扫描成为可能。在网络拓扑探测方面,像ZMap和Masscan这样的异步扫描工具极大地增强了我们进行全网测量的能力。在网络资产扫描方面,Shodan、Censys等网络设备搜索引擎可以获取丰富的网络资产数据,用于评估网络安全状况、漏洞发现与修复等。然而,IPv6巨量的地址空间范围使得这些工具并不能直接应用。
现有的一些IPv6活性地址挖掘方法,如Entropy/IP、6Gen、6Tree等。等,在IPv6地址空间探测方面取得了一定的成绩,但是IPv6地址空间探测方面还是存在探测效率不高的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种IPv6地址模式挖掘方法、装置、电子设备及存储介质,该方法用于互联网范围内的IPv6活性地址探测和挖掘。
一种IPv6地址模式挖掘方法,所述方法包括:
获取IPv6种子地址以及预定的总资源阈值。
根据所述IPv6种子地址,利用层次分裂聚类算法,得到空间树;所述空间树的每一个叶子节点代表地址空间的一个种子区域。
根据所述种子区域,得到无向图;所述无向图中的节点为IPv6种子地址。
查找所述无向图中长度最长的边,当断开所述长度最长的边后得到的两个子图的区域密度上升,则对长度最长的边进行切割得到两个切割子图,当两个子图的区域密度不上升,则不进行切割;对所述切割子图递归进行无向图切割过程,直到满足停止条件,得到多个连通子图;多个所述连通子图为聚类结果,每个连通子图为一个聚类簇,其中:仅包含一个IPv6种子地址的所述聚类簇为异常种子,包含多个IPv6种子地址的所述聚类簇为地址模式。
根据所述地址模式生成IPv6探测目标,并对所述IPv6探测目标进行探测,得到新的活性地址。
将所述新的活性地址作为新的种子地址并生成探测目标,并在所述探测目标中剔除已经探测的活性地址和非活性地址,进行下一轮迭代探测,直到达到预定的总资源阈值,迭代停止,得到基于地址模式挖掘的活性IPv6地址。
在其中一个实施例中,根据所述IPv6种子地址,利用层次分裂聚类算法,得到空间树,包括:
构建一个先进先出的数据结构,将初始种子区域构建的节点存入所述先进先出的数据结构。
循环的从先进先出的数据结构取出节点,并在所述节点的第一个自由维度分裂出子节点,将这些子节点存入先进先出的数据结构,当划分的子区域内IPv6种子地址的数目小于预定数目时,则停止加入先进先出数据结构中,得到空间树。
在其中一个实施例中,距离是差异度的衡量标准,差异度衡量用于种子地址与种子地址之间,种子地址与区域之间,区域与区域之间;所述衡量标准为,每当一个维度不相同时,则距离增加一个单位。
根据所述种子区域,得到无向图,包括:
将所述种子区域中的所述种子映射到无向图中;所述无向图中的节点为IPv6种子地址。
计算所述种子区域内两两IPv6种子地址之间的距离,并按照从小到的顺序进行排序。
从小到大的顺序按照边加入的条件加入以IPv6种子地址为节点的无向图;所述边加入的条件为:如果边对应的两个节点在该无向图不可达,则加入无向图。
在其中一个实施例中,区域密度是区域IPv6种子地址数目与自由维度数目的比值,当区域仅有一个种子时,自由维度为0个,区域密度为无穷大。
查找所述无向图中长度最长的边,当断开所述长度最长的边后得到的两个子图的区域密度上升,则对长度最长的边进行切割得到两个切割子图,当两个子图的区域密度不上升,则不进行切割;对所述切割子图递归进行无向图切割过程,直到满足停止条件,得到多个连通子图,包括:
查找所述无向图中长度最长的边,并尝试断开,得到两个子图。
计算两个子图的区域密度,判断所述区域目的是否上升,得到判断结果。
当判断结果为上升时,则将所述最长边去掉,得到新生成的两个切割子图。
对所述切割子图进一步进行递归切割,直到满足停止条件,得到多个连通子图;所述停止条件为子图的区域密度不上升。
在其中一个实施例中,根据所述地址模式生成IPv6探测目标,并对所述IPv6探测目标进行探测,得到新的活性地址,包括:
生成与地址模式中的IPv6种子地址距离为1的目标地址,并将所述目标地址作为IPv6探测目标。
对所述IPv6探测目标发送探测包进行探测,得到新的活性地址。
在其中一个实施例中,根据所述地址模式生成IPv6探测目标,并对所述IPv6探测目标进行探测,得到新的活性地址,步骤前还包括:
将所述异常种子重新与已获得的地址模式进行匹配并加入。
根据加入失败的异常种子重新进行空间划分和地址挖掘,得到新的地址模式和异常种子,重复以上过程,直到异常种子数目不再减小,得到地址模式。
一种IPv6地址模式挖掘装置,所述装置包括:
IPv6种子地址获取模块,用于获取IPv6种子地址以及预定的总资源阈值。
空间树构建模块,用于根据所述IPv6种子地址,利用层次分裂聚类算法,得到空间树;所述空间树的每一个叶子节点代表地址空间的一个种子区域。
地址模式挖掘模块,用于根据所述种子区域,得到无向图;所述无向图中的节点为IPv6种子地址;查找所述无向图中长度最长的边,当断开所述长度最长的边后得到的两个子图的区域密度上升,则对长度最长的边进行切割得到两个切割子图,当两个子图的区域密度不上升,则不进行切割;对所述切割子图递归进行无向图切割过程,直到满足停止条件,得到多个连通子图;多个所述连通子图为聚类结果,每个连通子图为一个聚类簇,其中:仅包含一个IPv6种子地址的所述聚类簇为异常种子,包含多个IPv6种子地址的所述聚类簇为地址模式。
活性地址探测模块,用于根据所述地址模式生成IPv6探测目标,并对所述IPv6探测目标进行探测,得到新的活性地址;将所述新的活性地址作为新的种子地址并生成探测目标,并在所述探测目标中剔除已经探测的活性地址和非活性地址,进行下一轮迭代探测,直到达到预定的总资源阈值,迭代停止,得到基于地址模式挖掘的活性IPv6地址。
上述IPv6地址模式挖掘方法、装置、电子设备及存储介质,所述方法利用已知的IPv6种子地址来划分地址空间,并将每个区域的种子地址映射为无向图,并通过不断切割最长边以聚类种子地址并检测出异常地址,从而发掘出地址模式;基于地址模式,能够生成大量探测目标地址。本方法可在互联网范围内发掘活跃IPv6地址模式并探测活跃IPV6地址,与其他地址探测方法相比,该方法具有更高的命中率。
附图说明
图1为一个实施例中IPv6地址模式挖掘方法的流程示意图;
图2为另一个实施例中种子区域示意图;
图3为另一个实施例中空间划分示意图;
图4为另一个实施例中距离度量示意图;
图5为另一个实施例中图切割聚类示意图;
图6为另一个实施例中地址模式挖掘的示意图
图7为另一个实施例中地址模式挖掘结果示意图;
图8为一个实施例中一种IPv6地址模式挖掘方法的工作流程图示意图;
图9为一个实施例中IPv6地址模式挖掘装置的结构框图;
图10为一个实施例中电子设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
通常将IPv6地址空间映射为32维度的高维向量,每一个维度取值范围为(0-15)的整数。
在一个实施例中,如图1所示,提供了一种IPv6地址模式挖掘方法,该方法包括以下步骤:
步骤100:获取IPv6种子地址以及预定的总资源阈值。
IPv6种子地址,一组初始的已知的活性IPv6地址,这些地址通常可以通过网络流量收集,域名记录等获取。
预定的总资源阈值是预定的探测数据包的数量。
步骤102:根据IPv6种子地址,利用层次分裂聚类算法,得到空间树。
空间树的每一个叶子节点代表地址空间的一个种子区域。
种子区域,经过区域划分后,由多个种子构成的集合。
种子区域示意图如图2所示。该种子区域由是三个种子构成,其中第15,16个维度为自由维度,其余维度为固定维度,因此其区域密度为,种子数目(3)/自由维度数目(2)=1.5。
自由维度和固定维度,对于一个32维度的种子区域,若在某一维度,种子的在该维度值均相同,则为固定维度,否则为自由维度。
地址空间的划分逻辑上首先利用种子结合层次分裂聚类算法构造一个树形结构,该树形结构命名为“空间树”。空间树是通过层次化的方式从根到叶构建的,通过自顶向下的方式分割32维IPv6地址空间,即把128位的地址看做32个半字节,每个半字节为1维空间。同时为了减小存储消耗和并行计算,采用宽度优先的方式探索和拓展这个逻辑上的空间树。
步骤104:根据种子区域,得到无向图。
所述无向图显示的是种子之间相互关系。其中,每一个种子作为该无向图的节点,而任意两个种子之间存在距离,该距离即为两节点之间边的长度。初始状态下,无向图仅存在种子构成的节点,然后根据预定方式,不断加入边,直至满足停止条件,即得到全连通的无向图。
无向图中的节点为IPv6种子地址。
步骤106:查找无向图中长度最长的边,当断开长度最长的边后得到的两个子图的区域密度上升,则对长度最长的边进行切割得到两个切割子图,当两个子图的区域密度不上升,则不进行切割;对切割子图递归进行无向图切割过程,直到满足停止条件,得到多个连通子图;多个连通子图为聚类结果,每个连通子图为一个聚类簇,其中:仅包含一个IPv6种子地址的聚类簇为异常种子,包含多个IPv6种子地址的聚类簇为地址模式。
区域密度,该区域种子数目与自由维度数目的比值。特殊的,当该区域仅有一个种子时,自由维度为0个,区域密度为无穷大。
步骤108:根据地址模式生成IPv6探测目标,并对IPv6探测目标进行探测,得到新的活性地址。
根据已经挖掘的地址模式生成的IPv6探测目标具有远超其他方法的命中率。
其基本原理是,同一地址模式内,Ipv6活性地址之间距离较小。因此,与已知IPv6活性地址相距在自由维度上一个单位距离的候选IPv6地址即为探测目标。
步骤110:将新的活性地址作为新的种子地址并生成探测目标,并在探测目标中剔除已经探测的活性地址和非活性地址,进行下一轮迭代探测,直到达到预定的总资源阈值,迭代停止,得到基于地址模式挖掘的活性IPv6地址。
上述IPv6地址模式挖掘方法中,所述方法利用已知的IPv6种子地址来划分地址空间,并将每个区域的种子地址映射为无向图,并通过不断切割最长边以聚类种子地址并检测出异常地址,从而发掘出地址模式;基于地址模式,能够生成大量探测目标地址。本方法可在互联网范围内发掘活跃IPv6地址模式并探测活跃IPV6地址,与其他地址探测方法相比,该方法具有更高的命中率。
在其中一个实施例中,步骤102还包括:构建一个先进先出的数据结构,将初始种子区域构建的节点存入先进先出的数据结构;循环的从先进先出的数据结构取出节点,并在节点的第一个自由维度分裂出子节点,将这些子节点存入先进先出的数据结构,当划分的子区域内IPv6种子地址的数目小于预定数目时,则停止加入先进先出数据结构中,得到空间树。
在另一个实施例中,图3所示为一个空间划分的实例。注意该空间树仅为逻辑示意图,运行实例最终仅保留其中的白色叶子节点,即种子区域。当从先进先出的数据结构中取出节点时,选择该节点的第一个自由维度,并且按照该自由维度上的值划分接下来的子区域,构成子节点。当划分的区域内种子数目小于指定数目,则停止加入先进先出数据结构中。最后完成空间划分。
在其中一个实施例中,距离是差异度的衡量标准,差异度衡量用于种子地址与种子地址之间,种子地址与区域之间,区域与区域之间;衡量标准为,每当一个维度不相同时,则距离增加一个单位。步骤104还包括:将种子区域中的种子映射到无向图中;无向图中的节点为IPv6种子地址;计算种子区域内两两IPv6种子地址之间的距离,并按照从小到的顺序进行排序;从小到大的顺序按照边加入的条件加入以IPv6种子地址为节点的无向图;边加入的条件为:如果边对应的两个节点在该无向图不可达,则加入无向图。
图4所示为距离度量示意图。自由维度“*”与任何值相等,第一种情况是种子区域和种子区域的距离度量;第二种是种子区域和种子地址的距离度量;第三种是种子地址和种子地址的距离度量。
在其中一个实施例中,区域密度是区域IPv6种子地址数目与自由维度数目的比值,当区域仅有一个种子时,自由维度为0个,区域密度为无穷大。步骤106还包括:查找无向图中长度最长的边,并尝试断开,得到两个子图;计算两个子图的区域密度,判断区域目的是否上升,得到判断结果;当判断结果为上升时,则将最长边去掉,得到新生成的两个切割子图;对切割子图进一步进行递归切割,直到满足停止条件,得到多个连通子图;停止条件为子图的区域密度不上升。
在另一个实施例中,图5所示是一个图切割聚类的示意图,图6为地址模式挖掘的示意图。为给定种子区域构建流程图后,根据新的区域密度是否上升,逐步断开最长的边。最终完成种子聚类和异常地址检测。实例中,边(0,1),边(0,8)和边(0,9)的长度最长,分别尝试断开后发现,集合(0),集合(10),集合(1,4,5,2,3)和集合(6,7,8,9)的区域密度上升,因此断开边(0,1),边(0,8)和边(0,9)。最后完成聚类。
在其中一个实施例中,步骤108还包括:生成与地址模式中的IPv6种子地址距离为1的目标地址,并将目标地址作为IPv6探测目标;对IPv6探测目标发送探测包进行探测,得到新的活性地址。
图7所示地址模式挖掘结果示意图,是根据地址模式和已知的种子地址生成探测目标。给定地址模式内存在是三个种子地址,分别相距这些地址的一个单位距离,剔除已知地址后,每一个种子地址可生成15个探测目标地址。
在其中一个实施例中,步骤108前还包括:将异常种子重新与已获得的地址模式进行匹配并加入;根据加入失败的异常种子重新进行空间划分和地址挖掘,得到新的地址模式和异常种子,重复以上过程,直到异常种子数目不再减小,得到地址模式。
在另一个实施例中,如图8所示,提供一种IPv6地址模式挖掘方法的工作流程图。首先将根据种子地址划分地址空间,得到种子区域,然后对种子区域内部进行地址挖掘,得到地址模式和异常种子,这些种子会尝试重新匹配所有已知的地址模式并加入。加入失败的异常种子会重新进行空间划分,重复以上过程,直到异常种子数目不再减小。最后将根据地址模式生成探测目标地址。
应该理解的是,虽然图1和图8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1和图8中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图9所示,提供了一种IPv6地址模式挖掘装置,装置包括:IPv6种子地址获取模块、空间树构建模块、地址模式挖掘模块以及活性地址探测模块,其中:
IPv6种子地址获取模块,用于获取IPv6种子地址以及预定的总资源阈值;
空间树构建模块,用于根据IPv6种子地址,利用层次分裂聚类算法,得到空间树;空间树的每一个叶子节点代表地址空间的一个种子区域;
地址模式挖掘模块,用于根据种子区域,得到无向图;无向图中的节点为IPv6种子地址;查找无向图中长度最长的边,当断开长度最长的边后得到的两个子图的区域密度上升,则对长度最长的边进行切割得到两个切割子图,当两个子图的区域密度不上升,则不进行切割;对切割子图递归进行无向图切割过程,直到满足停止条件,得到多个连通子图;多个连通子图为聚类结果,每个连通子图为一个聚类簇,其中:仅包含一个IPv6种子地址的聚类簇为异常种子,包含多个IPv6种子地址的聚类簇为地址模式;
活性地址探测模块,用于根据地址模式生成IPv6探测目标,并对IPv6探测目标进行探测,得到新的活性地址;将新的活性地址作为新的种子地址并生成探测目标,并在探测目标中剔除已经探测的活性地址和非活性地址,进行下一轮迭代探测,直到达到预定的总资源阈值,迭代停止,得到基于地址模式挖掘的活性IPv6地址。
在其中一个实施例中,空间树构建模块,还用于构建一个先进先出的数据结构,将初始种子区域构建的节点存入先进先出的数据结构;循环的从先进先出的数据结构取出节点,并在节点的第一个自由维度分裂出子节点,将这些子节点存入先进先出的数据结构,当划分的子区域内IPv6种子地址的数目小于预定数目时,则停止加入先进先出数据结构中,得到空间树。
在其中一个实施例中,距离是差异度的衡量标准,差异度衡量用于种子地址与种子地址之间,种子地址与区域之间,区域与区域之间;衡量标准为,每当一个维度不相同时,则距离增加一个单位。地址模式挖掘模块,还用于将种子区域中的种子映射到无向图中;无向图中的节点为IPv6种子地址;计算种子区域内两两IPv6种子地址之间的距离,并按照从小到的顺序进行排序;从小到大的顺序按照边加入的条件加入以IPv6种子地址为节点的无向图;边加入的条件为:如果边对应的两个节点在该无向图不可达,则加入无向图。
在其中一个实施例中,区域密度是区域IPv6种子地址数目与自由维度数目的比值,当区域仅有一个种子时,自由维度为0个,区域密度为无穷大。地址模式挖掘模块,还用于查找无向图中长度最长的边,并尝试断开,得到两个子图;计算两个子图的区域密度,判断区域目的是否上升,得到判断结果;当判断结果为上升时,则将最长边去掉,得到新生成的两个切割子图;对切割子图进一步进行递归切割,直到满足停止条件,得到多个连通子图;停止条件为子图的区域密度不上升。
在其中一个实施例中,活性地址探测模块,还用于生成与地址模式中的IPv6种子地址距离为1的目标地址,并将目标地址作为IPv6探测目标;对IPv6探测目标发送探测包进行探测,得到新的活性地址。
在其中一个实施例中,活性地址探测模块前还包括异常种子处理模块,还用于将异常种子重新与已获得的地址模式进行匹配并加入;根据加入失败的异常种子重新进行空间划分和地址挖掘,得到新的地址模式和异常种子,重复以上过程,直到异常种子数目不再减小,得到地址模式。
关于种IPv6地址模式挖掘装置的具体限定可以参见上文中对于种IPv6地址模式挖掘方法的限定,在此不再赘述。上述种IPv6地址模式挖掘装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种电子设备,该电子设备可以是终端,其内部结构图可以如图10所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种种IPv6地址模式挖掘方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种电子设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述方法实施例中的方法步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中的方法步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种IPv6地址模式挖掘方法,其特征在于,所述方法包括:
获取IPv6种子地址以及预定的总资源阈值;
根据所述IPv6种子地址,利用层次分裂聚类算法,得到空间树;所述空间树的每一个叶子节点代表地址空间的一个种子区域;
根据所述种子区域,得到无向图;所述无向图中的节点为IPv6种子地址;
查找所述无向图中长度最长的边,当断开所述长度最长的边后得到的两个子图的区域密度上升,则对长度最长的边进行切割得到两个切割子图,当两个子图的区域密度不上升,则不进行切割;对所述切割子图递归进行无向图切割过程,直到满足停止条件,得到多个连通子图;多个所述连通子图为聚类结果,每个连通子图为一个聚类簇,其中:仅包含一个IPv6种子地址的所述聚类簇为异常种子,包含多个IPv6种子地址的所述聚类簇为地址模式;
根据所述地址模式生成IPv6探测目标,并对所述IPv6探测目标进行探测,得到新的活性地址;
将所述新的活性地址作为新的种子地址并生成探测目标,并在所述探测目标中剔除已经探测的活性地址和非活性地址,进行下一轮迭代探测,直到达到所述预定的总资源阈值,迭代停止,得到基于地址模式挖掘的活性IPv6地址。
2.根据权利要求1所述的方法,其特征在于,根据所述IPv6种子地址,利用层次分裂聚类算法,得到空间树,包括:
构建一个先进先出的数据结构,将初始种子区域构建的节点存入所述先进先出的数据结构;
循环的从先进先出的数据结构取出节点,并在所述节点的第一个自由维度分裂出子节点,将这些子节点存入先进先出的数据结构,当划分的子区域内IPv6种子地址的数目小于预定数目时,则停止加入先进先出数据结构中,得到空间树。
3.根据权利要求1所述的方法,其特征在于,距离是差异度的衡量标准,差异度衡量用于种子地址与种子地址之间,种子地址与区域之间,区域与区域之间;所述衡量标准为,每当一个维度不相同时,则距离增加一个单位;
根据所述种子区域,得到无向图,包括:
将所述种子区域中的所述种子映射到无向图中;所述无向图中的节点为IPv6种子地址;
计算所述种子区域内两两IPv6种子地址之间的距离,并按照从小到的顺序进行排序;
从小到大的顺序按照边加入的条件加入以IPv6种子地址为节点的无向图;所述边加入的条件为:如果边对应的两个节点在该无向图不可达,则加入无向图。
4.根据权利要求1所述的方法,其特征在于,区域密度是区域IPv6种子地址数目与自由维度数目的比值,当区域仅有一个种子时,自由维度为0个,区域密度为无穷大;
查找所述无向图中长度最长的边,当断开所述长度最长的边后得到的两个子图的区域密度上升,则对长度最长的边进行切割得到两个切割子图,当两个子图的区域密度不上升,则不进行切割;对所述切割子图递归进行无向图切割过程,直到满足停止条件,得到多个连通子图,包括:
查找所述无向图中长度最长的边,并尝试断开,得到两个子图;
计算两个子图的区域密度,判断所述区域目的是否上升,得到判断结果;
当判断结果为上升时,则将所述最长边去掉,得到新生成的两个切割子图;
对所述切割子图进一步进行递归切割,直到满足停止条件,得到多个连通子图;所述停止条件为子图的区域密度不上升。
5.根据权要求1所述的方法,其特征在于,根据所述地址模式生成IPv6探测目标,并对所述IPv6探测目标进行探测,得到新的活性地址,包括:
生成与地址模式中的IPv6种子地址距离为1的目标地址,并将所述目标地址作为IPv6探测目标;
对所述IPv6探测目标发送探测包进行探测,得到新的活性地址。
6.根据权利要求1所述的方法,其特征在于,根据所述地址模式生成IPv6探测目标,并对所述IPv6探测目标进行探测,得到新的活性地址,步骤前还包括:
将所述异常种子重新与已获得的地址模式进行匹配并加入;
根据加入失败的异常种子重新进行空间划分和地址挖掘,得到新的地址模式和异常种子,重复以上过程,直到异常种子数目不再减小,得到地址模式。
7.一种IPv6地址模式挖掘装置,其特征在于,所述装置包括:
IPv6种子地址获取模块,用于获取IPv6种子地址以及预定的总资源阈值;
空间树构建模块,用于根据所述IPv6种子地址,利用层次分裂聚类算法,得到空间树;所述空间树的每一个叶子节点代表地址空间的一个种子区域;
地址模式挖掘模块,用于根据所述种子区域,得到无向图;所述无向图中的节点为IPv6种子地址;查找所述无向图中长度最长的边,当断开所述长度最长的边后得到的两个子图的区域密度上升,则对长度最长的边进行切割得到两个切割子图,当两个子图的区域密度不上升,则不进行切割;对所述切割子图递归进行无向图切割过程,直到满足停止条件,得到多个连通子图;多个所述连通子图为聚类结果,每个连通子图为一个聚类簇,其中:仅包含一个IPv6种子地址的所述聚类簇为异常种子,包含多个IPv6种子地址的所述聚类簇为地址模式;
活性地址探测模块,用于根据所述地址模式生成IPv6探测目标,并对所述IPv6探测目标进行探测,得到新的活性地址;将所述新的活性地址作为新的种子地址并生成探测目标,并在所述探测目标中剔除已经探测的活性地址和非活性地址,进行下一轮迭代探测,直到达到预定的总资源阈值,迭代停止,得到基于地址模式挖掘的活性IPv6地址。
8.根据权利要求7所述的装置,其特征在于,空间树构建模块,还用于构建一个先进先出的数据结构,将初始种子区域构建的节点存入所述先进先出的数据结构;循环的从先进先出的数据结构取出节点,并在所述节点的第一个自由维度分裂出子节点,将这些子节点存入先进先出的数据结构,当划分的子区域内IPv6种子地址的数目小于预定数目时,则停止加入先进先出数据结构中,得到空间树。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110705312.2A CN113282805B (zh) | 2021-06-24 | 2021-06-24 | IPv6地址模式挖掘方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110705312.2A CN113282805B (zh) | 2021-06-24 | 2021-06-24 | IPv6地址模式挖掘方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113282805A true CN113282805A (zh) | 2021-08-20 |
CN113282805B CN113282805B (zh) | 2022-04-22 |
Family
ID=77285544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110705312.2A Active CN113282805B (zh) | 2021-06-24 | 2021-06-24 | IPv6地址模式挖掘方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113282805B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114157637A (zh) * | 2022-02-09 | 2022-03-08 | 中国人民解放军国防科技大学 | IPv6地址扫描方法、装置、计算机设备及存储介质 |
CN115102922A (zh) * | 2022-04-25 | 2022-09-23 | 国家计算机网络与信息安全管理中心山东分中心 | 一种基于多地址比对结果扩展的IPv6活跃地址探测方法 |
CN115297036A (zh) * | 2022-08-12 | 2022-11-04 | 北京华顺信安科技有限公司 | 一种基于IPv6地址智能分析的网络空间地图绘制方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9025494B1 (en) * | 2012-03-27 | 2015-05-05 | Infoblox Inc. | IPv6 network device discovery |
CN109905497A (zh) * | 2019-03-05 | 2019-06-18 | 长沙学院 | 一种IPv6活跃地址动态发现方法 |
CN111432043A (zh) * | 2020-03-09 | 2020-07-17 | 清华大学 | 基于密度的动态IPv6地址探测方法 |
CN112383644A (zh) * | 2020-10-21 | 2021-02-19 | 北京邮电大学 | 一种启发式IPv6地址扫描目标生成方法及相关设备 |
CN112398969A (zh) * | 2021-01-19 | 2021-02-23 | 中国人民解放军国防科技大学 | IPv6地址的动态探测方法、装置及计算机设备 |
-
2021
- 2021-06-24 CN CN202110705312.2A patent/CN113282805B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9025494B1 (en) * | 2012-03-27 | 2015-05-05 | Infoblox Inc. | IPv6 network device discovery |
CN109905497A (zh) * | 2019-03-05 | 2019-06-18 | 长沙学院 | 一种IPv6活跃地址动态发现方法 |
CN111432043A (zh) * | 2020-03-09 | 2020-07-17 | 清华大学 | 基于密度的动态IPv6地址探测方法 |
CN112383644A (zh) * | 2020-10-21 | 2021-02-19 | 北京邮电大学 | 一种启发式IPv6地址扫描目标生成方法及相关设备 |
CN112398969A (zh) * | 2021-01-19 | 2021-02-23 | 中国人民解放军国防科技大学 | IPv6地址的动态探测方法、装置及计算机设备 |
Non-Patent Citations (2)
Title |
---|
李果 等: ""基于多层级分类和空间建模的IPv6活跃地址发现算法"", 《清华大学学报(自然科学版)》 * |
李果 等: ""基于种子地址的IPv6地址探测技术综述"", 《电信科学》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114157637A (zh) * | 2022-02-09 | 2022-03-08 | 中国人民解放军国防科技大学 | IPv6地址扫描方法、装置、计算机设备及存储介质 |
CN114157637B (zh) * | 2022-02-09 | 2022-04-22 | 中国人民解放军国防科技大学 | IPv6地址扫描方法、装置、计算机设备及存储介质 |
CN115102922A (zh) * | 2022-04-25 | 2022-09-23 | 国家计算机网络与信息安全管理中心山东分中心 | 一种基于多地址比对结果扩展的IPv6活跃地址探测方法 |
CN115297036A (zh) * | 2022-08-12 | 2022-11-04 | 北京华顺信安科技有限公司 | 一种基于IPv6地址智能分析的网络空间地图绘制方法及系统 |
CN115297036B (zh) * | 2022-08-12 | 2023-09-05 | 北京华顺信安科技有限公司 | 一种基于IPv6地址智能分析的网络空间地图绘制方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113282805B (zh) | 2022-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113282805B (zh) | IPv6地址模式挖掘方法、装置、电子设备及存储介质 | |
CN111355697B (zh) | 僵尸网络域名家族的检测方法、装置、设备及存储介质 | |
CN109120465B (zh) | 基于模体的目标区域网络拓扑划分方法 | |
Ribeiro et al. | Strategies for network motifs discovery | |
CN112398969B (zh) | IPv6地址的动态探测方法、装置及计算机设备 | |
CN112182306B (zh) | 一种基于不确定图的社区发现方法 | |
Ruan et al. | Distance preserving graph simplification | |
Ribeiro et al. | Efficient parallel subgraph counting using g-tries | |
CN113992541B (zh) | 网络流量测量方法、系统、计算机设备、存储介质及应用 | |
CN110809066A (zh) | IPv6地址生成模型创建方法、装置及地址生成方法 | |
Wang et al. | Moss: A scalable tool for efficiently sampling and counting 4-and 5-node graphlets | |
Edunov et al. | Generating synthetic social graphs with darwini | |
Zhang et al. | Efficient and high-quality seeded graph matching: Employing higher-order structural information | |
Zhu et al. | 2-hop+ sampling: Efficient and effective influence estimation | |
Behera et al. | An efficient modularity based algorithm for community detection in social network | |
Zhao et al. | Finding key nodes in complex networks: An edge and local partition approach | |
CN111679963A (zh) | 用户行为数据的处理方法、装置、设备及存储介质 | |
Cvetkovski et al. | On the choice of a spanning tree for greedy embedding of network graphs | |
Akgun et al. | Impact of multi-access links on the internet topology modeling | |
Dong et al. | Pure Message Passing Can Estimate Common Neighbor for Link Prediction | |
CN115827379A (zh) | 异常进程检测方法、装置、设备和介质 | |
Chen et al. | Optimal region search with submodular maximization | |
CN113704309A (zh) | 图数据处理方法、装置、计算机设备和存储介质 | |
Magoni et al. | Analysis and comparison of Internet topology generators | |
CN115955323A (zh) | 一种网络安全态势感知方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |