CN110809066A - IPv6地址生成模型创建方法、装置及地址生成方法 - Google Patents
IPv6地址生成模型创建方法、装置及地址生成方法 Download PDFInfo
- Publication number
- CN110809066A CN110809066A CN201910943931.8A CN201910943931A CN110809066A CN 110809066 A CN110809066 A CN 110809066A CN 201910943931 A CN201910943931 A CN 201910943931A CN 110809066 A CN110809066 A CN 110809066A
- Authority
- CN
- China
- Prior art keywords
- ipv6 address
- segment
- ipv6
- segments
- generation model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L61/00—Network arrangements, protocols or services for addressing or naming
- H04L61/50—Address allocation
- H04L61/5007—Internet protocol [IP] addresses
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2101/00—Indexing scheme associated with group H04L61/00
- H04L2101/60—Types of network addresses
- H04L2101/618—Details of network addresses
- H04L2101/659—Internet protocol version 6 [IPv6] addresses
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明实施例提供IPv6地址生成模型创建方法、装置及地址生成方法,包括:根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由不同取值的出现频率计算每一地址位取值的不确定性;按照IPv6地址中各个地址位取值的不确定性对IPv6地址进行分割,得到多个分割段;对IPv6地址各个分割段的取值空间分别进行聚类,得到各个分割段内所有聚类簇的概率分布;根据IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练IPv6地址生成模型。本发明实施例所提供的IPv6地址生成模型创建方法生成能够自动创建具有较高存活率的IPv6地址生成模型,能有效提高工作效率、节约人力物力。
Description
技术领域
本发明涉及网络安全技术领域,尤其涉及一种IPv6地址生成模型创建方法、装置及地址生成方法。
背景技术
在IPv6资产探查中,首先要得到IPv6地址,特别是存活的IPv6地址。所谓存活的IPv6地址是指有用户使用的IPv6地址。由于IPv6地址共有128位,地址空间范围极为庞大,不可能采用传统IPv4地址时期常见的穷举法来获取存活的IPv6地址。需要通过一定策略,以智能的方式生成可靠的、存活率高的IPv6地址候选集。
当前对这方面的研究和工作都很少,主要是一些理论性研究,缺乏实践验证。在商业应用中,当前主要通过人工专家依据经验产生一些候选IPv6地址集,这种方法所得到的IPv6地址的稳定度和存活率都不高,而且效率低下。
发明内容
本发明实施例提供一种IPv6地址生成模型创建方法、装置及地址生成方法,用以解决现有技术中主要通过人工方式寻找存活IPv6地址所带来的IPv6地址稳定度、存活率均不高,效率低下的缺陷,实现对存活IPv6地址的快速、高效查找。
第一方面,本发明实施例提供一种IPv6地址生成模型创建方法,包括:
根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位取值的不确定性;按照IPv6地址中各个地址位取值的不确定性对IPv6地址进行分割,得到多个分割段;其中,同一分割段内各地址位取值的不确定性接近;
对IPv6地址各个分割段的取值空间分别进行聚类,得到各个分割段内所有聚类簇的概率分布;
根据所述IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练IPv6地址生成模型;所述IPv6地址生成模型反映了IPv6地址所包含的分割段以及所述分割段之间的条件概率值。
基于上述任一本发明实施例,还包括:收集IPv6地址,得到所述所收集的多个IPv6地址。
基于上述任一本发明实施例,采用密度聚类算法对IPv6地址各个分割段的取值空间分别进行聚类,得到各个分割段内所有聚类簇的概率分布。
基于上述任一本发明实施例,根据所述IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练基于贝叶斯网络的IPv6地址生成模型。
基于上述任一本发明实施例,根据所述IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练基于贝叶斯网络的IPv6地址生成模型,包括:
构建贝叶斯网络结构,所述贝叶斯网络结构反映了所述IPv6地址所包含的分割段以及所述分割段之间的关联关系;
构建所述贝叶斯网络结构的概率分布模型,所述概率分布模型反映了各个所述分割段之间的依赖关系;根据所述各个分割段内所有聚类簇的概率分布训练所述概率分布模型,使得所述概率分布模型中的参数符合所述各个分割段内所有聚类簇的概率分布,得到所述分割段之间的条件概率值。
基于上述任一本发明实施例,所述每一地址位取值的不确定性采用信息熵描述,所述信息熵的熵值越大,不确定性越大;
所述信息熵用于对IPv6地址进行分割,将相邻地址位信息熵熵值变化大的位置作为分割点,包括:找出IPv6地址中各相邻地址位的信息熵之间的最大差值a,将a的1/2作为分割阈值,两个相邻地址位的信息熵熵值变化情况超过该分割阈值,则将这两个相邻地址位之间的位置作为分割点;
所述同一分割段内各地址位取值的不确定性接近是指同一分割段内相邻地址位的信息熵之差小于所述分割阈值。
本发明实施例所提供的IPv6地址生成模型创建方法通过对已有存活IPv6地址的分析,对IPv6地址进行分割并寻找出IPv6地址中各个分割段之间的联系,利用这一联系生成一种能够自动创建具有较高存活率的IPv6地址生成模型,能有效提高工作效率、节约人力物力。
第二方面,本发明实施例提供一种IPv6地址生成方法,包括:
根据所述的IPv6地址生成模型创建方法所得到的IPv6地址生成模型确定待生成IPv6地址所包含的分割段;
确定所述分割段的值;其中,一分割段的值由与它有关联关系的在先分割段的值以及相应的条件概率确定;所述条件概率为所述在先分割段的值发生的条件下所述一分割段的值发生的概率,所述条件概率的值从所述的IPv6地址生成模型创建方法所得到的IPv6地址生成模型中得到;
所有所述分割段的值均确定后,按照顺序将这些分割段组合,形成IPv6地址。
本发明实施例所提供的IPv6地址生成方法利用了通过对已有存活IPv6地址进行分析所得到的、包含有存活IPv6地址分割段间内在规律的IPv6地址生成模型,因而能够自动生成具有较高存活率的IPv6地址,有效提高了网络资产探查的效率和资产规模,节约了人力物力。
第三方面,本发明实施例提供了一种IPv6地址生成模型创建装置,包括:
IPv6地址分割模块,用于根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位取值的不确定性;按照IPv6地址中各个地址位取值的不确定性对IPv6地址进行分割,得到多个分割段;其中,同一分割段内各地址位取值的不确定性接近;
聚类模块,用于对IPv6地址各个分割段的取值空间分别进行聚类,得到各个分割段内所有聚类簇的概率分布;
IPv6地址生成模型训练模块,用于根据所述IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练IPv6地址生成模型;所述IPv6地址生成模型反映了IPv6地址所包含的分割段以及所述分割段之间的条件概率值。
基于上述任一本发明实施例,还包括:IPv6地址收集模块,收集IPv6地址,得到所述所收集的多个IPv6地址。
基于上述任一本发明实施例,所述聚类模块采用密度聚类算法对IPv6地址各个分割段的取值空间分别进行聚类,得到各个分割段内所有聚类簇的概率分布。
基于上述任一本发明实施例,所述IPv6地址生成模型训练模块根据所述IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练基于贝叶斯网络的IPv6地址生成模型。
基于上述任一本发明实施例,所述IPv6地址生成模型训练模块根据所述IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练基于贝叶斯网络的IPv6地址生成模型,包括:
构建贝叶斯网络结构,所述贝叶斯网络结构反映了所述IPv6地址所包含的分割段以及所述分割段之间的关联关系;
构建所述贝叶斯网络结构的概率分布模型,所述概率分布模型反映了各个所述分割段之间的依赖关系;根据所述各个分割段内所有聚类簇的概率分布训练所述概率分布模型,使得所述概率分布模型中的参数符合所述各个分割段内所有聚类簇的概率分布,得到所述分割段之间的条件概率值。
基于上述任一本发明实施例,所述IPv6地址分割模块采用信息熵描述每一地址位取值的不确定性,所述信息熵的熵值越大,不确定性越大;
所述信息熵用于对IPv6地址进行分割,将相邻地址位信息熵熵值变化大的位置作为分割点,包括:找出IPv6地址中各相邻地址位的信息熵之间的最大差值a,将a的1/2作为分割阈值,两个相邻地址位的信息熵熵值变化情况超过该分割阈值,则将这两个相邻地址位之间的位置作为分割点;
所述同一分割段内各地址位取值的不确定性接近是指同一分割段内相邻地址位的信息熵之差小于所述分割阈值。
本发明实施例所提供的IPv6地址生成模型创建装置通过对已有存活IPv6地址的分析,对IPv6地址进行分割并寻找出IPv6地址中各个分割段之间的联系,利用这一联系生成一种能够自动创建具有较高存活率的IPv6地址生成模型,能有效提高工作效率、节约人力物力。
第四方面,本发明实施例提供了一种IPv6地址生成装置,包括:
分割段生成模块,用于根据所述的IPv6地址生成模型创建装置所得到的IPv6地址生成模型确定待生成IPv6地址所包含的分割段;
分割段定值模块,用于确定所述分割段的值;其中,一分割段的值由与它有关联关系的在先分割段的值以及相应的条件概率确定;所述条件概率为所述在先分割段的值发生的条件下所述一分割段的值发生的概率,所述条件概率的值从所述的IPv6地址生成模型创建装置所得到的IPv6地址生成模型中得到;
分割段组合模块,用于待所有所述分割段的值均确定后,按照顺序将这些分割段组合,形成IPv6地址。
本发明实施例提供的IPv6地址生成装置利用了通过对已有存活IPv6地址进行分析所得到的、包含有存活IPv6地址分割段间内在规律的IPv6地址生成模型,因而能够自动生成具有较高存活率的IPv6地址,有效提高了网络资产探查的效率和资产规模,节约了人力物力。
第五方面,本发明实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如所述IPv6地址生成模型创建方法的步骤,或实现如所述IPv6地址生成方法的步骤。
第六方面,本发明实施例提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如所述IPv6地址生成模型创建方法的步骤,或实现如所述IPv6地址生成方法的步骤。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种IPv6地址生成模型创建方法的流程图;
图2为本发明实施例提供的一个IPv6地址分割样例的示意图;
图3为本发明实施例提供的一个分割段聚类样例的示意图;
图4为图2所示本发明实施例提供的IPv6地址分割样例中的各个分割段所建立的贝叶斯网络结构的示意图;
图5为本发明另一实施例提供的一种IPv6地址生成模型创建方法的流程图;
图6为本发明实施例提供的一种IPv6地址生成方法的流程图;
图7为本发明实施例提供的一种IPv6地址生成模型创建装置的结构示意图;
图8为本发明实施例提供的一种IPv6地址生成装置的结构示意图;
图9示例了一种电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种IPv6地址生成模型创建方法的流程图,如图1所示,为了解决上述问题,本发明实施例提供了一种IPv6地址生成模型创建方法,该方法包括:
步骤101、根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位的信息熵;然后按照IPv6地址中各个地址位的信息熵对IPv6地址进行分割,得到多个分割段;其中,同一分割段内各地址位的信息熵熵值较为接近。
本发明实施例中,所收集的IPv6地址应当是存活的IPv6地址,至少是存活率较高的IPv6地址。
统计IPv6地址中每一地址位上不同取值的出现频率,以IPv6地址中常见的16进制表示方式为例,每一地址位可能的取值包括0-F(即0-9以及用于表示10-15的A-F)。假设本步骤中,所收集的IPv6地址有10000个,那么分别统计这10000个IPv6地址中在第0地址位上取值是0的IPv6地址的个数、取值为1的IPv6地址的个数、……、取值为F的IPv6地址的个数,从而得到第0地址位上不同取值的出现概率;依次类推,可分别得到第1地址位上不同取值的出现概率、第2地址位上不同取值的出现概率、……、第127地址位上不同取值的出现概率。
在得到IPv6地址中每一地址位上不同取值的出现频率后,可根据这一概率计算每一地址位的信息熵。信息熵是一种不确定性的度量方式,熵值越大,不确定性越大;信源的平均不确定性应当为单个符号不确定性-log pi的统计平均值(E),计算得到的统计平均值也就是信息熵。信息熵的计算公式为:
其中,H(U)表示信息熵,E[]表示求平均值,pi表示所述地址位上的值为i时的出现频率,n为i所能取的最大值,n的大小取决于所述地址位的数值所采用的数学进制法,在本发明实施例中地址位的数值采用16进制,因此n的大小为16。
通过使用信息熵来描述IPv6地址每一位的信息量,可得到数据之间的关联关系和相邻地址位之间的差异程度。因此可以利用IPv6地址中相邻地址位信息熵熵值的变化情况确定分割点。在本发明实施例中,可采用如下方法确定分割点:找出IPv6地址中相邻地址位的信息熵之间的最大差值a,将a的1/2作为分割阈值,然后将两个相邻地址位的信息熵熵值变化情况与这一分割阈值进行比较,如果两个相邻地址位的信息熵熵值变化情况超过该分割阈值,就认为这两个相邻地址位之间是分割点。
确定IPv6地址中所有分割点后,就可以将IPv6地址进行分割,得到多个分割段。由于在分割时参考了相邻地址位的信息熵熵值变化情况,因此在同一分割段内,同一分割段内地址位的信息熵熵值较为接近,如通常在分割阈值范围内。
图2是本发明实施例提供的一个IPv6地址分割样例的示意图,其中图2(a)是基于信息熵对IPv6地址进行分割的示意图,图2(a)中的横轴是IPv6地址的128位,纵轴是根据每一位出现数据的频次计算出的信息熵值。在图2(a)中信息熵的波动将IPv6地址划分为A-K段。图2(b)是分割段所对应的一些数值的出现概率的示意图,从图2(b)中可以看出,不同分割段内地址位取值的稳定程度不一样,如A段中,地址位取值20010db8是稳定不变的;在C段中地址位取值可以是10、22、20、21,且这些取值有不同的出现概率。
步骤102、对IPv6地址各个分割段的取值空间分别进行聚类,得到各个分割段内所有聚类簇的概率分布。
在本发明实施例中,采用密度聚类算法实现聚类操作。按照密度聚类算法进行聚类时,只要一个区域中的点的密度大过某个阈值,就把它加到与之相近的聚类中去。在具体实现时可采用DBSCAN算法、OPTICS算法、DENCLUE算法等密度聚类算法中的一种。
图3是本发明实施例提供的一个分割段聚类样例的示意图,该样例中的分割段包含2个16进制位,总共有256种可能的取值空间,因此图中的横轴代表这256种可能的取值空间,纵轴表示通过对所收集的多个IPv6地址做统计得到的在该分割段上各取值出现的频次。在图3所示的样例中,该分割段聚类后形成7个聚类簇。
步骤103、根据所述IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练IPv6地址生成模型;所述IPv6地址生成模型反映了IPv6地址所包含的分割段以及所述分割段之间的条件概率值。
在本发明实施例中,所述IPv6地址生成模型是基于贝叶斯网络实现的。贝叶斯网络起源于人工智能领域的研究,是一种将概率统计应用于复杂系统、进行不确定性推理和数据分析的工具,是概率论和图论相结合的产物。贝叶斯网络是一种基于贝叶斯定理的概率图模型,可表示为BN=<<V,E>,P>。网络结构由<V,E>表示,是一个有向无环图,V是网络节点,E是节点之间有向边,E指代条件概率表(Conditional ProbabilityTable,CPT)。
在具体实现时,首先,构建贝叶斯网络结构。
所述贝叶斯网络结构反映了所述IPv6地址所包含的分割段以及所述分割段之间的关联关系。图4为图2所示IPv6地址分割样例中的各个分割段所建立的贝叶斯网络结构的示意图。这一贝叶斯网络结构反映了分割段A-分割段K中,哪些分割段是独立的,哪些分割段之间有关联关系的。
然后,构建所述贝叶斯网络结构的概率分布模型,根据所述各个分割段内所有聚类簇的概率分布训练所述概率分布模型,使得所述概率分布模型中的参数符合所述各个分割段内所有聚类簇的概率分布,得到所述分割段之间的条件概率值。
在之前建立的贝叶斯网络结构中只能反映哪些分割段之间具有关联关系,并不能反映关联程度的高低。此处通过概率分布模型来表征关联程度,通过已知的各个分割段内所有聚类簇的概率分布对概率分布模型中的参数进行调整,当概率分布模型中的参数符合所述各个分割段内所有聚类簇的概率分布时,由概率分布模型中的参数就能够得到分割段之间的条件概率值。
本发明实施例中是以贝叶斯网络为基础构建并训练了IPv6地址生成模型,在本发明的其它实施例中,也可以以其它方法为基础构建并训练IPv6地址生成模型,如循环神经网络法。
以上是对本发明实施例所提供的IPv6地址生成模型创建方法的实现步骤的说明。本发明实施例所提供的IPv6地址生成模型创建方法通过对已有存活IPv6地址的分析,对IPv6地址进行分割并寻找出IPv6地址中各个分割段之间的联系,利用这一联系生成一种能够自动创建具有较高存活率的IPv6地址生成模型,能有效提高工作效率、节约人力物力。
基于上述任一实施例,图5为本发明另一实施例提供的一种IPv6地址生成模型创建方法的流程图,如图5所示,本发明另一实施例提供的IPv6地址生成模型创建方法包括:
步骤501、收集IPv6地址,得到所述所收集的多个IPv6地址。
在本发明实施例中,收集IPv6地址采用网络流量分析的方式。当前网络流量分析主要有以下三种方式:基于SNMP流量分析、基于网络探针的流量分析、基于实时流量抓包的数据分析。这三种方式均可用于本发明实施例以实现对存活IPv6地址的收集。采用网络流量分析的方式收集IPv6地址能够收集到存活率更高的IPv6地址。
在本发明的其它实施例中,也可通过向第三方机构获取存活的IPv6地址集等本领域技术人员公知的手段来获得存活IPv6地址。
步骤502、根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位的信息熵;然后按照IPv6地址中各个地址位的信息熵对IPv6地址进行分割,得到多个分割段。
步骤503、对IPv6地址各个分割段的取值空间分别进行聚类,得到各个分割段内所有聚类簇的概率分布。
步骤504、根据所述IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练IPv6地址生成模型;所述IPv6地址生成模型反映了IPv6地址所包含的分割段以及所述分割段之间的条件概率值。
步骤502-步骤504与步骤101-步骤103在具体实现细节上并无本质区别,因此不在此处重复描述。
本发明实施例所提供的IPv6地址生成模型创建方法采用网络流量分析的方法来获取用于分析的存活IPv6地址,使得最终所生成的IPv6地址生成模型所生成的IPv6地址存活率更高。
基于上述任一实施例,图6为本发明实施例提供的一种IPv6地址生成方法的流程图,如图6所示,本发明实施例提供的IPv6地址生成方法包括:
步骤601、根据前述的IPv6地址生成模型创建方法所得到的IPv6地址生成模型确定待生成IPv6地址所包含的分割段;
由之前所得到的IPv6地址生成模型可以知道一个IPv6地址包含有多少个分割段,由此可确定组成一个IPv6地址的分割段的数量、每个分割段内的地址位的数量以及各个分割段之间的顺序关系。此时可默认各分割段内各地址位的数值都为0或其它任意指定的数值。
步骤602、确定各个分割段的值。
从IPv6地址生成模型可以知道,有些分割段是独立的,如图4中的A段、B段、K段,这些独立的分割段通常是网络前缀或其它数值为常量的情况,因此这些分割段的值是确定的,可按照确定值直接赋值。有些分割段之间有关联关系,如在为C段赋值时,可按照IPv6地址生成模型所提供的概率,给C段赋予一个概率较高的值,接着为D段赋值。例如,假设C段是长度为3(有3个地址位)的分割段,D段是长度为2的分割段。C段有8个聚类簇,依据聚类簇的概率分布随机抽取一个聚类簇中的一个数值,比如选择了C3簇中的0f6这个值作为一个初始值,接下来根据所述IPv6地址生成模型要推导出其他分割段的值。以D段为例,根据IPv6地址生成模型得到分割段之间的概率关系,比如在C段选择C3簇时,D段中(假设有5个聚类簇)的D1簇出现的概率最高(比如50%的概率),那么根据IPv6地址生成模型很可能从D1中选择一个值,比如0f,作为D段的生成值。以此类推,可以确定各个分割段的值。
步骤603、所有所述分割段的值均确定后,按照顺序将这些分割段组合,形成IPv6地址。
已知各个分割段之间的顺序关系,在确定各分割段的值以后,就可以将这些分割段按照顺序组合起来,形成IPv6地址。通过这种方法所形成的IPv6地址具有较高的存活率。
本发明实施例所提供的IPv6地址生成方法利用了通过对已有存活IPv6地址进行分析所得到的、包含有存活IPv6地址分割段间内在规律的IPv6地址生成模型,因而能够自动生成具有较高存活率的IPv6地址,有效提高了网络资产探查的效率和资产规模,节约了人力物力。
基于上述任一实施例,图7为本发明实施例提供的一种IPv6地址生成模型创建装置的结构示意图,如图7所示,本发明实施例提供的一种IPv6地址生成模型创建装置包括:
IPv6地址分割模块701,用于根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位取值的不确定性;按照IPv6地址中各个地址位取值的不确定性对IPv6地址进行分割,得到多个分割段;其中,同一分割段内各地址位取值的不确定性接近。
在本发明实施例中,所述IPv6地址分割模块701采用信息熵描述每一地址位取值的不确定性,所述信息熵的熵值越大,不确定性越大。信息熵的计算公式为:
其中,H(U)表示信息熵,E[]表示求平均值,pi表示所述地址位上的值为i时的出现频率,n为i所能取的最大值,n的大小取决于所述地址位的数值所采用的数学进制法,在本发明实施例中地址位的数值采用16进制,因此n的大小为16。
所述IPv6地址分割模块701按照所述信息熵对IPv6地址进行分割,将相邻地址位信息熵熵值变化大的位置作为分割点,包括:找出IPv6地址中各相邻地址位的信息熵之间的最大差值a,将a的1/2作为分割阈值,两个相邻地址位的信息熵熵值变化情况超过该分割阈值,则将这两个相邻地址位之间的位置作为分割点。
聚类模块702,用于对IPv6地址各个分割段的取值空间分别进行聚类,得到各个分割段内所有聚类簇的概率分布。
在本发明实施例中,所述聚类模块702采用密度聚类算法对IPv6地址各个分割段的取值空间分别进行聚类。
IPv6地址生成模型训练模块703,用于根据所述IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练IPv6地址生成模型;所述IPv6地址生成模型反映了IPv6地址所包含的分割段以及所述分割段之间的条件概率值。
在本发明实施例中,所述IPv6地址生成模型训练模块703基于贝叶斯网络技术来构建并训练所述IPv6地址生成模型,具体包括:构建贝叶斯网络结构,所述贝叶斯网络结构反映了所述IPv6地址所包含的分割段以及所述分割段之间的关联关系;构建所述贝叶斯网络结构的概率分布模型,所述概率分布模型反映了各个所述分割段之间的依赖关系;根据所述各个分割段内所有聚类簇的概率分布训练所述概率分布模型,使得所述概率分布模型中的参数符合所述各个分割段内所有聚类簇的概率分布,得到所述分割段之间的条件概率值。
本发明实施例所提供的IPv6地址生成模型创建装置通过对已有存活IPv6地址的分析,对IPv6地址进行分割并寻找出IPv6地址中各个分割段之间的联系,利用这一联系生成一种能够自动创建具有较高存活率的IPv6地址生成模型,能有效提高工作效率、节约人力物力。
基于上述任一实施例,本发明另一实施例提供的一种IPv6地址生成模型创建装置还包括:IPv6地址收集模块,该模块收集IPv6地址,得到所述所收集的多个IPv6地址。
基于上述任一实施例,图8为本发明实施例提供的一种IPv6地址生成装置的结构示意图,如图8所示,本发明实施例提供的一种IPv6地址生成装置包括:
分割段生成模块801,用于根据前述的IPv6地址生成模型创建装置所得到的IPv6地址生成模型确定待生成IPv6地址所包含的分割段;
分割段定值模块802,用于确定所述分割段的值;其中,一分割段的值由与它有关联关系的在先分割段的值以及相应的条件概率确定;所述条件概率为所述在先分割段的值发生的条件下所述一分割段的值发生的概率,所述条件概率的值从前述的IPv6地址生成模型创建装置所得到的IPv6地址生成模型中得到;
分割段组合模块803,用于待所有所述分割段的值均确定后,按照顺序将这些分割段组合,形成IPv6地址。
本发明实施例所提供的IPv6地址生成装置利用了通过对已有存活IPv6地址进行分析所得到的、包含有存活IPv6地址分割段间内在规律的IPv6地址生成模型,因而能够自动生成具有较高存活率的IPv6地址,有效提高了网络资产探查的效率和资产规模,节约了人力物力。
图9示例了一种电子设备的实体结构示意图,如图9所示,该电子设备可以包括:处理器(processor)910、通信接口(Communications Interface)920、存储器(memory)930和通信总线940,其中,处理器910,通信接口920,存储器930通过通信总线940完成相互间的通信。处理器910可以调用存储器930中的逻辑指令,以执行如下方法:根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位取值的不确定性;按照IPv6地址中各个地址位取值的不确定性对IPv6地址进行分割,得到多个分割段;对IPv6地址各个分割段的取值空间分别进行聚类,得到各个分割段内所有聚类簇的概率分布;根据所述IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练IPv6地址生成模型;所述IPv6地址生成模型反映了IPv6地址所包含的分割段以及所述分割段之间的条件概率值。或执行如下方法:根据IPv6地址生成模型确定待生成IPv6地址所包含的分割段;确定所述分割段的值;所有所述分割段的值均确定后,按照顺序将这些分割段组合,形成IPv6地址。
此外,上述的存储器930中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的方法,例如包括:根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位取值的不确定性;按照IPv6地址中各个地址位取值的不确定性对IPv6地址进行分割,得到多个分割段;对IPv6地址各个分割段的取值空间分别进行聚类,得到各个分割段内所有聚类簇的概率分布;根据所述IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练IPv6地址生成模型;所述IPv6地址生成模型反映了IPv6地址所包含的分割段以及所述分割段之间的条件概率值。或包括:根据IPv6地址生成模型确定待生成IPv6地址所包含的分割段;确定所述分割段的值;所有所述分割段的值均确定后,按照顺序将这些分割段组合,形成IPv6地址。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (16)
1.一种IPv6地址生成模型创建方法,其特征在于,包括:
根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位取值的不确定性;按照IPv6地址中各个地址位取值的不确定性对IPv6地址进行分割,得到多个分割段;其中,同一分割段内各地址位取值的不确定性接近;
对IPv6地址各个分割段的取值空间分别进行聚类,得到各个分割段内所有聚类簇的概率分布;
根据所述IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练IPv6地址生成模型;所述IPv6地址生成模型反映了IPv6地址所包含的分割段以及所述分割段之间的条件概率值。
2.根据权利要求1所述的IPv6地址生成模型创建方法,其特征在于,还包括:收集IPv6地址,得到所述所收集的多个IPv6地址。
3.根据权利要求1或2所述的IPv6地址生成模型创建方法,其特征在于,采用密度聚类算法对IPv6地址各个分割段的取值空间分别进行聚类,得到各个分割段内所有聚类簇的概率分布。
4.根据权利要求1或2所述的IPv6地址生成模型创建方法,其特征在于,根据所述IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练基于贝叶斯网络的IPv6地址生成模型。
5.根据权利要求4所述的IPv6地址生成模型创建方法,其特征在于,根据所述IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练基于贝叶斯网络的IPv6地址生成模型,包括:
构建贝叶斯网络结构,所述贝叶斯网络结构反映了所述IPv6地址所包含的分割段以及所述分割段之间的关联关系;
构建所述贝叶斯网络结构的概率分布模型,所述概率分布模型反映了各个所述分割段之间的依赖关系;根据所述各个分割段内所有聚类簇的概率分布训练所述概率分布模型,使得所述概率分布模型中的参数符合所述各个分割段内所有聚类簇的概率分布,得到所述分割段之间的条件概率值。
6.根据权利要求1或2所述的IPv6地址生成模型创建方法,其特征在于,所述每一地址位取值的不确定性采用信息熵描述,所述信息熵的熵值越大,不确定性越大;
所述信息熵用于对IPv6地址进行分割,将相邻地址位信息熵熵值变化大的位置作为分割点,包括:找出IPv6地址中各相邻地址位的信息熵之间的最大差值a,将a的1/2作为分割阈值,两个相邻地址位的信息熵熵值变化情况超过该分割阈值,则将这两个相邻地址位之间的位置作为分割点;
所述同一分割段内各地址位取值的不确定性接近是指同一分割段内相邻地址位的信息熵之差小于所述分割阈值。
7.一种IPv6地址生成方法,其特征在于,包括:
根据权利要求1-6任一项所述的IPv6地址生成模型创建方法所得到的IPv6地址生成模型确定待生成IPv6地址所包含的分割段;
确定所述分割段的值;其中,一分割段的值由与它有关联关系的在先分割段的值以及相应的条件概率确定;所述条件概率为所述在先分割段的值发生的条件下所述一分割段的值发生的概率,所述条件概率的值从权利要求1-6任一项所述的IPv6地址生成模型创建方法所得到的IPv6地址生成模型中得到;
所有所述分割段的值均确定后,按照顺序将这些分割段组合,形成IPv6地址。
8.一种IPv6地址生成模型创建装置,其特征在于,包括:
IPv6地址分割模块,用于根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位取值的不确定性;按照IPv6地址中各个地址位取值的不确定性对IPv6地址进行分割,得到多个分割段;其中,同一分割段内各地址位取值的不确定性接近;
聚类模块,用于对IPv6地址各个分割段的取值空间分别进行聚类,得到各个分割段内所有聚类簇的概率分布;
IPv6地址生成模型训练模块,用于根据所述IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练IPv6地址生成模型;所述IPv6地址生成模型反映了IPv6地址所包含的分割段以及所述分割段之间的条件概率值。
9.根据权利要求8所述的IPv6地址生成模型创建装置,其特征在于,还包括:IPv6地址收集模块,收集IPv6地址,得到所述所收集的多个IPv6地址。
10.根据权利要求8或9所述的IPv6地址生成模型创建装置,其特征在于,所述聚类模块采用密度聚类算法对IPv6地址各个分割段的取值空间分别进行聚类,得到各个分割段内所有聚类簇的概率分布。
11.根据权利要求8或9所述的IPv6地址生成模型创建装置,其特征在于,所述IPv6地址生成模型训练模块根据所述IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练基于贝叶斯网络的IPv6地址生成模型。
12.根据权利要求11所述的IPv6地址生成模型创建装置,其特征在于,所述IPv6地址生成模型训练模块根据所述IPv6地址的分割段以及各个分割段内所有聚类簇的概率分布,构建并训练基于贝叶斯网络的IPv6地址生成模型,包括:
构建贝叶斯网络结构,所述贝叶斯网络结构反映了所述IPv6地址所包含的分割段以及所述分割段之间的关联关系;
构建所述贝叶斯网络结构的概率分布模型,所述概率分布模型反映了各个所述分割段之间的依赖关系;根据所述各个分割段内所有聚类簇的概率分布训练所述概率分布模型,使得所述概率分布模型中的参数符合所述各个分割段内所有聚类簇的概率分布,得到所述分割段之间的条件概率值。
13.根据权利要求8或9所述的IPv6地址生成模型创建装置,其特征在于,所述IPv6地址分割模块采用信息熵描述每一地址位取值的不确定性,所述信息熵的熵值越大,不确定性越大;
所述信息熵用于对IPv6地址进行分割,将相邻地址位信息熵熵值变化大的位置作为分割点,包括:找出IPv6地址中各相邻地址位的信息熵之间的最大差值a,将a的1/2作为分割阈值,两个相邻地址位的信息熵熵值变化情况超过该分割阈值,则将这两个相邻地址位之间的位置作为分割点;
所述同一分割段内各地址位取值的不确定性接近是指同一分割段内相邻地址位的信息熵之差小于所述分割阈值。
14.一种IPv6地址生成装置,其特征在于,包括:
分割段生成模块,用于根据权利要求8-13任一项所述的IPv6地址生成模型创建装置所得到的IPv6地址生成模型确定待生成IPv6地址所包含的分割段;
分割段定值模块,用于确定所述分割段的值;其中,一分割段的值由与它有关联关系的在先分割段的值以及相应的条件概率确定;所述条件概率为所述在先分割段的值发生的条件下所述一分割段的值发生的概率,所述条件概率的值从权利要求8-13任一项所述的IPv6地址生成模型创建装置所得到的IPv6地址生成模型中得到;
分割段组合模块,用于待所有所述分割段的值均确定后,按照顺序将这些分割段组合,形成IPv6地址。
15.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述IPv6地址生成模型创建方法的步骤,或实现如权利要求7所述IPv6地址生成方法的步骤。
16.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6任一项所述IPv6地址生成模型创建方法的步骤,或实现如权利要求7所述IPv6地址生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910943931.8A CN110809066A (zh) | 2019-09-30 | 2019-09-30 | IPv6地址生成模型创建方法、装置及地址生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910943931.8A CN110809066A (zh) | 2019-09-30 | 2019-09-30 | IPv6地址生成模型创建方法、装置及地址生成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110809066A true CN110809066A (zh) | 2020-02-18 |
Family
ID=69488314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910943931.8A Pending CN110809066A (zh) | 2019-09-30 | 2019-09-30 | IPv6地址生成模型创建方法、装置及地址生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110809066A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111432043A (zh) * | 2020-03-09 | 2020-07-17 | 清华大学 | 基于密度的动态IPv6地址探测方法 |
CN111885213A (zh) * | 2020-06-09 | 2020-11-03 | 中国科学院信息工程研究所 | 一种基于门控卷积变分自编码器的IPv6地址发现方法和装置 |
CN112651227A (zh) * | 2020-11-24 | 2021-04-13 | 中国科学院信息工程研究所 | 一种基于向量空间下语言建模的IPv6目标生成方法和装置 |
CN113630482A (zh) * | 2021-08-23 | 2021-11-09 | 南京莱克贝尔信息技术有限公司 | 一种基于隐半马尔可夫的IPv6快速探测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102340551A (zh) * | 2010-07-27 | 2012-02-01 | 中国电信股份有限公司 | 一种构建IPv6地址池的方法与系统 |
US20170359227A1 (en) * | 2016-06-09 | 2017-12-14 | Akamai Technologies, Inc. | Internet address structure analysis, and applications thereof |
CN109905497A (zh) * | 2019-03-05 | 2019-06-18 | 长沙学院 | 一种IPv6活跃地址动态发现方法 |
-
2019
- 2019-09-30 CN CN201910943931.8A patent/CN110809066A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102340551A (zh) * | 2010-07-27 | 2012-02-01 | 中国电信股份有限公司 | 一种构建IPv6地址池的方法与系统 |
US20170359227A1 (en) * | 2016-06-09 | 2017-12-14 | Akamai Technologies, Inc. | Internet address structure analysis, and applications thereof |
CN109905497A (zh) * | 2019-03-05 | 2019-06-18 | 长沙学院 | 一种IPv6活跃地址动态发现方法 |
Non-Patent Citations (2)
Title |
---|
FOREMSKI P, PLONKA D, BERGER A.: "Entropy/IP: Uncovering Structure in IPv6 Addresses", 《ACM INTERNET MEASUREMENT CONFERENCE》 * |
左志昊等: "活跃IPv6地址前缀的预测算法", 《通信学报》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111432043A (zh) * | 2020-03-09 | 2020-07-17 | 清华大学 | 基于密度的动态IPv6地址探测方法 |
CN111432043B (zh) * | 2020-03-09 | 2021-06-01 | 清华大学 | 基于密度的动态IPv6地址探测方法 |
CN111885213A (zh) * | 2020-06-09 | 2020-11-03 | 中国科学院信息工程研究所 | 一种基于门控卷积变分自编码器的IPv6地址发现方法和装置 |
CN112651227A (zh) * | 2020-11-24 | 2021-04-13 | 中国科学院信息工程研究所 | 一种基于向量空间下语言建模的IPv6目标生成方法和装置 |
CN113630482A (zh) * | 2021-08-23 | 2021-11-09 | 南京莱克贝尔信息技术有限公司 | 一种基于隐半马尔可夫的IPv6快速探测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110809066A (zh) | IPv6地址生成模型创建方法、装置及地址生成方法 | |
CN110138764B (zh) | 一种基于层次攻击图的攻击路径分析方法 | |
CN112640380B (zh) | 用于对事件的输入流进行异常检测的设备和方法 | |
CN109194707B (zh) | 分布式图嵌入的方法及装置 | |
Papadopoulos et al. | Network mapping by replaying hyperbolic growth | |
US11652709B2 (en) | Managing computation load in a fog network | |
CN110135603B (zh) | 一种基于改进熵权法的电力网络告警空间特征分析方法 | |
CN112085125A (zh) | 基于线性自学习网络的缺失值填补方法、存储介质及系统 | |
CN115358487A (zh) | 面向电力数据共享的联邦学习聚合优化系统及方法 | |
CN110838072A (zh) | 一种基于社区发现的社交网络影响力最大化方法及系统 | |
CN113489619A (zh) | 一种基于时间序列分析的网络拓扑推断方法及装置 | |
Edunov et al. | Darwini: Generating realistic large-scale social graphs | |
Liu et al. | Finding densest lasting subgraphs in dynamic graphs: A stochastic approach | |
CN116681104A (zh) | 分布式空间图神经网络的模型建立及实现方法 | |
CN106022936B (zh) | 适用论文合作网络的基于社团结构的影响最大化算法 | |
Al-Saedi et al. | Reducing communication overhead of federated learning through clustering analysis | |
WO2011114135A1 (en) | Detecting at least one community in a network | |
US11914956B1 (en) | Unusual score generators for a neuro-linguistic behavioral recognition system | |
Bekkerman et al. | Heuristic approximation method for a random flow of events by an MC-flow with arbitrary number of states | |
Chandio et al. | Towards adaptable and tunable cloud-based map-matching strategy for GPS trajectories | |
CN114492849B (zh) | 一种基于联邦学习的模型更新方法及装置 | |
CN111917589B (zh) | 一种电力通信网络资源备份方法及相关装置 | |
Xu et al. | Dm-KDE: dynamical kernel density estimation by sequences of KDE estimators with fixed number of components over data streams | |
CN115168326A (zh) | Hadoop大数据平台分布式能源数据清洗方法及系统 | |
CN114036029A (zh) | 一种服务器的磁盘空间使用预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200218 |