CN110784561A - IPv6地址分割方法及相似站点或链路地址集寻找方法 - Google Patents

IPv6地址分割方法及相似站点或链路地址集寻找方法 Download PDF

Info

Publication number
CN110784561A
CN110784561A CN201910943917.8A CN201910943917A CN110784561A CN 110784561 A CN110784561 A CN 110784561A CN 201910943917 A CN201910943917 A CN 201910943917A CN 110784561 A CN110784561 A CN 110784561A
Authority
CN
China
Prior art keywords
address
ipv6
ipv6 address
segmentation
uncertainty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910943917.8A
Other languages
English (en)
Inventor
禹庆华
李国辉
李斌
武浩
叶盛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qax Technology Group Inc
Secworld Information Technology Beijing Co Ltd
Original Assignee
Qax Technology Group Inc
Secworld Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qax Technology Group Inc, Secworld Information Technology Beijing Co Ltd filed Critical Qax Technology Group Inc
Priority to CN201910943917.8A priority Critical patent/CN110784561A/zh
Publication of CN110784561A publication Critical patent/CN110784561A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2101/00Indexing scheme associated with group H04L61/00
    • H04L2101/60Types of network addresses
    • H04L2101/618Details of network addresses
    • H04L2101/659Internet protocol version 6 [IPv6] addresses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供一种IPv6地址分割方法及相似站点或链路地址集寻找方法,包括:根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位取值的不确定性;按照IPv6地址中各个地址位取值的不确定性对IPv6地址进行分割,得到多个分割段;其中,同一分割段内各地址位取值的不确定性接近。本发明实施例所公开的IPv6地址分割方法能够根据地址位取值的不确定性对IPv6地址进行自动分割,有利于识别出IPv6地址中不同地址位的功能。

Description

IPv6地址分割方法及相似站点或链路地址集寻找方法
技术领域
本发明涉及网络安全技术领域,尤其涉及一种IPv6地址分割方法及相似站点或链路地址集寻找方法。
背景技术
在网络安全领域中,有时需要寻找相似站点或链路地址集。在网络普遍采用IPv4地址的时代,可以通过对IPv4地址遍历的方式进行搜寻。但当IPv6地址启用后,由于IPv6地址共有128位,与仅有32位的IPv4地址相比,地址空间范围极为庞大,因此通过传统的地址遍历的方式来寻找相似站点或链路地址集需要耗费极其庞大的计算资源与时间资源,在实际操作中已不可行。
现有可行的IPv6相似站点或链路地址集寻找方法有人工手动查找法,这种方法效率低、成本高,且效果有限;或者从分配IPv6地址的运营商那里获取,这一方法有较多障碍,实际使用时未必可行。因此需要一种高效果、低成本且能计算机实现的相似站点或链路地址集寻找方法。
发明内容
本发明实施例提供一种IPv6地址分割方法及相似站点或链路地址集寻找方法,用以解决现有技术中用户需要人工手动查找所带来的效率低、成本高、效果有限的缺陷,实现相似站点或链路地址集的快速查找。
第一方面,本发明实施例提供IPv6地址分割方法,包括:
根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位取值的不确定性;
按照IPv6地址中各个地址位取值的不确定性对IPv6地址进行分割,得到多个分割段;其中,同一分割段内各地址位取值的不确定性接近。
基于上述任一本发明实施例,所述每一地址位取值的不确定性采用信息熵描述,所述信息熵的熵值越大,不确定性越大;
所述信息熵用于对IPv6地址进行分割,得到多个分割段;其中,同一分割段内各地址位信息熵的熵值接近。
基于上述任一本发明实施例,所述信息熵的计算公式为:
Figure BDA0002223665800000021
其中,H(U)表示信息熵,E[]表示求平均值,pi表示所述地址位上的值为i时的出现频率,n为i所能取的最大值,n的大小取决于所述地址位的数值所采用的数学进制法。
基于上述任一本发明实施例,按照所述信息熵对IPv6地址进行分割时,将相邻地址位信息熵熵值变化大的位置作为分割点,包括:
找出IPv6地址中各相邻地址位的信息熵之间的最大差值a,将a的1/2作为分割阈值,两个相邻地址位的信息熵熵值变化情况超过该分割阈值,则将这两个相邻地址位之间的位置作为分割点;
所述同一分割段内各地址位信息熵的熵值接近为同一分割段内相邻地址位的信息熵之差小于所述分割阈值。
基于上述任一本发明实施例,还包括:从一个或多个网络内部收集IPv6地址,得到所述所收集的多个IPv6地址。
本发明实施例所公开的IPv6地址分割方法能够根据地址位取值的不确定性对IPv6地址进行自动分割,有利于识别出IPv6地址中不同地址位的功能,在网络资产探查等方面具有重要意义。
第二方面,本发明实施例还提供了一种相似站点或链路地址集寻找方法,包括:
从IPv6地址分割段中选取段内地址位取值不确定性较低的分割段,将这些分割段作为待比较的网络前缀;其中,所述IPv6地址分割段采用所述IPv6地址分割方法得到;
为另一待比较的IPv6地址与所述待比较的网络前缀在对应地址位计算相似度并归一化,归一化后的所述相似度高于相似度阈值,则该待比较的IPv6地址所源自的网络与所述待比较的网络前缀所在的网络为相似站点或链路地址集。
基于上述任一本发明实施例,所述地址位取值不确定性采用信息熵描述,所述信息熵的熵值越大,不确定性越大;
所述从IPv6地址分割段中选取段内地址位取值不确定性较低的分割段为从IPv6地址分割段中选取段内地址位信息熵的熵值均小于第一阈值的分割段。
基于上述任一本发明实施例,所述第一阈值小于0.1。
基于上述任一本发明实施例,所述相似度阈值在0.5-1之间。
本发明实施例提供的相似站点或链路地址集寻找方法能够高效地探测相似站点或链路地址集,实现成本低,无需大量的人力物力,也能有效减少工作时间。
第三方面,本发明实施例提供了一种IPv6地址分割装置,包括:
地址位取值不确定性计算模块,用于根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位取值的不确定性;
IPv6地址分割模块,用于按照IPv6地址中各个地址位取值的不确定性对IPv6地址进行分割,得到多个分割段;其中,同一分割段内相邻地址位取值的不确定性接近。
基于上述任一本发明实施例,所述每一地址位取值的不确定性采用信息熵描述,所述信息熵的熵值越大,不确定性越大;
所述信息熵用于对IPv6地址进行分割,得到多个分割段;其中,同一分割段内各地址位信息熵的熵值接近。
基于上述任一本发明实施例,所述信息熵的计算公式为:
Figure BDA0002223665800000031
其中,H(U)表示信息熵,E[]表示求平均值,pi表示所述地址位上的值为i时的出现频率,n为i所能取的最大值,n的大小取决于所述地址位的数值所采用的数学进制法。
基于上述任一本发明实施例,按照所述信息熵对IPv6地址进行分割时将相邻地址位信息熵熵值变化大的位置作为分割点,包括:
找出IPv6地址中相邻地址位的信息熵之间的最大差值a,将a的1/2作为分割阈值,两个相邻地址位的信息熵熵值变化情况超过该分割阈值,则将这两个相邻地址位之间的位置作为分割点;
所述同一分割段内各地址位信息熵的熵值接近为同一分割段内相邻地址位的信息熵之差小于所述分割阈值。
基于上述任一本发明实施例,还包括:IPv6地址收集模块,用于从一个或多个网络内部收集IPv6地址,得到所述所收集的多个IPv6地址。
本发明实施例所公开的IPv6地址分割装置能够根据地址位取值的不确定性对IPv6地址进行自动分割,有利于识别出IPv6地址中不同地址位的功能,在网络资产探查等方面具有重要意义。
第四方面,本发明实施例还提供了一种相似站点或链路地址集寻找装置,包括:
分割段选择模块,用于从IPv6地址分割段中选取段内地址位取值不确定性较低的分割段,将这些分割段作为待比较的网络前缀;其中,所述IPv6地址分割段采用所述IPv6地址分割装置得到;
相似度计算与比较模块,用于为另一待比较的IPv6地址与所述待比较的网络前缀在对应地址位计算相似度并归一化,归一化后的所述相似度高于相似度阈值,则该待比较的IPv6地址所源自的网络与所述待比较的网络前缀所在的网络为相似站点或链路地址集。
基于上述任一本发明实施例,所述地址位取值不确定性采用信息熵描述,所述信息熵的熵值越大,不确定性越大;
所述从IPv6地址分割段中选取段内地址位取值不确定性较低的分割段为从IPv6地址分割段中选取段内地址位信息熵的熵值均小于第一阈值的分割段。
基于上述任一本发明实施例,所述第一阈值小于0.1。
基于上述任一本发明实施例,所述相似度阈值在0.5-1之间。
本发明实施例提供的相似站点或链路地址集寻找装置能够高效地探测相似站点或链路地址集,实现成本低,无需大量的人力物力,也能有效减少工作时间。
第五方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如所述IPv6地址分割方法的步骤,或实现如所述相似站点或链路地址集寻找方法的步骤。
第六方面,本发明实施例又提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如所述IPv6地址分割方法的步骤,或实现如所述相似站点或链路地址集寻找方法的步骤。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种IPv6地址分割方法的流程图;
图2是一个IPv6地址分割样例的示意图;
图3是本发明另一实施例提供的一种IPv6地址分割方法的流程图;
图4是本发明实施例提供的一种相似站点或链路地址集寻找方法的流程图;
图5是本发明实施例提供的一种IPv6地址分割装置的结构示意图;
图6是本发明实施例提供的相似站点或链路地址集寻找装置的结构示意图;
图7是一种电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种IPv6地址分割方法的流程图,如图1所示,为了解决上述问题,本发明实施例提供了一种IPv6地址分割方法,该方法包括:
步骤101、根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位的信息熵。
以IPv6地址中常见的16进制表示方式为例,每一地址位可能的取值包括0-F(即0-9以及用于表示10-15的A-F)。假设本步骤中,所收集的IPv6地址有10000个,那么分别统计这10000个IPv6地址中在第0地址位上取值是0的IPv6地址的个数、取值为1的IPv6地址的个数、……、取值为F的IPv6地址的个数,从而得到第0地址位上不同取值的出现概率;依次类推,可分别得到第1地址位上不同取值的出现概率、第2地址位上不同取值的出现概率、……、第127地址位上不同取值的出现概率。
在得到IPv6地址中每一地址位上不同取值的出现频率后,可根据这一概率计算每一地址位的信息熵。信息熵是一种不确定性的度量方式,熵值越大,不确定性越大;信源的平均不确定性应当为单个符号不确定性-log pi的统计平均值(E),计算得到的统计平均值也就是信息熵。信息熵的计算公式为:
Figure BDA0002223665800000061
其中,H(U)表示信息熵,E[]表示求平均值,pi表示所述地址位上的值为i时的出现频率,n为i所能取的最大值,n的大小取决于所述地址位的数值所采用的数学进制法,在本发明实施例中地址位的数值采用16进制,因此n的大小为16。
通过使用信息熵来描述IPv6地址每一位的信息量,可得到数据之间的关联关系和相邻地址位之间的差异程度。
步骤102、按照IPv6地址中各个地址位的信息熵对IPv6地址进行分割,得到多个分割段;其中,同一分割段内各地址位的信息熵熵值较为接近。
正如前面所提到的,信息熵能够反映相邻地址位之间的差异程度,因此可以利用IPv6地址中相邻地址位信息熵熵值的变化情况确定分割点。在本发明实施例中,可采用如下方法确定分割点:找出IPv6地址中相邻地址位的信息熵之间的最大差值a,将a的1/2作为分割阈值,然后将两个相邻地址位的信息熵熵值变化情况与这一分割阈值进行比较,如果两个相邻地址位的信息熵熵值变化情况超过该分割阈值,就认为这两个相邻地址位之间是分割点。
确定IPv6地址中所有分割点后,就可以将IPv6地址进行分割,得到多个分割段。由于在分割时参考了相邻地址位的信息熵熵值变化情况,因此在同一分割段内,同一分割段内地址位的信息熵熵值较为接近,如通常在分割阈值范围内。
图2是一个IPv6地址分割样例的示意图,其中图2(a)是基于信息熵对IPv6地址进行分割的示意图,图2(a)中的横轴是IPv6地址的128位,纵轴是根据每一位出现数据的频次计算出的信息熵值。在图2(a)中信息熵的波动将IPv6地址划分为A-K段。图2(b)是分割段所对应的一些数值的出现概率的示意图,从图2(b)中可以看出,不同分割段内地址位取值的稳定程度不一样,如A段中,地址位取值20010db8是稳定不变的;在C段中地址位取值可以是10、22、20、21,且这些取值有不同的出现概率。
本发明实施例所公开的IPv6地址分割方法能够根据地址位取值的不确定性对IPv6地址进行自动分割,有利于识别出IPv6地址中不同地址位的功能,在网络资产探查等方面具有重要意义。
基于上述任一实施例,图3为本发明另一实施例提供的一种IPv6地址分割方法的流程图,如图3所示,该方法包括:
步骤301、从一个或多个网络内部收集IPv6地址,得到多个IPv6地址;
步骤302、根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位的信息熵;
步骤303、按照所述信息熵对IPv6地址进行分割,得到多个分割段;其中,同一分割段内各地址位信息熵的熵值接近。
本发明实施例所公开的IPv6地址分割方法利用已有的网络收集IPv6地址,根据这些收集的IPv6地址中地址位取值的不确定性对IPv6地址进行自动分割,有利于识别出IPv6地址中不同地址位的功能,在网络资产探查等方面具有重要意义。
基于上述任一实施例,图4为本发明实施例提供的一种相似站点或链路地址集寻找方法的流程图,如图4所示,该方法包括:
步骤401、从IPv6地址分割段中选取段内地址位的熵值均较小的分割段,将这些分割段作为待比较的网络前缀;其中,所述IPv6地址分割段采用前述的IPv6地址分割方法得到;
正如图2(b)中所显示的那样,不同分割段内地址位取值的稳定程度(即地址位信息熵的熵值)是不一样的,那些稳定性高的分割段有极大可能是网络前缀,而稳定性较低的分割段有可能是主机号等信息。因此在本步骤中选取那些地址位熵值较小的分割段作为网络前缀。在本发明实施例中,将分割段内地址位信息熵的熵值小于第一阈值的分割段作为网络前缀,在本发明实施例中,所述第一阈值的大小为0.1以下,但在本发明的其它实施例中,可以根据实际情况对第一阈值的大小进行调整,如将分割段内地址位信息熵的熵值均在0.05以下的分割段作为网络前缀,或将分割段内地址位信息熵的熵值均在0.12以下的分割段作为网络前缀。
步骤402、为另一待比较的IPv6地址与所述待比较的网络前缀在对应地址位计算相似度并归一化,归一化后的所述相似度高于相似度阈值,则该待比较的IPv6地址所源自的网络与所述待比较的网络前缀所在的网络为相似站点或链路地址集。
在前一步骤中,已经选取了一些分割段作为网络前缀,在本步骤中可以将待比较的IPv6地址与这些网络前缀在相应的地址位上计算相似度,如果相似度高于一阈值,则该待比较的IPv6地址所源自的网络与所述待比较的网络前缀所在的网络为相似站点或链路地址集。在本发明实施例中,相似度的计算方法是欧式距离法,在本发明的其它实施例中,可以采用其它相似度计算方法,如汉明距离法、夹角余弦距离法等本领域技术人员常用的相似度计算方法。在本发明实施例中,所述相似度阈值的大小为0.7,在本发明的其它实施例中,所述相似度阈值的大小可根据实际应用有一定的变化,其取值范围通常在0.5-1之间。
本发明实施例提供的相似站点或链路地址集寻找方法能够高效地探测相似站点或链路地址集,实现成本低,无需大量的人力物力,也能有效减少工作时间。
基于上述任一实施例,图5为本发明实施例提供的一种IPv6地址分割装置的结构示意图,如图5所示,该IPv6地址分割装置包括:
地址位取值不确定性计算模块501,用于根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位取值的不确定性。
在本模块中,地址位取值不确定性可以用信息熵来描述,所述信息熵的熵值越大,不确定性越大。信息熵的具体计算方法在前面的描述中已经有详细说明,因此不在此处重复。
IPv6地址分割模块502,用于按照IPv6地址中各个地址位取值的不确定性对IPv6地址进行分割,得到多个分割段;其中,同一分割段内相邻地址位取值的不确定性接近。
本发明实施例所公开的IPv6地址分割装置能够根据地址位取值的不确定性对IPv6地址进行自动分割,有利于识别出IPv6地址中不同地址位的功能,在网络资产探查等方面具有重要意义。
基于上述任一实施例,本发明另一实施例提供的IPv6地址分割装置还包括:IPv6地址收集模块,该模块用于从一个或多个网络内部收集IPv6地址,得到所述所收集的多个IPv6地址。
本发明实施例提供的IPv6地址分割装置能够自动实现对IPv6地址的收集,进一步提高了装置的自动化水平。
基于上述任一实施例,图6为本发明实施例提供的相似站点或链路地址集寻找装置的结构示意图,如图6所示,该相似站点或链路地址集寻找装置包括:
分割段选择模块601,用于从IPv6地址分割段中选取段内地址位取值不确定性较低的分割段,将这些分割段作为待比较的网络前缀;其中,所述IPv6地址分割段采用所述IPv6地址分割装置得到;
相似度计算与比较模块602,用于为另一待比较的IPv6地址与所述待比较的网络前缀在对应地址位计算相似度并归一化,归一化后的所述相似度高于相似度阈值,则该待比较的IPv6地址所源自的网络与所述待比较的网络前缀所在的网络为相似站点或链路地址集。
本发明实施例提供的相似站点或链路地址集寻找装置能够高效地探测相似站点或链路地址集,实现成本低,无需大量的人力物力,也能有效减少工作时间。
图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行如下方法:根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位取值的不确定性;按照IPv6地址中各个地址位取值的不确定性对IPv6地址进行分割,得到多个分割段;其中,同一分割段内各地址位取值的不确定性接近,相邻的不同分割段中的地址位取值的不确定性差别较大。或执行如下方法:从IPv6地址分割段中选取段内地址位取值不确定性较低的分割段,将这些分割段作为待比较的网络前缀;其中,所述IPv6地址分割段采用所述IPv6地址分割方法得到;为另一待比较的IPv6地址与所述待比较的网络前缀在对应地址位计算相似度并归一化,归一化后的所述相似度高于相似度阈值,则该待比较的IPv6地址所源自的网络与所述待比较的网络前缀所在的网络为相似站点或链路地址集。
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的方法,例如包括:根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位取值的不确定性;按照IPv6地址中各个地址位取值的不确定性对IPv6地址进行分割,得到多个分割段;其中,同一分割段内各地址位取值的不确定性接近,相邻的不同分割段中的地址位取值的不确定性差别较大。或从IPv6地址分割段中选取段内地址位取值不确定性较低的分割段,将这些分割段作为待比较的网络前缀;其中,所述IPv6地址分割段采用所述IPv6地址分割方法得到;为另一待比较的IPv6地址与所述待比较的网络前缀在对应地址位计算相似度并归一化,归一化后的所述相似度高于相似度阈值,则该待比较的IPv6地址所源自的网络与所述待比较的网络前缀所在的网络为相似站点或链路地址集。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (20)

1.一种IPv6地址分割方法,其特征在于,包括:
根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位取值的不确定性;
按照IPv6地址中各个地址位取值的不确定性对IPv6地址进行分割,得到多个分割段;其中,同一分割段内各地址位取值的不确定性接近。
2.根据权利要求1所述的IPv6地址分割方法,其特征在于,所述每一地址位取值的不确定性采用信息熵描述,所述信息熵的熵值越大,不确定性越大;
所述信息熵用于对IPv6地址进行分割,得到多个分割段;其中,同一分割段内各地址位信息熵的熵值接近。
3.根据权利要求2所述的IPv6地址分割方法,其特征在于,所述信息熵的计算公式为:
其中,H(U)表示信息熵,E[]表示求平均值,pi表示所述地址位上的值为i时的出现频率,n为i所能取的最大值,n的大小取决于所述地址位的数值所采用的数学进制法。
4.根据权利要求2所述的IPv6地址分割方法,其特征在于,所述信息熵用于对IPv6地址进行分割时,将相邻地址位信息熵熵值变化大的位置作为分割点,包括:
找出IPv6地址中各相邻地址位的信息熵之间的最大差值a,将a的1/2作为分割阈值,两个相邻地址位的信息熵熵值变化情况超过该分割阈值,则将这两个相邻地址位之间的位置作为分割点;
所述同一分割段内各地址位信息熵的熵值接近是指同一分割段内相邻地址位的信息熵之差小于所述分割阈值。
5.根据权利要求1或2所述的IPv6地址分割方法,其特征在于,还包括:从一个或多个网络内部收集IPv6地址,得到所述所收集的多个IPv6地址。
6.一种相似站点或链路地址集寻找方法,其特征在于,包括:
从IPv6地址分割段中选取段内地址位取值不确定性较低的分割段,将所选取的分割段作为待比较的网络前缀;其中,所述IPv6地址分割段采用权利要求1-5任一项所述IPv6地址分割方法得到;
为另一待比较的IPv6地址与所述待比较的网络前缀在对应地址位计算相似度并归一化,归一化后的所述相似度高于相似度阈值,则所述待比较的IPv6地址所源自的网络与所述待比较的网络前缀所在的网络为相似站点或链路地址集。
7.根据权利要求6所述的相似站点或链路地址集寻找方法,其特征在于,所述地址位取值不确定性采用信息熵描述,所述信息熵的熵值越大,不确定性越大;
所述从IPv6地址分割段中选取段内地址位取值不确定性较低的分割段为从IPv6地址分割段中选取段内地址位信息熵的熵值均小于第一阈值的分割段。
8.根据权利要求7所述的相似站点或链路地址集寻找方法,其特征在于,所述第一阈值小于0.1。
9.根据权利要求6所述的相似站点或链路地址集寻找方法,其特征在于,所述相似度阈值在0.5-1之间。
10.一种IPv6地址分割装置,其特征在于,包括:
地址位取值不确定性计算模块,用于根据所收集的多个IPv6地址统计IPv6地址中每一地址位上不同取值的出现频率,由所述不同取值的出现频率计算每一地址位取值的不确定性;
IPv6地址分割模块,用于按照IPv6地址中各个地址位取值的不确定性对IPv6地址进行分割,得到多个分割段;其中,同一分割段内相邻地址位取值的不确定性接近。
11.根据权利要求10所述的IPv6地址分割装置,其特征在于,所述每一地址位取值的不确定性采用信息熵描述,所述信息熵的熵值越大,不确定性越大;
所述信息熵用于对IPv6地址进行分割,得到多个分割段;其中,同一分割段内各地址位信息熵的熵值接近。
12.根据权利要求11所述的IPv6地址分割装置,其特征在于,所述信息熵的计算公式为:
Figure FDA0002223665790000031
其中,H(U)表示信息熵,E[]表示求平均值,pi表示所述地址位上的值为i时的出现频率,n为i所能取的最大值,n的大小取决于所述地址位的数值所采用的数学进制法。
13.根据权利要求11所述的IPv6地址分割装置,其特征在于,所述信息熵用于对IPv6地址进行分割时将相邻地址位信息熵熵值变化大的位置作为分割点,包括:
找出IPv6地址中相邻地址位的信息熵之间的最大差值a,将a的1/2作为分割阈值,两个相邻地址位的信息熵熵值变化情况超过该分割阈值,则将这两个相邻地址位之间的位置作为分割点;
所述同一分割段内各地址位信息熵的熵值接近为同一分割段内相邻地址位的信息熵之差小于所述分割阈值。
14.根据权利要求10或11所述的IPv6地址分割装置,其特征在于,还包括:IPv6地址收集模块,用于从一个或多个网络内部收集IPv6地址,得到所述所收集的多个IPv6地址。
15.一种相似站点或链路地址集寻找装置,其特征在于,包括:
分割段选择模块,用于从IPv6地址分割段中选取段内地址位取值不确定性较低的分割段,将这些分割段作为待比较的网络前缀;其中,所述IPv6地址分割段采用权利要求10至14任一项所述IPv6地址分割装置得到;
相似度计算与比较模块,用于为另一待比较的IPv6地址与所述待比较的网络前缀在对应地址位计算相似度并归一化,归一化后的所述相似度高于相似度阈值,则该待比较的IPv6地址所源自的网络与所述待比较的网络前缀所在的网络为相似站点或链路地址集。
16.根据权利要求15所述的相似站点或链路地址集寻找装置,其特征在于,所述地址位取值不确定性采用信息熵描述,所述信息熵的熵值越大,不确定性越大;
所述从IPv6地址分割段中选取段内地址位取值不确定性较低的分割段为从IPv6地址分割段中选取段内地址位信息熵的熵值均小于第一阈值的分割段。
17.根据权利要求16所述的相似站点或链路地址集寻找装置,其特征在于,所述第一阈值小于0.1。
18.根据权利要求15所述的相似站点或链路地址集寻找装置,其特征在于,其特征在于,所述相似度阈值在0.5-1之间。
19.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述IPv6地址分割方法的步骤,或实现如权利要求6至9任一项所述相似站点或链路地址集寻找方法的步骤。
20.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至5任一项所述IPv6地址分割方法的步骤,或实现如权利要求6至9任一项所述相似站点或链路地址集寻找方法的步骤。
CN201910943917.8A 2019-09-30 2019-09-30 IPv6地址分割方法及相似站点或链路地址集寻找方法 Pending CN110784561A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910943917.8A CN110784561A (zh) 2019-09-30 2019-09-30 IPv6地址分割方法及相似站点或链路地址集寻找方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910943917.8A CN110784561A (zh) 2019-09-30 2019-09-30 IPv6地址分割方法及相似站点或链路地址集寻找方法

Publications (1)

Publication Number Publication Date
CN110784561A true CN110784561A (zh) 2020-02-11

Family

ID=69385112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910943917.8A Pending CN110784561A (zh) 2019-09-30 2019-09-30 IPv6地址分割方法及相似站点或链路地址集寻找方法

Country Status (1)

Country Link
CN (1) CN110784561A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113630482A (zh) * 2021-08-23 2021-11-09 南京莱克贝尔信息技术有限公司 一种基于隐半马尔可夫的IPv6快速探测方法
CN115460168A (zh) * 2022-08-22 2022-12-09 浪潮通信信息系统有限公司 一种基于资源管理的IPv6容量分析方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103164475A (zh) * 2011-12-16 2013-06-19 北京思博途信息技术有限公司 多个ip地域信息库的合并方法及系统
CN106330906A (zh) * 2016-08-23 2017-01-11 上海海事大学 一种大数据环境下的DDoS攻击检测方法
CN107360271A (zh) * 2017-08-22 2017-11-17 顺丰科技有限公司 网络设备信息获取及ip地址自动分割方法、系统及设备
US20170359227A1 (en) * 2016-06-09 2017-12-14 Akamai Technologies, Inc. Internet address structure analysis, and applications thereof
CN108959930A (zh) * 2018-07-26 2018-12-07 中国民航大学 恶意pdf检测方法、系统、数据存储设备和检测程序

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103164475A (zh) * 2011-12-16 2013-06-19 北京思博途信息技术有限公司 多个ip地域信息库的合并方法及系统
US20170359227A1 (en) * 2016-06-09 2017-12-14 Akamai Technologies, Inc. Internet address structure analysis, and applications thereof
CN106330906A (zh) * 2016-08-23 2017-01-11 上海海事大学 一种大数据环境下的DDoS攻击检测方法
CN107360271A (zh) * 2017-08-22 2017-11-17 顺丰科技有限公司 网络设备信息获取及ip地址自动分割方法、系统及设备
CN108959930A (zh) * 2018-07-26 2018-12-07 中国民航大学 恶意pdf检测方法、系统、数据存储设备和检测程序

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
FOREMSKI P等: "《Entropy /IP: Uncovering Structure in IPv6 Addresses》", 《ACM INTERNET MEANSUREMENT CONFERENCE》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113630482A (zh) * 2021-08-23 2021-11-09 南京莱克贝尔信息技术有限公司 一种基于隐半马尔可夫的IPv6快速探测方法
CN115460168A (zh) * 2022-08-22 2022-12-09 浪潮通信信息系统有限公司 一种基于资源管理的IPv6容量分析方法及系统
CN115460168B (zh) * 2022-08-22 2024-05-14 浪潮通信信息系统有限公司 一种基于资源管理的IPv6容量分析方法及系统

Similar Documents

Publication Publication Date Title
CN110177094B (zh) 一种用户团体识别方法、装置、电子设备及存储介质
US9503465B2 (en) Methods and apparatus to identify malicious activity in a network
CN110839016A (zh) 异常流量监测方法、装置、设备及存储介质
CN109800220B (zh) 一种大数据清洗方法、系统及相关装置
CN110784561A (zh) IPv6地址分割方法及相似站点或链路地址集寻找方法
CN108153735B (zh) 一种近义词的获取方法及系统
CN113821793B (zh) 基于图卷积神经网络的多阶段攻击场景构建方法及系统
CN110809066A (zh) IPv6地址生成模型创建方法、装置及地址生成方法
CN115358308A (zh) 一种大数据实例约简方法、装置、电子设备及存储介质
CN115905309A (zh) 相似实体搜索方法、装置、计算机设备及可读存储介质
CN113360895A (zh) 站群检测方法、装置及电子设备
JP6683839B2 (ja) モバイル装置識別子を設定する方法及び装置
CN109256774B (zh) 一种基于电压等级的电网子图划分方法及装置
CN113572721A (zh) 一种异常访问检测方法、装置、电子设备及存储介质
US20160301658A1 (en) Method, apparatus, and computer-readable medium for efficient subnet identification
CN115292303A (zh) 数据处理方法及装置
CN110874387A (zh) 移动设备识别符共现关系稀疏图的构建方法及装置
CN113079176B (zh) 一种适用于海量数据的高速网络流量异常检测系统
CN109241421B (zh) Id数据网处理方法、装置、计算设备及计算机存储介质
CN113553370A (zh) 异常检测方法、装置、电子设备及可读存储介质
CN113326178A (zh) 一种异常账号传播方法、装置、电子设备和存储介质
CN111368294B (zh) 病毒文件的识别方法和装置、存储介质、电子装置
CN110362603B (zh) 一种特征冗余性分析方法、特征选择方法和相关装置
CN108076068B (zh) 一种防攻击方法以及装置
KR102562765B1 (ko) Ip 대역별 정보 추출 시스템 및 그 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200211

RJ01 Rejection of invention patent application after publication