CN110430133B - 一种基于置信区间的域间路径标识前缀获取方法 - Google Patents

一种基于置信区间的域间路径标识前缀获取方法 Download PDF

Info

Publication number
CN110430133B
CN110430133B CN201910679128.8A CN201910679128A CN110430133B CN 110430133 B CN110430133 B CN 110430133B CN 201910679128 A CN201910679128 A CN 201910679128A CN 110430133 B CN110430133 B CN 110430133B
Authority
CN
China
Prior art keywords
inter
domain path
path identifier
prefix
pid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910679128.8A
Other languages
English (en)
Other versions
CN110430133A (zh
Inventor
罗洪斌
张珊
颜飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Publication of CN110430133A publication Critical patent/CN110430133A/zh
Application granted granted Critical
Publication of CN110430133B publication Critical patent/CN110430133B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • H04L45/04Interdomain routing, e.g. hierarchical routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/74Address processing for routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/74Address processing for routing
    • H04L45/745Address table lookup; Address filtering
    • H04L45/748Address table lookup; Address filtering using longest matching prefix

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于置信区间的域间路径标识前缀获取方法,该方法能够利用请求包中所携带的域间路径标识信息,通过将任一域间路径标识与除自身之外的域间路径标识集进行两两比较得到最长公共前缀长度,并统计最长公共前缀频次,形成域间路径标识前缀频次统计表;然后,对最长公共前缀长度所对应的频次值进行置信区间检验,判断统计次数是否落在置信区间内,若落在置信区间内,则获取该频次所对应的域间路径标识前缀长度、域间路径标识前缀和相应的域间路径。通过本发明方法可快速分析域间路径标识,准确获得域间路径标识前缀,并获得网络拓扑结构中各个前缀分组的域间路径标识信息。

Description

一种基于置信区间的域间路径标识前缀获取方法
技术领域
本发明涉及计算机网络技术领域,更具体的是,本发明涉及一种基于置信区间的域间路径标识前缀获取方法。
背景技术
当前互联网的发展对政治、经济、文化的影响越来越深刻,网络传输信息的安全需求已成为当今网络技术发展的热点。由于传统的TCP/IP基于“开放”、“默认联通”、“尽力而为”的理念设计,在TCP/IP架构下主流流量溯源方案,如包标记算法等,存在着存储计算开销大、需要部署额外的基础设施、可溯源规模受限等问题,难以在当前的互联网中进行大规模部署。并且,由于伪造源地址的问题在TCP/IP架构下很难得到彻底的解决,借助伪造源地址发起的分布式拒绝服务攻击DDoS(distributed denial of service),极其难以防范,且常常带来巨大的经济损失。因此,国内外学者于近年来提出了若干新型网络体系结构。
“CoLoR架构”是一种基于路径标识的新型路由体系结构,其核心思想是边界路由器为每条域间路径分配一个域间路径标识前缀(Path Identifier,PID),域间按域间路径标识前缀进行路由。“CoLoR架构”出处请参考“IEEE Network”2014年第3期第28卷《CoLoR:an information-centric internet architecture for innovations》罗洪斌,陈哲等人。
在CoLoR架构中,自治域(AS:Autonomous System)、域间路径(Path)、域间路径标识(PID:Path Identifier)和域间路径标识前缀(PX:PID-Prefix)等定义如下:
自治域:指一组处于相同的管理与技术控制下的路由器集合所在的同一个区域。
域间路径:两个自治域之间进行数据传输的通道。
域间路径标识:是一串二进制数字,如011011001101010101。一个域间路径标识可由前缀部分和非前缀部分构成;在具体应用中,其长度通常是固定的。
CoLoR架构为自治域间的每条域间路径分配一个域间路径标识前缀。分配的原则是:给定一个自治域,为该自治域与其它自治域之间的所有域间路径分配的域间路径标识前缀不同,且这些域间路径标识前缀互不相交(即:任意两个域间路径标识前缀间,没有相同的域间路径标识)。在CoLoR架构中,内容请求者向内容提供者发送请求消息。请求消息从一个自治域向另一个自治域经域间路径转发前,需要在该请求消息的尾部添加一个域间路径标识(PID)。
在CoLoR架构中,可将传输路径的域间路径标识信息嵌入到请求包中,自治域的管理者可通过收集数据包的路径标识信息分析自治域间路径,实现网络拓扑推测、网络攻击溯源、网络路径流量感知。其中,网络拓扑结构的推测是以域间路径标识前缀(PX)为依据进行分析的。因而,对域间标识前缀长度进行分析,进而获得域间路径标识前缀,便成了网络拓扑分析的首要任务。
发明内容
本发明解决的技术问题是:给定一个域间路径标识集合,从中推测出该集合中域间路径标识的前缀和前缀长度。本发明方法能够利用CoLoR架构中的请求包中所携带的域间路径标识(PID)信息,通过将任一域间路径标识与除自身之外的域间路径标识集进行两两比较得到最长公共前缀长度(Path Prefix Length,LPX),统计最长公共前缀频次,利用置信区间对所统计的频次进行验证,并记录下落入置信区间内的频次所对应的域间路径标识前缀和域间路径标识。通过本发明方法能够对域间路径标识前缀进行前缀分组,并准确获得网络拓扑结构中各个前缀分组的域间路径、域间路径标识前缀及前缀的长度。
本发明的一种基于置信区间的域间路径标识前缀获取方法,其包括有下列步骤:
步骤一,获取域间路径标识集合;
步骤101,在CoLoR架构中,从请求包中提取出域间路径标识信息中的域间路径标识,得到域间路径标识集合Sanalysis={PID1,PID2,…,PIDa-1,PIDa,PIDa+1,…,PIDA};
步骤102,然后对域间路径标识集合Sanalysis进行最小样本量判断,若所述Sanalysis的样本量小于最小样本量,则结束分析;若所述Sanalysis的样本量大于等于最小样本量,则执行步骤二;
步骤二,从所述域间路径标识集合中取出首个域间路径标识,然后将首个域间路径标识与所述域间路径标识集合中的其它域间路径标识进行两两比较,得到一系列最长公共前缀及最长公共前缀长度,并统计基于首个域间路径标识的最长公共前缀长度出现的频次;
步骤201:从所述Sanalysis中选取出首个域间路径标识PID1,将所述PID1与所述Sanalysis中的其它域间路径标识进行两两前缀比较,得到一系列最长公共前缀长度;最长公共前缀长度LPX的位置位,记为M;
步骤202:统计步骤201所获得的最长公共前缀长度的出现频次,形成域间路径标识前缀频次表;
步骤三,对基于首个域间路径标识的最长公共前缀长度所对应的频次值进行置信区间检验;
步骤301:从最长公共前缀频次统计信息中选取首个非零的最长公共前缀长度,以及其对应的频次值counter[M];
步骤302:从步骤301所在的位置位向后查找到特征位置,记为
Figure BDA0002144216720000031
所述特征位置
Figure BDA0002144216720000032
满足公式(1)条件:
Figure BDA0002144216720000033
步骤303:统计步骤302所得的自位置位M至统计表最后位置位所对应的频次值之和,记为
Figure BDA0002144216720000034
步骤304:对统计结果
Figure BDA0002144216720000035
进行最小样本量阈值
Figure BDA0002144216720000036
判断;
若统计结果
Figure BDA0002144216720000037
小于最小样本量阈值
Figure BDA0002144216720000038
(即
Figure BDA0002144216720000039
),则不满足最小样本量阈值
Figure BDA00021442167200000310
执行步骤302;
若统计结果
Figure BDA00021442167200000311
大于等于最小样本量阈值
Figure BDA00021442167200000312
(即
Figure BDA00021442167200000313
),则满足最小样本量阈值
Figure BDA00021442167200000314
进行步骤305置信区间检验;
所述最小样本量阈值
Figure BDA00021442167200000315
是由公式(2)估计所得,
Figure BDA00021442167200000316
步骤305:对满足步骤304最小样本量阈值
Figure BDA0002144216720000041
判断的位置位M所对应的频次值进行置信区间检验;
所述置信区间如公式(3)所示:
Figure BDA0002144216720000042
步骤306:从步骤305的特征位置开始继续向后重复步骤302至步骤305,获得满足公式(1)的位置位,从而得到最长公共前缀长度;
步骤307:保存下基于PID1的满足置信区间检验的前缀分组;所述前缀分组中有最长公共前缀频次数、该频次所对应的域间路径标识前缀长度、域间路径标识前缀和域间路径标识;执行步骤四;
步骤四,去除基于首个域间路径标识的前缀分组中的域间路径标识,得到第一组剩余域间路径标识集;执行步骤五;
去除基于PID1的前缀分组中的域间路径标识PID,得到第一组剩余域间路径标识集合SSanalysis={PID8,PID12,…,PIDa-1,PIDa+1,…,PIDA};
步骤五,判断第一组剩余域间路径标识集是否只有一个元素或者为空;
然后判断SSanalysis中是否有元素;
若只有一个元素或为空,则结束域间路径标识前缀获取,输出结果;
若SSanalysis中存在有元素,执行步骤六;
步骤六,对第一组剩余域间路径标识集执行步骤201至步骤三,得到属于第一组剩余域间路径标识集中首个域间路径标识的满足置信区间检验的前缀分组;
从所述SSanalysis={PID8,PID12,…,PIDa-1,PIDa+1,…,PIDA}中选取首个域间路径标识PID8,重复执行步骤201至步骤三,得到属于PID8的满足置信区间检验的前缀分组;执行步骤七;
步骤七,去除属于第一组剩余域间路径标识集中首个域间路径标识的前缀分组中的域间路径标识,得到第二组剩余域间路径标识集;
去除属于PID8的前缀分组中的域间路径标识PID,得到第二组剩余域间路径标识集合SSSanalysis;执行步骤八;
步骤八,判断第二组剩余域间路径标识集是否只有一个元素或者为空;
然后判断SSSanalysis中是否有元素:
若只有一个元素或为空,则结束域间路径标识前缀获取,输出结果;
若SSSanalysis中存在有元素,执行步骤六至步骤七,直至剩余域间路径标识集中只有一个元素或为空。
本发明基于边缘节点请求信息特征的域间聚合路径分析方法的优点在于:
①本发明域间路径标识前缀获取方法,可推导得出域间路径标识前缀分析所需的最小样本量。
②本发明域间路径标识前缀获取方法,可在最小样本量的条件下,分析获取到域间路径标识前缀的长度。
③本发明域间路径标识前缀获取方法,利用所获取到的域间路径标识前缀,可对域间路径标识前缀进行分组,并记录各分组的域间路径标识前缀长度、域间路径标识前缀和域间路径标识。
④由于自治域通常不愿意公开其域间路径标识前缀,因而经本发明方法得到的域间路径及其域间路径标识前缀及前缀长度,能够用于推测域间网络拓扑结构,同时也能用作域间流量监测、攻击溯源等。
附图说明
图1是本发明基于置信区间的域间路径标识前缀获取方法流程图。
图2是域间路径标识集截图。
具体实施方式
下面将结合附图和实施例对本发明做进一步的详细说明。
域间路径标识长度(Length,L):指构成域间路径标识的二进制数字的个数。域间路径标识长度可为32、48、64、128位等任意数字。为了便于表述,后面假定域间路径标识长度为32位,并采用类似IPv4地址的点分十进制记法,如1.0.0.0。所述域间路径标识的二进制数中有前缀和非前缀位,如:一个长度为32为的域间路径标识由21位前缀和11位非前缀位构成,其结构如表1所示:
表1域间路径标识结构
域间路径标识前缀(PX) 非前缀
注:非前缀是依据“计算HASH的方法”所得的二进制数字串。
域间路径标识前缀(Path Prefix,PX):指给定域间路径标识长度时,一块连续的域间路径标识,并且这些域间路径标识最左边的若干二进制数相同。例如,假定域间路径标识的长度为8位,则域间路径标识00001000、00001001、00001010、00001011的前6位二进制数相同。因此,000010为这四个域间路径标识的前缀,其长度为6。类似的,可以定义两个域间路径标识的前缀为:两个域间路径标识最左边相同的二进制部分,如00001000和00001001的前缀可以是:0、00、000、0000、00001、000010、0000100。其中长度值最大的前缀,称为最长前缀。因此,00001000和00001001的最长前缀是0000100,且唯一。最长前缀的二进制位数,称为最长前缀的长度(LPX:length of PX)。将域间路径标识前缀记为:PID/LPX,表示域间路径标识PID的最左边LPX二进制数为相应的域间路径标识前缀。例如,1.0.0.0/8表示前缀长度为8个二进制位;该前缀为1.0.0.0的最左边8个二进制位,即00000001。
在本发明中,最长公共前缀是指从多个公共前缀中取最长的公共前缀,所取最长的公共前缀的长度称为最长公共前缀长度(LPX)。
请求包:将内容请求者所要获取的服务内容(Service Identifier,SID)和自身节点身份标识(Node Identifier,NID)封装成数据包,该数据包称为请求包。需要说明的是,在CoLoR架构中,每经过一条域间链路,边界路由器会计算一个域间路径标识(PID),并添加到请求包中。
表2域间路径标识前缀频次统计表:
相同的最长公共前缀长度(LPX)的位数
频次总个数
在本发明中,域间路径标识前缀频次统计表是一个两行多列的表格。第一行记录了相同的最长公共前缀长度(LPX)的位数,第二行记录了具有相同的最长公共前缀长度(LPX)的位数出现次数。如,域间路径标识(PID)信息是32位的,则“域间路径标识前缀频次统计表”有33列。如,域间路径标识(PID)信息是16位的,则“域间路径标识前缀频次统计表”有17列。“出现次数”是指任意一域间路径标识与除自身之外的所有域间路径集对比得到的公共前缀长度位置位出现的频次次数。
在本发明中,所有域间路径标识PID采用集合形式表达为域间路径标识集合Sanalysis={PID1,PID2,…,PIDa-1,PIDa,PIDa+1,…,PIDA},PID1表示域间路径标识集中第一个域间路径标识,PID2表示域间路径标识集中第二个域间路径标识,PIDa表示域间路径标识集中第a个域间路径标识,下角标a表示域间路径标识的序号,PIDA表示域间路径标识集中最后一个域间路径标识,下角标A表示域间路径标识的总数。将Sanalysis={PID1,PID2,…,PIDA}简称为域间路径标识集。为了方便说明,所述PIDa也表示域间路径标识集中的任意一个域间路径标识,位于所述PIDa之前的域间路径标识,记为PIDa-1,位于所述PIDa之后的域间路径标识,记为PIDa+1
在本发明中,任意一个域间路径标识PIDA是一个二进制的数,可以是16位、32位、48位、128位。所述PIDA的二进制数中必须有域间路径标识前缀(PX)。
参见图1所示,本发明的一种基于置信区间的域间路径标识前缀获取方法,包括有下列步骤:
步骤一,获取域间路径标识集合;
步骤101,在CoLoR架构中,从请求包中提取出域间路径标识(PID)信息中的域间路径标识,得到域间路径标识集合Sanalysis={PID1,PID2,…,PIDa-1,PIDa,PIDa+1,…,PIDA}。
在本发明中,域间路径标识(PID)信息如图2所示,图中是一条一条的数字信息。
步骤102,然后对域间路径标识集合Sanalysis进行最小样本量判断,若所述Sanalysis的样本量小于最小样本量,则结束分析;若所述Sanalysis的样本量大于等于最小样本量,则执行步骤二;
步骤二,从所述域间路径标识集合中取出首个域间路径标识,然后将首个域间路径标识与所述域间路径标识集合中的其它域间路径标识进行两两比较,得到一系列最长公共前缀及最长公共前缀长度,并统计基于首个域间路径标识的最长公共前缀长度出现的频次;
在本发明中,最长公共前缀长度LPX的位置位,记为M。
步骤201:从所述Sanalysis中选取出首个域间路径标识PID1,将所述PID1与所述Sanalysis中的其它域间路径标识进行两两前缀比较,得到一系列最长公共前缀长度(LPX);
如图2所示,PID1与PID2进行域间路径标识比较,得到PID1与PID2之间的最长公共前缀长度,记为
Figure BDA0002144216720000081
所述
Figure BDA0002144216720000082
的最长公共前缀长度的位置位记为
Figure BDA0002144216720000083
Figure BDA0002144216720000084
如图2所示,PID1与PID3进行域间路径标识比较,得到PID1与PID3之间的最长公共前缀长度,记为
Figure BDA0002144216720000085
所述
Figure BDA0002144216720000086
的最长公共前缀长度的位置位记为
Figure BDA0002144216720000087
Figure BDA0002144216720000088
如图2所示,PID1与PID4进行域间路径标识比较,得到PID1与PID4之间的最长公共前缀长度,记为
Figure BDA0002144216720000089
所述
Figure BDA00021442167200000810
的最长公共前缀长度的位置位记为
Figure BDA00021442167200000811
Figure BDA00021442167200000812
如图2所示,PID1与PID5进行域间路径标识比较,得到PID1与PID5之间的最长公共前缀长度,记为
Figure BDA00021442167200000813
所述
Figure BDA00021442167200000814
的最长公共前缀长度的位置位记为
Figure BDA00021442167200000815
Figure BDA00021442167200000816
如图2所示,PID1与PID6进行域间路径标识比较,得到PID1与PID6之间的最长公共前缀长度,记为
Figure BDA00021442167200000817
所述
Figure BDA00021442167200000818
的最长公共前缀长度的位置位记为
Figure BDA00021442167200000819
Figure BDA00021442167200000820
如图2所示,PID1与PID7进行域间路径标识比较,得到PID1与PID7之间的最长公共前缀长度,记为
Figure BDA00021442167200000821
所述
Figure BDA00021442167200000822
的最长公共前缀长度的位置位记为
Figure BDA00021442167200000823
Figure BDA00021442167200000824
如图2所示,PID1与PID8进行域间路径标识比较,得到PID1与PID8之间的最长公共前缀长度,记为
Figure BDA00021442167200000825
所述
Figure BDA00021442167200000826
的最长公共前缀长度的位置位记为
Figure BDA00021442167200000827
Figure BDA00021442167200000828
PID1与PIDa-1进行域间路径标识比较,得到PID1与PIDa-1之间的最长公共前缀长度,记为
Figure BDA00021442167200000829
所述
Figure BDA00021442167200000830
的最长公共前缀长度的位置位记为
Figure BDA00021442167200000831
Figure BDA00021442167200000832
PID1与PIDa进行域间路径标识比较,得到PID1与PIDa之间的最长公共前缀长度,记为
Figure BDA00021442167200000833
所述
Figure BDA00021442167200000834
的最长公共前缀长度的位置位记为
Figure BDA00021442167200000835
Figure BDA00021442167200000836
PID1与PIDa+1进行域间路径标识比较,得到PID1与PIDa+1之间的最长公共前缀长度,记为
Figure BDA00021442167200000837
所述
Figure BDA00021442167200000838
的最长公共前缀长度的位置位记为
Figure BDA0002144216720000091
Figure BDA0002144216720000092
PID1与PIDA进行域间路径标识比较,得到PID1与PIDA之间的最长公共前缀长度,记为
Figure BDA0002144216720000093
所述
Figure BDA0002144216720000094
的最长公共前缀长度的位置位记为
Figure BDA0002144216720000095
Figure BDA0002144216720000096
步骤202:统计步骤201所获得的最长公共前缀长度的出现频次,形成域间路径标识前缀频次表;执行步骤三;
例如,统计基于PID1的最长公共前缀长度(LPX)相同的总个数,从而得到基于PID1的域间路径标识前缀频次统计表,该频次统计用表3列示;
如图2所示的域间路径标识信息是32位的,则有基于PID1的域间路径标识前缀频次统计表33列,即表3。
表3域间路径标识前缀频次表
Figure BDA0002144216720000097
步骤三,对基于首个域间路径标识的最长公共前缀长度所对应的频次值进行置信区间检验;
步骤301:从最长公共前缀频次统计信息中选取首个非零的最长公共前缀长度(LPX),以及其对应的频次值counter[M];
如表3所示,从表中取出首个非零的最长公共前缀长度(LPX)为5,5所对应的频次值counter[M]为579。
步骤302:从步骤301所在的位置位向后查找到特征位置,记为
Figure BDA0002144216720000098
所述特征位置
Figure BDA0002144216720000099
满足公式(1)条件:
Figure BDA00021442167200000910
M表示最长公共前缀长度LPX的位置位。
i表示域间路径标识前缀频次统计表中的第一个任意位置位。
j表示域间路径标识前缀频次统计表中的第二个任意位置位。
p表示位于位置位i与位置位j之间的一个位置位。
q表示位于位置位j与位置位M之间的一个位置位。
counter[M]表示最长公共前缀长度(LPX)的位置位M所对应的频次数,简称为频次值。counter[i]表示属于位置位i的频次值。counter[j]表示属于位置位j的频次值。counter[p]表示属于位置位p的频次值。counter[q]表示属于位置位q的频次值。
在本发明中,counter[i]≠0是指位置位i所对应的频次值不为零;counter[M]≠0是指位置位M所对应的频次值不为零;
Figure BDA0002144216720000101
是指存在位置位j的取值介于位置位i和位置位M之间,数学符号
Figure BDA0002144216720000102
表示存在,数学符号“∈”表示属于;
Figure BDA0002144216720000103
是指位置位p的取值介于位置位i和位置位j之间,位置位q的取值介于位置位j和位置位M之间,数学符号
Figure BDA0002144216720000104
表示任意;counter[p]≠0∧counter[q]=0是指位置位p所对应的频次值不为零,并且位置位q所对应的频次值为零,数学符号“∧”表示并且。
在本发明中,当位置位i和位置位M之间的位置位对应的频次数全0时,则位置位j和位置位p与位置位i重合。
如表3所示,从步骤301所在位置位5开始向后查找特征位置,发现位置位9满足特征位置
Figure BDA0002144216720000105
性质,则取该位置所对应的频次值为518,即
Figure BDA0002144216720000106
步骤303:统计步骤302所得的自位置位M至统计表最后位置位所对应的频次值之和,记为
Figure BDA0002144216720000107
在表3中,所述频次值之和是指自位置位9开始至位置位32所对应的频次进行累加统计,即
Figure BDA0002144216720000108
步骤304:对统计结果
Figure BDA0002144216720000109
进行最小样本量阈值
Figure BDA00021442167200001010
判断;
若统计结果
Figure BDA00021442167200001011
小于最小样本量阈值
Figure BDA00021442167200001012
(即
Figure BDA00021442167200001013
),则不满足最小样本量阈值
Figure BDA00021442167200001014
执行步骤302;
若统计结果
Figure BDA0002144216720000111
大于等于最小样本量阈值
Figure BDA0002144216720000112
(即
Figure BDA0002144216720000113
),则满足最小样本量阈值
Figure BDA0002144216720000114
进行步骤305置信区间检验;
所述最小样本量阈值
Figure BDA0002144216720000115
是由公式(2)估计所得,
Figure BDA0002144216720000116
Figure BDA0002144216720000117
表示所要求的最小样本量。
E为允许的相对采样误差,本发明中E的取值为0.05。
π表示0或1在样本中的比例,在此该比例取值为0.5;π(1-π)为方差,表示抽样个体与整体均值之间的偏离程度,方差越大,表明抽样数值分布越大,所需样本量就越大。
Figure BDA0002144216720000118
为正态分布的
Figure BDA0002144216720000119
分为点;α代表置信度;在本发明中,求最小样本量
Figure BDA00021442167200001110
的置信度α为95%的置信区间,经查“附表1正态分布数值表”,可得μ0.025=1.96,则所述
Figure BDA00021442167200001111
的取值为384。“附表1正态分布数值表”出处请参见2015年6月第四版《数理统计》第64、288页,师义民,徐伟,秦超英,许勇编著。
依据步骤303可得,频次值之和1018>384,则满足最小样本量要求。
步骤305:对满足步骤304最小样本量阈值
Figure BDA00021442167200001112
判断的位置位M所对应的频次值进行置信区间检验;
所述置信区间如公式(3)所示:
Figure BDA00021442167200001113
ψ表示频次累计系数。在本发明中,ψ取值为0.5。
ξ表示置信区间调节系数。在本发明中,ξ取值为0.5。
依据步骤303所得频次值之和
Figure BDA00021442167200001114
可得置信区间为:[0.5×1018-0.5×1.96×31.91,0.5×1018+0.5×1.96×31.91]=[477.73,540.27];
当位置位为9时,特征位置对应的频次值
Figure BDA00021442167200001115
落在置信区间[477.73,540.27]内,可得最长公共前缀长度为9。
步骤306:从步骤305的特征位置开始继续向后重复步骤302至步骤305,获得满足公式(1)的位置位,从而得到最长公共前缀长度(LPX);
例如,依据表3和步骤302至步骤305可得,位置位为16时满足公式(1),并取得该特征位置所对应的频次值为
Figure BDA0002144216720000121
依据步骤303所得频次值之和
Figure BDA0002144216720000122
依据公式(3)可得置信区间为:[228.57,272.43],因此位置位16时,相应的频次值为
Figure BDA0002144216720000123
落在置信区间[228.57,272.43]内,可得最长公共前缀长度为16。
步骤307:保存下基于PID1的满足置信区间检验的前缀分组;所述前缀分组中有最长公共前缀频次数、该频次所对应的域间路径标识前缀长度、域间路径标识前缀和域间路径标识;执行步骤四;
步骤四,去除基于首个域间路径标识的前缀分组中的域间路径标识,得到第一组剩余域间路径标识集;执行步骤五;
去除基于PID1的前缀分组中的域间路径标识PID,得到第一组剩余域间路径标识集合SSanalysis={PID8,PID12,…,PIDa-1,PIDa+1,…,PIDA};
PID8表示域间路径标识集中第八个域间路径标识。
PID12表示域间路径标识集中第十二个域间路径标识。
步骤五,判断第一组剩余域间路径标识集是否只有一个元素或者为空;
然后判断SSanalysis中是否有元素;
若只有一个元素或为空,则结束域间路径标识前缀获取,输出结果;
若SSanalysis中存在有元素,执行步骤六。
步骤六,对第一组剩余域间路径标识集执行步骤201至步骤三,得到属于第一组剩余域间路径标识集中首个域间路径标识的满足置信区间检验的前缀分组;
从所述SSanalysis={PID8,PID12,…,PIDa-1,PIDa+1,…,PIDA}中选取首个域间路径标识PID8,重复执行步骤201至步骤三,得到属于PID8的满足置信区间检验的前缀分组;执行步骤七;
步骤七,去除属于第一组剩余域间路径标识集中首个域间路径标识的前缀分组中的域间路径标识,得到第二组剩余域间路径标识集;
去除属于PID8的前缀分组中的域间路径标识PID,得到第二组剩余域间路径标识集合SSSanalysis;执行步骤八;
步骤八,判断第二组剩余域间路径标识集是否只有一个元素或者为空;
然后判断SSSanalysis中是否有元素:
若只有一个元素或为空,则结束域间路径标识前缀获取,输出结果;
若SSSanalysis中存在有元素,执行步骤六至步骤七,直至剩余域间路径标识集中只有一个元素或为空。
本发明是一种基于置信区间的域间路径标识前缀获取方法,利用CoLoR架构中的请求包中所携带的PID信息,通过将任一域间路径标识与除自身之外的域间路径标识集进行两两比较得到最长公共前缀长度,统计最长公共前缀频次,利用置信区间对所统计的频次进行验证,并记录下落入置信区间内的频次所对应的域间路径标识前缀和域间路径标识。通过本发明设计的域间路径标识前缀获取方法能够对域间路径标识前缀进行分组,并获得各分组的域间路径、域间路径标识前缀。

Claims (4)

1.一种基于置信区间的域间路径标识前缀获取方法,其特征在于域间路径标识前缀获取有下列步骤:
步骤一,获取域间路径标识集合;
步骤101,在CoLoR架构中,从请求包中提取出域间路径标识信息中的域间路径标识,得到域间路径标识集合Sanalysis={PID1,PID2,…,PIDa-1,PIDa,PIDa+1,…,PIDA};PID1表示域间路径标识集中第一个域间路径标识,PID2表示域间路径标识集中第二个域间路径标识,PIDa表示域间路径标识集中第a个域间路径标识,下角标a表示域间路径标识的序号,PIDA表示域间路径标识集中最后一个域间路径标识,下角标A表示域间路径标识的总数;位于所述PIDa之前的域间路径标识,记为PIDa-1,位于所述PIDa之后的域间路径标识,记为PIDa+1
步骤102,然后对域间路径标识集合Sanalysis进行最小样本量判断,若所述Sanalysis的样本量小于最小样本量,则结束分析;若所述Sanalysis的样本量大于等于最小样本量,则执行步骤二;
步骤二,从所述域间路径标识集合中取出首个域间路径标识,然后将首个域间路径标识与所述域间路径标识集合中的其它域间路径标识进行两两比较,得到一系列最长公共前缀及最长公共前缀长度,并统计基于首个域间路径标识的最长公共前缀长度出现的频次;
步骤201:从所述Sanalysis中选取出首个域间路径标识PID1,将所述PID1与所述Sanalysis中的其它域间路径标识进行两两前缀比较,得到一系列最长公共前缀长度;最长公共前缀长度LPX的位置位,记为M;
步骤202:统计步骤201所获得的最长公共前缀长度的出现频次,形成域间路径标识前缀频次表;
步骤三,对基于首个域间路径标识的最长公共前缀长度所对应的频次值进行置信区间检验;
步骤301:从最长公共前缀频次统计信息中选取首个非零的最长公共前缀长度,以及其对应的频次值counter[M];
步骤302:从步骤301所在的位置位向后查找到特征位置,记为
Figure FDA0002448989420000021
所述特征位置
Figure FDA0002448989420000022
满足公式(1)条件:
Figure FDA0002448989420000023
M表示最长公共前缀长度LPX的位置位;
i表示域间路径标识前缀频次统计表中的第一个任意位置位;
j表示域间路径标识前缀频次统计表中的第二个任意位置位;
p表示位于位置位i与位置位j之间的一个位置位;
q表示位于位置位j与位置位M之间的一个位置位;
counter[M]表示最长公共前缀长度的位置位M所对应的频次数,简称为频次值;counter[i]表示属于位置位i的频次值;counter[j]表示属于位置位j的频次值;counter[p]表示属于位置位p的频次值;counter[q]表示属于位置位q的频次值;
步骤303:统计步骤302所得的自位置位M至统计表最后位置位所对应的频次值之和,记为
Figure FDA0002448989420000024
步骤304:对统计结果
Figure FDA0002448989420000025
进行最小样本量阈值
Figure FDA0002448989420000026
判断;
若统计结果
Figure FDA0002448989420000027
小于最小样本量阈值
Figure FDA0002448989420000028
Figure FDA0002448989420000029
则不满足最小样本量阈值
Figure FDA00024489894200000210
执行步骤302;
若统计结果
Figure FDA00024489894200000211
大于等于最小样本量阈值
Figure FDA00024489894200000212
Figure FDA00024489894200000213
则满足最小样本量阈值
Figure FDA00024489894200000214
进行步骤305置信区间检验;
所述最小样本量阈值
Figure FDA00024489894200000215
是由公式(2)估计所得,
Figure FDA00024489894200000216
Figure FDA00024489894200000217
表示所要求的最小样本量;
E为允许的相对采样误差,E的取值为0.05;
π表示0或1在样本中的比例,在此该比例取值为0.5;π(1-π)为方差,表示抽样个体与整体均值之间的偏离程度,方差越大,表明抽样数值分布越大,所需样本量就越大;
Figure FDA0002448989420000031
为正态分布的
Figure FDA0002448989420000032
分为点;α代表置信度;
步骤305:对满足步骤304最小样本量阈值
Figure FDA0002448989420000033
判断的位置位M所对应的频次值进行置信区间检验;
所述置信区间如公式(3)所示:
Figure FDA0002448989420000034
ψ表示频次累计系数;ψ取值为0.5;
ξ表示置信区间调节系数;ξ取值为0.5;
步骤306:从步骤305的特征位置开始继续向后重复步骤302至步骤305,获得满足公式(1)的位置位,从而得到最长公共前缀长度;
步骤307:保存下基于PID1的满足置信区间检验的前缀分组;所述前缀分组中有最长公共前缀频次数、该频次所对应的域间路径标识前缀长度、域间路径标识前缀和域间路径标识;执行步骤四;
步骤四,去除基于首个域间路径标识的前缀分组中的域间路径标识,得到第一组剩余域间路径标识集SSanalysis;执行步骤五;
步骤五,判断第一组剩余域间路径标识集SSanalysis是否只有一个元素或者为空;
然后判断SSanalysis中是否有元素;
若只有一个元素或为空,则结束域间路径标识前缀获取,输出结果;
若SSanalysis中存在有元素,执行步骤六;
步骤六,对第一组剩余域间路径标识集执行步骤201至步骤三,得到属于第一组剩余域间路径标识集中首个域间路径标识的满足置信区间检验的前缀分组;
从所述SSanalysis中选取首个域间路径标识,重复执行步骤201至步骤三,得到属于SSanalysis中首个域间路径标识的满足置信区间检验的前缀分组;执行步骤七;
步骤七,去除属于第一组剩余域间路径标识集中首个域间路径标识的前缀分组中的域间路径标识,得到第二组剩余域间路径标识集;
去除属于SSanalysis中首个域间路径标识的前缀分组中的域间路径标识PID,得到第二组剩余域间路径标识集合SSSanalysis;执行步骤八;
步骤八,判断第二组剩余域间路径标识集是否只有一个元素或者为空;
然后判断SSSanalysis中是否有元素:
若只有一个元素或为空,则结束域间路径标识前缀获取,输出结果;
若SSSanalysis中存在有元素,执行步骤六至步骤七,直至剩余域间路径标识集中只有一个元素或为空。
2.根据权利要求1所述的基于置信区间的域间路径标识前缀获取方法,其特征在于:当位置位i和位置位M之间的位置位对应的频次数全0时,则位置位j和位置位p与位置位i重合。
3.根据权利要求1所述的基于置信区间的域间路径标识前缀获取方法,其特征在于:域间路径标识长度为32、48、64或128位。
4.根据权利要求1所述的基于置信区间的域间路径标识前缀获取方法,其特征在于:获得的域间路径标识前缀及前缀长度用于推测域间网络拓扑结构。
CN201910679128.8A 2019-05-23 2019-07-25 一种基于置信区间的域间路径标识前缀获取方法 Active CN110430133B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2019104368284 2019-05-23
CN201910436828 2019-05-23

Publications (2)

Publication Number Publication Date
CN110430133A CN110430133A (zh) 2019-11-08
CN110430133B true CN110430133B (zh) 2020-06-26

Family

ID=68410861

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910679128.8A Active CN110430133B (zh) 2019-05-23 2019-07-25 一种基于置信区间的域间路径标识前缀获取方法

Country Status (1)

Country Link
CN (1) CN110430133B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111784246B (zh) * 2020-07-01 2023-04-07 深圳市检验检疫科学研究院 物流路径的估测方法
CN112866243B (zh) * 2021-01-15 2022-02-25 北京航空航天大学 一种基于单包溯源的DDoS攻击检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6757298B1 (en) * 2000-10-10 2004-06-29 Cisco Technology, Inc. VLAN trunking over ATM PVCs (VTAP)
CN107925613A (zh) * 2016-07-01 2018-04-17 华为技术有限公司 业务功能链sfc中用于转发报文的方法、装置和系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8761022B2 (en) * 2007-12-26 2014-06-24 Rockstar Consortium Us Lp Tie-breaking in shortest path determination
CN103281253B (zh) * 2013-05-27 2016-08-17 杭州华三通信技术有限公司 一种非等价路由的负载分担方法和设备
CN108121791A (zh) * 2017-12-14 2018-06-05 苏州泥娃软件科技有限公司 一种交通大数据路径可搜索系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6757298B1 (en) * 2000-10-10 2004-06-29 Cisco Technology, Inc. VLAN trunking over ATM PVCs (VTAP)
CN107925613A (zh) * 2016-07-01 2018-04-17 华为技术有限公司 业务功能链sfc中用于转发报文的方法、装置和系统

Also Published As

Publication number Publication date
CN110430133A (zh) 2019-11-08

Similar Documents

Publication Publication Date Title
CN109040081B (zh) 一种基于bwt的协议字段逆向分析系统及方法
JP5961354B2 (ja) 効率的なネットフローデータ解析のための方法及び装置
CN107070895B (zh) 一种基于sdn的数据流溯源方法
CN110278150B (zh) 一种基于边缘节点请求信息特征的域间聚合路径分析方法
CN110430133B (zh) 一种基于置信区间的域间路径标识前缀获取方法
CN101668025B (zh) 一种链路层网络拓扑发现方法及装置
CN113378899B (zh) 非正常账号识别方法、装置、设备和存储介质
CN102215136A (zh) 流量拓扑生成方法和装置
CN106992966B (zh) 一种针对真假消息的网络信息传播实现方法
CN112261645A (zh) 一种基于分组分域的移动应用指纹自动化提取方法及系统
CN102611706A (zh) 一种基于半监督学习的网络协议识别方法及系统
CN110932971B (zh) 一种基于请求信息逐层重构的域间路径分析方法
Jaiswal et al. Comparing the structure of power-law graphs and the Internet AS graph
CN113872962B (zh) 一种面向高速网络抽样数据采集场景的慢速端口扫描检测方法
Raahemi et al. Peer-to-peer traffic identification by mining IP layer data streams using concept-adapting very fast decision tree
CN111641729B (zh) 一种基于前缀树的域间路径标识前缀冲突检测与分解方法
CN108199878B (zh) 高性能ip网络中个人标识信息识别系统及方法
Hammerschmidt et al. Behavioral clustering of non-stationary IP flow record data
CN117914599A (zh) 基于图神经网络的移动网络恶意流量识别方法
CN112235254A (zh) 一种高速主干网中Tor网桥的快速识别方法
CN115580543B (zh) 一种基于哈希计数的网络系统活跃度评估方法
CN115242724A (zh) 一种基于两阶段聚类的高速网络流量服务分类方法
CN106130817B (zh) 一种国内自治域边界判定方法
Kozik Distributed system for botnet traffic analysis and anomaly detection
Atmojo et al. A New Approach for ARP Poisoning Attack Detection Based on Network Traffic Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant