CN116708273B - 停止判定分类模型的生成方法、网络拓扑探测方法及装置 - Google Patents

停止判定分类模型的生成方法、网络拓扑探测方法及装置 Download PDF

Info

Publication number
CN116708273B
CN116708273B CN202310937279.5A CN202310937279A CN116708273B CN 116708273 B CN116708273 B CN 116708273B CN 202310937279 A CN202310937279 A CN 202310937279A CN 116708273 B CN116708273 B CN 116708273B
Authority
CN
China
Prior art keywords
detection
path
node
repeated
classification model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310937279.5A
Other languages
English (en)
Other versions
CN116708273A (zh
Inventor
张宇光
张志勇
张位
毛得明
饶志宏
兰昆
刘正军
程丽君
张淑文
朱治丞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Electronic Technology Cyber Security Co Ltd
Original Assignee
China Electronic Technology Cyber Security Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Electronic Technology Cyber Security Co Ltd filed Critical China Electronic Technology Cyber Security Co Ltd
Priority to CN202310937279.5A priority Critical patent/CN116708273B/zh
Publication of CN116708273A publication Critical patent/CN116708273A/zh
Application granted granted Critical
Publication of CN116708273B publication Critical patent/CN116708273B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • H04L45/08Learning-based routing, e.g. using neural networks or artificial intelligence
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种停止判定分类模型的生成方法、网络拓扑探测方法及装置,属于网络拓扑探测领域,包括步骤:获取原始探测结果数据集;将原始探测结果数据集中的探测路径按目标分组;统计分组后同目标路径中的重复节点,以及在其之后是否存在多径路由;提取各个重复节点的特征;以重复节点特征为特征,其后路径中是否存在多径路由为标签形成数据集;利用带标签数据集进行机器学习分类模型训练得到停止判定分类模型;在之后的其他探测过程中,当遇到重复节点时,利用停止判定分类模型进行停止判定,由判定结果决定是否停止探测。本发明控制了网络拓扑探测成本,保障了拓扑探测发现率,适用于对网络拓扑发现性价比和完整性有较高要求的场景。

Description

停止判定分类模型的生成方法、网络拓扑探测方法及装置
技术领域
本发明涉及网络空间拓扑探测领域,更为具体的,涉及一种停止判定分类模型的生成方法、网络拓扑探测方法及装置。
背景技术
随着信息技术和数字技术的迅猛发展,网络空间已经广泛地渗透到各个领域,包括国防、经济和民生等方面。通过对互联网拓扑结构的深入了解,我们可以更好地掌握网络资源的分布情况、网络性能的瓶颈位置、网络攻击的来源等重要信息,这对于网络管理、网络优化和网络安全都具有非常重要的意义。
目前,研究者们提出了多种网络空间拓扑探测方法,其中包括基于IP地址探测的网络拓扑探测方法、基于路由表的网络拓扑探测方法、基于流量分析的网络拓扑探测方法等。其中,基于IP地址探测的拓扑探测是最为常见的方法之一,通过向目标网络中的大量节点发送探测包,并利用探测包的回复信息来推断网络的拓扑结构。
随着网络技术的不断发展,现代网络空间已经变得非常庞大,网络节点数量极多,节点间的连接关系也异常复杂。因此,如何高效快速地发现网络空间的拓扑结构成为了一个极具挑战性的问题。为此,研究者们提出了基于多线程技术和并行计算技术的探测方法,通过使用多探测源高并发网络拓扑测量和建设大规模网络拓扑测量平台等手段提高探测效率,加速探测进程。比如ZMap是一种高速的互联网扫描器,可以在几分钟内扫描整个IPv4地址空间。它使用多线程和异步I/O技术,能够快速地发送大量的数据包,并在短时间内获取网络拓扑信息。由Luckie等人设计的Scamper工具,它可以通过调用远程API的方式来对目标IP实现高速率的并行探测。微软开发的Pingmesh使用了大规模分布式系统来进行网络拓扑探测,具备高度可扩展和高效性能,能够快速地发现网络中的节点和链路信息。CAIDA(应用互联网数据分析中心)通过开发和部署第二代通用大规模拓扑测量平台ARK,在网络范围内设置了120个节点,这些探测源不断进行网络探测和数据收集,以高强度获取互联网拓扑信息。尽管上述探测方法能够广泛探测网络目标,但同时也会向网络投送大量探测数据包,这会增加网络带宽的压力,也会对探测目标的正常工作产生影响。
为了解决这一问题,Donnet等提出了基于停止集的DoubleTree网络拓扑测量方法,这种方法通过信息共享机制将不同探测源探测的拓扑路径分发给所有探测源,各个探测源将已经探到的拓扑节点存储在停止集中,当下一次再探到停止集中相同目标的重复节点时,就停止探测并复用已经探测的结果,从而避免冗余探测,减少探测发包,控制测量损耗。这种探测方法存在两个问题,一是探测源为了共享探测结果会带来巨大的通信数据量,二是由于一旦遇到重复节点就会停止探测,因此无法探测到重复节点之后多径路由路径上的节点。为了克服这两个问题,研究人员提出了多种优化方法。Ding Xianhua等人提出了一种提升网络拓扑探测完整性的方法,该方法利用二分搜索算法几乎可以查找到路径中所有的拓扑链路和节点,不过这种方法要求目的地和接口均匀分布,在实践中比较苛刻。为了降低探测设备之间的通信成本,乔宏等人提高了全局停止集的存储维度,同时通过仅交互变化信息的方式来传递探测结果。另外,杨旭等人将探测源分成等量小组,以组组通信的方式替代了大量的点对点通信,降低了通信量。然而,现有技术均无法解决实际探测时基于停止集的网络拓扑探测方法中,由于多径路由的广泛使用带来的拓扑发现覆盖率不足的问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种停止判定分类模型的生成方法、网络拓扑探测方法及装置,解决了现有基于停止集的网络拓扑探测技术一旦遇到重复节点就停止探测,但因多径路由的广泛使用导致的网络节点、链路等拓扑元素发现不完整的问题,可以在缩减探测发包量的同时,探测到更多的多径路由上的拓扑元素,从而既控制了网络拓扑探测成本,又保障了拓扑探测发现率,更适用于对网络拓扑发现性价比和完整性有较高要求的应用场景。
本发明的目的是通过以下方案实现的:
一种停止判定分类模型的生成方法,包括以下步骤:
S1,获取原始探测结果数据集;
S2,将原始探测结果数据集中的探测路径按目标分组;
S3,统计分组后同目标路径中的重复节点,以及在其之后是否存在多径路由;
S4,提取各个重复节点的特征;
S5,以重复节点特征为特征,其后路径中是否存在多径路由为标签形成数据集;
S6,利用步骤S5中所得带标签数据集进行机器学习分类模型训练得到停止判定分类模型。
进一步地,在步骤S1中,所述原始探测结果数据集为节点和链路构成的去重后的拓扑探测路径集合。
进一步地,所述获取原始探测结果数据集,还包括子步骤:汇总所有探测源的所有探测结果路径形成原始探测结果数据集。
进一步地,在步骤S3中,所述分组后统计同目标路径中的重复节点,以及在其之后是否存在多径路由,具体包括子步骤:重复节点是在原始数据集的同一目标分组中,出现在至少两条路径上的节点;
重复节点之后是否存在多径路由是从重复节点到探测目标之间是否存在多条路径,如果存在多条路径,则存在多径路由,若不存在多条路径,则不存在多径路由。
进一步地,在步骤S4中,所述提取各个重复节点的特征,具体包括子步骤:针对步骤S3中统计出的各个重复节点,面向其所在的每一条路径,抽取其特征。
进一步地,在步骤S5中,所述以重复节点特征为特征,其后路径中是否存在多径路由为标签形成数据集,具体包括子步骤:将步骤S4中针对重复节点的每一条路径抽取的特征值和步骤S3中相应路径在该重复节点之后是否存在多径路由的结果结合,以重复节点特征为特征,其后路径中是否存在多径路由为标签形成数据集。
进一步地,在步骤S6中,所述机器学习方法包括决策树、随机森林、回归算法、神经网络算法中的任一种。
一种网络拓扑探测方法,包括如下子步骤:
步骤1,获取探测源结果路径;
步骤2,当前探测源启动新一轮探测;
步骤3,判断当前节点是否与目标节点IP地址相同;如果是新一轮探测刚启动,则直接比较探测源和目标节点,若不是,则将刚探得的节点与目标节点进行比较;如果相同,则结束探测,如果不同,则进行步骤4;
步骤4,查看当前节点是否是已经出现在已知的同目标路径当中的重复节点,若是则进行步骤5,若不是,则进行下一跳的探测,并返回步骤3;
步骤5,抽取当前节点的所有特征,能够依据当前探测路径抽取的特征基于当前路径抽取,不能依据当前探测路径抽取的特征基于包含此重复节点的已知探测路径抽取;
步骤6,基于步骤5中抽取出的特征集合,利用如上训练生成的所述停止判定分类模型进行机器学习分类;
步骤7,如果步骤6中的分类结果是1,即之后路径中存在多径路由,则进行新一跳的探测,并回到步骤3;若分类结果是0,即之后路径中不存在多径路由,则结束探测。
进一步地,在步骤1中,所述获取探测源结果路径包括子步骤:当前探测源通过路径共享机制获取其他探测源的探测结果路径。
一种网络拓扑探测装置,包括处理器和存储器,所述存储器中存储有计算机程序,当所述计算机程序被所述处理器加载时并执行如上任一项所述的网络拓扑探测方法。
本发明的有益效果包括:
本发明解决了现有基于停止集的网络拓扑探测技术一旦遇到重复节点就停止探测,但因多径路由的广泛使用导致的网络节点、链路等拓扑元素发现不完整的问题,提出了一种基于机器学习技术进行停止判定的网络拓扑优化探测方法。当遇到停止集中的重复节点时,本发明方法提取重复节点的关键特征,通过使用机器学习分类的手段根据多径路由出现的概率来进行停止判定,以决定是否继续探测。使用本发明方法代替现有基于停止集的探测方法中一旦遇到停止集中的重复节点就停止探测的停止判定方式,可以在缩减探测发包量的同时,探测到更多的多径路由上的拓扑元素,从而既控制了网络拓扑探测成本,又保障了拓扑探测发现率,更适用于对网络拓扑发现性价比和完整性有较高要求的应用场景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的停止判定分类模型生成步骤流程图;
图2为本发明实施例的多探测源传统探测示例;
图3为本发明实施例的以D1为目标的路径分组;
图4为本发明实施例的基于停止判定的网络拓扑探测方法流程图。
具体实施方式
本说明书中所有实施例公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合和/或扩展、替换。
鉴于背景中的问题,针对在多探测源网络拓扑探测中,现有基于停止集的网络拓扑探测技术一旦遇到重复节点就停止探测,但因多径路由的广泛使用导致的网络节点、链路等拓扑元素发现不完整的问题,本发明提出了一种基于机器学习技术进行停止判定的网络拓扑优化探测方案。当遇到停止集中的重复节点时,本发明方法提取重复节点的关键特征,通过使用机器学习分类的手段根据多径路由出现的概率来进行停止判定,以决定是否继续探测。使用本发明方法代替现有基于停止集的探测方法中一旦遇到停止集中的重复节点就停止探测的停止判定方式,可以在缩减探测发包量的同时,探测到更多的多径路由上的拓扑元素,从而既控制了网络拓扑探测成本,又保障了拓扑探测发现率,更适用于对网络拓扑发现性价比和完整性有较高要求的应用场景。
本发明的技术方案,在具体实施过程中,包括如下两个方面:
一方面,本发明提供一种用在网络拓扑探测场景的停止判定分类模型生成技术方案,其中停止判定分类模型生成步骤如图1所示,依次包含如下步骤:
1)在未采用优化探测方法的情况下获取原始探测结果数据集。为了获得用于机器学习训练的带标签特征数据集,首先需要通过探测或者搜集的手段获取原始数据集。原始数据集是在不采用任何优化方法而使用传统的基于IP地址的拓扑探测技术(比如使用Traceroute工具)的情况下获得的由节点和链路构成的去重后的拓扑路径集合。在原始数据集中,各个探测源均分别各自对探测目标进行探测,获取网络拓扑路径。图2展示了多探测源的传统探测示例。
图2中,S1、S2、S3、S4、S5为5个探测源,可以主动向拓扑路径上的各个节点发送探测包。D1、D2为探测目标。探测路径上的中继节点用n表示。本发明中所指拓扑节点包括探测源、探测目标和中继节点。拓扑链路用l表示,由两个拓扑节点和他们之间的一条边构成。图中节点和链路被几个探测源所探测即用几根重叠线刻画。
在图2示例中,5个探测源分别采用传统方法探测,将获得的拓扑路径去重后得到原始数据集,如表1所示。
表1:由图2示例构成的原始数据集
2)将所有探测路径按目标分组。因为特征抽取和标签生成都是面向针对相同目标的探测路径集合进行,因此将所有原始数据集中的路径按照目标进行分组。图2示例中,原始数据集将被分为两组,路径1、2、3、4、5为第一组,路径6、7、8、9、10、11为第二组。
3)统计同目标路径中的重复节点,以及在其之后是否存在多径路由。本发明实施例中的重复节点是指,在原始数据集的同一目标分组中,出现在至少两条路径上的节点。在基于停止集的网络拓扑探测方法中,一旦遇到同目标的重复节点,就会立即停止探测。而在本发明方法实施例中,遇到重复节点时会利用分类模型做出停止判定,由判定结果决定是否停止探测。重复节点之后是否存在多径路由是指,从重复节点到探测目标之间是否存在多条路径,如果存在多条路径,则存在多径路由,若不存在多条路径,则不存在多径路由。将图2拓扑中以D1为目标的路径分组取出为例,如图3所示。
图3中的重复节点是n2和n4,之后的停止判定过程将在这里进行。由于n2到D1之间存在路径[n2、n3、n4、D1]和路径[n2、n6、n4、D1],因此n2之后存在多径路由,用数字1标识。而n4和D1之间只有一条路径[n4、D1],因此n4之后没有多径路由,用数字0标识。这个结果由表2所示。
表2:图3示例中的重复节点和多径路由统计表
4)提取各个重复节点的特征。针对步骤3中统计出的各个重复节点,面向其所在的每一条路径,即表2中的每一行,抽取其特征,其特征包括但不局限于表3所示内容。
表3:重复节点的特征列表
表3中AS指自治域。AS的距离指当前重复节点到目标节点的路径中,中间经过的不同AS的个数。前缀距离是指当前重复节点和目标节点的子网前缀长度之差。
5)以重复节点特征为特征,其后路径中是否存在多径路由为标签形成数据集。将步骤4中针对重复节点的每一条路径抽取的特征值和步骤3)中相应路径在该重复节点之后是否存在多径路由的结果结合,以重复节点特征为特征,其后路径中是否存在多径路由为标签形成数据集。
6)进行机器学习分类模型训练。基于步骤5)中所得带标签数据集利用机器学习方法进行分类模型训练,得到停止判定分类模型。这里的机器学习方法包括但不限于决策树、随机森林、回归算法、神经网络等算法。
另一方面,本发明还提供一种基于停止判定的网络拓扑探测技术方案,其中基于停止判定的网络拓扑探测技术流程如图4所示,这个流程是针对一个探测源的探测流程,描述了一个探测源使用基于停止判定的网络拓扑探测技术进行拓扑测量的过程,依次包含如下步骤:
1)获取其他探测源结果路径
当前探测源通过路径共享机制获取其他探测源的探测结果路径。路径共享机制的实现方法与在基于停止集的探测方法中相同,目前已有很多研究成果,不在本发明讨论范围之内。
2)启动新一轮探测
当前探测源启动新一轮探测。
3)判断当前节点是否是目标节点
判断当前节点是否与目标节点IP地址相同。如果是新一轮探测刚刚启动,则直接比较探测源和目标节点,若不是,则将刚刚探得的节点与目标节点进行比较。如果相同,则结束探测,如果不同,进行步骤4)。
4)判断当前节点是否是同目标重复节点
查看当前节点是否是已经出现在已知的同目标路径当中的重复节点。若是则进行步骤5),若不是,则进行下一跳的探测,并返回步骤3)。
5)抽取当前节点特征
按照包括但不限于表3中的特征列表抽取当前节点的所有特征,能够依据当前探测路径抽取的特征基于当前路径抽取,不能依据当前探测路径抽取的特征基于包含此重复节点的已知探测路径抽取。
6)利用停止判定模型进行分类
基于步骤5)中抽取出的特征集合,利用停止判定模型进行机器学习分类。
7)根据分类结果决定是否停止探测
如果步骤6)中的分类结果是1,即之后路径中存在多径路由,则进行新一跳的探测,并回到步骤3)。若分类结果是0,即之后路径中不存在多径路由,则结束探测。
需要说明的是,在本发明权利要求书中所限定的保护范围内,以下实施例均可以从上述具体实施方式中,例如公开的技术原理,公开的技术特征或隐含公开的技术特征等,以合乎逻辑的任何方式进行组合和/或扩展、替换。
实施例1
一种停止判定分类模型的生成方法,包括以下步骤:
S1,获取原始探测结果数据集;
S2,将原始探测结果数据集中的探测路径按目标分组;
S3,统计分组后同目标路径中的重复节点,以及在其之后是否存在多径路由;
S4,提取各个重复节点的特征;
S5,以重复节点特征为特征,其后路径中是否存在多径路由为标签形成数据集;
S6,利用步骤S5中所得带标签数据集进行机器学习分类模型训练得到停止判定分类模型。
实施例2
在实施例1的基础上,在步骤S1中,所述原始探测结果数据集为节点和链路构成的去重后的拓扑探测路径集合。
实施例3
在实施例1的基础上,所述获取原始探测结果数据集,还包括子步骤:汇总所有探测源的所有探测结果路径形成原始探测结果数据集。
实施例4
在实施例1的基础上,在步骤S3中,所述分组后统计同目标路径中的重复节点,以及在其之后是否存在多径路由,具体包括子步骤:重复节点是在原始数据集的同一目标分组中,出现在至少两条路径上的节点;
重复节点之后是否存在多径路由是从重复节点到探测目标之间是否存在多条路径,如果存在多条路径,则存在多径路由,若不存在多条路径,则不存在多径路由。
实施例5
在实施例1的基础上,在步骤S4中,所述提取各个重复节点的特征,具体包括子步骤:针对步骤S3中统计出的各个重复节点,面向其所在的每一条路径,抽取其特征。
实施例6
在实施例5的基础上,在步骤S5中,所述以重复节点特征为特征,其后路径中是否存在多径路由为标签形成数据集,具体包括子步骤:将步骤S4中针对重复节点的每一条路径抽取的特征值和步骤S3中相应路径在该重复节点之后是否存在多径路由的结果结合,以重复节点特征为特征,其后路径中是否存在多径路由为标签形成数据集。
实施例7
在实施例5的基础上,在步骤S6中,所述机器学习方法包括决策树、随机森林、回归算法、神经网络算法中的任一种。
实施例8
一种网络拓扑探测方法,包括如下子步骤:
步骤1,获取探测源结果路径;
步骤2,当前探测源启动新一轮探测;
步骤3,判断当前节点是否与目标节点IP地址相同;如果是新一轮探测刚启动,则直接比较探测源和目标节点,若不是,则将刚探得的节点与目标节点进行比较;如果相同,则结束探测,如果不同,则进行步骤4;
步骤4,查看当前节点是否是已经出现在已知的同目标路径当中的重复节点,若是则进行步骤5,若不是,则进行下一跳的探测,并返回步骤3;
步骤5,抽取当前节点的所有特征,能够依据当前探测路径抽取的特征基于当前路径抽取,不能依据当前探测路径抽取的特征基于包含此重复节点的已知探测路径抽取;
步骤6,基于步骤5中抽取出的特征集合,利用如上方法中训练生成的所述停止判定分类模型进行机器学习分类;
步骤7,如果步骤6中的分类结果是1,即之后路径中存在多径路由,则进行新一跳的探测,并回到步骤3;若分类结果是0,即之后路径中不存在多径路由,则结束探测。
实施例9
在实施例8的基础上,在步骤1中,所述获取探测源结果路径包括子步骤:当前探测源通过路径共享机制获取其他探测源的探测结果路径。
实施例10
一种网络拓扑探测装置,包括处理器和存储器,所述存储器中存储有计算机程序,当所述计算机程序被所述处理器加载时并执行如实施例8~实施例9任一项所述的网络拓扑探测方法方法。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
根据本发明实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的方法。
作为另一方面,本发明实施例还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。
上述技术方案只是本发明的一种实施方式,对于本领域内的技术人员而言,在本发明公开了应用方法和原理的基础上,很容易做出各种类型的改进或变形,而不仅限于本发明上述具体实施方式所描述的方法,因此前面描述的方式只是优选的,而并不具有限制性的意义。
除以上实例以外,本领域技术人员根据上述公开内容获得启示或利用相关领域的知识或技术进行改动获得其他实施例,各个实施例的特征可以互换或替换,本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (6)

1.一种停止判定分类模型的生成方法,其特征在于,包括以下步骤:
S1,获取原始探测结果数据集,所述原始探测结果数据集为节点和链路构成的去重后的拓扑探测路径集合;
S2,将原始探测结果数据集中的探测路径按目标分组;
S3,统计分组后同目标路径中的重复节点,以及在其之后是否存在多径路由;重复节点是在原始数据集的同一目标分组中,出现在至少两条路径上的节点;重复节点之后是否存在多径路由是从重复节点到探测目标之间是否存在多条路径,如果存在多条路径,则存在多径路由,若不存在多条路径,则不存在多径路由;
S4,提取各个重复节点的特征,针对步骤S3中统计出的各个重复节点,面向其所在的每一条路径,抽取其特征;
S5,以重复节点特征为特征,其后路径中是否存在多径路由为标签形成数据集,步骤S4中针对重复节点的每一条路径抽取的特征值和步骤S3中相应路径在该重复节点之后是否存在多径路由的结果结合,以重复节点特征为特征,其后路径中是否存在多径路由为标签形成数据集;
S6,利用步骤S5中所得带标签数据集进行机器学习分类模型训练得到停止判定分类模型。
2.根据权利要求1所述的停止判定分类模型的生成方法,其特征在于,所述获取原始探测结果数据集,还包括子步骤:汇总所有探测源的所有探测结果路径形成原始探测结果数据集。
3.根据权利要求1所述的停止判定分类模型的生成方法,其特征在于,在步骤S6中,所述机器学习方法包括决策树、随机森林、回归算法、神经网络算法中的任一种。
4.一种网络拓扑探测方法,其特征在于,包括如下子步骤:
步骤1,获取探测源结果路径;
步骤2,当前探测源启动新一轮探测;
步骤3,判断当前节点是否与目标节点IP地址相同;如果是新一轮探测刚启动,则直接比较探测源和目标节点,若不是,则将刚探得的节点与目标节点进行比较;如果相同,则结束探测,如果不同,则进行步骤4;
步骤4,查看当前节点是否是已经出现在已知的同目标路径当中的重复节点,若是则进行步骤5,若不是,则进行下一跳的探测,并返回步骤3;
步骤5,抽取当前节点的所有特征,能够依据当前探测路径抽取的特征基于当前路径抽取,不能依据当前探测路径抽取的特征基于包含此重复节点的已知探测路径抽取;
步骤6,基于步骤5中抽取出的特征集合,利用如权利要求1中训练生成的所述停止判定分类模型进行机器学习分类;
步骤7,如果步骤6中的分类结果是1,即之后路径中存在多径路由,则进行新一跳的探测,并回到步骤3;若分类结果是0,即之后路径中不存在多径路由,则结束探测。
5.根据权利要求4所述的网络拓扑探测方法,其特征在于,在步骤1中,所述获取探测源结果路径包括子步骤:当前探测源通过路径共享机制获取其他探测源的探测结果路径。
6.一种网络拓扑探测装置,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,当所述计算机程序被所述处理器加载时并执行如权利要求4~5中任一项所述的网络拓扑探测方法。
CN202310937279.5A 2023-07-28 2023-07-28 停止判定分类模型的生成方法、网络拓扑探测方法及装置 Active CN116708273B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310937279.5A CN116708273B (zh) 2023-07-28 2023-07-28 停止判定分类模型的生成方法、网络拓扑探测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310937279.5A CN116708273B (zh) 2023-07-28 2023-07-28 停止判定分类模型的生成方法、网络拓扑探测方法及装置

Publications (2)

Publication Number Publication Date
CN116708273A CN116708273A (zh) 2023-09-05
CN116708273B true CN116708273B (zh) 2023-10-31

Family

ID=87826014

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310937279.5A Active CN116708273B (zh) 2023-07-28 2023-07-28 停止判定分类模型的生成方法、网络拓扑探测方法及装置

Country Status (1)

Country Link
CN (1) CN116708273B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102546251A (zh) * 2011-12-31 2012-07-04 清华大学 基于混合探测技术的网络拓扑发现和自动布局方法及系统
CN102820984A (zh) * 2011-01-29 2012-12-12 特克特朗尼克公司 自动网络拓扑结构检测和建模
CN107404411A (zh) * 2017-09-11 2017-11-28 哈尔滨工程大学 一种并行网络拓扑发现方法
CN109120465A (zh) * 2018-10-23 2019-01-01 中国人民解放军战略支援部队信息工程大学 基于模体的目标区域网络拓扑划分方法
CN112583657A (zh) * 2020-11-13 2021-03-30 东北大学 一种基于嵌入式设备的分布式路由级网络拓扑探测方法
CN112737861A (zh) * 2021-01-06 2021-04-30 郑州埃文计算机科技有限公司 一种ip接口层网络拓扑探测方法
CN114629543A (zh) * 2022-01-28 2022-06-14 航天东方红卫星有限公司 一种基于深度监督学习的卫星网络自适应流量调度方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11437846B2 (en) * 2021-02-03 2022-09-06 Zhejiang Lab Reliable resilient router for wide-area phasor measurement system of power grid

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102820984A (zh) * 2011-01-29 2012-12-12 特克特朗尼克公司 自动网络拓扑结构检测和建模
CN102546251A (zh) * 2011-12-31 2012-07-04 清华大学 基于混合探测技术的网络拓扑发现和自动布局方法及系统
CN107404411A (zh) * 2017-09-11 2017-11-28 哈尔滨工程大学 一种并行网络拓扑发现方法
CN109120465A (zh) * 2018-10-23 2019-01-01 中国人民解放军战略支援部队信息工程大学 基于模体的目标区域网络拓扑划分方法
CN112583657A (zh) * 2020-11-13 2021-03-30 东北大学 一种基于嵌入式设备的分布式路由级网络拓扑探测方法
CN112737861A (zh) * 2021-01-06 2021-04-30 郑州埃文计算机科技有限公司 一种ip接口层网络拓扑探测方法
CN114629543A (zh) * 2022-01-28 2022-06-14 航天东方红卫星有限公司 一种基于深度监督学习的卫星网络自适应流量调度方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
大规模网络拓扑探测和路径性能测量方法研究;高梦超;王俊峰;陈世强;赵重阳;;计算机测量与控制(第02期);336-338 *

Also Published As

Publication number Publication date
CN116708273A (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
CN109921996B (zh) 一种高性能的OpenFlow虚拟流表查找方法
Liu et al. Optimizing overlay topology by reducing cut vertices
US9491074B2 (en) Method, apparatus, and system for detecting connectivity
US11637787B2 (en) Preventing duplication of packets in a network
CN111786857B (zh) 基于分布式的网络资产主动探测方法及系统
Xu et al. ELDA: Towards efficient and lightweight detection of cache pollution attacks in NDN
Raftopoulou et al. iCluster: a self-organizing overlay network for P2P information retrieval
CN104639443A (zh) 一种报文快速转发的方法和装置
Anceaume et al. Identifying global icebergs in distributed streams
CN116708273B (zh) 停止判定分类模型的生成方法、网络拓扑探测方法及装置
Türker et al. Spreading in scale-free computer networks with improved clustering
He et al. On the reliability of large-scale distributed systems–A topological view
CN110049039B (zh) 一种基于gbdt的信息中心网络缓存污染检测方法
CN113965492A (zh) 一种数据流统计方法及装置
Zhang et al. A new algorithm of service discovery based on DHT for mobile application
CN112965970A (zh) 一种基于哈希算法的异常流量并行检测方法及系统
Itagi et al. DDoS Attack Detection in SDN Environment using Bi-directional Recurrent Neural Network
Zhang et al. Chat: Accurate network latency measurement for 5g e2e networks
Leng et al. Research on P2P Network Resource Search Model
Liu et al. A hash-based algorithm for measuring cardinality distribution in network traffic
Qian et al. OffsetINT: Achieving High Accuracy and Low Bandwidth for In-Band Network Telemetry
CN114189299B (zh) 一种可防御频谱感知数据伪造攻击的快速共识方法及系统
Shao et al. A Multi-path Nonoverlapping Routing Algorithm for Deterministic Networking
Zhang et al. Collaborative Optimization Measurement Method for Network Topology
Bonelli et al. A probabilistic counting framework for distributed measurements

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant