CN118101515A - 异常拓扑处理方法、系统、设备以及集群 - Google Patents

异常拓扑处理方法、系统、设备以及集群 Download PDF

Info

Publication number
CN118101515A
CN118101515A CN202410497468.XA CN202410497468A CN118101515A CN 118101515 A CN118101515 A CN 118101515A CN 202410497468 A CN202410497468 A CN 202410497468A CN 118101515 A CN118101515 A CN 118101515A
Authority
CN
China
Prior art keywords
network card
network
access control
media access
control address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410497468.XA
Other languages
English (en)
Other versions
CN118101515B (zh
Inventor
陈森法
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Xingyun Zhilian Technology Co Ltd
Original Assignee
Zhuhai Xingyun Zhilian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Xingyun Zhilian Technology Co Ltd filed Critical Zhuhai Xingyun Zhilian Technology Co Ltd
Priority to CN202410497468.XA priority Critical patent/CN118101515B/zh
Publication of CN118101515A publication Critical patent/CN118101515A/zh
Application granted granted Critical
Publication of CN118101515B publication Critical patent/CN118101515B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供了一种异常拓扑处理方法、系统、设备以及集群。所述系统包括:数据处理器,用于提供网卡以及网卡的拓扑关系的硬件逻辑,数据处理器还设置有模拟器,模拟器用于提供网卡以及网卡的拓扑关系的软件逻辑,并与硬件逻辑之间协商交互以实现对网卡的模拟,网卡包括第一网卡,第一网卡包括第一网口,第一网口具有第一媒体访问控制地址;处理器,用于通过驱动程序驱动网卡;数据处理器,还用于接收第一外部设备通过第一网口上传的第一报文,对源媒体访问控制地址为第一媒体访问控制地址的第一报文的第一速率进行统计,并在第一速率大于速率阈值的情况下,对第一网口执行惩罚动作,第一报文为广播报文。

Description

异常拓扑处理方法、系统、设备以及集群
技术领域
本申请涉及数据处理领域,尤其涉及一种异常拓扑处理方法、系统、设备以及集群。
背景技术
在数字化日益普及的今天,云计算数据中心已经成为当今时代的“新基建”。在数据中心机房中,网卡、交换机、路由器等等组成的拓扑会非常复杂。由于拓扑非常复杂,经常存在误操作,导致出现环路。一旦环路后,会导致广播风暴。如果不能及时发现,会影响正常的业务,造成严重的事故。
发明内容
本申请提供了一种异常拓扑处理方法、系统、设备以及集群,能够在网卡实现对异常拓扑进行处理。
第一方面,提供了一种异常拓扑处理系统,包括:
数据处理器,用于提供网卡以及所述网卡的拓扑关系的硬件逻辑,所述数据处理器还设置有模拟器,所述模拟器用于提供所述网卡以及所述网卡的拓扑关系的软件逻辑,并与所述硬件逻辑之间协商交互以实现对所述网卡的模拟,所述网卡包括第一网卡,所述第一网卡包括第一网口,所述第一网口具有第一媒体访问控制地址;
处理器,用于通过驱动程序驱动所述网卡;
所述数据处理器,还用于接收第一外部设备通过所述第一网口上传的第一报文,对源媒体访问控制地址为所述第一媒体访问控制地址的第一报文的第一速率进行统计,并在所述第一速率大于速率阈值的情况下,对所述第一网口执行惩罚动作,其中,所述第一报文为广播报文。
在一些可能的设计中,所述第一网卡还包括第二网口,所述第二网口具有第二媒体访问控制地址,
所述数据处理器,还用于接收第二外部设备通过所述第二网口上传的第二报文,对源媒体访问控制地址为所述第二媒体访问控制地址的第二报文的第二速率进行统计,并在所述第二速率大于速率阈值的情况下,对所述第二网口执行惩罚动作,所述第一网口不同于所述第二网口,所述第二报文为广播报文。
在一些可能的设计中,所述网卡包括第二网卡,所述第二网卡包括第三网口,所述第三网口具有第三媒体访问控制地址,
所述数据处理器,还用于接收第三外部设备通过所述第三网口上传的第三报文,对源媒体访问控制地址为所述第三媒体访问控制地址的第三报文的第三速率进行统计,并在所述第三速率大于速率阈值的情况下,对所述第三网口执行惩罚动作,其中,所述第三报文为广播报文。
在一些可能的设计中,所述数据处理器用于在所述第一网口执行惩罚动作之后,重新对源媒体访问控制地址为所述第一媒体访问控制地址的第一报文的第四速率进行统计,并在所述第四速率小于速率阈值的情况下,停止对所述第一网口执行惩罚动作。
在一些可能的设计中,所述第一报文是从所述驱动程序通过所述第一网口下发的。
在一些可能的设计中,数据处理器为数据处理单元、现场可编程门阵列、专用集成电路中的任意一种。
在一些可能的设计中,所述惩罚动作包括将丢弃报文、对报文进行限速、关闭网口中的任意一种。
第二方面,提供了一种异常拓扑处理方法,包括:
通过数据处理器提供网卡以及所述网卡的拓扑关系的硬件逻辑,所述数据处理器还设置有模拟器,所述模拟器用于提供所述网卡以及所述网卡的拓扑关系的软件逻辑,并与所述硬件逻辑之间协商交互以实现对所述网卡的模拟,所述网卡包括第一网卡,所述第一网卡包括第一网口,所述第一网口具有第一媒体访问控制地址;
通过处理器提供驱动程序驱动所述网卡;
通过数据处理器接收第一外部设备通过所述第一网口上传的第一报文,对源媒体访问控制地址为所述第一媒体访问控制地址的第一报文的第一速率进行统计,并在所述第一速率大于速率阈值的情况下,对所述第一网口执行惩罚动作,其中,所述第一报文为广播报文。
第三方面,提供了一种计算设备,包括数据处理器以及处理器,
所述数据处理器,用于提供网卡以及所述网卡的拓扑关系的硬件逻辑,所述数据处理器还设置有模拟器,所述模拟器用于提供所述网卡以及所述网卡的拓扑关系的软件逻辑,并与所述硬件逻辑之间协商交互以实现对所述网卡的模拟,所述网卡包括第一网卡,所述第一网卡包括第一网口,所述第一网口具有第一媒体访问控制地址;
所述处理器,用于通过驱动程序驱动所述网卡;
所述数据处理器,还用于接收第一外部设备通过所述第一网口上传的第一报文,对源媒体访问控制地址为所述第一媒体访问控制地址的第一报文的第一速率进行统计,并在所述第一速率大于速率阈值的情况下,对所述第一网口执行惩罚动作,其中,所述第一报文为广播报文。
第四方面,提供了一种计算集群,包括多个如第三方面所述的计算设备。
附图说明
为了更清楚地说明本发明实施例或背景技术中的技术方案,下面将对本发明实施例或背景技术中所需要使用的附图进行说明。
图1是本申请提供的一种异常拓扑处理系统的结构示意图;
图2是本申请提供的另一种异常拓扑处理系统的结构示意图;
图3是本申请提供的一种异常拓扑处理方法的流程示意图;
图4是本申请提供的一种计算设备的结构示意图。
具体实施方式
下面结合本发明实施例中的附图对本发明实施例进行描述。本发明的实施方式部分使用的术语仅用于对本发明的具体实施例进行解释,而非旨在限定本发明。
参见图1,图1是本申请提供的一种异常拓扑处理系统的结构示意图。如图1所示,本申请的异常拓扑处理系统包括:处理器110以及数据处理器120。
处理器(Processor)110是主机的运算核心和控制核心。处理器110中可以包括一个或多个处理器核(core)。处理器110可以是一块超大规模的集成电路。在处理器110中安装有操作系统和其他软件程序,从而处理器110能够实现对各种外围组件互联扩展(Peripheral Component Interconnect Express,PCIe)设备的访问。可以理解的是,在本发明实施例中,处理器110中的处理器核例如可以是中央处理器(Central Processingunit,CPU)。
数据处理器120可以是数据处理单元(Data Processing Unit,DPU)或者网络接口控制器(Network Interface Card,NIC),其可以是采用现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者专用集成电路(Application-Specific IntegratedCircuit,ASIC)等等实现的。数据处理器,用于提供网卡以及所述网卡的拓扑关系的硬件逻辑。数据处理器还设置有模拟器,模拟器提供网卡以及网卡的拓扑关系的软件逻辑,并与硬件逻辑之间协商交互以实现对网卡的模拟。网卡,也被称为网络适配器或网络接口卡,是一种用于进行数据传输的设备。网卡的数量可以是一个,也可以是多个。以网卡为多个为例,每个网卡均可以包括一个或者多个网口。每个网口都有一个媒体访问控制(Media AccessControl,MAC)地址。以图1所示为例,数据处理器120模拟出了第一网卡以及第二网网卡,其中,第一网卡设置有第一网口以及第二网口,第二网卡设置有第三网口。其中,第一网口具有第一MAC地址,第二网口具有第二MAC地址,第三网口具有第三MAC地址。
处理器(Processor)110通过驱动程序驱动网卡。驱动程序将会管理数据处理器模拟的网卡的MAC地址,这些网口的MAC地址组成MAC链,即从该驱动程序下来的报文的源MAC地址都是属于MAC链的。
上述异常拓扑处理系统仅仅示例了两个网卡以及三个网口,在实际应用中,可以包括更多或者更少的网卡,每个网卡可以包括更多或者更少的网口,此处不作具体限定。
此外,如图2所示,异常拓扑处理系统还可以包括第一交换机130以及第二交换机140。其中,第一交换机130以及第二交换机140可以是二层交换机,也可以是三层交换机。当然,第一交换机130和第二交换机140可以替换成路由器。第一交换机130包括第一端口、第二端口以及第三端口。其中,第一端口、第二端口和第三端口属于同一个第一广播域。第二交换机140包括第四端口以及第五端口。其中,第四端口、第五端口属于同一个第二广播域。第一端口通过有线或者无线网络连接第一网卡的第一网口,第二端口通过有线或者无线网络连接第二交换机的第四端口,第三端口通过有线或者无线网络连接第二交换机的第五端口。所以,第二端口、第三端口、第四端口、第五端口之间就构成了环路,会造成广播风暴。
上述异常拓扑处理系统仅仅示例了两个交换机以及两个交换机的连接方法,在实际应用中,可以包括更多或者更少的交换机,交换机之间的连接关系可以是其他,此处不作具体限定。
假设驱动程序通过第一网卡的第一网口下发第一报文。其中,第一报文是广播报文,第一报文的源MAC地址为第一网口的第一MAC地址。第一交换机的第一端口接收到第一网口发送的第一报文之后,确定第一报文是广播报文,在第一广播域中对第一报文进行广播,从而通过第二端口以及第三端口将第一报文发送出去。第二交换机140的第四端口接收到第一交换机130的第二端口发送的第一报文之后,确定第一报文是广播报文,于是,将第一报文在第二广播域中对第一报文进行广播,从而将第一报文通过第五端口发送出去。第一交换机130的第三端口接收到第二交换机140的第五端口发送的第一报文之后,确定第一报文是广播报文,在第一广播域中对第一报文进行广播,从而通过第一端口以及第二端口将第一报文发送出去。因此,第一网卡的第一网口接收到第一交换机130的第一端口发送的第一报文。而第一报文本来就是第一网卡的第一网口发送出去的,最后,又通过第一网卡的第一网口接收回来了,这样循环往复,就构成了广播风暴。
为了解决这个问题,数据处理器120在接收第一外部设备(例如,第一交换机)通过第一网口上传的第一报文,对源媒体访问控制地址为第一媒体访问控制地址的第一报文的第一速率进行统计,并在第一速率大于速率阈值的情况下,对第一网口执行惩罚动作。为了具有一定的容错性,避免一出现第一网卡的第一网口接收到源媒体访问控制地址为第一媒体访问控制地址的第一报文,就马上对第一网口执行惩罚动作,从而导致对正常的业务造成影响,因此,可以对源媒体访问控制地址为第一媒体访问控制地址的第一报文的第一速率进行统计,并在第一速率大于速率阈值的情况下,才对第一网口执行惩罚动作。其中,惩罚动作包括对报文进行限速、丢弃报文、关闭网口中的任意一种。对报文进行限速为将源媒体访问控制地址为第一媒体访问控制地址的第一报文的速率进行限制。丢弃报文为将源媒体访问控制地址为第一媒体访问控制地址的第一报文进行丢弃。关闭网口为将第一网口进行关闭。在实际应用中,可以根据不同的情况采用不同的惩罚动作,例如,当第一网口接收到的第一报文的数量不多的时候,可以执行对报文进行限速的惩罚动作,当第一网口接收到的第一报文的数量增多的时候,可以执行丢弃报文的惩罚动作,当第一网口接收到的第一报文的数量非常多的时候,可以执行关闭第一网口的惩罚动作。
速率阈值可以根据经验进行设置,例如,可以是整个带宽的二分之一,三分之一等等。这里,
第一速率=(第一当前时刻计数-第一上一时刻计数)/第一时间戳;
其中,第一当前时刻计数为当前时刻接收到的源媒体访问控制地址为第一媒体访问控制地址的第一报文的数量,第一上一时刻计数为之前时刻接收到的源媒体访问控制地址为第一媒体访问控制地址的第一报文的数量,第一时间戳为第一当前时刻减去第一上一时刻得到的时间段。
同理,驱动程序通过第一网卡的第二网口下发第二报文也可以执行同样的操作。数据处理器120在接收第二外部设备(例如,第一交换机或者其他的交换机或者路由器)通过第二网口上传的第二报文,对源媒体访问控制地址为第二媒体访问控制地址的第二报文的第二速率进行统计,并在第二速率大于速率阈值的情况下,对第二网口执行惩罚动作。为了具有一定的容错性,避免一出现第一网卡的第二网口接收到源媒体访问控制地址为第二媒体访问控制地址的第二报文,就马上对第二网口执行惩罚动作,从而导致对正常的业务造成影响,因此,可以对源媒体访问控制地址为第二媒体访问控制地址的第二报文的第二速率进行统计,并在第二速率大于速率阈值的情况下,才对第二网口执行惩罚动作。其中,惩罚动作包括对报文进行限速、丢弃报文、关闭网口中的任意一种。对报文进行限速为将源媒体访问控制地址为第二媒体访问控制地址的第二报文的速率进行限制。丢弃报文为将源媒体访问控制地址为第二媒体访问控制地址的第二报文进行丢弃。关闭网口为将第二网口进行关闭。在实际应用中,可以根据不同的情况采用不同的惩罚动作,例如,当第二网口接收到的第二报文的数量不多的时候,可以执行对报文进行限速的惩罚动作,当第二网口接收到的第二报文的数量增多的时候,可以执行丢弃报文的惩罚动作,当第二网口接收到的第二报文的数量非常多的时候,可以执行关闭第二网口的惩罚动作。这里,
第二速率=(第二当前时刻计数-第二上一时刻计数)/第二时间戳;
其中,第二当前时刻计数为当前时刻接收到的源媒体访问控制地址为第二媒体访问控制地址的第二报文的数量,第二上一时刻计数为之前时刻接收到的源媒体访问控制地址为第二媒体访问控制地址的第二报文的数量,第二时间戳为第二当前时刻减去第二上一时刻得到的时间段。
同理,驱动程序通过第二网卡的第三网口下发第三报文也可以执行同样的操作。数据处理器120在接收第三外部设备(例如,第一交换机或者其他的交换机或者路由器)通过第三网口上传的第三报文,对源媒体访问控制地址为第三媒体访问控制地址的第三报文的第三速率进行统计,并在第三速率大于速率阈值的情况下,对第三网口执行惩罚动作。为了具有一定的容错性,避免一出现第二网卡的第三网口接收到源媒体访问控制地址为第三媒体访问控制地址的第三报文,就马上对第三网口执行惩罚动作,从而导致对正常的业务造成影响,因此,可以对源媒体访问控制地址为第三媒体访问控制地址的第三报文的第三速率进行统计,并在第三速率大于速率阈值的情况下,才对第三网口执行惩罚动作。其中,惩罚动作包括对报文进行限速、丢弃报文、关闭网口中的任意一种。对报文进行限速为将源媒体访问控制地址为第三媒体访问控制地址的第三报文的速率进行限制。丢弃报文为将源媒体访问控制地址为第三媒体访问控制地址的第三报文进行丢弃。关闭网口为将第三网口进行关闭。在实际应用中,可以根据不同的情况采用不同的惩罚动作,例如,当第三网口接收到的第三报文的数量不多的时候,可以执行对报文进行限速的惩罚动作,当第三网口接收到的第三报文的数量增多的时候,可以执行丢弃报文的惩罚动作,当第三网口接收到的第三报文的数量非常多的时候,可以执行关闭第三网口的惩罚动作。这里,
第三速率=(第三当前时刻计数-第三上一时刻计数)/第三时间戳;
其中,第三当前时刻计数为当前时刻接收到的源媒体访问控制地址为第三媒体访问控制地址的第三报文的数量,第三上一时刻计数为之前时刻接收到的源媒体访问控制地址为第三媒体访问控制地址的第三报文的数量,第三时间戳为第三当前时刻减去第三上一时刻得到的时间段。
在对网口执行惩罚动作之后,可以观察网口的情况是否有恢复,如果网口的情况有恢复,就可以停止对网口执行惩罚动作。具体地,
在第一网口执行惩罚动作之后,重新对源媒体访问控制地址为第一媒体访问控制地址的第一报文的第四速率进行统计,并在第四速率小于速率阈值的情况下,停止对第一网口执行惩罚动作。
同理,在第二网口执行惩罚动作之后,重新对源媒体访问控制地址为第二媒体访问控制地址的第二报文的第五速率进行统计,并在第五速率小于速率阈值的情况下,停止对第二网口执行惩罚动作。
同理,在第三网口执行惩罚动作之后,重新对源媒体访问控制地址为第三媒体访问控制地址的第三报文的第六速率进行统计,并在第六速率小于速率阈值的情况下,停止对第三网口执行惩罚动作。
上述方案中,因为网卡是数据处理器模拟出来的,数据处理器通常具有比普通网卡更多的资源,而数据处理器模拟出来的网卡的网口可能会有几百个,对应的MAC地址也可能有几百个,因此,普通的网卡根本没法对这么多MAC地址进行维护,也不能执行对源MAC地址为网口的MAC地址的报文的速率进行统计,并在速率大于速率阈值的情况下,对网口执行惩罚动作。而本申请中数据处理器具有较多的资源,可以对这些MAC地址进行维护,也可以执行对源MAC地址为网口的MAC地址的报文的速率进行统计,并在速率大于速率阈值的情况下,对网口执行惩罚动作。而在交换机和路由设备中,尽管交换机和路由设备的资源也比较多,但是,交换机和路由设备接收到的报文的MAC地址是一直在变的,因此,是不可能通过对网口接收到的报文的源MAC地址为网口的MAC地址的报文进行统计,从而实现对异常拓扑进行处理。而在本申请中,数据处理器模拟出来的网卡的MAC地址是不变的,因此,能通过对网口接收到的报文的源MAC地址为网口的MAC地址的报文进行统计,从而实现对异常拓扑进行处理。
参见图3,图3是本申请提供的一种异常拓扑处理方法的流程示意图。如图3所示,本申请的异常拓扑处理方法,包括:
S101:通过数据处理器提供网卡以及网卡的拓扑关系的硬件逻辑以及软件逻辑。
数据处理器还设置有模拟器,模拟器用于提供网卡以及网卡的拓扑关系的软件逻辑,并与硬件逻辑之间协商交互以实现对网卡的模拟。网卡也被称为网络适配器或网络接口卡,是一种用于进行数据传输的设备。网卡的数量可以是一个,也可以是多个。网卡包括第一网卡,第一网卡包括第一网口,第一网口具有第一媒体访问控制地址。
S102:通过处理器提供驱动程序驱动网卡。
S103:通过数据处理器接收第一外部设备通过第一网口上传的第一报文,对源媒体访问控制地址为第一媒体访问控制地址的第一报文的第一速率进行统计。
第一报文为广播报文,第一报文的源MAC地址为第一网口的第一MAC地址。这里,第一速率=(第一当前时刻计数-第一上一时刻计数)/第一时间戳;
其中,第一当前时刻计数为当前时刻接收到的源媒体访问控制地址为第一媒体访问控制地址的第一报文的数量,第一上一时刻计数为之前时刻接收到的源媒体访问控制地址为第一媒体访问控制地址的第一报文的数量,第一时间戳为第一当前时刻减去第一上一时刻得到的时间段。
S104:在第一速率大于速率阈值的情况下,对第一网口执行惩罚动作。
速率阈值可以根据经验进行设置,例如,可以是整个带宽的二分之一,三分之一等等。
惩罚动作包括对报文进行限速、丢弃报文、关闭网口中的任意一种。对报文进行限速为将源媒体访问控制地址为第二媒体访问控制地址的第二报文的速率进行限制。丢弃报文为将源媒体访问控制地址为第二媒体访问控制地址的第二报文进行丢弃。关闭网口为将第二网口进行关闭。在实际应用中,可以根据不同的情况采用不同的惩罚动作,例如,当第二网口接收到的第二报文的数量不多的时候,可以执行对报文进行限速的惩罚动作,当第二网口接收到的第二报文的数量增多的时候,可以执行丢弃报文的惩罚动作,当第二网口接收到的第二报文的数量非常多的时候,可以执行关闭第二网口的惩罚动作。
参见图4,图4是本申请提供的一种计算设备的结构示意图。该计算设备400包括:一个或者多个处理单元410、通信接口420以及存储器430。
所述处理单元410、通信接口420以及存储器430通过总线440相互连接。可选地,该计算设备400还可以包括输入/输出接口450,输入/输出接口450连接有输入/输出设备,用于接收用户设置的参数等。该计算设备400能够用于实现上述的本申请实施例中设备实施例或者系统实施例的部分或者全部功能;处理单元410还能够用于实现上述的本申请实施例中方法实施例的部分或者全部操作步骤。例如,该计算设备400执行各种操作的具体实现可参照上述实施例中的具体细节,如处理单元410用于执行上述方法实施例中部分或者全部步骤或者上述方法实施例中的部分或者全部操作。再例如,本申请实施例中,计算设备400可用于实现上述装置实施例中一个或者多个部件的部分或者全部功能,此外通信接口420具体可用于为了实现这些装置、部件的功能所必须的通讯功能等,以及处理单元410具体可用于为了实现这些装置、部件的功能所必须的处理功能等。
应当理解的是,图4的计算设备400可以包括一个或者多个处理单元410,并且多个处理单元410可以按照并行化连接方式、串行化连接方式、串并行连接方式或者任意连接方式来协同提供处理能力,或者多个处理单元410可以构成处理器序列或者处理器阵列,或者多个处理单元410之间可以分成主处理器和辅助处理器,或者多个处理单元410之间可以具有不同的架构如采用异构计算架构。另外,图4所示的计算设备400,相关的结构性描述及功能性描述是示例性且非限制性的。在一些示例性实施例中,计算设备400可以包括比图4所示的更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者具有不同的部件布置。
处理单元410可以有多种具体实现形式,例如处理单元410可以包括中央处理器(central processingunit,CPU)、图形处理器(graphic processing unit,GPU)、神经网络处理器(neural-networkprocessing unit,NPU)、张量处理器(tensor processing unit,TPU)或数据处理器(data processing unit,DPU)等一种或多种的组合,本申请实施例不做具体限定。处理单元410还可以是单核处理器或多核处理器。处理单元410可以由CPU和硬件芯片的组合。上述硬件芯片可以是专用集成电路(application-specificintegratedcircuit,ASIC),可编程逻辑器件(programmable logicdevice,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complexprogrammable logic device,CPLD),现场可编程逻辑门阵列(field-programmable gate array,FPGA),通用阵列逻辑(generic array logic,GAL)或其任意组合。处理单元410也可以单独采用内置处理逻辑的逻辑器件来实现,例如FPGA或数字信号处理器(digital signal processor,DSP)等。通信接口420可以为有线接口或无线接口,用于与其他模块或设备进行通信,有线接口可以是以太接口、局域互联网络(local interconnect network,LIN)等,无线接口可以是蜂窝网络接口或使用无线局域网接口等。
存储器430可以是非易失性存储器,例如,只读存储器(read-onlymemory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electricallyEPROM,EEPROM)或闪存。存储器430也可以是易失性存储器,易失性存储器可以是随机存取存储器(randomaccess memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(doubledatarate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM,DR RAM)。存储器430也可用于存储程序代码和数据,以便于处理单元410调用存储器430中存储的程序代码执行上述方法实施例中的部分或者全部操作步骤,或者执行上述设备实施例中的相应功能。此外,计算设备400可能包含相比于图4展示的更多或者更少的组件,或者有不同的组件配置方式。
总线440可以是快捷外设部件互连标准(peripheral component interconnectexpress,PCIe)总线,或扩展工业标准结构(extended industry standard architecture,EISA)总线、统一总线(unified bus,Ubus或UB)、计算机快速链接(compute express link,CXL)、缓存一致互联协议(cache coherentinterconnect for accelerators,CCIX)等。总线440可以分为地址总线、数据总线、控制总线等。总线440除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
本申请实施例还提供一种系统,该系统包括多个计算设备,每个计算设备的结构可以参照上述的计算设备的结构。该系统可实现的功能或者操作可以参照上述方法实施例中的具体实现步骤和/或上述装置实施例中所描述的具体功能,在此不再赘述。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者任意组合来实现。当使用软件实现时,可以全部或者部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令,在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络或其他可编程装置。所述计算机指令可存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网络站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、微波等)方式向另一个网络站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质,也可以是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带等)、光介质(例如DVD等)、或者半导体介质(例如固态硬盘)等等。
在上述实施例中,对各个实施例的描述各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

Claims (10)

1.一种异常拓扑处理系统,其特征在于,包括:
数据处理器,用于提供网卡以及所述网卡的拓扑关系的硬件逻辑,所述数据处理器还设置有模拟器,所述模拟器用于提供所述网卡以及所述网卡的拓扑关系的软件逻辑,并与所述硬件逻辑之间协商交互以实现对所述网卡的模拟,所述网卡包括第一网卡,所述第一网卡包括第一网口,所述第一网口具有第一媒体访问控制地址;
处理器,用于通过驱动程序驱动所述网卡;
所述数据处理器,还用于接收第一外部设备通过所述第一网口上传的第一报文,对源媒体访问控制地址为所述第一媒体访问控制地址的第一报文的第一速率进行统计,并在所述第一速率大于速率阈值的情况下,对所述第一网口执行惩罚动作,其中,所述第一报文为广播报文。
2.根据权利要求1所述的系统,其特征在于,所述第一网卡还包括第二网口,所述第二网口具有第二媒体访问控制地址,
所述数据处理器,还用于接收第二外部设备通过所述第二网口上传的第二报文,对源媒体访问控制地址为所述第二媒体访问控制地址的第二报文的第二速率进行统计,并在所述第二速率大于速率阈值的情况下,对所述第二网口执行惩罚动作,所述第一网口不同于所述第二网口,其中,所述第二报文为广播报文。
3.根据权利要求1或2所述的系统,其特征在于,所述网卡包括第二网卡,所述第二网卡包括第三网口,所述第三网口具有第三媒体访问控制地址,
所述数据处理器,还用于接收第三外部设备通过所述第三网口上传的第三报文,对源媒体访问控制地址为所述第三媒体访问控制地址的第三报文的第三速率进行统计,并在所述第三速率大于速率阈值的情况下,对所述第三网口执行惩罚动作,其中,所述第三报文为广播报文。
4.根据权利要求1或2所述的系统,其特征在于,
所述数据处理器用于在所述第一网口执行惩罚动作之后,重新对源媒体访问控制地址为所述第一媒体访问控制地址的第一报文的第四速率进行统计,并在所述第四速率小于速率阈值的情况下,停止对所述第一网口执行惩罚动作。
5.根据权利要求1或2所述的系统,其特征在于,
所述第一报文是从所述驱动程序通过所述第一网口下发的。
6.根据权利要求1或2所述的系统,其特征在于,数据处理器为数据处理单元、现场可编程门阵列、专用集成电路中的任意一种。
7.根据权利要求1或2所述的系统,其特征在于,所述惩罚动作包括将丢弃报文、对报文进行限速、关闭网口中的任意一种。
8.一种异常拓扑处理方法,其特征在于,包括:
通过数据处理器提供网卡以及所述网卡的拓扑关系的硬件逻辑,所述数据处理器还设置有模拟器,所述模拟器用于提供所述网卡以及所述网卡的拓扑关系的软件逻辑,并与所述硬件逻辑之间协商交互以实现对所述网卡的模拟,所述网卡包括第一网卡,所述第一网卡包括第一网口,所述第一网口具有第一媒体访问控制地址;
通过处理器提供驱动程序驱动所述网卡;
通过数据处理器接收第一外部设备通过所述第一网口上传的第一报文,对源媒体访问控制地址为所述第一媒体访问控制地址的第一报文的第一速率进行统计,并在所述第一速率大于速率阈值的情况下,对所述第一网口执行惩罚动作,其中,所述第一报文为广播报文。
9.一种计算设备,其特征在于,包括数据处理器以及处理器,
所述数据处理器,用于提供网卡以及所述网卡的拓扑关系的硬件逻辑,所述数据处理器还设置有模拟器,所述模拟器用于提供所述网卡以及所述网卡的拓扑关系的软件逻辑,并与所述硬件逻辑之间协商交互以实现对所述网卡的模拟,所述网卡包括第一网卡,所述第一网卡包括第一网口,所述第一网口具有第一媒体访问控制地址;
所述处理器,用于通过驱动程序驱动所述网卡;
所述数据处理器,还用于接收第一外部设备通过所述第一网口上传的第一报文,对源媒体访问控制地址为所述第一媒体访问控制地址的第一报文的第一速率进行统计,并在所述第一速率大于速率阈值的情况下,对所述第一网口执行惩罚动作,其中,所述第一报文为广播报文。
10.一种计算集群,其特征在于,包括多个如权利要求9所述的计算设备。
CN202410497468.XA 2024-04-24 2024-04-24 异常拓扑处理方法、系统、设备以及集群 Active CN118101515B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410497468.XA CN118101515B (zh) 2024-04-24 2024-04-24 异常拓扑处理方法、系统、设备以及集群

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410497468.XA CN118101515B (zh) 2024-04-24 2024-04-24 异常拓扑处理方法、系统、设备以及集群

Publications (2)

Publication Number Publication Date
CN118101515A true CN118101515A (zh) 2024-05-28
CN118101515B CN118101515B (zh) 2024-07-19

Family

ID=91144346

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410497468.XA Active CN118101515B (zh) 2024-04-24 2024-04-24 异常拓扑处理方法、系统、设备以及集群

Country Status (1)

Country Link
CN (1) CN118101515B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1941775A (zh) * 2006-07-19 2007-04-04 华为技术有限公司 一种防止网络消息攻击的方法及设备
CN102281171A (zh) * 2011-08-30 2011-12-14 华为数字技术有限公司 二层网络的环路检测方法及设备
WO2015154548A1 (zh) * 2014-09-11 2015-10-15 中兴通讯股份有限公司 端口处理方法及装置
CN106230632A (zh) * 2016-07-29 2016-12-14 锐捷网络股份有限公司 网络环路的处理方法及装置
CN109347810A (zh) * 2018-09-27 2019-02-15 新华三技术有限公司 一种处理报文的方法和装置
CN109714182A (zh) * 2017-10-25 2019-05-03 中兴通讯股份有限公司 一种网络控制方法、装置和计算机可读存储介质
CN115941599A (zh) * 2023-03-10 2023-04-07 珠海星云智联科技有限公司 一种用于预防pfc死锁的流量控制方法、设备及介质
CN116028292A (zh) * 2023-02-28 2023-04-28 珠海星云智联科技有限公司 用于远程直接内存访问仿真验证的仿真验证系统及方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1941775A (zh) * 2006-07-19 2007-04-04 华为技术有限公司 一种防止网络消息攻击的方法及设备
CN102281171A (zh) * 2011-08-30 2011-12-14 华为数字技术有限公司 二层网络的环路检测方法及设备
WO2015154548A1 (zh) * 2014-09-11 2015-10-15 中兴通讯股份有限公司 端口处理方法及装置
CN106230632A (zh) * 2016-07-29 2016-12-14 锐捷网络股份有限公司 网络环路的处理方法及装置
CN109714182A (zh) * 2017-10-25 2019-05-03 中兴通讯股份有限公司 一种网络控制方法、装置和计算机可读存储介质
CN109347810A (zh) * 2018-09-27 2019-02-15 新华三技术有限公司 一种处理报文的方法和装置
CN116028292A (zh) * 2023-02-28 2023-04-28 珠海星云智联科技有限公司 用于远程直接内存访问仿真验证的仿真验证系统及方法
CN115941599A (zh) * 2023-03-10 2023-04-07 珠海星云智联科技有限公司 一种用于预防pfc死锁的流量控制方法、设备及介质

Also Published As

Publication number Publication date
CN118101515B (zh) 2024-07-19

Similar Documents

Publication Publication Date Title
CN102055667B (zh) 用于实现网络规则的方法和设备
US11388081B1 (en) Methods, systems, and computer readable media for impairment testing using an impairment device
CN108696428B (zh) 基于隧道技术的路由探测方法、路由节点和中心服务器
CN113364638B (zh) 用于epa组网的方法、电子设备和存储介质
CN111865810B (zh) 一种拥塞信息采集方法、系统、相关设备及计算机存储介质
CN101442513A (zh) 实现多种业务处理功能的方法和多核处理器设备
CN113872826B (zh) 网卡端口稳定性测试方法、系统、终端及存储介质
CN118101515B (zh) 异常拓扑处理方法、系统、设备以及集群
CN117573602A (zh) 用于远程直接内存访问报文发送的方法及计算机设备
CN117749682A (zh) 报文编辑模块验证系统、平台、方法、设备、集群及介质
CN112019492B (zh) 访问控制方法、装置及存储介质
CN111082980A (zh) 一种解析拓扑结构的方法及装置
US11916768B2 (en) Information sharing method and apparatus in redundancy network, and computer storage medium
WO2022206480A1 (zh) 一种数据包发送方法及设备
CN112019459B (zh) 基于堆叠系统中设备动态上下线的报文处理方法及系统
CN114039810A (zh) 基于以太网的柔性自动化控制系统
KR20180121776A (ko) 로봇을 위한 데이터 통신 버스
CN118132449B (zh) 自动化测试系统、平台、方法、设备、集群、介质及产品
CN118282851B (zh) 用于网络控制器边带接口协议的配置方法、设备及介质
CN113132442B (zh) 一种基于虚拟网络的分布式存储网络系统及通信方法
KR102182494B1 (ko) 노이즈 판별 기능을 가진 이더캣 네트워크 시스템 및 이더캣 네트워크 시스템의 노이즈 판별 방법
CN111866089A (zh) 网络通信代理方法、装置及计算机可读存储介质
CN116781498A (zh) 一种流量分析系统、方法以及相关设备
CN118590443A (zh) 一种流量调度方法、计算机设备及介质
Janjić et al. Implementation and Optimization of Gateway for Data Routing between CAN and FlexRay protocols

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant