CN108123901B - 一种报文传输方法和装置 - Google Patents

一种报文传输方法和装置 Download PDF

Info

Publication number
CN108123901B
CN108123901B CN201611086150.4A CN201611086150A CN108123901B CN 108123901 B CN108123901 B CN 108123901B CN 201611086150 A CN201611086150 A CN 201611086150A CN 108123901 B CN108123901 B CN 108123901B
Authority
CN
China
Prior art keywords
node
numa
interface
interfaces
numa node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611086150.4A
Other languages
English (en)
Other versions
CN108123901A (zh
Inventor
辛戌冰
柳佳佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou H3C Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN201611086150.4A priority Critical patent/CN108123901B/zh
Priority to EP17875885.0A priority patent/EP3534579B1/en
Priority to JP2019528820A priority patent/JP6751819B2/ja
Priority to PCT/CN2017/113556 priority patent/WO2018099394A1/zh
Priority to US16/464,815 priority patent/US11057302B2/en
Publication of CN108123901A publication Critical patent/CN108123901A/zh
Application granted granted Critical
Publication of CN108123901B publication Critical patent/CN108123901B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/74Address processing for routing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/544Buffers; Shared memory; Pipes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/14Routing performance; Theoretical aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/30Peripheral units, e.g. input or output ports
    • H04L49/3009Header conversion, routing tables or routing tags

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供一种报文传输方法和装置,该方法包括:在接收到报文后,通过所述报文的目的IP地址查询转发表;若查询到与所述目的IP地址匹配的至少两个出接口,则从所述转发表中获取所述至少两个出接口所属的NUMA节点对应的节点信息;利用所述节点信息确定所述至少两个出接口中位于本NUMA节点上的出接口;通过所述位于本NUMA节点上的出接口发送所述报文。通过本申请的技术方案,减少了跨NUMA节点转发报文的情况,提高了报文转发效率,减少带宽开销,提升吞吐能力。

Description

一种报文传输方法和装置
技术领域
本申请涉及通信技术领域,尤其涉及一种报文传输方法和装置。
背景技术
如图1所示,为NUMA(Non-Uniform Memory Architecture,非统一内存架构)的组网示意图,网络设备A可以包括NUMA节点1和NUMA节点2,每个NUMA节点包含一组处理器资源(如图中CPU(Central Processing Unit,中央处理器)包括的多个核)、内存资源和多个接口,且NUMA节点1和NUMA节点2之间通过CSI(Common System Interface,公共系统接口)总线连接。
针对网络设备B发送给网络设备A、再由网络设备A发送给网络设备C的报文,当NUMA节点1通过接口1接收到该报文后,为了实现负载分担,NUMA节点1可以从接口2、接口3、接口4、接口5中随机选择一个接口,假设选择接口4,则NUMA节点1将报文发送给NUMA节点2,由NUMA节点2通过接口4转发报文给网络设备C。
显然,在上述方式下,NUMA节点1需要跨CSI总线转发报文给NUMA节点2,从而降低了报文转发效率,而且会浪费CSI总线的带宽开销。
发明内容
本申请提供一种报文传输方法,应用于网络设备包括的非统一内存架构NUMA节点,且所述网络设备包括至少两个NUMA节点,所述方法包括:
在接收到报文后,通过所述报文的目的IP地址查询转发表;
若查询到与所述目的IP地址匹配的至少两个出接口,则从所述转发表中获取所述至少两个出接口所属的NUMA节点对应的节点信息;
利用所述节点信息确定所述至少两个出接口中位于本NUMA节点上的出接口;
通过所述位于本NUMA节点上的出接口发送所述报文。
本申请提供一种报文传输装置,应用于网络设备包括的非统一内存架构NUMA节点,且所述网络设备包括至少两个NUMA节点,所述装置包括:
查询模块,用于在接收到报文后,通过所述报文的目的IP地址查询转发表;
获取模块,用于当查询到与所述目的IP地址匹配的至少两个出接口时,则从所述转发表中获取所述至少两个出接口所属的NUMA节点对应的节点信息;
确定模块,用于利用所述节点信息确定所述至少两个出接口中位于本NUMA节点上的出接口;
发送模块,用于通过所述位于本NUMA节点上的出接口发送所述报文。
基于上述技术方案,本申请实施例中,本NUMA节点在收到报文后,当目的IP地址对应至少两个出接口时,则本NUMA节点可以基于每个出接口所属的NUMA节点对应的节点信息,确定位于本NUMA节点上的出接口,并通过位于本NUMA节点上的出接口发送报文。这样,可以通过位于本NUMA节点上的出接口发送报文,而不是通过位于另一个NUMA节点上的出接口发送报文,从而减少了跨NUMA节点转发报文的情况,提高了报文转发效率,并减少NUMA节点之间的CSI总线的带宽开销,并提升网络设备整体的吞吐能力(即报文转发的能力)。
附图说明
为了更加清楚地说明本申请实施例或者现有技术中的技术方案,下面将对本申请实施例或者现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是NUMA的组网示意图;
图2是本申请一种实施方式中的报文传输方法的流程图;
图3是本申请一种实施方式中的NUMA节点的硬件结构图;
图4是本申请一种实施方式中的报文传输装置的结构图。
具体实施方式
在本申请使用的术语仅仅是出于描述特定实施例的目的,而非限制本申请。本申请和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其它含义。还应当理解,本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,此外,所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
本申请实施例中提出一种报文传输方法,该方法可以应用于网络设备(如路由器、交换机等)包括的NUMA节点,且该网络设备可以包括至少两个NUMA节点,每个NUMA节点包含一组处理器资源、内存资源和多个接口,且NUMA节点之间通过CSI总线连接。参见图2所示,为该报文传输方法的流程图。
步骤201,在接收到报文后,通过该报文的目的IP地址查询转发表。
在一个例子中,在通过该报文的目的IP地址查询转发表之前,可以先维护转发表,该转发表用于记录IP地址与出接口的对应关系。针对转发表的维护过程,NUMA节点在生成该目的IP地址对应的转发表时,若获知该目的IP地址对应至少两个出接口,则在转发表中记录该目的IP地址、该目的IP地址对应的至少两个出接口、以及该至少两个出接口所属的NUMA节点对应的节点信息的对应关系。
步骤202,若查询到与该目的IP地址匹配的至少两个出接口,则从该转发表中获取该至少两个出接口所属的NUMA节点对应的节点信息。
在一个例子中,由于转发表中记录了该目的IP地址、该目的IP地址对应的至少两个出接口、以及该至少两个出接口所属的NUMA节点对应的节点信息的对应关系,因此,NUMA节点可以从该转发表中获取到该至少两个出接口所属的NUMA节点对应的节点信息。
步骤203,利用该节点信息确定所述至少两个出接口(即与该目的IP地址匹配的至少两个出接口)中位于本NUMA节点上的出接口。
在一个例子中,针对“利用该节点信息确定所述至少两个出接口中位于本NUMA节点上的出接口”的过程,可以包括但不限于如下方式:方式一、确定该报文的入接口所属的NUMA节点的节点信息,若出接口所属的NUMA节点的节点信息与该入接口所属的NUMA节点的节点信息相同,则可以确定该出接口是位于本NUMA节点上的出接口。或者,方式二、确定本NUMA节点的节点信息,若出接口所属的NUMA节点的节点信息与本NUMA节点的节点信息相同,则可以确定该出接口是位于本NUMA节点上的出接口。
步骤204,通过位于本NUMA节点上的出接口发送报文。
在一个例子中,针对“通过位于本NUMA节点上的出接口发送报文”的过程,可以包括:若位于本NUMA节点上的出接口为一个出接口,则可以通过位于本NUMA节点上的一个出接口发送该报文;或者,若位于本NUMA节点上的出接口为至少两个出接口,则基于预设负载分担策略,从位于本NUMA节点上的至少两个出接口中选择一个出接口,并通过选择的出接口发送该报文。
在一个例子中,在从转发表中获取至少两个出接口所属的NUMA节点对应的节点信息(即步骤202)之后,若利用该节点信息确定这至少两个出接口均不是位于本NUMA节点上的出接口,则本NUMA节点可以基于预设负载分担策略,从这至少两个出接口中选择一个出接口,并通过选择的出接口发送该报文。
基于上述技术方案,本申请实施例中,本NUMA节点在收到报文后,当目的IP地址对应至少两个出接口时,则本NUMA节点可以基于每个出接口所属的NUMA节点对应的节点信息,确定位于本NUMA节点上的出接口,并通过位于本NUMA节点上的出接口发送报文。这样,可以通过位于本NUMA节点上的出接口发送报文,而不是通过位于另一个NUMA节点上的出接口发送报文,从而减少了跨NUMA节点转发报文的情况,提高了报文转发效率,并减少NUMA节点之间的CSI总线的带宽开销,并提升网络设备整体的吞吐能力。
以下结合图1所示的应用场景,对本申请实施例的技术方案进行详细说明。本应用场景下,在网络设备A与网络设备C之间部署四条链路,这四条链路就形成ECMP(Equal-CostMultiPath,等价多路径)。当所有链路均正常时,则可以在所有链路之间进行报文的负载分担,从而提高传输性能。当有链路发生故障时,则可以通过未发生故障的链路发送报文,从而提高稳定性和可靠性。
在传统方式中,当ECMP的出接口位于多个NUMA节点时,若接收报文的入接口与发送报文的出接口位于不同NUMA节点,则报文需要跨NUMA节点转发,从而影响网络设备的转发性能,降低报文转发效率。而本申请实施例中,当ECMP的出接口位于多个NUMA节点时,根据出接口与NUMA节点的对应关系,NUMA节点可以尽量使发送报文的出接口位于本NUMA节点上,避免报文跨NUMA节点转发,提高网络设备的转发性能,提高报文转发效率。
在一个例子中,以网络设备B下的主机1(图1中未示出)通过网络设备A向网络设备C下的主机2(图1中未示出)发送报文为例,假设主机2的IP地址为100.100.100.100,则网络设备C可以通过四条链路发布携带IP地址100.100.100.100的路由,且网络设备A会从接口2、接口3、接口4和接口5上接收到这个路由,并在转发表(即路由表)中记录IP地址100.100.100.100与接口的对应关系,如表1所示,为转发表的一个示例。
表1
Figure BDA0001167028350000051
与表1不同的是,本申请实施例中,网络设备A生成IP地址100.100.100.100对应的转发表时,由于IP地址100.100.100.100对应有4个出接口,因此,网络设备A会在转发表中记录IP地址100.100.100.100、这4个出接口、以及这4个出接口所属的NUMA节点对应的节点信息的对应关系,如表2所示的一个示例。
表2
Figure BDA0001167028350000061
在一个例子中,可以从网络设备A的所有核中确定出控制核,如确定NUMA节点1的核0为控制核。上述从接口2、接口3、接口4和接口5接收到的路由,均会发送给控制核。控制核在接收到这些路由后,可以生成表2所示的转发表,并将该转发表存储到内存1中。在后续过程中,所有NUMA节点内的核均可以访问到内存1中的转发表。
在一个例子中,为了生成表2所示的转发表,可以在网络设备A上预先配置每个接口与该接口所属的NUMA节点对应的节点信息的对应关系,如接口1与NUMA节点1的对应关系、接口2与NUMA节点1的对应关系、接口3与NUMA节点1的对应关系、接口4与NUMA节点2的对应关系、接口5与NUMA节点2的对应关系、接口6与NUMA节点2的对应关系。基于此,控制核在生成转发表时,通过查询该对应关系,就可以得到接口2所属的NUMA节点对应的节点信息是NUMA节点1,接口3所属的NUMA节点对应的节点信息是NUMA节点1,接口4所属的NUMA节点对应的节点信息是NUMA节点2,接口5所属的NUMA节点对应的节点信息是NUMA节点2,从而生成表2。
在上述应用场景下,本申请实施例中提出的报文传输方法,包括以下步骤:
步骤1,NUMA节点1(如NUMA节点1内的某个核,后续以NUMA节点1的处理为例)接收到报文,该报文的目的IP地址为100.100.100.100。
步骤2,NUMA节点1通过该目的IP地址100.100.100.100查询表2所示的转发表,得到与该目的IP地址匹配的出接口为接口2、接口3、接口4和接口5。
步骤3,NUMA节点1从表2所示的转发表中,获取到各个出接口所属的NUMA节点所对应的节点信息。例如,NUMA节点1获取到接口2所属的NUMA节点对应的节点信息为NUMA节点1,接口3所属的NUMA节点对应的节点信息是NUMA节点1,接口4所属的NUMA节点对应的节点信息是NUMA节点2,接口5所属的NUMA节点对应的节点信息是NUMA节点2。
步骤4,NUMA节点1根据各个出接口所属的NUMA节点所对应的节点信息,确定接口2、接口3、接口4和接口5中,位于本NUMA节点上的出接口,如位于本NUMA节点上的出接口可以为接口2和接口3。
方式一、NUMA节点1确定接收到报文的入接口为接口1,基于在网络设备A上预先配置的每个接口与该接口所属的NUMA节点对应的节点信息的对应关系,NUMA节点1可以确定接口1所属的NUMA节点的节点信息为NUMA节点1。基于此,由于接口2、接口3所属的NUMA节点的节点信息与接口1所属的NUMA节点的节点信息相同,因此,NUMA节点1可以确定接口2、接口3是位于本NUMA节点上的出接口。由于接口4、接口5所属的NUMA节点的节点信息与接口1所属的NUMA节点的节点信息不同,因此,NUMA节点1可以确定接口4、接口5不是位于本NUMA节点上的出接口。
方式二、NUMA节点1确定本NUMA节点的节点信息,即NUMA节点1。由于接口2、接口3所属的NUMA节点的节点信息与本NUMA节点的节点信息相同,则NUMA节点1确定接口2、接口3是位于本NUMA节点上的出接口。由于接口4、接口5所属的NUMA节点的节点信息与本NUMA节点的节点信息不同,则NUMA节点1确定接口4、接口5不是位于本NUMA节点上的出接口。
在实际应用中,可能会存在如下两种情况:情况一、在每个NUMA节点内,均包含接收核(用于接收其它网络设备发送的报文)和转发核(用于向其它网络设备发送报文),如图1所示,CPU1内的核0为控制核,核1为接收核,核2-核n为转发核,CPU2内的核0为接收核,核1-核n为转发核。情况二、NUMA节点内可能没有接收核或者转发核,如图1所示,CPU1内的核0为控制核,核1-核n为转发核,CPU2内的核0、核1为接收核,核2-核n为转发核。
针对情况一,CPU1/CPU2内的接收核在接收到报文后,只会将报文交给同一NUMA节点内的转发核,该转发核在接收到报文后,针对确定位于本NUMA节点上的出接口的过程,可以采用上述方式一或者方式二处理。
针对情况二,CPU2内的接收核在接收到报文后,将报文交给同一NUMA节点内的转发核或者另一个NUMA节点内的转发核,该转发核在接收到报文后,针对确定位于本NUMA节点上的出接口的过程,可以采用上述方式二处理。
步骤5,NUMA节点1通过位于本NUMA节点上的出接口发送报文。
在一个例子中,针对“NUMA节点1通过位于本NUMA节点上的出接口发送报文”的过程,可以包括:若位于本NUMA节点上的出接口为一个出接口,则NUMA节点1可以通过位于本NUMA节点上的一个出接口发送该报文。若位于本NUMA节点上的出接口为至少两个出接口,则NUMA节点1可以基于预设负载分担策略(如轮询策略或者hash策略等),从位于本NUMA节点上的这至少两个出接口中选择一个出接口,并通过选择的出接口发送该报文。
例如,由于接口2、接口3是位于本NUMA节点上的出接口,因此,NUMA节点1可以基于预设负载分担策略(如轮询策略或者hash策略等),从接口2和接口3中选择一个出接口,并通过选择的出接口发送该报文。
在一个例子中,当预设负载分担策略为轮询策略时,则相应的转发流程可以为:针对主机1发送给主机2的第一个报文,NUMA节点1先轮询到接口2,由于接口2是位于本NUMA节点上的出接口,因此,NUMA节点1通过接口2发送第一个报文。针对主机1发送给主机2的第二个报文,NUMA节点1轮询到接口3,由于接口3是位于本NUMA节点上的出接口,因此,NUMA节点1通过接口3发送第二个报文。针对主机1发送给主机2的第三个报文,NUMA节点1轮询到接口4,由于接口4不是位于本NUMA节点上的出接口,因此,NUMA节点1轮询到下一个接口5,由于接口5不是位于本NUMA节点上的出接口,因此,NUMA节点1轮询到下一个接口2,由于接口2是位于本NUMA节点上的出接口,因此,NUMA节点1通过接口2发送第三个报文。以此类推。
在一个例子中,当预设负载分担策略为hash策略时,则相应的转发流程可以为:针对主机1发送给主机2的第一个报文,根据报文的源IP地址和目的IP地址随机生成一个散列值,具体生成方式不再赘述,然后将散列值对数量2(即位于本NUMA节点上的出接口数量)取余。若余数为0,则NUMA节点1通过接口2发送第一个报文,若余数为1,则NUMA节点1通过接口3发送第一个报文。以此类推,针对主机1发送给主机2的每个报文,均采用上述方式处理。
上述过程是以有位于本NUMA节点上的出接口为例进行说明的,在另一个例子中,若目的IP地址对应的所有出接口均不是位于本NUMA节点上的出接口,则NUMA节点1还可以基于预设负载分担策略(如轮询策略或者hash策略等),从目的IP地址对应的所有出接口(即位于其它NUMA节点上的出接口)中选择一个出接口,并通过选择的出接口发送该报文,具体选择过程不再赘述。
基于上述技术方案,本申请实施例中,本NUMA节点在收到报文后,当目的IP地址对应至少两个出接口时,则本NUMA节点可以基于每个出接口所属的NUMA节点对应的节点信息,确定位于本NUMA节点上的出接口,并通过位于本NUMA节点上的出接口发送报文。这样,可以通过位于本NUMA节点上的出接口发送报文,而不是通过位于另一个NUMA节点上的出接口发送报文,从而减少了跨NUMA节点转发报文的情况,提高了报文转发效率,并减少NUMA节点之间的CSI总线的带宽开销,并提升网络设备整体的吞吐能力。
基于与上述方法同样的申请构思,本申请实施例中还提供了一种报文传输装置,该报文传输装置可以应用在网络设备包括的NUMA节点上,且该网络设备可以包括至少两个NUMA节点。其中,该报文传输装置可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在的NUMA节点的处理器,读取非易失性存储器中对应的计算机程序指令形成的。从硬件层面而言,如图3所示,为本申请提出的报文传输装置所在的NUMA节点的一种硬件结构图,除了图3所示的处理器、非易失性存储器外,NUMA节点还可以包括其他硬件,如负责处理报文的转发芯片、网络接口、内存等;从硬件结构上来讲,该NUMA节点还可能是分布式设备,可能包括多个接口卡,以便在硬件层面进行报文处理的扩展。
如图4所示,为本申请提出的报文传输装置的结构图,所述装置包括:
查询模块11,用于在接收到报文后,通过报文的目的IP地址查询转发表;
获取模块12,用于当查询到与所述目的IP地址匹配的至少两个出接口时,从所述转发表中获取所述至少两个出接口所属的NUMA节点对应的节点信息;
确定模块13,用于利用所述节点信息确定所述至少两个出接口中位于本NUMA节点上的出接口;
发送模块14,用于通过所述位于本NUMA节点上的出接口发送所述报文。
在一个例子中,所述装置还包括(在图中未体现):记录模块,用于在所述查询模块11通过所述报文的目的IP地址查询转发表之前,在生成所述目的IP地址对应的转发表时,若获知所述目的IP地址对应至少两个出接口,则在所述转发表中记录所述目的IP地址、所述目的IP地址对应的至少两个出接口、以及该至少两个出接口所属的NUMA节点对应的节点信息的对应关系。
在一个例子中,所述确定模块13,具体用于在利用所述节点信息确定所述至少两个出接口中位于本NUMA节点上的出接口的过程中,确定所述报文的入接口所属的NUMA节点的节点信息,若出接口所属的NUMA节点的节点信息与所述入接口所属的NUMA节点的节点信息相同,则确定该出接口是位于本NUMA节点上的出接口;或者,确定本NUMA节点的节点信息,若出接口所属的NUMA节点的节点信息与本NUMA节点的节点信息相同,则确定该出接口是位于本NUMA节点上的出接口。
在一个例子中,所述发送模块14,具体用于在通过所述位于本NUMA节点上的出接口发送所述报文的过程中,若位于本NUMA节点上的出接口为一个出接口,则通过位于本NUMA节点上的所述一个出接口发送所述报文;或者,若位于本NUMA节点上的出接口为至少两个出接口,则基于预设负载分担策略,从位于本NUMA节点上的所述至少两个出接口中选择一个出接口,并通过选择的出接口发送所述报文。
在一个例子中,所述发送模块14,还用于在所述获取模块12从所述转发表中获取所述至少两个出接口所属的NUMA节点对应的节点信息之后,若利用所述节点信息确定所述至少两个出接口均不是位于本NUMA节点上的出接口,则基于预设负载分担策略,从所述至少两个出接口中选择一个出接口,并通过选择的出接口发送所述报文。
本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可进一步拆分成多个子模块。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
以上公开的仅为本申请的几个具体实施例,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (10)

1.一种报文传输方法,应用于网络设备包括的非统一内存架构NUMA节点,且所述网络设备包括至少两个NUMA节点,其特征在于,所述方法包括:
在接收到报文后,通过所述报文的目的IP地址查询转发表;
若查询到与所述目的IP地址匹配的至少两个出接口,则从所述转发表中获取所述至少两个出接口所属的NUMA节点对应的节点信息;其中,所述转发表中记录了目的IP地址、该目的IP地址对应的至少两个出接口、以及该至少两个出接口所属的NUMA节点对应的节点信息的对应关系;
利用所述节点信息确定所述至少两个出接口中位于本NUMA节点上的出接口;
通过所述位于本NUMA节点上的出接口发送所述报文。
2.根据权利要求1所述的方法,其特征在于,
所述通过所述报文的目的IP地址查询转发表之前,所述方法还包括:
在生成所述目的IP地址对应的转发表时,若获知所述目的IP地址对应至少两个出接口,则在所述转发表中记录所述目的IP地址、所述目的IP地址对应的至少两个出接口、以及该至少两个出接口所属的NUMA节点对应的节点信息的对应关系。
3.根据权利要求1所述的方法,其特征在于,所述利用所述节点信息确定所述至少两个出接口中位于本NUMA节点上的出接口的过程,具体包括:
确定所述报文的入接口所属的NUMA节点的节点信息,若出接口所属的NUMA节点的节点信息与所述入接口所属的NUMA节点的节点信息相同,则确定该出接口是位于本NUMA节点上的出接口;或者,
确定本NUMA节点的节点信息,若出接口所属的NUMA节点的节点信息与本NUMA节点的节点信息相同,则确定该出接口是位于本NUMA节点上的出接口。
4.根据权利要求1所述的方法,其特征在于,所述通过所述位于本NUMA节点上的出接口发送所述报文的过程,具体包括:
若位于本NUMA节点上的出接口为一个出接口,则通过位于本NUMA节点上的所述一个出接口发送所述报文;或者,若位于本NUMA节点上的出接口为至少两个出接口,则基于预设负载分担策略,从位于本NUMA节点上的所述至少两个出接口中选择一个出接口,并通过选择的出接口发送所述报文。
5.根据权利要求1所述的方法,其特征在于,所述从所述转发表中获取所述至少两个出接口所属的NUMA节点对应的节点信息之后,所述方法还包括:
若利用所述节点信息确定所述至少两个出接口均不是位于本NUMA节点上的出接口,则基于预设负载分担策略,从所述至少两个出接口中选择一个出接口,并通过选择的出接口发送所述报文。
6.一种报文传输装置,应用于网络设备包括的非统一内存架构NUMA节点,且所述网络设备包括至少两个NUMA节点,其特征在于,所述装置包括:
查询模块,用于在接收到报文后,通过所述报文的目的IP地址查询转发表;
获取模块,用于当查询到与所述目的IP地址匹配的至少两个出接口时,则从所述转发表中获取所述至少两个出接口所属的NUMA节点对应的节点信息;其中,所述转发表中记录了目的IP地址、该目的IP地址对应的至少两个出接口、以及该至少两个出接口所属的NUMA节点对应的节点信息的对应关系;
确定模块,用于利用所述节点信息确定所述至少两个出接口中位于本NUMA节点上的出接口;
发送模块,用于通过所述位于本NUMA节点上的出接口发送所述报文。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:记录模块,用于在所述查询模块通过所述报文的目的IP地址查询转发表之前,在生成所述目的IP地址对应的转发表时,若获知所述目的IP地址对应至少两个出接口,则在所述转发表中记录所述目的IP地址、所述目的IP地址对应的至少两个出接口、以及该至少两个出接口所属的NUMA节点对应的节点信息的对应关系。
8.根据权利要求6所述的装置,其特征在于,所述确定模块,具体用于在利用所述节点信息确定所述至少两个出接口中位于本NUMA节点上的出接口的过程中,确定所述报文的入接口所属的NUMA节点的节点信息,若出接口所属的NUMA节点的节点信息与所述入接口所属的NUMA节点的节点信息相同,则确定该出接口是位于本NUMA节点上的出接口;或者,确定本NUMA节点的节点信息,若出接口所属的NUMA节点的节点信息与本NUMA节点的节点信息相同,则确定该出接口是位于本NUMA节点上的出接口。
9.根据权利要求6所述的装置,其特征在于,所述发送模块,具体用于在通过所述位于本NUMA节点上的出接口发送所述报文的过程中,若位于本NUMA节点上的出接口为一个出接口,则通过位于本NUMA节点上的所述一个出接口发送所述报文;或者,若位于本NUMA节点上的出接口为至少两个出接口,则基于预设负载分担策略,从位于本NUMA节点上的所述至少两个出接口中选择一个出接口,并通过选择的出接口发送所述报文。
10.根据权利要求6所述的装置,其特征在于,所述发送模块,还用于在所述获取模块从所述转发表中获取所述至少两个出接口所属的NUMA节点对应的节点信息之后,若利用所述节点信息确定所述至少两个出接口均不是位于本NUMA节点上的出接口,则基于预设负载分担策略,从所述至少两个出接口中选择一个出接口,并通过选择的出接口发送所述报文。
CN201611086150.4A 2016-11-30 2016-11-30 一种报文传输方法和装置 Active CN108123901B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201611086150.4A CN108123901B (zh) 2016-11-30 2016-11-30 一种报文传输方法和装置
EP17875885.0A EP3534579B1 (en) 2016-11-30 2017-11-29 Packet transmission method, device and computer-readable medium
JP2019528820A JP6751819B2 (ja) 2016-11-30 2017-11-29 パケット伝送
PCT/CN2017/113556 WO2018099394A1 (zh) 2016-11-30 2017-11-29 报文传输
US16/464,815 US11057302B2 (en) 2016-11-30 2017-11-29 Sending packet

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611086150.4A CN108123901B (zh) 2016-11-30 2016-11-30 一种报文传输方法和装置

Publications (2)

Publication Number Publication Date
CN108123901A CN108123901A (zh) 2018-06-05
CN108123901B true CN108123901B (zh) 2020-12-29

Family

ID=62226309

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611086150.4A Active CN108123901B (zh) 2016-11-30 2016-11-30 一种报文传输方法和装置

Country Status (5)

Country Link
US (1) US11057302B2 (zh)
EP (1) EP3534579B1 (zh)
JP (1) JP6751819B2 (zh)
CN (1) CN108123901B (zh)
WO (1) WO2018099394A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106936739B (zh) * 2015-12-30 2020-02-11 新华三技术有限公司 一种报文转发方法及装置
US11301278B2 (en) * 2018-04-25 2022-04-12 Vmware, Inc. Packet handling based on multiprocessor architecture configuration
US11805010B2 (en) * 2019-06-21 2023-10-31 Juniper Networks, Inc. Signaling IP path tunnels for traffic engineering
CN111614794B (zh) * 2020-04-24 2022-09-23 南京南瑞继保工程技术有限公司 报文传输方法、装置、电子设备及存储介质
US11296958B2 (en) 2020-04-24 2022-04-05 Toyo Corporation Packet capture device and packet capture method
EP4075757A1 (en) * 2021-04-14 2022-10-19 Juniper Networks, Inc. A plurality of smart network interface cards on a single compute node
CN115996203B (zh) * 2023-03-22 2023-06-06 北京华耀科技有限公司 网络流量分域方法、装置、设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3470951B2 (ja) * 1998-06-30 2003-11-25 インターナショナル・ビジネス・マシーンズ・コーポレーション 非一様メモリ・アクセス・コンピュータ・システム及びその操作方法
CN101291290A (zh) * 2008-05-29 2008-10-22 华为技术有限公司 一种进行业务转发的方法及装置
CN102318275A (zh) * 2011-08-02 2012-01-11 华为技术有限公司 基于cc-numa的报文处理方法、装置和系统
CN102364900A (zh) * 2011-09-13 2012-02-29 杭州华三通信技术有限公司 一种irf系统中基于frr的数据传输方法和设备
CN104901898A (zh) * 2015-06-08 2015-09-09 东软集团股份有限公司 一种负载均衡方法及装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005020492A (ja) 2003-06-27 2005-01-20 Hitachi Ltd ネットワーク中継装置
US8446824B2 (en) * 2009-12-17 2013-05-21 Intel Corporation NUMA-aware scaling for network devices
US8495604B2 (en) 2009-12-30 2013-07-23 International Business Machines Corporation Dynamically distribute a multi-dimensional work set across a multi-core system
US10019167B2 (en) * 2013-02-20 2018-07-10 Red Hat, Inc. Non-Uniform Memory Access (NUMA) resource assignment and re-evaluation
US9178815B2 (en) * 2013-03-05 2015-11-03 Intel Corporation NIC flow switching
US9537718B2 (en) * 2013-03-15 2017-01-03 Cisco Technology, Inc. Segment routing over label distribution protocol
US10684973B2 (en) * 2013-08-30 2020-06-16 Intel Corporation NUMA node peripheral switch
CN103957155B (zh) * 2014-05-06 2018-01-23 华为技术有限公司 报文传输方法、装置及互联接口
US9807001B2 (en) * 2014-07-17 2017-10-31 Cisco Technology, Inc. Segment routing using a remote forwarding adjacency identifier
US9495192B2 (en) * 2014-09-30 2016-11-15 Vmware, Inc. NUMA I/O aware network queue assignments
US10721302B2 (en) * 2014-12-05 2020-07-21 Foundation for Research and Technology—Hellas (FORTH) Network storage protocol and adaptive batching apparatuses, methods, and systems
US10218647B2 (en) * 2015-12-07 2019-02-26 Intel Corporation Mechanism to support multiple-writer/multiple-reader concurrency for software flow/packet classification on general purpose multi-core systems
US10069688B2 (en) * 2016-03-07 2018-09-04 International Business Machines Corporation Dynamically assigning, by functional domain, separate pairs of servers to primary and backup service processor modes within a grouping of servers
US10142231B2 (en) * 2016-03-31 2018-11-27 Intel Corporation Technologies for network I/O access
JP6855906B2 (ja) * 2017-04-25 2021-04-07 富士通株式会社 スイッチプログラム、スイッチング方法及び情報処理装置
US10742690B2 (en) * 2017-11-21 2020-08-11 Juniper Networks, Inc. Scalable policy management for virtual networks

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3470951B2 (ja) * 1998-06-30 2003-11-25 インターナショナル・ビジネス・マシーンズ・コーポレーション 非一様メモリ・アクセス・コンピュータ・システム及びその操作方法
CN101291290A (zh) * 2008-05-29 2008-10-22 华为技术有限公司 一种进行业务转发的方法及装置
CN102318275A (zh) * 2011-08-02 2012-01-11 华为技术有限公司 基于cc-numa的报文处理方法、装置和系统
CN102364900A (zh) * 2011-09-13 2012-02-29 杭州华三通信技术有限公司 一种irf系统中基于frr的数据传输方法和设备
CN104901898A (zh) * 2015-06-08 2015-09-09 东软集团股份有限公司 一种负载均衡方法及装置

Also Published As

Publication number Publication date
US20190297013A1 (en) 2019-09-26
JP6751819B2 (ja) 2020-09-09
US11057302B2 (en) 2021-07-06
EP3534579A1 (en) 2019-09-04
EP3534579A4 (en) 2019-09-04
JP2019536383A (ja) 2019-12-12
WO2018099394A1 (zh) 2018-06-07
EP3534579B1 (en) 2022-04-13
CN108123901A (zh) 2018-06-05

Similar Documents

Publication Publication Date Title
CN108123901B (zh) 一种报文传输方法和装置
US10623311B2 (en) Technologies for distributed routing table lookup
EP3605972B1 (en) Packet transmission method, edge device, and machine readable storage medium
US9502111B2 (en) Weighted equal cost multipath routing
CN108768866B (zh) 组播报文跨卡转发方法、装置、网络设备及可读存储介质
US9215171B2 (en) Hashing-based routing table management
CN107547391B (zh) 一种报文传输方法和装置
CN108718278B (zh) 一种报文传输方法和装置
CN107317752B (zh) 一种转发数据报文的方法及装置
JP6618610B2 (ja) ルーティング管理
Cheng et al. Application-aware SDN routing for big data networking
CN112311674B (zh) 报文发送方法、装置及存储介质
CN101599910B (zh) 报文发送的方法及设备
US10476774B2 (en) Selective transmission of bidirectional forwarding detection (BFD) messages for verifying multicast connectivity
US10205661B1 (en) Control messages for scalable satellite device clustering control in a campus network
WO2023093513A1 (zh) 路径感知方法、装置及系统
KR101952187B1 (ko) 서비스 노드 능력 처리 방법, 장치, 서비스 분류기 및 서비스 제어기
CN110995609A (zh) 报文发送方法、装置、电子设备及存储介质
CN107566302B (zh) 报文转发方法和装置
KR20130066401A (ko) 칩 멀티 프로세서, 및 칩 멀티 프로세서를 위한 라우터
CN113259248B (zh) 用于确定转发业务流的链路的方法及装置
US20230171180A1 (en) Data processing method, packet sending method, and apparatus
CN117692532A (zh) 报文分流方法和分布式路由设备
CN112910783A (zh) 一种报文转发方法、装置及分布式设备
CN115277878A (zh) 一种发送报文的方法、处理报文的方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant