CN108984327A - 报文转发方法、多核cpu及网络设备 - Google Patents

报文转发方法、多核cpu及网络设备 Download PDF

Info

Publication number
CN108984327A
CN108984327A CN201810843695.8A CN201810843695A CN108984327A CN 108984327 A CN108984327 A CN 108984327A CN 201810843695 A CN201810843695 A CN 201810843695A CN 108984327 A CN108984327 A CN 108984327A
Authority
CN
China
Prior art keywords
core
message
interface
cpu
buffer area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810843695.8A
Other languages
English (en)
Other versions
CN108984327B (zh
Inventor
黄敦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Technologies Co Ltd
Original Assignee
New H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Technologies Co Ltd filed Critical New H3C Technologies Co Ltd
Priority to CN201810843695.8A priority Critical patent/CN108984327B/zh
Publication of CN108984327A publication Critical patent/CN108984327A/zh
Application granted granted Critical
Publication of CN108984327B publication Critical patent/CN108984327B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/542Event management; Broadcasting; Multicasting; Notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45579I/O management, e.g. providing access to device drivers or storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances

Abstract

本公开涉及一种报文转发方法、多核CPU及网络设备。该报文转发方法应用于应用于多核CPU,多核CPU包括处于单核运行模式的核,该方法包括:处于单核运行模式的核轮询各个接口对应的缓冲区,各个接口用于接收报文;如果确定第一接口接收到报文,则对第一接口对应的缓冲区中存储的报文进行抢占获取;如果抢占获取到第一报文,则处于单核运行模式的核停止轮询各个接口对应的缓冲区,对第一报文进行转发处理和发送。本公开的报文转发方法、多核CPU及网络设备,能够充分利用多核CPU中的核,降低多核CPU中的核浪费,从而提升CPU整体转发性能。

Description

报文转发方法、多核CPU及网络设备
技术领域
本公开涉及通信技术领域,尤其涉及一种报文转发方法、多核CPU及网络设备。
背景技术
在NFV(Network Function Virtualization,网络功能虚拟化)的应用场景中,VNF(Virtualized Network Function,虚拟网络层)一般运行在数据中心的服务器上。服务器的CPU(Central Processing Unit,中央处理器)一般为多路CPU设计,每路CPU都是一个多核CPU。例如,某款两路CPU(即两颗CPU)的服务器每路CPU具有10个核,则服务器整体具有20个核。
相关技术中,通过软件层面的仔细设计能够实现最大限度利用服务器中多核CPU中的核,避免服务器中多核CPU中的核浪费。例如,针对多核CPU,可以依靠启动多个VM(Virtual Machine,虚拟机)充分利用多核CPU中的核,不同的VM利用不同的核。但是,如果VM过多,将会存在不同VM之间如何通信以及通信开销的问题。目前,对于多核CPU中的核,需要考虑如何在单个VM里面能够利用CPU的全部核,以便于发挥出CPU整体的最大性能。
发明内容
有鉴于此,本公开提出了一种报文转发方法、多核CPU及网络设备,以解决相关技术中多核CPU中的核利用效率较低导致多核CPU整体转发性能较差的问题。
根据本公开的一方面,提供了一种报文转发方法,应用于多核CPU,所述多核CPU包括处于单核运行模式的核,所述方法包括:
所述处于单核运行模式的核轮询各个接口对应的缓冲区,所述各个接口用于接收报文;
如果确定第一接口接收到报文,则对所述第一接口对应的缓冲区中存储的报文进行抢占获取;
如果抢占获取到第一报文,则所述处于单核运行模式的核停止轮询所述各个接口对应的缓冲区,对所述第一报文进行转发处理和发送。
根据本公开的另一方面,提供了一种多核CPU,所述多核CPU包括处于单核运行模式的核:
所述处于单核运行模式的核轮询各个接口对应的缓冲区,所述各个接口用于接收报文;如果确定第一接口接收到报文,则对所述第一接口对应的缓冲区中存储的报文进行抢占获取;如果抢占获取到第一报文,则所述处于单核运行模式的核停止轮询所述各个接口对应的缓冲区,对所述第一报文进行转发处理和发送。
根据本公开的另一方面,提供了一种网络设备,所述网络设备包括上述的多核CPU。
本公开的报文转发方法、多核CPU及网络设备,将多核CPU中的核按照预设配置比例配置为控制核、接收核、转发核和发送核,将多核CPU中除了满足预设配置比例之外的核配置为处于单核运行模式,由此能够充分利用多核CPU中的核,降低多核CPU中的核浪费,从而提升CPU整体转发性能。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。
图1示出相关技术中采用Pipeline模式的核分配方法的CPU示意图。
图2示出相关技术中采用RTC模式的核分配方法的CPU示意图。
图3示出相关技术中采用RSS模式的核分配方法的CPU示意图。
图4示出根据本公开一实施例的报文转发方法的流程图。
图5示出根据本公开一实施例的核分配方法的CPU示意图。
图6示出根据本公开一实施例的报文转发方法的流程图。
图7示出根据本公开一实施例的报文转发方法的流程图。
图8示出根据本公开一实施例的多核CPU的框图。
图9示出根据本公开一实施例的多核CPU的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
为了使本技术领域的人员更好地理解本公开实施例中的技术方案,下面先对本公开实施例中涉及的部分技术术语进行简单说明。
CPU:是超大规模的集成电路,是一台计算机的运算核心和控制核心,主要用于解释计算机指令以及处理计算机软件中的数据。CPU主要包括算术逻辑运算单元(ArithmeticLogic Unit,ALU)和高速缓冲存储器(Cache)以及实现它们之间联系的数据(Data)、控制和状态的总线(Bus)。
CPU核(Core,简称核):是CPU中的核心芯片,用于完成CPU所有的计算、接受或存储命令、处理数据等,是数字处理核心。各种类型的核都具有固定的逻辑结构。换言之,在各种类型的核中,一级缓存、二级缓存、执行单元、指令级单元和总线接口等逻辑单元都具有科学的布局。
多核CPU:是指集成多个完整核的CPU。一个CPU可以具有多个核,而一个核只能属于一个CPU。
相关技术中,对于多核CPU的利用,存在以下核的分配方法:
图1示出相关技术中采用Pipeline模式的核分配方法的CPU示意图。如图1所示,在Pipeline(流水线)模式下,核根据功能可以分为接收核、控制核、转发核和发送核。
接收核:是指轮询各个接口对应的缓冲区,以对各个接口对应的缓冲区中存储的报文进行抢占获取的核。其中,抢占获取是指获取报文对应的指针(Pointer)的过程,通过指针可以读取以指针为地址的内存中存储的报文。接口对应的缓冲区属于临界资源,获取报文时需要采用加锁等保护技术。
控制核:是指对报文进行控制处理的核。控制处理是指对报文进行各种类型控制层面处理的过程。例如,控制处理可以包括ARP(Address Resolution Protocol,地址解析协议)控制处理或路由控制处理等。
转发核:是指对报文进行转发处理的核。转发处理是指根据报文的信息,查找转发表以确定报文对应的出接口的过程。其中,出端口可以包括物理接口或逻辑接口等。例如,转发核可以根据报文的目的IP(Internet Protocol,网络协议)地址,查找路由表以确定报文对应的出接口。
发送核:是指发送报文的核。发送核根据转发核确定的报文对应的出接口,将报文通过该出接口发出。
如图1所示,接收核获取报文对应的指针,将指针写入到某个转发核的队列里,并通知转发核进行报文的后续处理。转发核从自己的队列里读取指针,并根据指针读取报文,对报文进行转发处理。发送核对报文进行发送。在Pipeline模式下,需要对CPU的核进行合理划分,即需要确定接收核、控制核、转发核和发送核各自的个数。
在Pipeline模式下,可以自由划分接收核、控制核、发送核和转发核的配置比例,流程灵活且具有较好的适应性。但是,各个类型核需要进行合理的配比和配合,CPU才能够具有较好的整体转发性能。如果各个类型核的配比不合理,将会导致CPU整体转发性能较差。例如,如果某个类型核的数量不足,将会成为整个处理流程的瓶颈,而CPU整体转发性能是由整个处理流程的瓶颈决定。
通过实验可以知晓,在接收核、控制核、转发核和发送核的配置比例是1:1:5:1的时,CPU整体转发性能可以达到最佳。即在CPU中的核的个数是8的倍数时,CPU中的核可以得到充分利用。但是,CPU中的核的个数通常是按2递增,例如,核的个数是8、10、12、14和16等。在Pipeline模式下,如果CPU中的核的个数是8或16等8的倍数时,则CPU中的核可以得到充分利用。如果CPU中的核的个数是12或14等非8的倍数,则CPU中的核按照1:1:5:1的配置比例配置后,还将剩余部分核,造成核浪费。
相关技术中,如果CPU中的核的个数是12或14等非8的倍数,在将CPU中的核按照1:1:5:1的配置比例配置后,通常将剩余的部分核配置为转发核。但是,此时CPU的瓶颈核是接收核、控制核或发送核,CPU整体转发性能是由接收核、控制核或发送核的性能决定。因此,将剩余的部分核配置为转发核对于提升CPU整体转发性能作用不大。
图2示出相关技术中采用RTC模式的核分配方法的CPU示意图。如图2所示,在RTC(Run to Completion,运行至完成)模式下,报文由接收到报文的接口对应的核进行处理。接口和核之间存在静态对应关系。其中,接口是指物理接口。
如图2所示,接口接收到报文后,通过DMA(Direct Memory Access,直接内存存取)将报文存储至接口对应的缓冲区,并通过中断通知接口对应的核进行报文的后续处理。接口对应的核根据指针读取报文,对报文进行控制处理和转发处理等,并对报文进行发送。
例如,CPU包括核1和核2,将核1静态分配给接口1,将核2静态分配给接口2。接口1接收到报文后,通过DMA将报文存储至接口1对应的缓冲区,并通过中断通知核1进行报文的后续处理。核1对报文进行控制处理和转发处理等,并对报文进行发送。
在RTC模式下,流程简单,接口在接收到报文后,通过中断通知接口对应的核进行报文的后续处理,不需要报文分流的过程。但是,由于没有分流的过程,且接口和核之间静态对应,在接口的流量不均衡时,可能出现某些接口流量大,对应的核繁忙,而某些接口流量小,对应的核空闲的情况,造成CPU负载不均衡。
图3示出相关技术中采用RSS模式的核分配方法的CPU示意图。如图3所示,在RSS(Receive Side Scale,接收边尺度)模式下,网卡对接收到的报文进行解析,获取报文特定字段的内容,例如五元组信息:IP地址、传输层协议和端口。网卡根据配置的HASH算法和报文特定字段的内容计算HASH值。网卡通过HASH值来确定对应的核,并通知对应的核进行报文的后续处理。
如图3所示,接口接收到报文后,网卡对报文进行解析,获取报文的源IP地址1.1.1.1和目的IP地址2.2.2.2。网卡根据配置的HASH算法和源IP地址1.1.1.1、目的IP地址2.2.2.2计算HASH值。网卡通过HASH值来确定核1,并通知核1进行报文的后续处理。核1对报文进行控制处理和转发处理等,并对报文进行发送。
在RSS模式下,CPU中的核可以得到充分利用,硬件网卡的分流效率也比较高。接口接收到的报文能够均匀地分布到CPU中的核上进行处理。但是,RSS模式需要依赖网卡的硬件分流功能。目前,不是所有的网卡都具有硬件分流功能。此外,依靠网卡的硬件分流功能,不利于业务灵活扩展。如果VNF需要新的分流方式,例如,按照GRE(Generic RoutingEncapsulation,通用路由封装)、VXLAN(Virtual Extensible Local Area Network,虚似扩展局域网)隧道内部IP报文进行分流,网卡能否支持将取决于网卡的功能,造成应用受限。
在本公开实施例中,对于多核CPU的利用,存在以下核的运行模式:
单核运行模式:是指由单个核独立完成报文接收、转发处理和发送过程的运行模式。在报文需要控制处理时,处于单核运行模式的核可以对报文进行控制处理。在单核运行模式下,核可以运行有接收线程和Packet处理线程。
其中,通过接收线程轮询各个接口对应的缓冲区,以对各个接口对应的缓冲区中存储的报文进行抢占获取。通过Packet处理线程对报文进行控制处理和转发处理等,并对报文进行发送。
在单核运行模式下,接收线程和Packet处理线程不同时运行。接收线程在抢占获取到报文后,即获取到报文对应的指针。接收线程停止运行,Packet处理线程开始运行。Packet处理线程根据报文对应的指针读取报文,对报文进行控制处理和转发处理等,并对报文进行发送。在将报文发送完毕后,Packet处理线程停止运行,接收线程开始运行。
多核运行模式:是指由多个核配合完成报文接收、控制处理、转发处理和发送过程的运行模式。在多核运行模式下,核根据功能可以分为接收核、控制核、转发核和发送核。
其中,接收核运行有接收线程,通过接收线程轮询各个接口对应的缓冲区,以对各个接口对应的缓冲区中存储的报文进行抢占获取。控制核运行有控制线程,通过控制线程对报文进行各种类型控制层面处理。转发核运行有转发线程,转发线程根据报文的信息,查找转发表以确定报文对应的出接口。发送核运行有发送线程,通过发送线程根据转发核确定的报文对应的出接口,将报文通过该出接口发出。
在多核运行模式下,接收线程、控制线程、转发线程和发送线程由于运行于不同的核中,因此上述几个线程可以同时运行。接收线程在抢占获取到报文后,即获取到报文对应的指针。控制线程根据报文对应的指针读取报文,对报文进行控制处理。转发线程根据报文对应的指针读取报文,对报文进行转发处理。发送线程根据通过转发线程确定的报文对应的出接口,将报文通过该出接口发出。
图4示出根据本公开一实施例的报文转发方法的流程图。该方法应用于多核CPU。该多核CPU可以应用于网络设备,例如路由器、交换机或服务器等,本公开对此不作限制。如图4所示,该方法包括步骤S41和步骤S42。
在步骤S41中,将多核CPU中的核按照预设配置比例配置为控制核、接收核、转发核和发送核。
在步骤S42中,将多核CPU中除了满足预设配置比例之外的核配置为处于单核运行模式。
其中,预设配置比例是指预先设置的接收核、控制核、转发核和发送核之间的个数比例。预设配置比例可以根据经验设定,例如,预设配置比例为接收核:控制核:转发核:发送核=1:1:5:1。本公开实施例对于预设配置比例的取值不作限制。
作为一个示例,预设配置比例为接收核:控制核:转发核:发送核=1:1:5:1。如果CPU具有10个核,则将1个核配置为接收核、1个核配置为控制核、5个核配置为转发核以及1个核配置为发送核,多核CPU中除了满足预设配置比例之外剩余有2个核,则将该2个核配置为单核运行模式。
作为一个示例,预设配置比例为接收核:控制核:转发核:发送核=1:1:5:1。如果CPU具有20个核,则将2个核配置为接收核、2个核配置为控制核、10个核配置为转发核以及2个核配置为发送核,多核CPU中除了满足预设配置比例之外剩余的4个核配置为单核运行模式。
作为一个示例,预设配置比例为接收核:控制核:转发核:发送核=1:1:5:1。如果CPU具有20个核,则将1个核配置为接收核、1个核配置为控制核、5个核配置为转发核以及1个核配置为发送核,多核CPU中除了满足预设配置比例之外剩余的12个核配置为单核运行模式。
需要说明的是,尽管以将多核CPU中的核按照预设配置比例配置为接收核、控制核、转发核和发送核,将多核CPU中除了满足预设配置比例之外剩余的4个核配置为单核运行模式作为示例介绍了多核CPU中的核分配方法,但本领域技术人员能够理解,本公开应不限于此。本领域技术人员可以根据实际应用场景灵活设定多核CPU中的核分配方法。
示例一:
图5示出根据本公开一实施例的核分配方法的CPU示意图。如图5所示,多核CPU属于NUMA节点。本实施例中以NUMA节点具有2个物理接口为例,即接口1和接口2进行说明。接口1和接口2的带宽分别为10GbE(Gigabit Ethernet,千兆位以太网)。NUMA节点还包括内存,部分内存作为接口1对应的缓冲区(即缓冲区1),部分内存作为接口2对应的缓冲区(即缓冲区2),缓冲区用于存储接口接收到的报文。CPU具有10个核,即核1~10。核1~10可以具有相同的物理结构。
报文可以通过接口1或接口2进入,由多核CPU进行相关处理后,再通过接口1或接口2发出。接口1和接口2可以虚拟出不同逻辑接口。报文可以从NUMA节点的同一个物理接口进入和发出,但是进入和发出的逻辑接口不相同。例如,接口1可以虚拟出逻辑接口1和逻辑接口2。报文可以从逻辑接口1进入,从逻辑接口2发出。
如图5所示,如果预设配置比例为接收核:控制核:转发核:发送核=1:1:5:1,则可以将核1~8配置为核组1。具体地,将核1配置为接收核、核2配置为控制核、核3~7配置为转发核以及核8配置为发送核。多核CPU中剩余2个未配置的核,即多核CPU中剩余未配置的核9和核10。将CPU除了满足上述预设配置比例之外所剩余的2个核,即多核CPU中的核9和核10配置为处于单核运行模式。
如图5所示,在核9中建立接收线程1和Packet处理线程1。在核10中建立接收线程2和Packet处理线程2。核9或核10可以单独完成报文的接收、转发处理和发送。核1~8构成核组1。在核1(即接收核)中建立接收线程3,在核2(即控制核)中建立控制线程1,在核3~7(即转发核)中建立转发线程1~5,在核8(即发送核)中建立发送线程1。核组1中的各个核可以配合完成报文的接收、控制处理、转发处理和发送。
本发明实施例的报文转发方法,将多核CPU中的核按照预设配置比例配置为控制核、接收核、转发核和发送核,将多核CPU中除了满足预设配置比例之外的核配置为处于单核运行模式,由此能够充分利用多核CPU中的核,降低多核CPU中的核浪费,从而提升CPU整体转发性能。
图6示出根据本公开一实施例的报文转发方法的流程图。该方法应用于多核CPU。多核CPU包括处于单核运行模式的核,处于单核运行模式的核运行有接收线程和Packet处理线程。如图6所示,该方法包括步骤S61至步骤S63。
在步骤S61中,处于单核运行模式的核轮询各个接口对应的缓冲区,接口用于接收报文。
其中,轮询是指处于单核运行模式的核针对每个接口对应的缓冲区,依序定时发出询问以确定接口是否接收到报文,周而复始。例如,处于单核运行模式的核可以运行接收线程轮询各个接口对应的缓冲区。
在步骤S62中,如果确定第一接口接收到报文,则对第一接口对应的缓冲区中存储的报文进行抢占获取。
在步骤S63中,如果抢占获取到第一报文,则处于单核运行模式的核停止轮询各个接口对应的缓冲区,对第一报文进行转发处理和发送。
在一种实现方式中,对于处于单核运行模式的核,由于不能同时运行多个线程,对报文的处理与轮询过程,需要交替进行。因此在对第一报文进行转发处理和发送(步骤S63)之后,处于单核运行模式的核轮询各个接口对应的缓冲区。后续的处理流程与步骤S62和S63类似,当确定接口接收到第三报文时,则对第三报文进行抢占,并停止轮询接口,开始对第三报文进行转发处理和发送。
示例二:
承接示例一,如图5所示,核9运行接收线程1轮询缓冲区1和缓冲区2,核10运行接收线程2轮询缓冲区1和缓冲区2。如果某一时刻报文1~100进入接口1,则报文1~100存储至缓冲区1。核9运行接收线程1轮询缓冲区1,抢占获取30个报文,例如报文1~30。核10运行接收线程2轮询缓冲区1,抢占获取20个报文,例如报文31~50。
如图5所示,在核9中,接收线程1获得报文1~30对应的指针P1~P30。接收线程1停止运行,Packet处理线程1开始运行。如果报文1需要进行控制处理,Packet处理线程1根据指针P1读取报文1,对报文1进行控制处理和转发处理,并对报文1进行发送。如果报文2不需要进行控制处理,Packet处理线程1根据指针P2读取报文2,对报文2进行转发处理,并对报文2进行发送。在将报文1~30发送完毕后,Packet处理线程1停止运行,接收线程1开始运行。核10的运行过程可以参见核9,在此不再赘述。
图7示出根据本公开一实施例的报文转发方法的流程图。该方法应用于多核CPU。多核CPU还包括处于多核运行模式的处于单核运行模式的核组,处于单核运行模式的核组包括接收核、控制核、转发核和发送核,接收核运行有接收线程,控制核运行有控制线程,转发核运行有转发线程,发送核运行有发送线程。如图7所示,该方法还包括步骤S71至步骤S75。
在步骤S71中,接收核轮询各个接口对应的缓冲区。
在步骤S72中,如果确定第一接口接收到报文,则对第一接口对应的缓冲区中存储的报文进行抢占获取。
在步骤S73中,如果抢占获取到第二报文,且第二报文需要进行控制处理,则控制核对第二报文进行控制处理。
在步骤S74中,转发核对第二报文进行转发处理。
在步骤S75中,发送核对第二报文进行发送。
示例三:
承接示例二,如图5所示,核1(即接收核)运行接收线程3轮询缓冲区1和缓冲区2。如果某一时刻报文1~100进入接口1,则报文1~100存储至缓冲区1。接收线程3轮询缓冲区1,抢占获取50个报文,例如报文51~100。接收线程3获得报文51~100对应的指针P51~P100。接收线程3对报文51~100进行分流,以使得报文51~100分别由核3~7(即转发核)进行转发处理。
如图5所示,如果报文51需要进行BGP控制处理,则核2(即控制核)运行控制线程1,根据指针P51读取报文51,对报文51进行BGP控制处理;核3运行转发线程1对报文51进行转发处理;核8(即发送核)运行发送线程1发送报文51。如果报文52不需要进行控制处理,则核3运行转发线程1,根据指针P52读取报文52,对报文52进行转发处理;核8运行发送线程1发送报文52。核4~7的运行过程可以参见核3,在此不再赘述。
图8示出根据本公开一实施例的多核CPU的框图。如图8所示,所述多核CPU包括处于单核运行模式的核81。
其中,所述处于单核运行模式的核轮询各个接口对应的缓冲区,所述各个接口用于接收报文;如果确定第一接口接收到报文,则对所述第一接口对应的缓冲区中存储的报文进行抢占获取;如果抢占获取到第一报文,则所述处于单核运行模式的核停止轮询所述各个接口对应的缓冲区,对所述第一报文进行转发处理和发送。
在一种实现方式中,在对所述第一报文进行转发处理和发送之后,所述处于单核运行模式的核81轮询所述各个接口对应的缓冲区。
在一种实现方式中,所述多核CPU还包括处于多核运行模式的核组82,所述处于多核运行模式的核组82包括接收核、控制核、转发核和发送核。
其中,所述接收核轮询所述各个接口对应的缓冲区;如果确定所述第一接口接收到报文,则对所述第一接口对应的缓冲区中存储的报文进行抢占获取;如果抢占获取到第二报文,且所述第二报文需要进行控制处理,则所述控制核对所述第二报文进行控制处理;所述转发核对所述第二报文进行转发处理;所述发送核对所述第二报文进行发送。
在一种实现方式中,所述多核CPU中的核按照预设配置比例被配置为控制核、接收核、转发核和发送核;所述多核CPU中除了满足所述预设配置比例之外的核被配置为处于单核运行模式。
在一种实现方式中,所述预设配置比例为接收核:控制核:转发核:发送核=1:1:5:1。
本发明实施例的多核CPU,将多核CPU中的核按照预设配置比例配置为控制核、接收核、转发核和发送核,将多核CPU中除了满足预设配置比例之外的核配置为处于单核运行模式,由此能够充分利用多核CPU中的核,降低多核CPU中的核浪费,从而提升CPU整体转发性能。
图9示出根据本公开一实施例的多核CPU的框图。参照图9,该装置900可包括处理器901、存储有机器可执行指令的机器可读存储介质902。处理器901与机器可读存储介质902可经由系统总线903通信。并且,处理器901通过读取机器可读存储介质902中与报文转发逻辑对应的机器可执行指令以执行上文中多核CPU执行的报文转发方法。
本公开还可以提供另外一种网络设备,该网络设备可以包括处理器、存储有机器可执行指令的机器可读存储介质。处理器与机器可读存储介质可经由系统总线通信。并且,处理器通过读取机器可读存储介质中与报文转发逻辑对应的机器可执行指令以执行上文中CPU执行的报文转发方法。
本文中提到的机器可读存储介质可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:RAM(Radom Access Memory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等),或类似的存储介质,或它们的组合。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (11)

1.一种报文转发方法,其特征在于,应用于多核CPU,所述多核CPU包括处于单核运行模式的核,所述方法包括:
所述处于单核运行模式的核轮询各个接口对应的缓冲区,所述各个接口用于接收报文;
如果确定第一接口接收到报文,则对所述第一接口对应的缓冲区中存储的报文进行抢占获取;
如果抢占获取到第一报文,则所述处于单核运行模式的核停止轮询所述各个接口对应的缓冲区,对所述第一报文进行转发处理和发送。
2.根据权利要求1所述的方法,其特征在于,在对所述第一报文进行转发处理和发送之后,所述方法还包括:
所述处于单核运行模式的核轮询所述各个接口对应的缓冲区。
3.根据权利要求1所述的方法,其特征在于,所述多核CPU还包括处于多核运行模式的核组,所述处于多核运行模式的核组包括接收核、控制核、转发核和发送核,所述方法还包括:
所述接收核轮询所述各个接口对应的缓冲区;
如果确定所述第一接口接收到报文,则对所述第一接口对应的缓冲区中存储的报文进行抢占获取;
如果抢占获取到第二报文,且所述第二报文需要进行控制处理,则所述控制核对所述第二报文进行控制处理;
所述转发核对所述第二报文进行转发处理;
所述发送核对所述第二报文进行发送。
4.根据权利要求1所述的方法,其特征在于,在所述处于单核运行模式的核轮询各个接口对应的缓冲区之前,所述方法还包括:
将所述多核CPU中的核按照预设配置比例配置为控制核、接收核、转发核和发送核;
将所述多核CPU中除了满足所述预设配置比例之外的核配置为处于单核运行模式。
5.根据权利要求4所述的方法,其特征在于,所述预设配置比例为接收核:控制核:转发核:发送核=1:1:5:1。
6.一种多核CPU,其特征在于,所述多核CPU包括处于单核运行模式的核:
所述处于单核运行模式的核轮询各个接口对应的缓冲区,所述各个接口用于接收报文;如果确定第一接口接收到报文,则对所述第一接口对应的缓冲区中存储的报文进行抢占获取;如果抢占获取到第一报文,则所述处于单核运行模式的核停止轮询所述各个接口对应的缓冲区,对所述第一报文进行转发处理和发送。
7.根据权利要求6所述的多核CPU,其特征在于,
在对所述第一报文进行转发处理和发送之后,所述处于单核运行模式的核轮询所述各个接口对应的缓冲区。
8.根据权利要求6所述的多核CPU,其特征在于,所述多核CPU还包括处于多核运行模式的核组,所述处于多核运行模式的核组包括接收核、控制核、转发核和发送核:
所述接收核轮询所述各个接口对应的缓冲区;如果确定所述第一接口接收到报文,则对所述第一接口对应的缓冲区中存储的报文进行抢占获取;
如果抢占获取到第二报文,且所述第二报文需要进行控制处理,则所述控制核对所述第二报文进行控制处理;
所述转发核对所述第二报文进行转发处理;
所述发送核对所述第二报文进行发送。
9.根据权利要求6所述的多核CPU,其特征在于,
所述多核CPU中的核按照预设配置比例被配置为控制核、接收核、转发核和发送核;
所述多核CPU中除了满足所述预设配置比例之外的核被配置为处于单核运行模式。
10.根据权利要求9所述的多核CPU,其特征在于,所述预设配置比例为接收核:控制核:转发核:发送核=1:1:5:1。
11.一种网络设备,其特征在于,所述网络设备包括权利要求1至10中任意一项所述的多核CPU。
CN201810843695.8A 2018-07-27 2018-07-27 报文转发方法、多核cpu及网络设备 Active CN108984327B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810843695.8A CN108984327B (zh) 2018-07-27 2018-07-27 报文转发方法、多核cpu及网络设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810843695.8A CN108984327B (zh) 2018-07-27 2018-07-27 报文转发方法、多核cpu及网络设备

Publications (2)

Publication Number Publication Date
CN108984327A true CN108984327A (zh) 2018-12-11
CN108984327B CN108984327B (zh) 2020-12-01

Family

ID=64551907

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810843695.8A Active CN108984327B (zh) 2018-07-27 2018-07-27 报文转发方法、多核cpu及网络设备

Country Status (1)

Country Link
CN (1) CN108984327B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109672575A (zh) * 2019-01-30 2019-04-23 新华三技术有限公司合肥分公司 数据处理方法及电子设备
CN110704211A (zh) * 2019-09-29 2020-01-17 烽火通信科技股份有限公司 一种在多核系统下跨cpu收包的方法及系统
WO2020134153A1 (zh) * 2018-12-26 2020-07-02 中兴通讯股份有限公司 一种分流方法、系统和处理设备
CN111614794A (zh) * 2020-04-24 2020-09-01 南京南瑞继保工程技术有限公司 报文传输方法、装置、电子设备及存储介质
CN114338548A (zh) * 2020-10-12 2022-04-12 迈普通信技术股份有限公司 报文分流方法、装置、网络设备及计算机可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101043446A (zh) * 2007-03-08 2007-09-26 华为技术有限公司 数据转发处理的方法和装置
CN101304322A (zh) * 2008-06-30 2008-11-12 杭州华三通信技术有限公司 一种网络设备和报文转发方法
CN101442513A (zh) * 2007-11-20 2009-05-27 杭州华三通信技术有限公司 实现多种业务处理功能的方法和多核处理器设备
CN101834790A (zh) * 2010-04-22 2010-09-15 上海华为技术有限公司 一种基于多核处理器的流量控制方法和多核处理器
CN104994032A (zh) * 2015-05-15 2015-10-21 京信通信技术(广州)有限公司 一种信息处理的方法和装置
CN106506393A (zh) * 2016-02-05 2017-03-15 华为技术有限公司 一种数据流处理方法、装置和系统
CN106936739A (zh) * 2015-12-30 2017-07-07 新华三技术有限公司 一种报文转发方法及装置
CN107979535A (zh) * 2017-10-31 2018-05-01 新华三技术有限公司 报文转发方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101043446A (zh) * 2007-03-08 2007-09-26 华为技术有限公司 数据转发处理的方法和装置
CN101442513A (zh) * 2007-11-20 2009-05-27 杭州华三通信技术有限公司 实现多种业务处理功能的方法和多核处理器设备
CN101304322A (zh) * 2008-06-30 2008-11-12 杭州华三通信技术有限公司 一种网络设备和报文转发方法
CN101834790A (zh) * 2010-04-22 2010-09-15 上海华为技术有限公司 一种基于多核处理器的流量控制方法和多核处理器
CN104994032A (zh) * 2015-05-15 2015-10-21 京信通信技术(广州)有限公司 一种信息处理的方法和装置
CN106936739A (zh) * 2015-12-30 2017-07-07 新华三技术有限公司 一种报文转发方法及装置
CN106506393A (zh) * 2016-02-05 2017-03-15 华为技术有限公司 一种数据流处理方法、装置和系统
CN107979535A (zh) * 2017-10-31 2018-05-01 新华三技术有限公司 报文转发方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020134153A1 (zh) * 2018-12-26 2020-07-02 中兴通讯股份有限公司 一种分流方法、系统和处理设备
CN109672575A (zh) * 2019-01-30 2019-04-23 新华三技术有限公司合肥分公司 数据处理方法及电子设备
CN110704211A (zh) * 2019-09-29 2020-01-17 烽火通信科技股份有限公司 一种在多核系统下跨cpu收包的方法及系统
CN110704211B (zh) * 2019-09-29 2022-03-11 烽火通信科技股份有限公司 一种在多核系统下跨cpu收包的方法及系统
CN111614794A (zh) * 2020-04-24 2020-09-01 南京南瑞继保工程技术有限公司 报文传输方法、装置、电子设备及存储介质
CN114338548A (zh) * 2020-10-12 2022-04-12 迈普通信技术股份有限公司 报文分流方法、装置、网络设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN108984327B (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
CN108984327A (zh) 报文转发方法、多核cpu及网络设备
US10382362B2 (en) Network server having hardware-based virtual router integrated circuit for virtual networking
US10614028B2 (en) Network traffic routing in distributed computing systems
US8806025B2 (en) Systems and methods for input/output virtualization
CN105207873B (zh) 一种报文处理方法和装置
US9294304B2 (en) Host network accelerator for data center overlay network
US9703743B2 (en) PCIe-based host network accelerators (HNAS) for data center overlay network
US8446824B2 (en) NUMA-aware scaling for network devices
CN109426549A (zh) 针对虚拟环境的加速器互连分配
US10554554B2 (en) Hybrid network processing load distribution in computing systems
CN115480869A (zh) 微服务架构
US20150163172A1 (en) Server switch integration in a virtualized system
US9910687B2 (en) Data flow affinity for heterogenous virtual machines
US9485191B2 (en) Flow-control within a high-performance, scalable and drop-free data center switch fabric
CN110214436A (zh) 一种多核无锁速率限制装置和方法
US20220078119A1 (en) Network interface device with flow control capability
US9128771B1 (en) System, method, and computer program product to distribute workload
US20230100935A1 (en) Microservice deployments using accelerators
CN109964211A (zh) 用于半虚拟化网络设备队列和存储器管理的技术
US20180375801A1 (en) Apparatus and method for distribution of congestion information in a switch
CN107920035A (zh) 被设计用于确定性交换式以太网的处理器
Inoue et al. Low-latency and high bandwidth TCP/IP protocol processing through an integrated HW/SW approach
CN110300068A (zh) Arp资源管理方法、装置、电子设备
Pickartz et al. Swift: A transparent and flexible communication layer for pcie-coupled accelerators and (co-) processors
US11580058B1 (en) Hierarchical ring-based interconnection network for symmetric multiprocessors

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant