CN103731364A

CN103731364A - 基于x86平台实现万兆大流量快速收包的方法

Info

Publication number: CN103731364A
Application number: CN201410021519.8A
Authority: CN
Inventors: 逯利军; 钱培专; 姜健; 汪海林; 凌志辉; 李克民; 宋聚平; 侯卫东
Original assignee: CERTUSNET CORP
Current assignee: SHANGHAI CERTUSNET INFORMATION TECHNOLOGY CO., LTD.
Priority date: 2014-01-16
Filing date: 2014-01-16
Publication date: 2014-04-16
Anticipated expiration: 2034-01-16
Also published as: CN103731364B

Abstract

本发明涉及一种基于X86平台实现万兆大流量快速收包的方法，其中包括设置支持多队列的网卡收包队列的CPU亲和性；修改内核中数据包的传入地址为收包内核态模块；将数据包向内核协议栈进行传输；所述的收包内核态模块通过地址映射机制将内核队列地址映射到用户态；所述的用户态收取数据包。采用该种基于X86平台实现万兆大流量快速收包的方法，主要解决了传统收包的不足和性能瓶颈，采用网卡RSS技术、内核动态module挂载、零拷贝技术和无锁RingBuffer技术，实现在大流量的环境和基于X86的平台上，快速不丢的将流量从网卡内核空间收到用户进程空间，适用于需要提取流量的局域网或广域网以及各运营商流量出口，具有广泛的应用范围。

Description

基于X86平台实现万兆大流量快速收包的方法

技术领域

本发明涉及网络技术领域，尤其涉及大流量收包领域，具体是指一种基于X86平台实现万兆大流量快速收包的方法。

背景技术

网络的飞速发展，使得网络应用越来越多，流量越来越大，传统的千兆逐步被万兆替代，如何将如此大的流量实时收取下来以供后续的分析挖掘使用，成为了当今一个热点研究课题

现有基本的收包技术都是基于Libpcap（分组捕获函数库）和Socket（插座）封装而来，优点是开发快，易于上手，缺点则是在大流量的情况下，收包所占资源多，而往往由于收包流程所耗费的资源庞大，导致处理的性能下降，丢包、来不及收包的情况常常发生，传统的收包方式已经远远不能满足大流量的需求了。

发明内容

本发明的目的是克服了上述现有技术的缺点，提供了一种能够实现在大流量的环境和基于X86的平台上、快速不丢的将流量从网卡内核空间收到用户进程空间、适用于大规模推广应用的基于X86平台实现万兆大流量快速收包的方法。

为了实现上述目的，本发明的基于X86平台实现万兆大流量快速收包的方法具有如下构成：

该基于X86平台实现万兆大流量快速收包的方法，其主要特点是，所述的方法包括以下步骤：

（1）设置支持多队列的网卡收包队列的CPU亲和性；

（2）修改内核中数据包的传入地址为收包内核态模块；

（3）将数据包向内核协议栈进行传输；

（4）所述的收包内核态模块通过地址映射机制将内核队列地址映射到用户态；

（5）所述的用户态收取数据包。

较佳地，所述的设置支持多队列的网卡收包队列的CPU亲和性，具体为：

通过系统Proc文件设置支持多队列的网卡收包队列的CPU亲和性。

较佳地，所述的修改内核中数据包的传入地址为收包内核态模块，包括以下步骤：

（21）所述的支持多队列的网卡收包发生硬中断，进入网卡中断处理函数；

（22）网卡中断处理函数将数据包传输到内核空间，同时发生软中断；

（23）调用软中断处理函数进行数据包的获取以及前期判断工作；

（24）修改数据包的传入地址为收包内核态模块。

更佳地，所述的网卡中断处理函数将数据包传输到内核空间，具体为：

网卡中断处理函数将数据包以直接存储器存取方式传输到内核空间。

较佳地，所述的收包内核态模块通过地址映射机制将内核队列地址映射到用户态，包括以下步骤：

（41）注册收包内核态模块地址函数；

（42）数据包到达收包内核态模块地址函数并进入过滤器进行过滤；

（43）通过过滤器过滤后的数据包进行Hash分流到达不同的内核队列；

（44）内核队列地址通过地址映射机制直接映射到用户态。

较佳地，所述的用户态收取数据包，具体为：

所述的用户态通过无锁RingBuffer结构的内存收取数据包。

更佳地，所述的用户态通过无锁RingBuffer结构的内存收取数据包，包括以下步骤：

（51）内核态采用Kmalloc函数申请无锁RingBuffer结构的内存；

（52）对整块内存进行内存块分割且在内存的第一块存放公用信息；

（53）每当有数据写入内存时，通过取第一块内存中的写位置指针和读位置指针判断此次写入的内存节点位置；

（54）写入数据后，将所对应的内存节点信息进行更新并将写位置指针向后移动；

（55）每当从内存收取数据时，通过取第一块内存中读位置指针来获取待收取的内存节点并通过该内存节点的状态信息标志位判断是否有数据可读。

采用了该发明中的基于X86平台实现万兆大流量快速收包的方法，具有如下有益效果：

本专利主要解决了传统收包的不足和性能瓶颈，采用网卡RSS技术、内核动态module挂载、零拷贝技术和无锁RingBuffer技术，实现在大流量的环境和基于X86的平台上，快速不丢的将流量从网卡内核空间收到用户进程空间，适用于需要提取流量的局域网或广域网以及各运营商流量出口，具有广泛的应用范围。

附图说明

图1为本发明的基于X86平台实现万兆大流量快速收包的方法的流程图。

图2为本发明的数据传输流程图。

图3为本发明的收包内核态模块的工作流程图。

图4为本发明的无锁Ringbuffer结构的内存的工作流程图。

具体实施方式

为了能够更清楚地描述本发明的技术内容，下面结合具体实施例来进行进一步的描述。

1、使用支持多队列（RSS）特性网卡，来提升性能。普通网卡亦可，只是普通网卡一般用在低流量的环境中。

2、网卡支持多队列，通过系统设置网卡收包队列的CPU亲和性，设置CPU的亲和性一般通过系统Proc文件完成。系统文件路径/proc/irq/中断号/smp_affinity。

3、通过上述两步，则实现了收包队列的软中断的平均分配，相比以前普通的收包方式，数据包的软中断一般都集中在CPU0上，往往数据量大的时候，CPU0的使用都在100%，导致0号CPU很忙，而其他CPU空闲的状态，效率大大降低。

4、修改内核，加入收包内核态模块的入口地址。

5、装载收包内核态模块（Rsspacket），该模块实现数据包从内核态到用户态的映射，以及高速收取算法的实现。

6、以上两步实现数据包的高速收取，为本发明的核心。整体数据传输流程见图2。

下面详细介绍实现技术点：

7、针对内核的修改，主要是为了减少包进入协议栈后系统的开销。具体实现方式为：

（1）网卡收包发生硬中断，中断产生后，进入网卡中断处理函数；

（2）网卡中断处理函数将数据包DMA（Direct memory access，直接存储器收取）到内核空间，同时产生软中断；

（3）内核软中断产生，调用软中断处理函数，进行数据包的获取以及一些前期判断工作；

（4）数据包向内核协议栈传递，我们在该步传递之前，修改数据包的传入地址为发明中的收包内核态模块，这样在网卡DMA数据后，直接进入发明中的收包内核态模块（Rsspacket），如此则直接摒弃掉了繁琐的协议栈流程和内核的开销流程，大大节省系统资源和提高速度。

8、收包内核态模块（Rsspacket）工作流程如下（流程见图3）：

（1）注册收包内核态模块地址函数；

（2）数据包到达收包地址函数，进行简单的包头分析，进入Filter（过滤器）判断，该Filter可以通过加载模块时进行配置，主要实现数据包的过滤功能；

（3）通过filter过滤后的数据包在进行Hash分流（哈希分流算法）到达不同的内核队列；

（4）内核队列地址通过内存映射（MMAP，Memory Map）直接映射到用户态，该块内存使用块状内存结构，内核负责申请，内存结构为高速无锁RingBuffer（环形缓冲区）结构。

9、高速无锁RingBuffer结构的描述如下（流程见图4）：

（1）内存按模块加载时传入参数初始化，默认256MB。该内存采取Kmalloc（内存分割函数）在内核态申请；

（2）对整块内存采取内存块分割的策略。每个内存块为固定的长度，包括但不仅包括读写指针、数据段、一些标志位（如读写完成、可重写、读过快等）；

（3）内存的第一块永远不放数据，存放当前的公用信息，如当前读位置、写位置、内存块数、每块内存大写等。读写位置指针占用不同的存储空间，读写程序进行该块内存读写时，永远取各自的读写位置，互不影响，无需加锁；

（4）每当数据写入内存时，通过取第一块内存中写位置指针和读位置指针，来判断该次写入的内存节点位置，写入后，进行内存节点信息的更新，包括该块可读，然后将写指针往后移动。该操作采用原子操作，防止被系统中断打断；

（5）每当读数据时，通过取第一块内存中读位置指针位置，来获取收取的内存节点，同时通过读写指针判断是否有数据可读，通过内存节点的状态信息标志位判断是够数据可读。通过以上完成数据的收取。

由于是环形缓冲，必将有读写重合或速率不一致导致的读写指针问题，在该发明中，我们将读写指针永远的只加不置位，在读写阶段，通过判断两个指针的大写即可完成环形缓冲的置换工作，如读指针应该永远小于写指针才有数据可读，写指针应该不大于读指针整个内存块数的情况下才不会过快写入数据，导致数据丢失等情况。

如图1所示，本发明的实现万兆大流量快速收包的方法包括以下步骤：

（1）设置支持多队列的网卡收包队列的CPU亲和性；

（2）修改内核中数据包的传入地址为收包内核态模块；

具体包括以下四个子步骤：

（24）修改数据包的传入地址为收包内核态模块。

（3）将数据包向内核协议栈进行传输；

具体包括以下四个子步骤：

（41）注册收包内核态模块地址函数；

（44）内核队列地址通过地址映射机制直接映射到用户态。

（5）所述的用户态收取数据包。

具体包括以下五个子步骤：

（51）内核态采用Kmalloc函数申请无锁RingBuffer结构的内存；

在此说明书中，本发明已参照其特定的实施例作了描述。但是，很显然仍可以作出各种修改和变换而不背离本发明的精神和范围。因此，说明书和附图应被认为是说明性的而非限制性的。

Claims

1.一种基于X86平台实现万兆大流量快速收包的方法，其特征在于，所述的方法包括以下步骤：

（1）设置支持多队列的网卡收包队列的CPU亲和性；

（2）修改内核中数据包的传入地址为收包内核态模块；

（3）将数据包向内核协议栈进行传输；

（5）所述的用户态收取数据包。

2.根据权利要求1所述的基于X86平台实现万兆大流量快速收包的方法，其特征在于，所述的设置支持多队列的网卡收包队列的CPU亲和性，具体为：

3.根据权利要求1所述的基于X86平台实现万兆大流量快速收包的方法，其特征在于，所述的修改内核中数据包的传入地址为收包内核态模块，包括以下步骤：

（24）修改数据包的传入地址为收包内核态模块。

4.根据权利要求3所述的基于X86平台实现万兆大流量快速收包的方法，其特征在于，所述的网卡中断处理函数将数据包传输到内核空间，具体为：

5.根据权利要求1所述的基于X86平台实现万兆大流量快速收包的方法，其特征在于，所述的收包内核态模块通过地址映射机制将内核队列地址映射到用户态，包括以下步骤：

（41）注册收包内核态模块地址函数；

（44）内核队列地址通过地址映射机制直接映射到用户态。

6.根据权利要求1所述的基于X86平台实现万兆大流量快速收包的方法，其特征在于，所述的用户态收取数据包，具体为：

所述的用户态通过无锁RingBuffer结构的内存收取数据包。

7.根据权利要求6所述的基于X86平台实现万兆大流量快速收包的方法，其特征在于，所述的用户态通过无锁RingBuffer结构的内存收取数据包，包括以下步骤：

（51）内核态采用Kmalloc函数申请无锁RingBuffer结构的内存；