CN108600053A - 一种基于零拷贝技术的无线网络数据包捕获方法 - Google Patents

一种基于零拷贝技术的无线网络数据包捕获方法 Download PDF

Info

Publication number
CN108600053A
CN108600053A CN201810441095.9A CN201810441095A CN108600053A CN 108600053 A CN108600053 A CN 108600053A CN 201810441095 A CN201810441095 A CN 201810441095A CN 108600053 A CN108600053 A CN 108600053A
Authority
CN
China
Prior art keywords
data packet
wireless network
buffering area
duplication technology
zero duplication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810441095.9A
Other languages
English (en)
Other versions
CN108600053B (zh
Inventor
卢艺
陈伟
刘栋
张楚月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201810441095.9A priority Critical patent/CN108600053B/zh
Publication of CN108600053A publication Critical patent/CN108600053A/zh
Application granted granted Critical
Publication of CN108600053B publication Critical patent/CN108600053B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/12Network monitoring probes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于零拷贝技术的无线网络数据包捕获方法,在Linux系统中安装Libpcap库来捕获无线网络数据包,在捕包时,采用零拷贝技术将数据包由网卡寄存器直接送入用户缓冲区;在存储时,通过零拷贝技术将用户缓冲区内捕获的数据包直接存放到硬盘上。本发明方法基于双零拷贝技术简化抓包流程,解决了Tshark的高丢包率的问题,该方法简单易行,大大增强了抓包软件应对实际应用环境的能力,对网络行为监控有着很重要作用。

Description

一种基于零拷贝技术的无线网络数据包捕获方法
技术领域
本发明具体涉及一种针对Linux环境下基于零拷贝技术的无线网络数据包捕获方法,属于网络数据分析和信息安全技术领域。
背景技术
随着无线局域网(WLAN:Wireless Local Area Network)技术的发展,全球的无线局域网市场呈现着如火如荼的扩张态势,WLAN的应用领域也扩展到军事和金融、交通等涉及国民经济的各行各业,人们越来越倾向于使用这种方便快捷的网络。但是,由于无线网络传输媒介固有的开放性,无线网络暴露出越来越多的安全问题,为了应对这些潜在的安全威胁,对无线网络数据进行捕获和分析就变得十分重要。
在无线数据包的捕获中,由于Windows把802.11帧转为以太网的帧交给内核,Windows通常需要特定网卡或软件才能捕获完整的802.11数据帧。而Linux相比Windows,可以使用常见的无线网卡捕获完整的802.11数据帧,因此在Linux环境下,使用Wireshark(现有的一种网络分析工具)捕获无线数据包具有更好的通用性。Wireshark是世界上最重要和最广泛使用的网络协议分析器,可以对数百个协议进行深入的检查,并不断添加更多的协议。它拥有实时捕获和离线分析并且有强大的显示过滤器、读/写许多不同的捕获文件格式。对许多协议的解密支持。它用简洁的可视化图形界面清晰地将监听和分析的数据包的内容显示给使用者。而Tshark作为Wireshark的终端模式(命令行工具),更方便用在脚本中,也可以通过SSH连接用在远程计算机上,方便远程调用。Tshark是一种高效的抓包分析软件,但是在高速网络流量的环境下,抓包过程中的高丢包率成为了难以解决的问题。高丢包率容易引发丢失重要信息的问题从而影响结果的准确度。
Tshark的抓包技术还在不断成熟的过程中,当前最核心的问题是如何提高在实际环境下它的抓包率,这里的环境包括系统使用环境和系统应用环境。在实际应用中,各种环境因素对Tshark的抓包率都有一定的影响,系统内核缓冲区的空间有限以及传输数据包时的流程复杂且内存拷贝次数多会严重影响抓包率,增加丢包率。
因此,在现在无线网络环境条件下,一种针对Linux环境的基于零拷贝技术的数据包捕获方法至关重要。
发明内容
本发明的目的在于克服现有技术中Tshark在高速网络环境下的高丢包率问题,提出了一种基于零拷贝技术的无线网络数据包捕获方法,采用基于Libpcap的双零拷贝技术方法,简化Libpcap的抓包流程方法,能够有效降低丢包率。
为解决上述技术问题,本发明提供了一种基于零拷贝技术的无线网络数据包捕获方法,在Linux系统中安装Libpcap库来捕获无线网络数据包,其特征是,包括以下步骤;
步骤S1,在捕包时,采用零拷贝技术将数据包由网卡寄存器直接送入用户缓冲区;
步骤S2,在存储时,通过零拷贝技术将用户缓冲区内捕获的数据包直接存放到硬盘上。
进一步的,步骤S1,在接收数据包时,网卡驱动程序通过DMA方式从网卡内部寄存器读取数据包,然后将接收到的数据封装成LWIP协议的格式写到网卡接收缓冲区中;
通过把网卡内部寄存器指针映射到LWIP内核内存空间,ERXST为接收缓冲区起始地址,ERXND为接收缓冲区结束地址,ETXST为发送缓冲区起始地址,ETXND为发送缓冲区结束地址,ERDPT为MCU读缓冲器指针,EWRPT为MCU写缓冲器指针,将ERDPT映射到LWIP协议缓存包中的数据指针,实现直接对网卡寄存器内的数据包进行存储操作。
进一步的,通过半轮询中断方式,读取数据包到用户缓冲区。
进一步的,在捕获数据包的时候,通过Tshark工具包中-s参数设置抓取数据包的长度。
进一步的,对Linux内核socket参数更改SO_RCVBUF参数,以增加Libpcap缓冲区长度。
进一步的,将数据包拷贝到用户缓冲区和硬盘上时,多组数据包一起拷贝。
进一步的,调用开发包packet32中的PacketReceivePacket()函数实现多组数据包拷贝。
与现有技术相比,本发明所达到的有益效果是:本发明使用双零拷贝技术和半轮询方法对抓包过程进行优化,减少了数据拷贝次数,降低了系统资源的消耗,有效提高了系统利用效率,提高抓包性能。本发明针对Linux系统的内核利用情况,通过协议栈和开发包优化系统,有效地提高了系统使用效率。本发明方法简单易行,大大增强了抓包软件应对实际应用环境的能力,对网络行为监控有着很重要作用。
附图说明
图1为本发明数据包捕获方法的流程图;
图2为传统拷贝方式和零拷贝方式的对比;
图3为网卡内部寄存器指针映射;
图4为Libpcap传统抓包流程;
图5为本发明实施例中抓包流程改进前后的效率对比。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明包含的技术术语如下:
内核:是一个操作系统的核心,是基于硬件的第一层软件扩充,提供操作系统的最基本的功能,是操作系统工作的基础,它负责管理系统的进程、内存、设备驱动程序、文件和网络系统,决定着系统的性能和稳定性。
内核缓冲区:内核的一部分,为文件系统层提供了一个通用函数集(与具体文件系统无关)。这个缓存层通过将数据保留一段时间(或者随即预先读取数据以便在需要时就可用)优化了对物理设备的访问。
零拷贝技术:通过减少或消除关键通信路径影响速率的操作,减少数据拷贝和共享总线操作的次数,消除通信数据在存储器之间不必要的中间拷贝过程,有效地提高通信效率,是设计高速接口通道、实现高速服务器和路由器的关键技术之一。数据拷贝受制于传统的操作系统或通信协议,限制了通信性能。采用零拷贝技术,通过减少数据拷贝次数,简化协议处理的层次,在应用和网络间提供更快的数据通路,可以有效地降低通信延迟,增加网络吞吐率。
LWIP:是瑞典计算机科学院(SICS)的Adam Dunkels开发的用于嵌入式系统的开源TCP/IP协议栈。LWIP的含义是轻量级的TCP/IP协议,专注于减少资源消耗。
远程直接内存存取(RDMA):它允许网络中的计算机在主存贮器里交换数据,而不用涉及任何一台计算机的处理器、高速缓冲存贮器或者操作系统。像本地直接内存存取(DMA)一样,远程直接内存存取改进了吞吐量和性能,因为它释放了资源。远程直接内存存取同时也让一个更快的数据传输率变得容易。
半轮询方式:是一种中断和轮询方式的集成。在高负载时使用轮询,在轻负载时使用中断驱动。很好的解决了低负载时,轮询方式响应时间和处理器资源消耗的问题,高负载时,中断方式的接收活锁问题,同时利用了两种方式的特点。
回调函数:回调函数就是一个通过函数指针调用的函数。如果一个函数的指针(地址)作为参数传递给另一个函数,当这个指针被用来调用其所指向的函数时,这就是回调函数。回调函数不是由该函数的实现方直接调用,而是在特定的事件或条件发生时由另外的一方调用的,用于对该事件或条件进行响应。
本发明的应用环境是Linux下基于Libpcap库来捕获无线网络数据包。现有技术中,Libpcap传统抓包流程可见图4,Libpcap函数库中采用循环截包函数pcap_loop()来捕获数据包,pcap_loop函数每抓一个数据包之后就调用callback函数pcap_callback()来处理,频繁调用会产生大量系统开销,影响系统性能。
本发明方法对其进行改进,利用双零拷贝技术即零拷贝捕包和零拷贝拷贝存储,以及采用半轮询中断方式,在linux环境下简化Libpcap抓包的流程,尽可能减少系统调用次数。本发明的一种基于零拷贝技术的无线网络数据包捕获方法,如图1所示,包括以下步骤:
步骤S1,在捕包时,采用零拷贝技术将数据包由网卡寄存器直接送入用户缓冲区。
图2为传统捕包方式(左)和本发明改进后的捕包方式(右)的对比。传统捕包方式中,每一个数据包被捕获后都要向CPU发出中断处理数据包,由网卡->内核buffer->用户buffer进行多次拷贝。本发明采用零拷贝捕包技术,接收的数据包由网络接口直接将数据包送入用户缓冲区。
具体实现过程为:在网卡驱动程序接收数据包时,网卡驱动程序向网卡发送数据包传送指令,网卡把边界寄存器处的一个网卡格式的数据包数据一次性全部发送到DMA端口,网卡驱动程序会在DMA端口读取所有字节数据,自动将边界寄存器值调整为下一个数据包地址,以准备下一次读取所有字节数据。然后LWIP协议栈将接收到的数据封装成LWIP协议的格式并且写到网卡接收缓冲区中。
通过把网卡内部寄存器指针映射到LWIP内核内存空间,如图3,ERXST为接收缓冲区起始地址,ERXND为接收缓冲区结束地址,ETXST为发送缓冲区起始地址,ETXND为发送缓冲区结束地址,ERDPT为MCU读缓冲器指针,EWRPT为MCU写缓冲器指针,将ERDPT映射到LWIP协议缓存包中的数据指针,就可以直接对网卡寄存器内的数据包进行存储等操作,来避免物理网卡到LWIP内核空间的数据拷贝。
通过半轮询中断方式,如图1中右侧的图,当第一个数据包到达内核层时,采用中断的方式告知系统,关闭对该设备的中断的响应。同时,激活一个软中断,按照轮询频率轮询队列中的数据报文,从中读取数据包到用户缓冲区。每次轮询时,如果网络设备接收队列中接收了P个或以上数据包(P值是设定值),就继续对后续数据包采用轮询机制处理;如果多轮轮询之后网络设备接收队列数据报文个数依旧少于P个,就开启中断方式来处理后续数据报文。
在捕获数据包的时候,可以设置抓取数据包的长度。在Linux环境下,用户可通过Tshark工具包中-s参数,根据网络速度控制抓取数据包的长度,范围是0~65536。例如,在百兆网络环境中,可以设置抓取数据包的前100个字节,命令行如下:
root@kami:~#tshark–s 100
为了Linux内核socket参数调优,增加Libpcap缓冲区长度。对Linux内核socket参数用sysctl命令更改SO_RCVBUF参数,增加Libpcap缓冲区长度,提升Linux性能,实现优化。SO_RCVBUF默认的值是由/proc/sys/net/core/rmem_default文件和最大值设置的,允许的值是由/proc/sys/net/core/rmem_max文件设置的,最小的值则为256bit。
步骤S2,在存储时,通过零拷贝技术将用户缓冲区内捕获的多组数据包直接存放到硬盘上。
在用户缓冲区中不再采用把数据包逐个提取出来送到callback回调函数的处理方式,而是把一组数据包直接存放到硬盘上,提高用户缓冲区处理数据包的效率,同时通过零拷贝技术减少多余报文的拷贝。
实施例
将本发明方法应用到具体实施例实现的具体流程参见图1,在Linux系统下安装Libpcap库来捕获无线网络数据包,先完成网卡寄存器指针映射,然后调用开发包packet32中的PacketSetMinToCopy()函数和PacketSetBuff()函数设置合适的接收内核缓冲区的大小和内核缓冲区中激发本事件的最小数据大小。在调用PacketReceivePacket()函数,根据网卡的工作模式,可以从系统内核页缓冲区拷贝一组数据包而不是逐个的到用户缓冲区中,然后将这组数据包不作任何处理就存放到硬盘上,通过循环直到用户按键终止抓包过程。
为了验证方法的有效性,使用发包器进行测试,软件平台为Kali,IP数据包长度选取了512byte,背景流量分别取30.23Mbps、71.24Mbps和89.56Mbps,改进前后的抓包情况对比如图5,可看到本发明方法有效提高了网络数据包的捕获率。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

Claims (7)

1.一种基于零拷贝技术的无线网络数据包捕获方法,在Linux系统中安装Libpcap库来捕获无线网络数据包,其特征是,包括以下步骤;
步骤S1,在捕包时,采用零拷贝技术将数据包由网卡寄存器直接送入用户缓冲区;
步骤S2,在存储时,通过零拷贝技术将用户缓冲区内捕获的数据包直接存放到硬盘上。
2.根据权利要求1所述的一种基于零拷贝技术的无线网络数据包捕获方法,其特征是,步骤S1,在接收数据包时,网卡驱动程序通过DMA方式从网卡内部寄存器读取数据包,然后将接收到的数据封装成LWIP协议的格式写到网卡接收缓冲区中;
通过把网卡内部寄存器指针映射到LWIP内核内存空间,ERXST为接收缓冲区起始地址,ERXND为接收缓冲区结束地址,ETXST为发送缓冲区起始地址,ETXND为发送缓冲区结束地址,ERDPT为MCU读缓冲器指针,EWRPT为MCU写缓冲器指针,将ERDPT映射到LWIP协议缓存包中的数据指针,实现直接对网卡寄存器内的数据包进行存储操作。
3.根据权利要求2所述的一种基于零拷贝技术的无线网络数据包捕获方法,其特征是,通过半轮询中断方式,读取数据包到用户缓冲区。
4.根据权利要求1所述的一种基于零拷贝技术的无线网络数据包捕获方法,其特征是,在捕获数据包的时候,通过Tshark工具包中-s参数设置抓取数据包的长度。
5.根据权利要求1所述的一种基于零拷贝技术的无线网络数据包捕获方法,其特征是,对Linux内核socket参数更改SO_RCVBUF参数,以增加Libpcap缓冲区长度。
6.根据权利要求1所述的一种基于零拷贝技术的无线网络数据包捕获方法,其特征是,将数据包拷贝到用户缓冲区和硬盘上时,多组数据包一起拷贝。
7.根据权利要求6所述的一种基于零拷贝技术的无线网络数据包捕获方法,其特征是,调用开发包packet32中的PacketReceivePacket()函数实现多组数据包拷贝。
CN201810441095.9A 2018-05-10 2018-05-10 一种基于零拷贝技术的无线网络数据包捕获方法 Active CN108600053B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810441095.9A CN108600053B (zh) 2018-05-10 2018-05-10 一种基于零拷贝技术的无线网络数据包捕获方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810441095.9A CN108600053B (zh) 2018-05-10 2018-05-10 一种基于零拷贝技术的无线网络数据包捕获方法

Publications (2)

Publication Number Publication Date
CN108600053A true CN108600053A (zh) 2018-09-28
CN108600053B CN108600053B (zh) 2021-09-28

Family

ID=63636318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810441095.9A Active CN108600053B (zh) 2018-05-10 2018-05-10 一种基于零拷贝技术的无线网络数据包捕获方法

Country Status (1)

Country Link
CN (1) CN108600053B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111107019A (zh) * 2019-12-29 2020-05-05 浪潮电子信息产业股份有限公司 一种数据传输方法、装置、设备及计算机可读存储介质
CN111124948A (zh) * 2019-12-04 2020-05-08 北京东土科技股份有限公司 嵌入式系统的网络数据抓包方法及系统、存储介质
CN111917835A (zh) * 2020-07-13 2020-11-10 北京天空卫士网络安全技术有限公司 一种监控网络数据的系统、方法和装置
CN113064846A (zh) * 2021-04-14 2021-07-02 中南大学 基于Rsockets协议的零拷贝数据传输方法
CN113590910A (zh) * 2021-09-26 2021-11-02 北京金睛云华科技有限公司 一种网络流量检索方法和装置
CN113660530A (zh) * 2021-07-27 2021-11-16 中央广播电视总台 节目流数据抓取方法、装置、计算机设备及可读存储介质
CN114338647A (zh) * 2021-12-16 2022-04-12 中孚安全技术有限公司 一种基于国产操作系统的轻量级文件传输方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101873337A (zh) * 2009-04-22 2010-10-27 电子科技大学 一种基于rt8169千兆网卡和Linux操作系统的零拷贝数据捕获技术
CN103581181A (zh) * 2013-10-28 2014-02-12 清华大学 数据包捕获、处理和发送方法及系统
US20170322828A1 (en) * 2016-05-09 2017-11-09 Cavium, Inc. Systems and methods for virtio based optimization of data packet paths between a virtual machine and a network device for live virtual machine migration

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101873337A (zh) * 2009-04-22 2010-10-27 电子科技大学 一种基于rt8169千兆网卡和Linux操作系统的零拷贝数据捕获技术
CN103581181A (zh) * 2013-10-28 2014-02-12 清华大学 数据包捕获、处理和发送方法及系统
US20170322828A1 (en) * 2016-05-09 2017-11-09 Cavium, Inc. Systems and methods for virtio based optimization of data packet paths between a virtual machine and a network device for live virtual machine migration

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LIU TIANHUA等: "Research and Implementation of Zero-Copy", 《IEEE》 *
周延森: "基于零拷贝数据包捕获机制的研究与改进", 《计算机安全》 *
张齐,劳炽元: "轻量级协议栈 LWIP 的分析与改进", 《计算机工程与设计》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111124948A (zh) * 2019-12-04 2020-05-08 北京东土科技股份有限公司 嵌入式系统的网络数据抓包方法及系统、存储介质
CN111107019A (zh) * 2019-12-29 2020-05-05 浪潮电子信息产业股份有限公司 一种数据传输方法、装置、设备及计算机可读存储介质
CN111917835A (zh) * 2020-07-13 2020-11-10 北京天空卫士网络安全技术有限公司 一种监控网络数据的系统、方法和装置
CN113064846A (zh) * 2021-04-14 2021-07-02 中南大学 基于Rsockets协议的零拷贝数据传输方法
CN113660530A (zh) * 2021-07-27 2021-11-16 中央广播电视总台 节目流数据抓取方法、装置、计算机设备及可读存储介质
CN113660530B (zh) * 2021-07-27 2024-03-19 中央广播电视总台 节目流数据抓取方法、装置、计算机设备及可读存储介质
CN113590910A (zh) * 2021-09-26 2021-11-02 北京金睛云华科技有限公司 一种网络流量检索方法和装置
CN113590910B (zh) * 2021-09-26 2021-12-24 北京金睛云华科技有限公司 一种网络流量检索方法和装置
CN114338647A (zh) * 2021-12-16 2022-04-12 中孚安全技术有限公司 一种基于国产操作系统的轻量级文件传输方法及系统

Also Published As

Publication number Publication date
CN108600053B (zh) 2021-09-28

Similar Documents

Publication Publication Date Title
CN108600053A (zh) 一种基于零拷贝技术的无线网络数据包捕获方法
US9634915B2 (en) Methods and computer program products for generating a model of network application health
Deri Improving passive packet capture: Beyond device polling
Phanishayee et al. Measurement and analysis of TCP throughput collapse in cluster-based storage systems.
CN108667853B (zh) 恶意攻击的检测方法和装置
US9021142B2 (en) Reflecting bandwidth and priority in network attached storage I/O
US20090161547A1 (en) Compression Mechanisms for Control Plane-Data Plane Processing Architectures
US8302109B2 (en) Synchronization optimized queuing system
WO2022105691A1 (zh) 防止ipfix消息丢失的方法及其应用、asic芯片
CN111600852A (zh) 一种基于可编程数据平面的防火墙设计方法
CN105978821B (zh) 网络拥塞避免的方法及装置
US8111700B2 (en) Computer-readable recording medium storing packet identification program, packet identification method, and packet identification device
Li et al. The comparison and verification of some efficient packet capture and processing technologies
Dickens FOBS: A lightweight communication protocol for grid computing
JP5613009B2 (ja) 高速フェイルオーバを用いた、パケット・ロスを防ぐエネルギー効率のよいethernet(r)のリンク移行のための方法、コンピュータ・プログラム、および装置
CN107277062B (zh) 数据包的并行处理方法及装置
Gu et al. Optimizing udp-based protocol implementations
Papadogiannakis et al. Stream-oriented network traffic capture and analysis for high-speed networks
WO2008121690A2 (en) Data and control plane architecture for network application traffic management device
Wu et al. The design and implementation of database audit system framework
Neeser et al. SoftRDMA: Implementing iWARP over TCP kernel sockets
Prakash et al. Jumbo frames or not: That is the question!
Zhang et al. Anatomy of UDP and M-VIA for cluster communication
Nikitinskiy et al. A stateless transport protocol in software defined networks
Huang et al. Accelerate in-line packet processing using fast queue

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant