CN109271268B - 一种基于dpdk的智能容错方法 - Google Patents

一种基于dpdk的智能容错方法 Download PDF

Info

Publication number
CN109271268B
CN109271268B CN201811026480.3A CN201811026480A CN109271268B CN 109271268 B CN109271268 B CN 109271268B CN 201811026480 A CN201811026480 A CN 201811026480A CN 109271268 B CN109271268 B CN 109271268B
Authority
CN
China
Prior art keywords
processor
intelligent fault
data receiving
thread
tolerant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811026480.3A
Other languages
English (en)
Other versions
CN109271268A (zh
Inventor
刘峰
李志恒
赵瑞东
李岩
朱书杉
刘强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chaoyue Technology Co Ltd
Original Assignee
Chaoyue Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chaoyue Technology Co Ltd filed Critical Chaoyue Technology Co Ltd
Priority to CN201811026480.3A priority Critical patent/CN109271268B/zh
Publication of CN109271268A publication Critical patent/CN109271268A/zh
Application granted granted Critical
Publication of CN109271268B publication Critical patent/CN109271268B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/54Indexing scheme relating to G06F9/54
    • G06F2209/548Queue

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供一种基于DPDK的智能容错方法,DPDK环境抽象层配置智能容错模块与各个处理器的连接接口及通信通道,使智能容错模块与各个处理器通过单独的通信通道通信连接;启动并运行DPDK环境抽象层,基于DPDK环境抽象层运行时启动智能容错模块;智能容错模块实时的读取处理器的运行参数,并对运行参数进行判断分析,输出判断分析结果。可以避免如果其中某个核心线程出现故障,会导致相应收发队列的数据报文无法处理,导致报文丢失的问题。

Description

一种基于DPDK的智能容错方法
技术领域
本发明涉及数据处理领域,尤其涉及一种基于DPDK的智能容错方法。
背景技术
随着网络通信技术的发展,网络带宽迅速提高,千兆、万兆网络逐渐普及,40Gb网络在电信运营商、大型企业级骨干网络中大规模应用。在新的网络形势下,面对大量高吞吐、高并发的网络环境,基于传统操作系统内核的网络数据收集机制在丢包率以及吞吐量方面已经难以匹配现有的需求。在当前高速网络中,高性能系统需要在极其有限的时间内成功地收集和处理大量数据,因此如何高效、完整、快速捕获数据包,是准确分析网络数据的基础以及进行下一步管控的关键。
DPDK即英特尔数据平面开发套件,是基于X86平台开发专为报文快速处理而提供的一系列库和驱动的集合。DPDK通过环境抽象层数据平面功能以取代内核的系统调用,使用UIO机制使网卡驱动程序运行在用户态,绕开内核网络协议栈,采用轮询和零拷贝技术从网卡收取报文,并且使用大页和CPU亲和机制提高应用程序处理报文的性能,由此可以节约开销,达到提高数据包处理性能的要求。
随着通用多核处理器的技术发展,目前往往采用基于DPDK的多核心、多队列网络数据包收发的加速设计,提高了网络数据报文的收发速率和吞吐率。在此软件架构中,如果其中某个核心线程出现故障,会导致相应收发队列的数据报文无法处理,进而导致报文丢失。
发明内容
为了克服上述现有技术中的不足,本发明提供一种基于DPDK的智能容错方法,方法包括:
步骤一,DPDK环境抽象层配置智能容错模块与各个处理器的连接接口及通信通道,使智能容错模块与各个处理器通过单独的通信通道通信连接;
步骤二,启动并运行DPDK环境抽象层,基于DPDK环境抽象层运行时启动智能容错模块;
步骤三,智能容错模块实时的读取处理器的运行参数,并对运行参数进行判断分析,输出判断分析结果。
优选地,步骤二的启动并运行DPDK环境抽象层还包括:
运行DPDK环境抽象层对系统的内存、日志以及PCI总线进行初始化;
运行DPDK环境抽象层对多线程框架的初始化,创建预设数量的线程,绑定到智能容错模块以及系统的每个处理器;
运行DPDK环境抽象层对各个处理器执行应用初始化程序,处理器初始化完毕后,DPDK环境抽象层通过远程方式启动每个处理器上的收发包线程,以及智能容错模块的收发包线程。
优选地,步骤三还包括:
智能容错模块对各个处理器线程运行状态进行实时监控;
当检测到处理器的某一数据处理线程出现故障,则对所述线程进行初始化,重新启动所述线程,将故障信息,初始化信息以及重启信息记录至日志中,并形成智能容错机制,保证数据包接收或发送队列不会出现拥塞,而导致网络丢包或中断。
优选地,步骤三还包括:
当某一处理器的运行参数存在异常,智能容错模块读取与所述处理器相应的数据收发队列的负载信息,并根据队列的负载信息判断数据收发是否正常;
如果数据收发不正常,智能容错模块初始化所述处理器,并重启运行在所述处理器上的线程,智能容错模块对重启运行在所述处理器上的线程进行监测。
优选地,步骤三还包括:
当处理器的某一线程运行时长超出阈值时,智能容错模块读取与处理器所述线程的相应数据收发队列负载信息,判断数据收发队列当前的负载信息是否运行超时;
如果数据收发队列当前的负载信息运行超时,智能容错模块初始化所述处理器,并重启运行所述处理器上的数据收发队列,数据收发队列再次执行在先运行超时长的线程,智能容错模块判断是否再次超时;
如再次超时,再初始化所述处理器,并重启运行所述处理器上的数据收发队列,进行判断;如达到预设重启次数后,仍运行超时,则向DPDK环境抽象层发出线程运行超时长提示。
优选地,步骤三还包括:
当处理器的结束当前的线程未能自动跳转至下一接续线程时,智能容错模块读取与处理器所述线程的相应数据收发队列负载信息,控制执行下一接续线程;
如果执行完接续线程后仍未能自动跳转至下一接续线程时,智能容错模块初始化所述处理器,并重启运行所述处理器上的数据收发队列,数据收发队列再次执行接续线程,执行完成后,智能容错模块判断是否能自动跳转至下一接续线程;
如再次未能自动跳转至下一接续线程时,初始化所述处理器,并重启运行所述处理器上的数据收发队列,进行判断;如达到预设重启次数后,仍未能自动跳转至下一接续线程时,则向DPDK环境抽象层发出未能自动跳转至下一接续线程提示。
优选地,步骤三还包括:
当处理器的结束当前的数据收发队列,且未能自动跳转至下一接续数据收发队列时,智能容错模块读取与处理器所述数据收发队列负载信息,控制执行下一接续数据收发队列;
如果执行完接续数据收发队列后仍未能自动跳转至下一接续数据收发队列时,智能容错模块初始化所述处理器,并重启运行所述处理器上的数据收发队列,再次执行接续数据收发队列,执行完成后,智能容错模块判断是否能自动跳转至下一接续数据收发队列;
如再次未能自动跳转至下一接续数据收发队列时,初始化所述处理器,并重启运行所述处理器上的数据收发队列,进行判断;如达到预设重启次数后,仍未能自动跳转至下一接续数据收发队列时,则向DPDK环境抽象层发出未能自动跳转至下一接续数据收发队列提示。
优选地,步骤三还包括:
智能容错模块每经过一预设时长读取处理器的运行参数,并对运行参数进行判断分析,输出判断分析结果。
优选地,步骤三还包括:
智能容错模块将当前读取到的处理器的运行参数缓存至容错缓存区,再经过一预设时长后,再次读取处理器的运行参数,并将再次读取处理器的运行参数缓存至容错缓存区;
当缓存至预设次数数量的读取处理器运行参数后,将缓存数据信息存储至智能容错模块的储存器内。
从以上技术方案可以看出,本发明具有以下优点:
智能容错模块实时的读取处理器的运行参数,并对运行参数进行判断分析,输出判断分析结果。可以避免如果其中某个核心线程出现故障,会导致相应收发队列的数据报文无法处理,导致报文丢失的问题。
本发明中,当某一处理器的运行参数存在异常,智能容错模块读取与所述处理器相应的数据收发队列的负载信息,并根据队列的负载信息判断数据收发是否正常;如果数据收发不正常,智能容错模块初始化所述处理器,并重启运行在所述处理器上的线程,智能容错模块对重启运行在所述处理器上的线程进行监测。这样可以自动恢复系统运行,自动排查排除故障。
智能容错模块配置有数据读取及处理日志,数据读取及处理日志实时记录读取到处理器的运行参数异常信息,或处理器的数据处理线程故障信息,以及后续处理过程。数据读取及处理日志保存在智能容错模块的储存器内,防止日志信息丢失。
附图说明
为了更清楚地说明本发明的技术方案,下面将对描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为基于DPDK的智能容错方法流程图;
图2为基于DPDK的智能容错方法实施例流程图;
图3为基于DPDK的智能容错方法实施例流程图;
图4为基于DPDK的智能容错方法实施例流程图。
具体实施方式
本发明提供一种基于DPDK的智能容错方法,如图1所示,方法包括:
S1,DPDK环境抽象层配置智能容错模块与各个处理器的连接接口及通信通道,使智能容错模块与各个处理器通过单独的通信通道通信连接;
S2,启动并运行DPDK环境抽象层,基于DPDK环境抽象层运行时启动智能容错模块;
S3,智能容错模块实时的读取处理器的运行参数,并对运行参数进行判断分析,输出判断分析结果。
智能容错模块实时的读取处理器的运行参数,并对运行参数进行判断分析,输出判断分析结果。可以避免如果其中某个核心线程出现故障,会导致相应收发队列的数据报文无法处理,导致报文丢失的问题。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将运用具体的实施例及附图,对本发明保护的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本专利中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利保护的范围。
本发明提供的实施例中,如图2所示,
S11,DPDK环境抽象层配置智能容错模块与各个处理器的连接接口及通信通道,使智能容错模块与各个处理器通过单独的通信通道通信连接;
S12,运行DPDK环境抽象层对系统的内存、日志以及PCI总线进行初始化;
S13,运行DPDK环境抽象层对多线程框架的初始化,创建预设数量的线程,绑定到智能容错模块以及系统的每个处理器;
S14,运行DPDK环境抽象层对各个处理器执行应用初始化程序,处理器初始化完毕后,DPDK环境抽象层通过远程方式启动每个处理器上的收发包线程,以及智能容错模块的收发包线程。
S15,智能容错模块实时的读取处理器的运行参数,并对运行参数进行判断分析,输出判断分析结果。
如果在硬件中实现,本发明涉及一种装置,例如可以作为处理器或者集成电路装置,诸如集成电路芯片或芯片组。可替换地或附加地,如果软件或固件中实现,所述技术可实现至少部分地由计算机可读的数据存储介质,包括指令,当执行时,使处理器执行一个或更多的上述方法。例如,计算机可读的数据存储介质可以存储诸如由处理器执行的指令。
本发明提供的实施例中,如图3所示,
S21,DPDK环境抽象层配置智能容错模块与各个处理器的连接接口及通信通道,使智能容错模块与各个处理器通过单独的通信通道通信连接;
S22,启动并运行DPDK环境抽象层,基于DPDK环境抽象层运行时启动智能容错模块;
S23,智能容错模块对各个处理器线程运行状态进行实时监控;
S24,当检测到处理器的某一数据处理线程出现故障,则对所述线程进行初始化,重新启动所述线程,将故障信息,初始化信息以及重启信息记录至日志中,并形成智能容错机制,保证数据包接收或发送队列不会出现拥塞,而导致网络丢包或中断。
本发明提供的实施例中,如图4所示,
S31,DPDK环境抽象层配置智能容错模块与各个处理器的连接接口及通信通道,使智能容错模块与各个处理器通过单独的通信通道通信连接;
S32,运行DPDK环境抽象层对系统的内存、日志以及PCI总线进行初始化;
S33,运行DPDK环境抽象层对多线程框架的初始化,创建预设数量的线程,绑定到智能容错模块以及系统的每个处理器;
S34,运行DPDK环境抽象层对各个处理器执行应用初始化程序,处理器初始化完毕后,DPDK环境抽象层通过远程方式启动每个处理器上的收发包线程,以及智能容错模块的收发包线程。
S35,智能容错模块对各个处理器线程运行状态进行实时监控;
S36,当检测到处理器的某一数据处理线程出现故障,则对所述线程进行初始化,重新启动所述线程,将故障信息,初始化信息以及重启信息记录至日志中,并形成智能容错机制,保证数据包接收或发送队列不会出现拥塞,而导致网络丢包或中断。
本发明提供的实施例中,DPDK环境抽象层配置智能容错模块与各个处理器的连接接口及通信通道,使智能容错模块与各个处理器通过单独的通信通道通信连接;
运行DPDK环境抽象层对系统的内存、日志以及PCI总线进行初始化;
运行DPDK环境抽象层对多线程框架的初始化,创建预设数量的线程,绑定到智能容错模块以及系统的每个处理器;
运行DPDK环境抽象层对各个处理器执行应用初始化程序,处理器初始化完毕后,DPDK环境抽象层通过远程方式启动每个处理器上的收发包线程,以及智能容错模块的收发包线程。
当某一处理器的运行参数存在异常,智能容错模块读取与所述处理器相应的数据收发队列的负载信息,并根据队列的负载信息判断数据收发是否正常;
如果数据收发不正常,智能容错模块初始化所述处理器,并重启运行在所述处理器上的线程,智能容错模块对重启运行在所述处理器上的线程进行监测。
本发明提供的实施例中,DPDK环境抽象层配置智能容错模块与各个处理器的连接接口及通信通道,使智能容错模块与各个处理器通过单独的通信通道通信连接;
运行DPDK环境抽象层对系统的内存、日志以及PCI总线进行初始化;
运行DPDK环境抽象层对多线程框架的初始化,创建预设数量的线程,绑定到智能容错模块以及系统的每个处理器;
运行DPDK环境抽象层对各个处理器执行应用初始化程序,处理器初始化完毕后,DPDK环境抽象层通过远程方式启动每个处理器上的收发包线程,以及智能容错模块的收发包线程。
当处理器的某一线程运行时长超出阈值时,智能容错模块读取与处理器所述线程的相应数据收发队列负载信息,判断数据收发队列当前的负载信息是否运行超时;
如果数据收发队列当前的负载信息运行超时,智能容错模块初始化所述处理器,并重启运行所述处理器上的数据收发队列,数据收发队列再次执行在先运行超时长的线程,智能容错模块判断是否再次超时;
如再次超时,再初始化所述处理器,并重启运行所述处理器上的数据收发队列,进行判断;如达到预设重启次数后,仍运行超时,则向DPDK环境抽象层发出线程运行超时长提示。
本发明提供的实施例中,DPDK环境抽象层配置智能容错模块与各个处理器的连接接口及通信通道,使智能容错模块与各个处理器通过单独的通信通道通信连接;
运行DPDK环境抽象层对系统的内存、日志以及PCI总线进行初始化;
运行DPDK环境抽象层对多线程框架的初始化,创建预设数量的线程,绑定到智能容错模块以及系统的每个处理器;
运行DPDK环境抽象层对各个处理器执行应用初始化程序,处理器初始化完毕后,DPDK环境抽象层通过远程方式启动每个处理器上的收发包线程,以及智能容错模块的收发包线程。
当处理器的结束当前的线程未能自动跳转至下一接续线程时,智能容错模块读取与处理器所述线程的相应数据收发队列负载信息,控制执行下一接续线程;
如果执行完接续线程后仍未能自动跳转至下一接续线程时,智能容错模块初始化所述处理器,并重启运行所述处理器上的数据收发队列,数据收发队列再次执行接续线程,执行完成后,智能容错模块判断是否能自动跳转至下一接续线程;
如再次未能自动跳转至下一接续线程时,初始化所述处理器,并重启运行所述处理器上的数据收发队列,进行判断;如达到预设重启次数后,仍未能自动跳转至下一接续线程时,则向DPDK环境抽象层发出未能自动跳转至下一接续线程提示。
本发明提供的实施例中,DPDK环境抽象层配置智能容错模块与各个处理器的连接接口及通信通道,使智能容错模块与各个处理器通过单独的通信通道通信连接;
运行DPDK环境抽象层对系统的内存、日志以及PCI总线进行初始化;
运行DPDK环境抽象层对多线程框架的初始化,创建预设数量的线程,绑定到智能容错模块以及系统的每个处理器;
运行DPDK环境抽象层对各个处理器执行应用初始化程序,处理器初始化完毕后,DPDK环境抽象层通过远程方式启动每个处理器上的收发包线程,以及智能容错模块的收发包线程。
当处理器的结束当前的数据收发队列,且未能自动跳转至下一接续数据收发队列时,智能容错模块读取与处理器所述数据收发队列负载信息,控制执行下一接续数据收发队列;
如果执行完接续数据收发队列后仍未能自动跳转至下一接续数据收发队列时,智能容错模块初始化所述处理器,并重启运行所述处理器上的数据收发队列,再次执行接续数据收发队列,执行完成后,智能容错模块判断是否能自动跳转至下一接续数据收发队列;
如再次未能自动跳转至下一接续数据收发队列时,初始化所述处理器,并重启运行所述处理器上的数据收发队列,进行判断;如达到预设重启次数后,仍未能自动跳转至下一接续数据收发队列时,则向DPDK环境抽象层发出未能自动跳转至下一接续数据收发队列提示。
本发明提供的实施例中,智能容错模块每经过一预设时长读取处理器的运行参数,并对运行参数进行判断分析,输出判断分析结果。这样可以避免太频繁的读取每个处理器的运行参数导致耗费系统资源,影响系统数据处理效率。
本发明提供的实施例中,智能容错模块将当前读取到的处理器的运行参数缓存至容错缓存区,再经过一预设时长后,再次读取处理器的运行参数,并将再次读取处理器的运行参数缓存至容错缓存区;
当缓存至预设次数数量的读取处理器运行参数后,将缓存数据信息存储至智能容错模块的储存器内。
如果读取到处理器的运行参数异常信息,或处理器的数据处理线程故障信息时,智能容错模块可以基于继续跟进读取异常信息,或线程故障信息的后续进程,并缓存在容错缓存区,便于用户调研读取,而且一个阶段一个阶段的缓存,可以使智能容错模块读取的数据具有一定的追溯性,便于用户查找,提高智能容错模块基于数据信息的读取。
其中智能容错模块配置有数据读取及处理日志,数据读取及处理日志实时记录读取到处理器的运行参数异常信息,或处理器的数据处理线程故障信息,以及后续处理过程。数据读取及处理日志保存在智能容错模块的储存器内,防止日志信息丢失。
计算机可读介质的计算机程序产品可以形成一部分,其可以包括包装材料。数据的计算机可读介质可以包括计算机存储介质,诸如随机存取存储器(RAM),只读存储器(ROM),非易失性随机存取存储器(NVRAM),电可擦可编程只读存储器(EEPROM),闪存,磁或光学数据存储介质,和类似物。在一些实施例中,一种制造产品可包括一个或多个计算机可读存储媒体。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种基于DPDK的智能容错方法,其特征在于,方法包括:
步骤一,DPDK环境抽象层配置智能容错模块与各个处理器的连接接口及通信通道,使智能容错模块与各个处理器通过单独的通信通道通信连接;
步骤二,启动并运行DPDK环境抽象层,基于DPDK环境抽象层运行时启动智能容错模块;
步骤三,智能容错模块实时的读取处理器的运行参数,并对运行参数进行判断分析,输出判断分析结果;
步骤三还包括:
智能容错模块对各个处理器线程运行状态进行实时监控;
当检测到处理器的某一数据处理线程出现故障,则对所述线程进行初始化,重新启动所述线程,将故障信息,初始化信息以及重启信息记录至日志中,并形成智能容错机制,保证数据包接收或发送队列不会出现拥塞,而导致网络丢包或中断。
2.根据权利要求1所述的基于DPDK的智能容错方法,其特征在于,
步骤二的启动并运行DPDK环境抽象层还包括:
运行DPDK环境抽象层对系统的内存、日志以及PCI总线进行初始化;
运行DPDK环境抽象层对多线程框架的初始化,创建预设数量的线程,绑定到智能容错模块以及系统的每个处理器;
运行DPDK环境抽象层对各个处理器执行应用初始化程序,处理器初始化完毕后,DPDK环境抽象层通过远程方式启动每个处理器上的收发包线程,以及智能容错模块的收发包线程。
3.根据权利要求1所述的基于DPDK的智能容错方法,其特征在于,
步骤三还包括:
当某一处理器的运行参数存在异常,智能容错模块读取与所述处理器相应的数据收发队列的负载信息,并根据队列的负载信息判断数据收发是否正常;
如果数据收发不正常,智能容错模块初始化所述处理器,并重启运行在所述处理器上的线程,智能容错模块对重启运行在所述处理器上的线程进行监测。
4.根据权利要求1所述的基于DPDK的智能容错方法,其特征在于,
步骤三还包括:
当处理器的某一线程运行时长超出阈值时,智能容错模块读取与处理器所述线程的相应数据收发队列负载信息,判断数据收发队列当前的负载信息是否运行超时;
如果数据收发队列当前的负载信息运行超时,智能容错模块初始化所述处理器,并重启运行所述处理器上的数据收发队列,数据收发队列再次执行在先运行超时长的线程,智能容错模块判断是否再次超时;
如再次超时,再初始化所述处理器,并重启运行所述处理器上的数据收发队列,进行判断;如达到预设重启次数后,仍运行超时,则向DPDK环境抽象层发出线程运行超时长提示。
5.根据权利要求3所述的基于DPDK的智能容错方法,其特征在于,
步骤三还包括:
当处理器的结束当前的线程未能自动跳转至下一接续线程时,智能容错模块读取与处理器所述线程的相应数据收发队列负载信息,控制执行下一接续线程;
如果执行完接续线程后仍未能自动跳转至下一接续线程时,智能容错模块初始化所述处理器,并重启运行所述处理器上的数据收发队列,数据收发队列再次执行接续线程,执行完成后,智能容错模块判断是否能自动跳转至下一接续线程;
如再次未能自动跳转至下一接续线程时,初始化所述处理器,并重启运行所述处理器上的数据收发队列,进行判断;如达到预设重启次数后,仍未能自动跳转至下一接续线程时,则向DPDK环境抽象层发出未能自动跳转至下一接续线程提示。
6.根据权利要求3所述的基于DPDK的智能容错方法,其特征在于,
步骤三还包括:
当处理器的结束当前的数据收发队列,且未能自动跳转至下一接续数据收发队列时,智能容错模块读取与处理器所述数据收发队列负载信息,控制执行下一接续数据收发队列;
如果执行完接续数据收发队列后仍未能自动跳转至下一接续数据收发队列时,智能容错模块初始化所述处理器,并重启运行所述处理器上的数据收发队列,再次执行接续数据收发队列,执行完成后,智能容错模块判断是否能自动跳转至下一接续数据收发队列;
如再次未能自动跳转至下一接续数据收发队列时,初始化所述处理器,并重启运行所述处理器上的数据收发队列,进行判断;如达到预设重启次数后,仍未能自动跳转至下一接续数据收发队列时,则向DPDK环境抽象层发出未能自动跳转至下一接续数据收发队列提示。
7.根据权利要求1所述的基于DPDK的智能容错方法,其特征在于,
步骤三还包括:
智能容错模块每经过一预设时长读取处理器的运行参数,并对运行参数进行判断分析,输出判断分析结果。
8.根据权利要求7所述的基于DPDK的智能容错方法,其特征在于,
步骤三还包括:
智能容错模块将当前读取到的处理器的运行参数缓存至容错缓存区,再经过一预设时长后,再次读取处理器的运行参数,并将再次读取处理器的运行参数缓存至容错缓存区;
当缓存至预设次数数量的读取处理器运行参数后,将缓存数据信息存储至智能容错模块的储存器内。
CN201811026480.3A 2018-09-04 2018-09-04 一种基于dpdk的智能容错方法 Active CN109271268B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811026480.3A CN109271268B (zh) 2018-09-04 2018-09-04 一种基于dpdk的智能容错方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811026480.3A CN109271268B (zh) 2018-09-04 2018-09-04 一种基于dpdk的智能容错方法

Publications (2)

Publication Number Publication Date
CN109271268A CN109271268A (zh) 2019-01-25
CN109271268B true CN109271268B (zh) 2022-03-18

Family

ID=65188205

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811026480.3A Active CN109271268B (zh) 2018-09-04 2018-09-04 一种基于dpdk的智能容错方法

Country Status (1)

Country Link
CN (1) CN109271268B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109951532B (zh) * 2019-02-27 2021-09-24 江苏省未来网络创新研究院 一种基于dpdk的流量模型自动变换装置
CN111277514B (zh) * 2020-01-21 2023-07-18 新华三技术有限公司合肥分公司 一种报文队列分配方法、报文转发方法及相关装置
CN117667357A (zh) * 2023-12-14 2024-03-08 江苏新质信息科技有限公司 一种多核并发轮询调度方法、装置、电子设备及存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100361081C (zh) * 2005-01-18 2008-01-09 华为技术有限公司 处理多线程/多任务/多处理器的方法
CN103744760A (zh) * 2013-12-30 2014-04-23 哈尔滨工业大学 基于门级症状的硬件故障检测方法
US9389976B2 (en) * 2014-04-09 2016-07-12 Intel Corporation Distributed persistent memory using asynchronous streaming of log records
CN104601668B (zh) * 2014-12-24 2019-01-18 北京京东尚科信息技术有限公司 基于状态管理的数据推送方法、装置和系统
US20160275026A1 (en) * 2015-03-20 2016-09-22 Intel Corporation Weakly ordered doorbell
US10425348B2 (en) * 2015-07-22 2019-09-24 The Regents Of The University Of Colorado Stateless network functions
AU2015101806A4 (en) * 2015-12-02 2016-01-28 Macau University Of Science And Technology A High-Efficient Packet I/O Engine for Commodity PC
AU2016382952B2 (en) * 2015-12-29 2018-08-02 Amazon Technologies, Inc. Networking technologies
CN107196870B (zh) * 2017-07-20 2021-07-20 哈尔滨工业大学 一种基于dpdk的流量动态负载均衡方法
CN107911237B (zh) * 2017-11-10 2021-05-04 南京邮电大学 一种基于dpdk的用户空间内数据包快速检测方法
CN108062269B (zh) * 2017-12-05 2020-12-11 上海交通大学 一种基于dpdk的计算资源弹性伸缩方法及系统
CN108171043A (zh) * 2017-12-28 2018-06-15 山东超越数控电子股份有限公司 一种计算机接口通信保护和异常告警方法与装置
CN108345502A (zh) * 2018-01-15 2018-07-31 中兴飞流信息科技有限公司 基于dpdk的资源调度方法、装置、终端设备及可读存储介质

Also Published As

Publication number Publication date
CN109271268A (zh) 2019-01-25

Similar Documents

Publication Publication Date Title
CN109271268B (zh) 一种基于dpdk的智能容错方法
US10884786B2 (en) Switch device, switching method, and computer program product
WO2015100878A1 (zh) 一种芯片启动方法及多核处理器芯片、存储介质
CN108023829B (zh) 报文处理方法及装置、存储介质、电子设备
US11301296B2 (en) Memory management based on classification of a software process
US9026629B2 (en) Graceful out-of-band power control of remotely-managed computer systems
CN106921665B (zh) 一种报文处理方法及网络设备
KR20130108613A (ko) 프로세스 간 통신을 위한 방법, 장치 및 컴퓨터 기록 매체
CN112769905B (zh) 一种基于numa架构的飞腾平台下高性能网卡性能优化方法
CN115150328B (zh) 一种流表硬件卸载方法、设备及介质
CN111163018A (zh) 网络设备及其降低传输时延的方法
US20170364279A1 (en) Systems and methods for non-uniform memory access aligned i/o for virtual machines
US20140280709A1 (en) Flow director-based low latency networking
CN110391989B (zh) 一种进行数据传输的方法和装置
CN114257559A (zh) 一种数据报文的转发方法及装置
CN116233018A (zh) 报文处理方法、装置、电子设备及存储介质
EP3576359A1 (en) Method and device for volume expansion of virtual network function
CN112261142A (zh) 一种rdma网络的数据重传方法、装置及fpga
CN107623581A (zh) 服务列表生成方法、装置及系统,获取、上报方法及装置
CN108512673B (zh) 一种云服务质量监控方法、装置及服务器
CN114257492B (zh) 智能网卡的故障处理方法、装置、计算机设备和介质
CN110309036B (zh) 一种cpu占用率检测方法及检测设备
CN115576698A (zh) 一种网卡中断聚合方法、装置、设备及介质
CN100589417C (zh) 处理电信网管系统拓扑界面大量上报消息的系统和方法
CN112783713A (zh) 一种多核虚拟机卡顿的处理方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Liu Feng

Inventor after: Li Zhiheng

Inventor after: Zhao Ruidong

Inventor after: Li Yan

Inventor after: Zhu Shushan

Inventor after: Liu Qiang

Inventor before: Zhao Ruidong

Inventor before: Li Yan

Inventor before: Zhu Shushan

Inventor before: Liu Qiang

CB02 Change of applicant information
CB02 Change of applicant information

Address after: 250101 no.2877 Kehang Road, Suncun Town, high tech Zone, Jinan City, Shandong Province

Applicant after: Chaoyue Technology Co.,Ltd.

Address before: 250101 no.2877 Kehang Road, Suncun Town, high tech Zone, Jinan City, Shandong Province

Applicant before: SHANDONG CHAOYUE DATA CONTROL ELECTRONICS Co.,Ltd.

GR01 Patent grant
GR01 Patent grant