CN109491713B - 一种基于网络芯片的检测挂死恢复方法 - Google Patents

一种基于网络芯片的检测挂死恢复方法 Download PDF

Info

Publication number
CN109491713B
CN109491713B CN201811301328.1A CN201811301328A CN109491713B CN 109491713 B CN109491713 B CN 109491713B CN 201811301328 A CN201811301328 A CN 201811301328A CN 109491713 B CN109491713 B CN 109491713B
Authority
CN
China
Prior art keywords
time point
network chip
detected
total packet
hang
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811301328.1A
Other languages
English (en)
Other versions
CN109491713A (zh
Inventor
王胜名
刘德俊
王乾
马红兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NANJING BALANCE NETWORK TECHNOLOGY CO LTD
Original Assignee
NANJING BALANCE NETWORK TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NANJING BALANCE NETWORK TECHNOLOGY CO LTD filed Critical NANJING BALANCE NETWORK TECHNOLOGY CO LTD
Priority to CN201811301328.1A priority Critical patent/CN109491713B/zh
Publication of CN109491713A publication Critical patent/CN109491713A/zh
Application granted granted Critical
Publication of CN109491713B publication Critical patent/CN109491713B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4418Suspend and resume; Hibernate and awake
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7807System on chip, i.e. computer system on a single chip; System in package, i.e. computer system on one or more chips in a single package
    • G06F15/7825Globally asynchronous, locally synchronous, e.g. network on chip

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种基于网络芯片的检测挂死恢复方法,应对NP挂死的情况,对NP进实时监测,在检测出现挂死的情况,进行快速复位。检测方式为在一段时间内检测NP输入端口的总进包数量并进行对比,排除出现错包的问题,进行对比如果出现不一致的情况则判定出现NP挂死的现象。检测到NP挂死后,进行快速复位。检测方式不仅快捷、迅速,而且占用极少的内存,从而在检测的同时保证网络芯片的处理速度;实现出现突发情况后快速处理,提高产品稳定性;保证整个地区的网络不会出现长时间的网络故障;降低顾客的投诉率;节省运营商的人力成本。

Description

一种基于网络芯片的检测挂死恢复方法
技术领域
本发明属于网络芯片实时检测技术领域,尤其涉及一种基于网络芯片的检测挂死恢复方法。
背景技术
网络芯片(NP,Networking Processor)是一个提供在通信网络中发送和接收数据逻辑的微处理器,NP是一种可编程器件,它特定的应用于通信领域的各种任务,比如包处理、协议分析、路由查找、声音/数据的汇聚、防火墙等。
但是,由于线网流量的复杂程度很高,会导致NP在线网运行过程中出现挂死的问题,从而导致设备故障,引起整个地区的网络故障。除此之外,在测试过程中无法模拟出复杂的线网的流量,不能覆盖完全测试出导致NP挂死的包,使得无法快速、及时的进行复位,即无法快速的恢复正常流量处理功能。
发明内容
为解决上述技术问题,本发明提供一种基于网络芯片的检测挂死恢复方法。
本发明采用如下技术方案:
在一些可选的实施例中,提供一种基于网络芯片的检测挂死恢复方法,包括:分别在第一时间点及第二时间点,检测NP输入端口的总进包数量;判断在所述第一时间点检测出的总进包数量与在所述第二时间点检测出的总进包数量是否相同;若是判断结果为不同,则判定所述NP挂死。
在一些可选的实施例中,所述的一种基于网络芯片的检测挂死恢复方法,还包括:当在所述第一时间点检测出总进包数量后,以及当在所述第二时间点检测出总进包数量后,均将检测出的总进包数量保存到程序的内存中。
在一些可选的实施例中,所述检测网络芯片输入端口的总进包数量的过程包括:查询所述NP各个输入端口的进包数量;将所述NP各个输入端口的进包数量相加,获取总进包数量。
在一些可选的实施例中,所述判断在所述第一时间点检测出的总进包数量与在所述第二时间点检测出的总进包数量是否相同的过程包括:计算在所述第一时间点检测出的总进包数量与在所述第二时间点检测出的总进包数量的差值;判断所述差值是否为0,若为0,则判定在所述第一时间点检测出的总进包数量与在所述第二时间点检测出的总进包数量相同,否则,判定在所述第一时间点检测出的总进包数量与在所述第二时间点检测出的总进包数量不同。
在一些可选的实施例中,所述的一种基于网络芯片的检测挂死恢复方法,还包括:当判定所述NP挂死时,进行NP复位。
在一些可选的实施例中,所述的一种基于网络芯片的检测挂死恢复方法,还包括:在进行NP复位的过程中,记录复位次数;判断复位次数是否达到预设值,若是达到预设值,则重新初始化NP。
在一些可选的实施例中,所述第一时间点与所述第二时间点之间的时间间隔为3秒。
本发明所带来的有益效果:通过在一段时间内检测网络芯片输入端口的总进包数量并进行对比,以判定网络芯片是否挂死,检测方式不仅快捷、迅速,而且占用极少的内存,从而在检测的同时保证网络芯片的处理速度;实现出现突发情况后快速处理,提高产品稳定性;保证整个地区的网络不会出现长时间的网络故障;降低顾客的投诉率;节省运营商的人力成本。
附图说明
图1是本发明一种基于网络芯片的检测挂死恢复方法的流程示意图。
具体实施方式
以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。其他实施方案可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施方案的部分和特征可以被包括在或替换其他实施方案的部分和特征。本发明的实施方案的范围包括权利要求书的整个范围,以及权利要求书的所有可获得的等同物。
如图1所示,在一些说明性的实施例中,提供一种基于网络芯片的检测挂死恢复方法,包括:
第一次统计:
101:在第一时间点,检测NP输入端口的总进包数量。
其中,第一时间为NP工作过程中的任意时间点。
在第一时间点检测NP输入端口的总进包数量的过程包括:首先,查询NP各个输入端口的进包数量;然后,将NP各个输入端口的进包数量相加,获取总进包数量。保证检测进包数量的准确性,且检测方式迅速。
102:将在第一时间点检测出的NP输入端口的总进包数量保存到程序的内存中。不仅易调出,而且便于之后进行对比计算。
第二次统计:
103:在第二时间点,检测NP输入端口的总进包数量。
其中,第二时间点位于第一时间之后,且优选的,第一时间点与第二时间点之间的时间间隔为3秒,使得之后依据两个时间点进包数量进行对比得出的判定结果更加准确。
在第二时间点检测NP输入端口的总进包数量的过程包括:首先,查询NP各个输入端口的进包数量;然后,将NP各个输入端口的进包数量相加,获取总进包数量。保证检测进包数量的准确性,且检测方式迅速。
104:将在第二时间点检测出的NP输入端口的总进包数量保存到程序的内存中。不仅易调出,而且便于之后进行对比计算。
105:判断在第一时间点检测出的总进包数量与在第二时间点检测出的总进包数量是否相同,若相同,则证明NP功能正常,若判断结果为不同,则进行步骤106。
判断在第一时间点检测出的总进包数量与在第二时间点检测出的总进包数量是否相同的过程包括:首先,计算在第一时间点检测出的总进包数量与在第二时间点检测出的总进包数量的差值;然后,判断差值是否为0,若为0,则判定在第一时间点检测出的总进包数量与在第二时间点检测出的总进包数量相同,否则,判定在第一时间点检测出的总进包数量与在第二时间点检测出的总进包数量不同。判断方式不仅简洁、迅速,而且有效、准确率高。
106:判定NP挂死。
107:调用NP提供的接口进行NP复位。对NP进行实时监测,在检测出现挂死的情况时,进行快速复位,即恢复正常流量处理功能。实现出现突发情况后快速处理,提高产品稳定性;保证整个地区的网络不会出现长时间的网络故障。
108:在进行NP复位的过程中,记录复位次数。
109:判断复位次数是否达到预设值,若是达到预设值,则进行步骤110,否则返回步骤108。避免NP一直处于复位状态中,当多次复位未成功时,及时重新初始化,优化操作流程。
110:重新初始化NP。
本领域技术人员还应当理解,结合本文的实施例描述的各种说明性的逻辑框、模块、电路和算法步骤均可以实现成电子硬件、计算机软件或其组合。为了清楚地说明硬件和软件之间的可交换性,上面对各种说明性的部件、框、模块、电路和步骤均围绕其功能进行了一般地描述。至于这种功能是实现成硬件还是实现成软件,取决于特定的应用和对整个系统所施加的设计约束条件。熟练的技术人员可以针对每个特定应用,以变通的方式实现所描述的功能,但是,这种实现决策不应解释为背离本公开的保护范围。

Claims (4)

1.一种基于网络芯片的检测挂死恢复方法,其特征在于,包括:
分别在第一时间点及第二时间点,检测网络芯片输入端口的总进包数量;
判断在所述第一时间点检测出的总进包数量与在所述第二时间点检测出的总进包数量是否相同;
若是判断结果为不同,则判定所述网络芯片挂死;还包括:当在所述第一时间点检测出总进包数量后,以及当在所述第二时间点检测出总进包数量后,均将检测出的总进包数量保存到程序的内存中;所述检测网络芯片输入端口的总进包数量的过程包括:
查询所述网络芯片各个输入端口的进包数量;
将所述网络芯片各个输入端口的进包数量相加,获取总进包数量;所述判断在所述第一时间点检测出的总进包数量与在所述第二时间点检测出的总进包数量是否相同的过程包括:
计算在所述第一时间点检测出的总进包数量与在所述第二时间点检测出的总进包数量的差值;
判断所述差值是否为0,若为0,则判定在所述第一时间点检测出的总进包数量与在所述第二时间点检测出的总进包数量相同,否则,判定在所述第一时间点检测出的总进包数量与在所述第二时间点检测出的总进包数量不同。
2.根据权利要求1所述的一种基于网络芯片的检测挂死恢复方法,其特征在于,还包括:当判定所述网络芯片挂死时,进行网络芯片复位。
3.根据权利要求2所述的一种基于网络芯片的检测挂死恢复方法,其特征在于,还包括:
在进行网络芯片复位的过程中,记录复位次数;
判断复位次数是否达到预设值,若是达到预设值,则重新初始化网络芯片。
4.根据权利要求3所述的一种基于网络芯片的检测挂死恢复方法,其特征在于,所述第一时间点与所述第二时间点之间的时间间隔为3秒。
CN201811301328.1A 2018-11-02 2018-11-02 一种基于网络芯片的检测挂死恢复方法 Active CN109491713B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811301328.1A CN109491713B (zh) 2018-11-02 2018-11-02 一种基于网络芯片的检测挂死恢复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811301328.1A CN109491713B (zh) 2018-11-02 2018-11-02 一种基于网络芯片的检测挂死恢复方法

Publications (2)

Publication Number Publication Date
CN109491713A CN109491713A (zh) 2019-03-19
CN109491713B true CN109491713B (zh) 2021-11-26

Family

ID=65692472

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811301328.1A Active CN109491713B (zh) 2018-11-02 2018-11-02 一种基于网络芯片的检测挂死恢复方法

Country Status (1)

Country Link
CN (1) CN109491713B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1956387A (zh) * 2005-10-24 2007-05-02 中兴通讯股份有限公司 一种提高通讯设备以太网口工作稳定性的方法
CN103246582A (zh) * 2012-02-07 2013-08-14 鼎桥通信技术有限公司 一种fpga故障检测方法和装置
CN104486109A (zh) * 2014-12-09 2015-04-01 大唐移动通信设备有限公司 一种故障检测、恢复方法及装置
CN105589772A (zh) * 2015-08-07 2016-05-18 杭州华三通信技术有限公司 检测fpga芯片逻辑挂死的方法和装置
CN105589776A (zh) * 2015-12-23 2016-05-18 华为技术有限公司 一种故障定位方法及服务器
CN105991358A (zh) * 2015-02-06 2016-10-05 中兴通讯股份有限公司 一种测试接口板流量的方法、装置、测试板及系统
CN106506265A (zh) * 2016-10-25 2017-03-15 杭州迪普科技股份有限公司 检测fpga芯片挂死的方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030225874A1 (en) * 2002-05-30 2003-12-04 International Business Machines Corporation Managing the sending of acknowledgments
WO2009147926A1 (ja) * 2008-06-06 2009-12-10 三菱電機株式会社 無線端末および通信システム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1956387A (zh) * 2005-10-24 2007-05-02 中兴通讯股份有限公司 一种提高通讯设备以太网口工作稳定性的方法
CN103246582A (zh) * 2012-02-07 2013-08-14 鼎桥通信技术有限公司 一种fpga故障检测方法和装置
CN104486109A (zh) * 2014-12-09 2015-04-01 大唐移动通信设备有限公司 一种故障检测、恢复方法及装置
CN105991358A (zh) * 2015-02-06 2016-10-05 中兴通讯股份有限公司 一种测试接口板流量的方法、装置、测试板及系统
CN105589772A (zh) * 2015-08-07 2016-05-18 杭州华三通信技术有限公司 检测fpga芯片逻辑挂死的方法和装置
CN105589776A (zh) * 2015-12-23 2016-05-18 华为技术有限公司 一种故障定位方法及服务器
CN106506265A (zh) * 2016-10-25 2017-03-15 杭州迪普科技股份有限公司 检测fpga芯片挂死的方法及装置

Also Published As

Publication number Publication date
CN109491713A (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
US10469364B2 (en) System and method for real-time load balancing of network packets
US9306819B2 (en) Controller driven OAM for split architecture network
US7990887B2 (en) Sampling test of network performance
US9692671B2 (en) Method and apparatus for automatically determining causes of service quality degradation
JP2006270961A (ja) パケットトレース診断システムおよび方法
CN108076019A (zh) 基于流量镜像的异常流量检测方法及装置
CN108259364B (zh) 一种网络拥塞确定方法及装置
CN109525736B (zh) 一种语音拨测环回方法及装置
CN112003747A (zh) 云虚拟网关的故障定位方法
CN111988170A (zh) 一种终端故障定位方法及装置
CN109491713B (zh) 一种基于网络芯片的检测挂死恢复方法
EP4246913A2 (en) Method, device and computer-readable medium for measuring traffic hit time during path switch
CN112532467B (zh) 用于实现故障检测的方法、装置及系统
CN103874106A (zh) 一种无线通信中自适应关闭基站射频的方法
JP4983435B2 (ja) パケット通信品質計測装置及び方法
CN114710424B (zh) 基于软件定义网络的主机侧数据包处理延时测量方法
CN113055224B (zh) 一种设备内报文转发故障检测及装置
CN110890996B (zh) 网口状态的检测方法、设备及系统
CN107104856B (zh) 一种hub设备识别方法及装置
CN118250154A (zh) 故障定位方法、装置、设备及存储介质
CN114978868A (zh) 基于oam环路自检网络报文加速芯片功能异常的方法和装置
CN112702236A (zh) 一种实现丢包检测的方法和处理器
CN112001623A (zh) 软件负载均衡的健康度的评估方法、系统、介质和设备
JP2007243371A (ja) 異なり数上位nキーの推定方法および推定システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant