CN114978868A - 基于oam环路自检网络报文加速芯片功能异常的方法和装置 - Google Patents

基于oam环路自检网络报文加速芯片功能异常的方法和装置 Download PDF

Info

Publication number
CN114978868A
CN114978868A CN202210773808.8A CN202210773808A CN114978868A CN 114978868 A CN114978868 A CN 114978868A CN 202210773808 A CN202210773808 A CN 202210773808A CN 114978868 A CN114978868 A CN 114978868A
Authority
CN
China
Prior art keywords
message
self
oam
detected
port
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210773808.8A
Other languages
English (en)
Other versions
CN114978868B (zh
Inventor
江林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou DPTech Technologies Co Ltd
Original Assignee
Hangzhou DPTech Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou DPTech Technologies Co Ltd filed Critical Hangzhou DPTech Technologies Co Ltd
Priority to CN202210773808.8A priority Critical patent/CN114978868B/zh
Publication of CN114978868A publication Critical patent/CN114978868A/zh
Application granted granted Critical
Publication of CN114978868B publication Critical patent/CN114978868B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本公开涉及一种基于OAM环路自检网络报文加速芯片功能异常的方法和装置,该方法包括:创建OAM自检报文;OAM自检报文转发至交换芯片;OAM自检报文转发至网络报文加速芯片;OAM自检报文转回至业务板CPU;基于OAM自检报文进行验证;进行针对下一个待检测端口的检测,当判断完成对当前端口的检测时,业务板CPU构造针对网络报文加速芯片的下一个待检测端口的OAM自检报文,并对针对下一个待检测端口的OAM自检报文执行OAM自检报文转发至交换芯片步骤、OAM自检报文转发至网络报文加速芯片步骤、OAM自检报文转回至业务板CPU步骤、基于OAM自检报文进行验证步骤和进行针对下一个待检测端口的检测步骤直至完成对网络报文加速芯片的所有端口的一轮检测。

Description

基于OAM环路自检网络报文加速芯片功能异常的方法和装置
技术领域
本公开涉及网络通讯技术领域,具体而言,涉及一种基于OAM环路自检网络报文加速芯片功能异常的方法和装置。
背景技术
当今网络报文加速芯片在通讯行业尤其是在高性能转发方面存在着广泛应用。当网络出现较大拥塞、带宽负载较大时,网络报文加速芯片在转发网络数据报文的时候就可能会出现异常。在现实场景中,如果网络报文加速芯片出现较多丢包或者更改了数据包的内容等会导致重传,由此会加剧网络的拥堵程度。因此,在采用网络报文加速芯片转发数据报文时,需要检测网络报文加速芯片转发业务中的异常,然后通知设备做出相应处理,以降低网络拥塞。
具体而言,防火墙的设备由主控板以及业务板组成,主控作为设备的控制中心对业务板进行控制以及调度,业务板负责流量转发等业务,当前检测网络报文加速芯片异常的方案通常为业务出现异常造成网络问题后,维护人员借助设备日志对设备不同的模块所抓取的报文进行分析,最终定位到异常网络报文加速芯片模块。但在整个流程中对设备中其他模块进行抓取报文分析时,涉及到的定位时间长,并且如果要精准的定位到具体出现问题的某一个网络报文加速芯片的端口则需要更多的分析;此外,现有的检测方法为被动检测,当网络报文加速芯片出现异常时是通过网络问题反应出来的,维护人员不清楚具体的问题点,因此不能及时对设备的异常进行处理;同时,原有的方法缺乏设备主动处理网络报文加速芯片不同业务异常的方法,需要维护人员通过对异常报文的分析定位做出处理。
因此,需要一种能够主动对网络报文加速芯片的每个端口进行检测并在检测到异常时主动进行处理的基于OAM环路自检网络报文加速芯片功能异常的方法和装置。
发明内容
有鉴于此,本公开提供一种基于OAM环路自检网络报文加速芯片功能异常的方法和装置。根据本公开的一方面,提出一种基于OAM环路自检网络报文加速芯片功能异常的方法,该方法包括:创建OAM自检报文,业务板CPU构造针对网络报文加速芯片当前待检测端口的OAM自检报文,所述OAM自检报文包括HIG报文头,所述HIG报文头包括所述当前待检测端口,所述当前待检测端口为网络报文加速芯片在接收到所述OAM自检报文时处理所述OAM自检报文的端口;OAM自检报文转发至交换芯片,业务板CPU将所述OAM自检报文向与其互联的交换芯片转发;OAM自检报文转发至网络报文加速芯片,所述交换芯片在接收到所述OAM自检报文后,根据所述OAM自检报文的HIG报文头包括的所述当前待检测端口将所述OAM自检报文转发到与所述交换芯片互联的所述网络报文加速芯片的所述当前待检测端口处;OAM自检报文转回至业务板CPU,所述网络报文加速芯片在接收到所述OAM自检报文后,将所述OAM自检报文转回至与所述网络报文加速芯片互联的所述业务板CPU;基于OAM自检报文进行验证,当所述业务板CPU成功接收到所述OAM自检报文时,即为完成对所述当前待检测端口的检测;进行针对下一个待检测端口的检测,当判断完成对所述当前端口的检测时,所述业务板CPU构造针对网络报文加速芯片的所述下一个待检测端口的OAM自检报文,并对针对所述下一个待检测端口的OAM自检报文执行OAM自检报文转发至交换芯片步骤、OAM自检报文转发至网络报文加速芯片步骤、OAM自检报文转回至业务板CPU步骤、基于OAM自检报文进行验证步骤和进行针对下一个待检测端口的检测步骤直至完成对所述网络报文加速芯片的所有端口的一轮检测。
根据本公开的基于OAM环路自检网络报文加速芯片功能异常的方法,其还包括:指定检测间隔时长;在完成一轮针对所述网络报文加速芯片的所有端口的检测后,等待所述检测间隔时长后进行下一轮的针对所述网络报文加速芯片的所有端口的检测。
根据本公开的基于OAM环路自检网络报文加速芯片功能异常的方法,其还包括:指定待检测端口的重检次数N;当所述业务板CPU未接收到针对所述当前待检测端口的OAM自检报文时,所述业务板CPU针对所述当前待检测端口重复执行创建OAM自检报文步骤、OAM自检报文转发至交换芯片步骤、OAM自检报文转发至网络报文加速芯片步骤、OAM自检报文转回至业务板CPU步骤直至所述业务CPU接收到针对所述当前待检测端口的OAM自检报文或执行完N次重检以完成针对所述当前待检测端口的检测,并在完成针对所述当前待检测端口的检测后进行对所述下一个待检测端口的检测。
根据本公开的基于OAM环路自检网络报文加速芯片功能异常的方法,其中,所述业务板CPU在构造OAM自检报文时,通过自定义其所包含的五元组指定所述OAM自检报文所针对的自检业务类型。
根据本公开的基于OAM环路自检网络报文加速芯片功能异常的方法,其还包括:所述业务板CPU在接收到OAM自检报文时,对所述OAM自检报文进行验证,以判断所述网络报文加速芯片的所述当前待检测端口是否存在异常;当判断验证未通过时,所述业务板CPU向主控板CPU发送异常事件消息,所述主控板CPU在接收到异常事件消息后关闭所述当前待检测端口或启动业务板热插拔。
根据本公开的基于OAM环路自检网络报文加速芯片功能异常的方法,其还包括:所述业务板CPU在构造针对网络报文加速芯片待检测端口的OAM自检报文后,对所述OAM自检报文进行校验和计算,并在收到所述OAM自检报文后基于所述检验和完成对所述OAM自检报文的验证。
根据本公开的另一方面,提出一种基于OAM环路自检网络报文加速芯片功能异常的装置,该装置包括:OAM自检报文创建组件,用于业务板CPU构造针对网络报文加速芯片当前待检测端口的OAM自检报文,所述OAM自检报文包括HIG报文头,所述HIG报文头包括所述当前待检测端口,所述当前待检测端口为网络报文加速芯片在接收到所述OAM自检报文时处理所述OAM自检报文的端口;OAM自检报文第一转发组件,用于业务板CPU将所述OAM自检报文向与其互联的交换芯片转发;OAM自检报文第二转发组件,用于所述交换芯片在接收到所述OAM自检报文后,根据所述OAM自检报文的HIG报文头包括的所述当前待检测端口将所述OAM自检报文转发到与所述交换芯片互联的所述网络报文加速芯片的所述当前待检测端口处;OAM自检报文第三转发组件,用于所述网络报文加速芯片在接收到所述OAM自检报文后,将所述OAM自检报文转回至与所述网络报文加速芯片互联的所述业务板CPU;验证组件,用于OAM自检报文当所述业务板CPU成功接收到所述OAM自检报文时,即为判断完成对所述当前待检测端口的检测;自动循环检测组件,当判断完成对所述当前端口的检测时,调用OAM自检报文创建组件,用于所述业务板CPU构造针对网络报文加速芯片的下一个待检测端口的OAM自检报文,并对针对所述下一个待检测端口的OAM自检报文调用所述OAM自检报文第一转发组件、所述OAM自检报文第二转发组件和所述OAM自检报文第三转发组件直至完成对所述网络报文加速芯片的所有端口的一轮检测。
根据本公开的基于OAM环路自检网络报文加速芯片功能异常的装置,其还包括:延时组件,用于指定检测间隔时长,以及在完成一轮针对所述网络报文加速芯片的所有端口的检测后,等待所述检测间隔时长后进行下一轮的针对所述网络报文加速芯片的所有端口的检测。
根据本公开的基于OAM环路自检网络报文加速芯片功能异常的装置,其还包括:重检组件,用于指定待检测端口的重检次数N,以及当所述业务板CPU未接收到针对所述当前待检测端口的OAM自检报文时,所述业务板CPU针对所述当前待检测端口重复调用所述OAM自检报文创建组件、所述OAM自检报文第一转发组件、所述OAM自检报文第二转发组件和所述OAM自检报文第三转发组件直至所述业务CPU接收到针对所述当前待检测端口的OAM自检报文或执行完N次重检以完成针对所述当前待检测端口的检测,并在完成针对所述当前待检测端口的检测后进行对所述下一个待检测端口的检测。
根据本公开的基于OAM环路自检网络报文加速芯片功能异常的装置,其还包括:OAM自检报文业务类型自定义组件,用于所述业务板CPU在构造OAM自检报文时,通过自定义其所包含的五元组指定所述OAM自检报文所针对的自检业务类型。
根据本公开的基于OAM环路自检网络报文加速芯片功能异常的装置,其还包括异常处理组件,其中,所述验证组件,还用于所述业务板CPU在接收到OAM自检报文时,对所述OAM自检报文进行验证,以判断所述网络报文加速芯片的所述当前待检测端口是否存在异常;所述异常处理组件,用于当判断验证未通过时,所述业务板CPU向主控板CPU发送异常事件消息,所述主控板CPU在接收到异常事件消息后关闭所述当前待检测端口或启动业务板热插拔。
根据本公开的基于OAM环路自检网络报文加速芯片功能异常的装置,其中,所述验证组件还用于:所述业务板CPU在构造针对网络报文加速芯片待检测端口的OAM自检报文后,对所述OAM自检报文进行校验和计算,并在收到所述OAM自检报文后基于所述检验和完成对所述OAM自检报文的验证。
综上,采用本公开的基于OAM环路自检网络报文加速芯片功能异常的方法和装置,在设备进行报文转发业务时,进行转发的业务板CPU能够通过构造检测报文,检测不同的网络报文加速芯片端口,最终实现主动对网络报文加速芯片的每一个端口进行检测,并当检测到网络报文加速芯片的某一个端口发生异常时发送异常事件给主控,让主控做出相应处理以及发出告警日志。具体而言,设备通过业务板CPU构造的检测报文主动检测网络报文加速芯片端口异常;业务板CPU通过构造报文中的附加字段HIG头来指定网络报文加速芯片目的端口以使得发出的报文经过交换芯片时进行分流;自检报文可以根据业务类型构造,从而检测不同的业务异常事件,网络报文加速芯片接收到自检报文后会按照正常业务报文进行处理,从而实现检测的目的。使用本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的方法和装置,可以简化维护人员对网络报文加速芯片出现异常时的定位以及维护的流程;OAM自检能够对网络报文加速芯片不同的业务流程进行检测,出现异常时通知主控做出相应处理,增加了系统的可维护性;现有方法中没有针对网络报文加速芯片进行异常的主动检测,当出现网络转发问题时已经造成了严重后果,通过OAM自检的方法主控接收到异常事件时可以主动处理问题,从而降低了业务异常的风险。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
通过参照附图详细描述其示例实施例,本申请的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1所示的是根据本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的方法的流程示意图。
图2所示的是根据本公开另一实施例的基于OAM环路自检网络报文加速芯片功能异常的方法的简要流程示意图。
图3所示的是根据本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的装置的原理示意图。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、系统、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本公开所必须的,因此不能用于限制本公开的保护范围。
根据本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的方法和装置,业务板进行流量转发的业务通过网络报文加速芯片来加速报文的转发,并且所述业务板侧的所述网络报文加速芯片与业务板CPU之间通过交换芯片连接,主控与所述业务板间有管理通道可用于所述主控与所述业务板间内部通信;此外,所述业务板CPU构建的自检报文能够通过所述交换芯片的特殊算法识别五元组以及附加HIG头里面的模块ID以及端口ID,将OAM检测报文指定分流到待检测的网络报文加速芯片端口。
图1所示的是根据本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的方法的流程示意图。
如图1所示,在步骤S102中,创建OAM自检报文,业务板CPU构造针对网络报文加速芯片当前待检测端口的OAM自检报文,所述OAM自检报文包括HIG报文头,所述HIG报文头包括所述当前待检测端口,所述当前待检测端口为网络报文加速芯片在接收到所述OAM自检报文时处理所述OAM自检报文的端口。在步骤S104中,OAM自检报文转发至交换芯片,业务板CPU将所述OAM自检报文向与其互联的交换芯片转发。
在步骤S106中,OAM自检报文转发至网络报文加速芯片,所述交换芯片在接收到所述OAM自检报文后,根据所述OAM自检报文的HIG报文头包括的所述当前待检测端口将所述OAM自检报文转发到与所述交换芯片互联的所述网络报文加速芯片的所述当前待检测端口处。
在步骤S108中,OAM自检报文转回至业务板CPU,所述网络报文加速芯片在接收到所述OAM自检报文后,将所述OAM自检报文转回至与所述网络报文加速芯片互联的所述业务板CPU。
在步骤S110中,基于OAM自检报文进行验证,当所述业务板CPU成功接收到所述OAM自检报文时,即为完成对所述当前待检测端口的检测。
在步骤S112中,进行针对下一个待检测端口的检测,当判断完成对所述当前端口的检测时,所述业务板CPU构造针对网络报文加速芯片的所述下一个待检测端口的OAM自检报文,并对针对所述下一个待检测端口的OAM自检报文执行OAM自检报文转发至交换芯片步骤、OAM自检报文转发至网络报文加速芯片步骤、OAM自检报文转回至业务板CPU步骤、基于OAM自检报文进行验证步骤和进行针对下一个待检测端口的检测步骤直至完成对所述网络报文加速芯片的所有端口的一轮检测。
根据本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的方法,还包括:指定检测间隔时长;在完成一轮针对所述网络报文加速芯片的所有端口的检测后,等待所述检测间隔时长后进行下一轮的针对所述网络报文加速芯片的所有端口的检测。
更具体的,本公开实施例的OAM自检功能通过在业务板上用命令启动,开启后定时检测网络报文加速芯片的业务流程。检测开启时,在业务板CPU上构建基于网络报文加速芯片的OAM自检报文,在所述OAM自检报文的头部附加一组HIG头,用于将所述OAM自检报文通过交换芯片后分流到指定的网络报文加速芯片端口,网络报文加速芯片接收到所述OAM自检报文时,通过设备下发的策略路由,将所述OAM自检报文返回给业务板CPU,由此形成一个检测环路。当业务板CPU成功接收到所述OAM自检报文后则直接对下一个端口进行发包检测,一个轮次结束后等待一定时间后启动下一轮次检测。其中,在构建所述OAM自检报文时,所述OAM自检报文的附加字段可以填充当前待检测端口的信息,在接收侧通过识别端口信息来确认上次检测的端口。
根据本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的方法,还包括:指定待检测端口的重检次数N;当所述业务板CPU未接收到针对所述当前待检测端口的OAM自检报文时,所述业务板CPU针对所述当前待检测端口重复执行创建OAM自检报文步骤、OAM自检报文转发至交换芯片步骤、OAM自检报文转发至网络报文加速芯片步骤、OAM自检报文转回至业务板CPU步骤直至所述业务CPU接收到针对所述当前待检测端口的OAM自检报文或执行完N次重检以完成针对所述当前待检测端口的检测,并在完成针对所述当前待检测端口的检测后进行对所述下一个待检测端口的检测。
更具体的,当所述业务板CPU对当前待检测端口进行发包检测后,计时器开始计时,若判断经过一定时间所述业务板CPU仍未接收到所述OAM自检报文,则判断为超时,此时所述业务板CPU针对未收到的所述OAM检测报文重新构造检测报文再次发送,N次后则对下一个待检测端口进行检测。
根据本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的方法,其中,所述业务板CPU在构造OAM自检报文时,通过自定义其所包含的五元组指定所述OAM自检报文所针对的自检业务类型。
根据本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的方法,OAM自检报文可以根据业务类型构造,从而检测不同的业务异常事件,网络报文加速芯片接收到OAM自检报文后会按照正常业务报文进行处理,从而实现检测的目的。
更具体的,当OAM自检功能开启时,在业务板CPU上构建基于网络报文加速芯片不同业务的OAM自检报文,所述OAM自检报文检测的业务类型可以进行自定义,通常构造UDP报文或者ICMP报文来检测网络报文加速芯片在进行报文转发时流程是否正常。通过OAM自检报文中的五元组内的源/目的IP以及物理地址等,可以唯一指定OAM自检报文的自检业务类型,交换芯片以及网络报文加速芯片通过五元组识别出检测业务,在设备内部形成环路转发。
根据本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的方法,还包括:所述业务板CPU在接收到OAM自检报文时,对所述OAM自检报文进行验证,以判断所述网络报文加速芯片的所述当前待检测端口是否存在异常;当判断验证未通过时,所述业务板CPU向主控板CPU发送异常事件消息,所述主控板CPU在接收到异常事件消息后关闭所述当前待检测端口或启动业务板热插拔。
更具体的,如果网络报文加速芯片功能正常,则将会将OAM自检报文返回给业务板CPU,异常时会丢掉OAM自检报文或者对应的业务异常标记置位。当业务板CPU检测到网络报文加速芯片的端口发生异常时,业务板CPU发送异常事件给主控,通知主控处理异常,关闭异常的网络报文加速芯片端口或者对业务板热插拔重启,然后发出告警日志。管理人员可以通过设备的串口或者WEB管理网页查看告警类型。
根据本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的方法,还包括:所述业务板CPU在构造针对网络报文加速芯片待检测端口的OAM自检报文后,对所述OAM自检报文进行校验和计算,并在收到所述OAM自检报文后基于所述检验和完成对所述OAM自检报文的验证。
更具体的,根据本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的方法,在发送OAM自检报文前,先计算一次校验和,当网络报文加速芯片将OAM自检报文返回时通过校验和验证报文内容是否被更改,具体而言,可当CPU收到网络报文加速芯片返回的检测报文后,通过对数据段以及校验和值的分析,判断网络报文加速芯片是否出现异常。
图2所示的是根据本公开另一实施例的基于OAM环路自检网络报文加速芯片功能异常的方法的简要流程示意图。
如图2所示,在1处,业务板CPU构建包括HIG2报文头的OAM自检报文,并将OAM自检报文向交换芯片发送;
在2处,网络报文加速芯片的待检测端口处接收到来自交换芯片发送的OAM自检报文;
在3处,网络报文加速芯片在通过识别出自检业务后,将所述OAM自检报文向业务板CPU发送;
在4处,业务板CPU接收到来自网络报文加速芯片发送的OAM自检报文;
在5处,当业务板CPU检测到网络报文加速芯片的端口发生异常时,业务板CPU可以日志的形式发送异常事件给主控,通知主控处理异常;
在6处,当主控板CPU接收到业务板CPU发送的网络报文加速芯片端口异常事件后,主控板CPU关闭异常的网络报文加速芯片端口或者对业务板热插拔重启,然后发出告警日志。
图3所示的是根据本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的装置的原理示意图。如图3所示,该装置包括:OAM自检报文创建组件302,用于业务板CPU构造针对网络报文加速芯片当前待检测端口的OAM自检报文,所述OAM自检报文包括HIG报文头,所述HIG报文头包括所述当前待检测端口,所述当前待检测端口为网络报文加速芯片在接收到所述OAM自检报文时处理所述OAM自检报文的端口;OAM自检报文第一转发组件304,用于业务板CPU将所述OAM自检报文向与其互联的交换芯片转发;OAM自检报文第二转发组件306,用于所述交换芯片在接收到所述OAM自检报文后,根据所述OAM自检报文的HIG报文头包括的所述当前待检测端口将所述OAM自检报文转发到与所述交换芯片互联的所述网络报文加速芯片的所述当前待检测端口处;OAM自检报文第三转发组件308,用于所述网络报文加速芯片在接收到所述OAM自检报文后,将所述OAM自检报文转回至与所述网络报文加速芯片互联的所述业务板CPU;验证组件310,用于OAM自检报文当所述业务板CPU成功接收到所述OAM自检报文时,即为判断完成对所述当前待检测端口的检测;自动循环检测组件312,当判断完成对所述当前端口的检测时,调用OAM自检报文创建组件302,用于所述业务板CPU构造针对网络报文加速芯片的下一个待检测端口的OAM自检报文,并对针对所述下一个待检测端口的OAM自检报文调用所述OAM自检报文第一转发组件304、所述OAM自检报文第二转发组件306和所述OAM自检报文第三转发组件308直至完成对所述网络报文加速芯片的所有端口的一轮检测。
根据本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的装置,其还包括:延时组件314,用于指定检测间隔时长,以及在完成一轮针对所述网络报文加速芯片的所有端口的检测后,等待所述检测间隔时长后进行下一轮的针对所述网络报文加速芯片的所有端口的检测。
根据本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的装置,其还包括:重检组件316,用于指定待检测端口的重检次数N,以及当所述业务板CPU未接收到针对所述当前待检测端口的OAM自检报文时,所述业务板CPU针对所述当前待检测端口重复调用所述OAM自检报文创建组件、所述OAM自检报文第一转发组件、所述OAM自检报文第二转发组件和所述OAM自检报文第三转发组件直至所述业务CPU接收到针对所述当前待检测端口的OAM自检报文或执行完N次重检以完成针对所述当前待检测端口的检测,并在完成针对所述当前待检测端口的检测后进行对所述下一个待检测端口的检测。
根据本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的装置,其还包括:OAM自检报文业务类型自定义组件318,用于所述业务板CPU在构造OAM自检报文时,通过自定义其所包含的五元组指定所述OAM自检报文所针对的自检业务类型。
根据本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的装置,还包括异常处理组件320,其中,所述验证组件310,还用于所述业务板CPU在接收到OAM自检报文时,对所述OAM自检报文进行验证,以判断所述网络报文加速芯片的所述当前待检测端口是否存在异常;所述异常处理组件320,用于当判断验证未通过时,所述业务板CPU向主控板CPU发送异常事件消息,所述主控板CPU在接收到异常事件消息后关闭所述当前待检测端口或启动业务板热插拔。
根据本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的装置,其中,所述验证组件310还用于:所述业务板CPU在构造针对网络报文加速芯片待检测端口的OAM自检报文后,对所述OAM自检报文进行校验和计算,并在收到所述OAM自检报文后基于所述检验和完成对所述OAM自检报文的验证。
综上,采用本公开的基于OAM环路自检网络报文加速芯片功能异常的方法和装置,在设备进行报文转发业务时,进行转发的业务板CPU能够通过构造检测报文,检测不同的网络报文加速芯片端口,最终实现主动对网络报文加速芯片的每一个端口进行检测,,并当检测到网络报文加速芯片的某一个端口发生异常时发送异常事件给主控,让主控做出相应处理以及发出告警日志。具体而言,设备通过业务板CPU构造的检测报文主动检测网络报文加速芯片端口异常;业务板CPU通过构造报文中的附加字段HIG头来指定网络报文加速芯片目的端口以使得发出的报文经过交换芯片时进行分流;自检报文可以根据业务类型构造,从而检测不同的业务异常事件,网络报文加速芯片接收到自检报文后会按照正常业务报文进行处理,从而实现检测的目的。使用本公开实施例的基于OAM环路自检网络报文加速芯片功能异常的方法和装置,可以简化维护人员对网络报文加速芯片出现异常时的定位以及维护的流程;OAM自检能够对网络报文加速芯片不同的业务流程进行检测,出现异常时通知主控做出相应处理,增加了系统的可维护性;现有方法中没有针对网络报文加速芯片进行异常的主动检测,当出现网络转发问题时已经造成了严重后果,通过OAM自检的方法主控接收到异常事件时可以主动处理问题,从而降低了业务异常的风险。

Claims (12)

1.一种基于OAM环路自检网络报文加速芯片功能异常的方法,包括:
创建OAM自检报文,业务板CPU构造针对网络报文加速芯片当前待检测端口的OAM自检报文,所述OAM自检报文包括HIG报文头,所述HIG报文头包括所述当前待检测端口,所述当前待检测端口为网络报文加速芯片在接收到所述OAM自检报文时处理所述OAM自检报文的端口;
OAM自检报文转发至交换芯片,业务板CPU将所述OAM自检报文向与其互联的交换芯片转发;
OAM自检报文转发至网络报文加速芯片,所述交换芯片在接收到所述OAM自检报文后,根据所述OAM自检报文的HIG报文头包括的所述当前待检测端口将所述OAM自检报文转发到与所述交换芯片互联的所述网络报文加速芯片的所述当前待检测端口处;
OAM自检报文转回至业务板CPU,所述网络报文加速芯片在接收到所述OAM自检报文后,将所述OAM自检报文转回至与所述网络报文加速芯片互联的所述业务板CPU;
基于OAM自检报文进行验证,当所述业务板CPU成功接收到所述OAM自检报文时,即为完成对所述当前待检测端口的检测;
进行针对下一个待检测端口的检测,当判断完成对所述当前端口的检测时,所述业务板CPU构造针对网络报文加速芯片的所述下一个待检测端口的OAM自检报文,并对针对所述下一个待检测端口的OAM自检报文执行OAM自检报文转发至交换芯片步骤、OAM自检报文转发至网络报文加速芯片步骤、OAM自检报文转回至业务板CPU步骤、基于OAM自检报文进行验证步骤和进行针对下一个待检测端口的检测步骤直至完成对所述网络报文加速芯片的所有端口的一轮检测。
2.根据权利要求1所述的基于OAM环路自检网络报文加速芯片功能异常的方法,其还包括:
指定检测间隔时长;
在完成一轮针对所述网络报文加速芯片的所有端口的检测后,等待所述检测间隔时长后进行下一轮的针对所述网络报文加速芯片的所有端口的检测。
3.根据权利要求1所述的基于OAM环路自检网络报文加速芯片功能异常的方法,其还包括:
指定待检测端口的重检次数N;
当所述业务板CPU未接收到针对所述当前待检测端口的OAM自检报文时,所述业务板CPU针对所述当前待检测端口重复执行创建OAM自检报文步骤、OAM自检报文转发至交换芯片步骤、OAM自检报文转发至网络报文加速芯片步骤、OAM自检报文转回至业务板CPU步骤直至所述业务CPU接收到针对所述当前待检测端口的OAM自检报文或执行完N次重检以完成针对所述当前待检测端口的检测,并在完成针对所述当前待检测端口的检测后进行对所述下一个待检测端口的检测。
4.根据权利要求1所述的基于OAM环路自检网络报文加速芯片功能异常的方法,其中,
所述业务板CPU在构造OAM自检报文时,通过自定义其所包含的五元组指定所述OAM自检报文所针对的自检业务类型。
5.根据权利要求1所述的基于OAM环路自检网络报文加速芯片功能异常的方法,其还包括:
所述业务板CPU在接收到OAM自检报文时,对所述OAM自检报文进行验证,以判断所述网络报文加速芯片的所述当前待检测端口是否存在异常;
当判断验证未通过时,所述业务板CPU向主控板CPU发送异常事件消息,所述主控板CPU在接收到异常事件消息后关闭所述当前待检测端口或启动业务板热插拔。
6.根据权利要求5所述的基于OAM环路自检网络报文加速芯片功能异常的方法,其还包括:
所述业务板CPU在构造针对网络报文加速芯片待检测端口的OAM自检报文后,对所述OAM自检报文进行校验和计算,并在收到所述OAM自检报文后基于所述检验和完成对所述OAM自检报文的验证。
7.一种基于OAM环路自检网络报文加速芯片功能异常的装置,包括:
OAM自检报文创建组件,用于业务板CPU构造针对网络报文加速芯片当前待检测端口的OAM自检报文,所述OAM自检报文包括HIG报文头,所述HIG报文头包括所述当前待检测端口,所述当前待检测端口为网络报文加速芯片在接收到所述OAM自检报文时处理所述OAM自检报文的端口;
OAM自检报文第一转发组件,用于业务板CPU将所述OAM自检报文向与其互联的交换芯片转发;
OAM自检报文第二转发组件,用于所述交换芯片在接收到所述OAM自检报文后,根据所述OAM自检报文的HIG报文头包括的所述当前待检测端口将所述OAM自检报文转发到与所述交换芯片互联的所述网络报文加速芯片的所述当前待检测端口处;
OAM自检报文第三转发组件,用于所述网络报文加速芯片在接收到所述OAM自检报文后,将所述OAM自检报文转回至与所述网络报文加速芯片互联的所述业务板CPU;
验证组件,用于OAM自检报文当所述业务板CPU成功接收到所述OAM自检报文时,即为判断完成对所述当前待检测端口的检测;
自动循环检测组件,当判断完成对所述当前端口的检测时,调用OAM自检报文创建组件,用于所述业务板CPU构造针对网络报文加速芯片的下一个待检测端口的OAM自检报文,并对针对所述下一个待检测端口的OAM自检报文调用所述OAM自检报文第一转发组件、所述OAM自检报文第二转发组件和所述OAM自检报文第三转发组件直至完成对所述网络报文加速芯片的所有端口的一轮检测。
8.根据权利要求7所述的基于OAM环路自检网络报文加速芯片功能异常的装置,其还包括:
延时组件,用于指定检测间隔时长,以及在完成一轮针对所述网络报文加速芯片的所有端口的检测后,等待所述检测间隔时长后进行下一轮的针对所述网络报文加速芯片的所有端口的检测。
9.根据权利要求7所述的基于OAM环路自检网络报文加速芯片功能异常的装置,其还包括:
重检组件,用于指定待检测端口的重检次数N,以及当所述业务板CPU未接收到针对所述当前待检测端口的OAM自检报文时,所述业务板CPU针对所述当前待检测端口重复调用所述OAM自检报文创建组件、所述OAM自检报文第一转发组件、所述OAM自检报文第二转发组件和所述OAM自检报文第三转发组件直至所述业务CPU接收到针对所述当前待检测端口的OAM自检报文或执行完N次重检以完成针对所述当前待检测端口的检测,并在完成针对所述当前待检测端口的检测后进行对所述下一个待检测端口的检测。
10.根据权利要求7所述的基于OAM环路自检网络报文加速芯片功能异常的装置,其还包括:
OAM自检报文业务类型自定义组件,用于所述业务板CPU在构造OAM自检报文时,通过自定义其所包含的五元组指定所述OAM自检报文所针对的自检业务类型。
11.根据权利要求7所述的基于OAM环路自检网络报文加速芯片功能异常的装置,其还包括异常处理组件,其中,
所述验证组件,还用于所述业务板CPU在接收到OAM自检报文时,对所述OAM自检报文进行验证,以判断所述网络报文加速芯片的所述当前待检测端口是否存在异常;
所述异常处理组件,用于当判断验证未通过时,所述业务板CPU向主控板CPU发送异常事件消息,所述主控板CPU在接收到异常事件消息后关闭所述当前待检测端口或启动业务板热插拔。
12.根据权利要求11所述的基于OAM环路自检网络报文加速芯片功能异常的装置,其中,所述验证组件还用于:
所述业务板CPU在构造针对网络报文加速芯片待检测端口的OAM自检报文后,对所述OAM自检报文进行校验和计算,并在收到所述OAM自检报文后基于所述检验和完成对所述OAM自检报文的验证。
CN202210773808.8A 2022-07-01 2022-07-01 基于oam环路自检网络报文加速芯片功能异常的方法和装置 Active CN114978868B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210773808.8A CN114978868B (zh) 2022-07-01 2022-07-01 基于oam环路自检网络报文加速芯片功能异常的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210773808.8A CN114978868B (zh) 2022-07-01 2022-07-01 基于oam环路自检网络报文加速芯片功能异常的方法和装置

Publications (2)

Publication Number Publication Date
CN114978868A true CN114978868A (zh) 2022-08-30
CN114978868B CN114978868B (zh) 2023-04-25

Family

ID=82967580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210773808.8A Active CN114978868B (zh) 2022-07-01 2022-07-01 基于oam环路自检网络报文加速芯片功能异常的方法和装置

Country Status (1)

Country Link
CN (1) CN114978868B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080016402A1 (en) * 2006-07-11 2008-01-17 Corrigent Systems Ltd. Connectivity fault management (CFM) in networks with link aggregation group connections
JP2010130479A (ja) * 2008-11-28 2010-06-10 Hitachi Ltd 導通試験方法及びネットワークシステム
US20100238800A1 (en) * 2007-12-12 2010-09-23 Huawei Technologies Co., Ltd. Method and Node Device for Fault Detection and Convergence in Ethernet
CN101908986A (zh) * 2010-08-12 2010-12-08 杭州华三通信技术有限公司 一种链路故障的检测方法和设备
CN101989955A (zh) * 2010-11-17 2011-03-23 中兴通讯股份有限公司 远端环回的实现方法和系统
CN102177681A (zh) * 2011-04-21 2011-09-07 华为技术有限公司 检测故障的方法和系统
US8218434B1 (en) * 2004-10-15 2012-07-10 Ciena Corporation Ethernet facility and equipment protection
WO2016177187A1 (zh) * 2015-07-27 2016-11-10 中兴通讯股份有限公司 业务处理方法及装置
CN109218059A (zh) * 2017-07-06 2019-01-15 华为技术有限公司 一种实现故障检测的方法、设备和系统
CN110971477A (zh) * 2018-09-29 2020-04-07 华为技术有限公司 一种通信方法、设备、系统和存储介质
US20210021540A1 (en) * 2019-07-18 2021-01-21 Huawei Technologies Co., Ltd. Method, Apparatus, and System for Locating Root Cause of Network Anomaly, and Computer Storage Medium
CN113783749A (zh) * 2021-08-11 2021-12-10 太原市高远时代科技有限公司 一种基于网络端口检测设备故障的方法
CN114297010A (zh) * 2021-12-28 2022-04-08 杭州迪普信息技术有限公司 一种业务板卡检测方法和装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8218434B1 (en) * 2004-10-15 2012-07-10 Ciena Corporation Ethernet facility and equipment protection
US20080016402A1 (en) * 2006-07-11 2008-01-17 Corrigent Systems Ltd. Connectivity fault management (CFM) in networks with link aggregation group connections
US20100238800A1 (en) * 2007-12-12 2010-09-23 Huawei Technologies Co., Ltd. Method and Node Device for Fault Detection and Convergence in Ethernet
JP2010130479A (ja) * 2008-11-28 2010-06-10 Hitachi Ltd 導通試験方法及びネットワークシステム
CN101908986A (zh) * 2010-08-12 2010-12-08 杭州华三通信技术有限公司 一种链路故障的检测方法和设备
CN101989955A (zh) * 2010-11-17 2011-03-23 中兴通讯股份有限公司 远端环回的实现方法和系统
CN102177681A (zh) * 2011-04-21 2011-09-07 华为技术有限公司 检测故障的方法和系统
WO2016177187A1 (zh) * 2015-07-27 2016-11-10 中兴通讯股份有限公司 业务处理方法及装置
CN109218059A (zh) * 2017-07-06 2019-01-15 华为技术有限公司 一种实现故障检测的方法、设备和系统
CN110971477A (zh) * 2018-09-29 2020-04-07 华为技术有限公司 一种通信方法、设备、系统和存储介质
US20210021540A1 (en) * 2019-07-18 2021-01-21 Huawei Technologies Co., Ltd. Method, Apparatus, and System for Locating Root Cause of Network Anomaly, and Computer Storage Medium
CN113783749A (zh) * 2021-08-11 2021-12-10 太原市高远时代科技有限公司 一种基于网络端口检测设备故障的方法
CN114297010A (zh) * 2021-12-28 2022-04-08 杭州迪普信息技术有限公司 一种业务板卡检测方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ANDRIAN PUTINA等: "Online Anomaly Detection Leveraging Stream-Based Clustering and Real-Time Telemetry" *
杨勇等: "一种网络设备内部的单端口环路检测技术" *

Also Published As

Publication number Publication date
CN114978868B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
CN101826989B (zh) 一种故障处理方法和装置
EP1968238A1 (en) A method and system for obtaining path maximum transfer unit in network
CN107342809B (zh) 一种业务性能监测与故障定位方法及装置
CN103078791B (zh) Oam报文处理方法、设备及系统
CN109995429A (zh) 宽带用户侧故障检测方法、装置、设备及介质
CN111988170B (zh) 一种终端故障定位方法及装置
CN110650041A (zh) Ipran网络故障定位方法及装置
CN110708715B (zh) 一种5g基站业务故障查找方法及装置
CN111683044A (zh) 一种正向隔离装置策略自动检测方法及装置
CN112003747A (zh) 云虚拟网关的故障定位方法
US7881207B2 (en) Method and system for loop-back and continue in packet-based network
CN114978868A (zh) 基于oam环路自检网络报文加速芯片功能异常的方法和装置
CN112787843A (zh) 故障节点的检测方法和存储介质及电子装置
CN104378246B (zh) 一种网络设备故障定位系统、方法及装置
CN108156052B (zh) 一种设备稳定性测试的方法及系统
CN101155078A (zh) 一种快速定位ip网络故障的方法
CN115766510A (zh) 一种交换机环路检测稳定性的测试方法及可读介质
US20080310314A1 (en) Method for Detecting a Message Interface Fault in a Communication Device
JP5367002B2 (ja) 監視サーバおよび監視プログラム
CN102291266A (zh) 环回检测方法及装置
CN106603334B (zh) 一种ip地址监测方法及装置
CN111193639A (zh) 一种网络质量检测处理方法及系统
CN114710424B (zh) 基于软件定义网络的主机侧数据包处理延时测量方法
CN113055224B (zh) 一种设备内报文转发故障检测及装置
CN115442284B (zh) 一种测试设备的系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant