CN105610594B - 业务链的故障诊断方法及装置 - Google Patents

业务链的故障诊断方法及装置 Download PDF

Info

Publication number
CN105610594B
CN105610594B CN201410663527.2A CN201410663527A CN105610594B CN 105610594 B CN105610594 B CN 105610594B CN 201410663527 A CN201410663527 A CN 201410663527A CN 105610594 B CN105610594 B CN 105610594B
Authority
CN
China
Prior art keywords
node
target service
service path
path
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410663527.2A
Other languages
English (en)
Other versions
CN105610594A (zh
Inventor
林木加
刘金坡
尹彬
周赟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201410663527.2A priority Critical patent/CN105610594B/zh
Publication of CN105610594A publication Critical patent/CN105610594A/zh
Application granted granted Critical
Publication of CN105610594B publication Critical patent/CN105610594B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供一种业务链的故障诊断方法及装置,该方法包括:业务节点接收目标业务路径中的上一节点发送的所述目标业务路径对应的诊断选项,并将所述诊断选项发送给目标业务路径上所述业务节点的下一节点,其中,所述诊断选项指示诊断方法和待诊断的内容;接收所述目标业务路径上所述业务节点的下一节点根据所述目标业务路径对应的诊断选项以及所述目标业务路径发送的回声报文;若所述业务节点在预设个数的周期内未收到所述目标业务路径上所述业务节点的下一节点发送的回声报文,则所述业务节点向控制器发送第一链路故障信息。本发明实施例中,实现了由路径中的各个节点独立完成故障监控,并独立上报控制器,使得故障信息可以及时到达控制器。

Description

业务链的故障诊断方法及装置
技术领域
本发明涉及通信技术,尤其涉及一种业务链的故障诊断方法及装置。
背景技术
数据中心是数据大集中而形成的集成信息技术(英文:Information Technology,简称IT)应用环境,是数据计算、网络传输、存储的中心。数据中心是由一整套复杂的设备构成的,不仅包括计算机系统和其它与之配套的设备,还包括可靠的数据通信连接、环境控制设备、监控设备以及各种安全装置。随着云计算的发展,各行业IT应用的增长,数据中心的规模和组网复杂性不断增加,多样化的企业业务对数据中心网络提出了更高要求。数据中心网络在扩展性、可靠性、安全性和可管理性等方面面临巨大的挑战。
在当前的数据中心网络中,部署增值业务,例如防火墙(英文:firewall,简称FW)、入侵防御系统(英文:intrusion prevention system,简称IPS)等,和网络拓扑紧密相关。其中,增值业务与网络拓扑的紧密相关性会导致增值业务设备部署不灵活,也不利于资源的动态分配和充分利用,更难以实现灵活的业务处理流程,面对这些问题,现有技术中引入了业务链(英文:service chaining)技术,该业务链技术是一种在以虚拟化和云计算为基础的数据中心网络中部署虚拟服务的新技术,简单来说,是引导网络业务报文次序通过引流节点(英文:flow classifier,简称FC)以及多个业务节点(英文:service node,简称SN)的转发技术。在数据中心网络中应用业务链技术,可以提高业务部署的灵活性。
随着业务链技术的广泛应用,在一个业务节点上有很多业务链的流量,在一个数据中心里有很多业务路径(英文:service path),发生故障时,需要快速诊断出哪条路径、哪个节点除了问题。现有技术中,由控制器通知引流节点生成一个操作管理和维护(英文:operation administration and maintenance,简称OAM)报文,该OAM报文模拟业务报文一样走过完整的一条业务路径,且该OAM报文经过的每个业务节点都给生成该OAM报文的引流节点返回一个响应报文,如果从某一个节点开始引流节点没有收到响应报文,则认为这个节点的链路出现故障,引流节点上报故障点给控制器。
但是,采用现有技术,故障发现较为滞后。
发明内容
本发明提供一种业务链的故障诊断方法及装置,用于解决故障发现滞后的问题。
本发明第一方面提供一种业务链的故障诊断方法,包括:
引流节点接收控制器发送的目标业务路径对应的诊断选项,并将所述诊断选项发送给目标业务路径上所述引流节点的下一节点,其中,所述诊断选项指示诊断方法和待诊断的内容;
所述引流节点接收所述目标业务路径上所述引流节点的下一节点根据所述目标业务路径对应的诊断选项以及所述目标业务路径发送的回声报文;
若所述引流节点在预设个数的周期内未收到所述目标业务路径上所述引流节点的下一节点发送的回声报文,则所述引流节点向所述控制器发送第一链路故障信息,其中,所述第一链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识。
结合第一方面,在第一方面的第一种实施方式中,所述引流节点接收控制器发送的目标业务路径对应的诊断选项之后,还包括:
所述引流节点建立所述目标业务路径对应的监控表项,所述监控表项用于存储链路故障信息。
结合第一方面的第一种实施方式,在第一方面的第二种实施方式中,所述方法,还包括:
所述引流节点接收所述目标业务路径上第一数据流的首报文;
所述引流节点为所述第一数据流的首报文添加所述诊断选项,并为所述第一数据流建立第一流表以及在所述第一流表中添加诊断标记;
所述引流节点在所述引流节点中查找所述目标业务路径对应的监控表项,若查找到,则建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系,若未查找到,则建立所述目标业务路径对应的监控表项,并建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系。
结合第一方面的第一或第二种实施方式,在第一方面的第三种实施方式中,所述方法还包括:
所述引流节点在所述目标业务路径对应的所有数据流都结束后,删除所述目标业务路径对应的监控表项。
本发明第二方面提供一种业务链的故障诊断方法,包括:
业务节点接收目标业务路径中的上一节点发送的所述目标业务路径对应的诊断选项,并将所述诊断选项发送给目标业务路径上所述业务节点的下一节点,其中,所述诊断选项指示诊断方法和待诊断的内容;
所述业务节点接收所述目标业务路径上所述业务节点的下一节点根据所述目标业务路径对应的诊断选项以及所述目标业务路径发送的回声报文;
若所述业务节点在预设个数的周期内未收到所述目标业务路径上所述业务节点的下一节点发送的回声报文,则所述业务节点向控制器发送第一链路故障信息,其中,所述第一链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识。
结合第二方面,在第二方面的第一种实施方式中,所述业务节点接收目标业务路径中上一节点发送的所述目标业务路径对应的诊断选项之后,还包括:
若所述业务节点确定所述业务节点业务处理异常,则所述业务节点捕获业务异常信息,并向所述控制器发送所述业务异常信息;
其中,所述业务异常信息包括:所述目标业务路径的标识、故障节点的标识、以及下述任一项或其任意组合:业务故障的标识、异常业务特性的标识、所述异常业务特性的退出点的标识以及所述业务处理异常发生时的流量特征。
结合第二方面,在第二方面的第二种实施方式中,所述业务节点接收目标业务路径中上一节点发送的所述目标业务路径对应的诊断选项之后,还包括:
若所述业务节点向所述目标业务路径中其它节点发送报文失败,则所述业务节点向所述控制器发送第二链路故障信息,其中,所述第二链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第二故障类型标识。
结合第二方面的第一或第二种实施方式,在第二方面的第三种实施方式中,所述业务节点接收目标业务路径中上一节点发送的所述目标业务路径对应的诊断选项之后,还包括:
所述业务节点建立所述目标业务路径对应的监控表项,所述监控表项用于存储故障信息以及业务异常信息。
结合第二方面的第三种实施方式,在第二方面的第四种实施方式中,所述业务节点建立所述目标业务路径对应的监控表项,还包括:
所述业务节点在所述目标业务路径对应的所有数据流都结束后,删除所述目标业务路径对应的监控表项。
结合第二方面的第一或第二种实施方式,在第二方面的第五种实施方式中,所述还包括:
所述业务节点接收所述目标业务路径上第一数据流的首报文;
所述业务节点为所述第一数据流建立第一流表以及在所述第一流表中添加诊断标记,其中,所述第一数据流的首报文中包括所述目标业务路径中引流节点添加的所述诊断选项;
所述业务节点在所述业务节点中查找所述目标业务路径对应的监控表项,若查找到,则建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系,若未查找到,则建立所述目标业务路径对应的监控表项,并建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系。
结合第二方面,在第二方面的第六种实施方式中,所述业务节点接收目标业务路径中上一节点发送的所述目标业务路径对应的诊断选项之后,还包括:
所述业务节点向所述目标业务路径中的上一节点发送回声报文。
结合第二方面的第六种实施方式,在第二方面的第七种实施方式中,所述业务节点向所述目标业务路径中的上一节点发送回声报文,包括:
若所述业务节点在多个不同路径中的上一节点为同一节点,则所述业务节点向所述多个不同路径中的上一节点发送合并回声报文,所述合并回声报文包括所述多个不同路径的标识。
本发明第三方面提供一种业务链的故障诊断方法,包括:
控制器向目标业务路径的引流节点发送所述目标业务路径对应的诊断选项,其中,所述诊断选项指示诊断方法和待诊断的内容;
所述控制器接收所述目标业务路径中引流节点和/或业务节点根据所述诊断选项发送的第一链路故障信息,其中,所述链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识。
结合第三方面,在第三方面的第一种实施方式中,所述控制器向目标业务路径的引流节点发送所述目标业务路径对应的诊断选项之后,还包括:
所述控制器接收所述目标业务路径中业务节点根据所述诊断选项发送的业务异常信息,其中,所述业务异常信息包括:所述目标业务路径的标识、故障节点的标识、以及下述任一项或其任意组合:业务故障的标识、异常业务特性的标识、所述异常业务特性的退出点的标识以及所述业务处理异常发生时的流量特征。
结合第三方面或第三方面的第一种实施方式,在第三方面的第二种实施方式中,所述控制器向目标业务路径的引流节点发送所述目标业务路径对应的诊断选项之后,还包括:
所述控制器接收所述目标业务路径中业务节点根据所述诊断选项发送的第二链路故障信息,其中,所述第二链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第二故障类型标识。
本发明第四方面提供一种引流节点,包括:
收发模块,用于接收控制器发送的目标业务路径对应的诊断选项,并将所述诊断选项发送给目标业务路径上所述引流节点的下一节点,其中,所述诊断选项指示诊断方法和待诊断的内容;
监控模块,用于接收所述目标业务路径上所述引流节点的下一节点根据所述目标业务路径对应的诊断选项以及所述目标业务路径发送的回声报文;若在预设个数的周期内未收到所述目标业务路径上所述引流节点的下一节点发送的回声报文,则向所述控制器发送第一链路故障信息,其中,所述链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识。
结合第四方面,在第四方面的第一种实施方式中,所述监控模块,用于在所述收发模块接收控制器发送的目标业务路径对应的诊断选项之后,建立所述目标业务路径对应的监控表项,所述监控表项用于存储链路故障信息。
结合第四方面的第一种实施方式,在第四方面的第二种实施方式中,所述引流节点还包括:建立模块;
所述收发模块,还用于接收所述目标业务路径上第一数据流的首报文;
所述建立模块,用于为所述第一数据流的首报文添加所述诊断选项,并为所述第一数据流建立第一流表以及在所述第一流表中添加诊断标记;
所述监控模块,用于在所述引流节点中查找所述目标业务路径对应的监控表项,若查找到,则建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系,若未查找到,则建立所述目标业务路径对应的监控表项,并建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系。
结合第四方面的第一或第二种实施方式,在第四方面的第三种实施方式中,所述引流节点还包括:
删除模块,用于在所述目标业务路径对应的所有数据流都结束后,删除所述目标业务路径对应的监控表项。
本发明第五方面提供一种业务节点,包括:
收发模块,用于接收目标业务路径中的上一节点发送的所述目标业务路径对应的诊断选项,并将所述诊断选项发送给目标业务路径上所述业务节点的下一节点,其中,所述诊断选项指示诊断方法和待诊断的内容;
监控模块,用于接收所述目标业务路径上所述业务节点的下一节点根据所述目标业务路径对应的诊断选项以及所述目标业务路径发送的回声报文;若在预设个数的周期内未收到所述目标业务路径上所述业务节点的下一节点发送的回声报文,则向所述控制器发送第一链路故障信息,其中,所述第一链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识。
结合第五方面,在第五方面的第一种可能的实施方式中,所述监控模块,还用于在所述收发模块接收目标业务路径中上一节点发送的所述目标业务路径对应的诊断选项之后,若确定所述业务节点业务处理异常,则捕获业务异常信息,并向所述控制器发送所述业务异常信息;
其中,所述业务异常信息包括:所述目标业务路径的标识、故障节点的标识、以及下述任一项或其任意组合:业务故障的标识、异常业务特性的标识、所述异常业务特性的退出点的标识以及所述业务处理异常发生时的流量特征。
结合第五方面,在第五方面的第二种可能的实施方式中,所述监控模块,还用于在所述收发模块接收目标业务路径中上一节点发送的所述目标业务路径对应的诊断选项之后,若所述收发模块向所述目标业务路径中其它节点发送报文失败,则向所述控制器发送第二链路故障信息,其中,所述第二链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第二故障类型标识。
结合第五方面的第一或第二种可能的实施方式,在第五方面的第三种可能的实施方式中,所述监控模块,还用于在所述收发模块接收目标业务路径中上一节点发送的所述目标业务路径对应的诊断选项之后,建立所述目标业务路径对应的监控表项,所述监控表项用于存储故障信息以及业务异常信息。
结合第五方面的的第三种可能的实施方式,在第五方面的第四种可能的实施方式中,所述业务节点还包括:
删除模块,用于在所述目标业务路径对应的所有数据流都结束后,删除所述目标业务路径对应的监控表项。
结合第五方面的第一或第二种可能的实施方式,在第五方面的第五种可能的实施方式中,所述业务节点还包括:建立模块;
所述收发模块,还用于接收所述目标业务路径上第一数据流的首报文;
所述建立模块,用于为所述第一数据流建立第一流表以及在所述第一流表中添加诊断标记,其中,所述第一数据流的首报文中包括所述目标业务路径中引流节点添加的所述诊断选项;
所述监控模块,用于在所述业务节点中查找所述目标业务路径对应的监控表项,若查找到,则建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系,若未查找到,则建立所述目标业务路径对应的监控表项,并建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系。
结合第五方面,在第五方面的第六种可能的实施方式中,所述收发模块,还用于在接收目标业务路径中上一节点发送的所述目标业务路径对应的诊断选项之后,向所述目标业务路径中的上一节点发送回声报文。
结合第五方面的第六种可能的实施方式,在第五方面的第七种可能的实施方式中,所述收发模块,具体用于若所述业务节点在多个不同路径中的上一节点为同一节点,则向所述多个不同路径中的上一节点发送合并回声报文,所述合并回声报文包括所述多个不同路径的标识。
本发明第六方面提供一种控制器,包括:
发送模块,用于向目标业务路径的引流节点发送所述目标业务路径对应的诊断选项,其中,所述诊断选项指示诊断方法和待诊断的内容;
接收模块,用于接收所述目标业务路径中所述引流节点和/或业务节点根据所述诊断选项发送的第一链路故障信息,其中,所述链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识。
结合第六方面,在第六方面的第一种实施方式中,所述接收模块,还用于接收所述目标业务路径中业务节点根据所述诊断选项发送的业务异常信息,其中,所述业务异常信息包括:所述目标业务路径的标识、故障节点的标识、以及下述任一项或其任意组合:业务故障的标识、异常业务特性的标识、所述异常业务特性的退出点的标识以及所述业务处理异常发生时的流量特征。
结合第六方面或第六方面的第一种实施方式,在第六方面的第二种实施方式中,所述接收模块,还用于接收所述目标业务路径中业务节点根据所述诊断选项发送的第二链路故障信息,其中,所述第二链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第二故障类型标识。
本发明提供的业务链的故障诊断方法及装置中,控制器向目标业务路径的引流节点发送该目标业务路径对应的诊断选项,诊断选项随着数据流到达目标业务路径中的各个节点,另外控制器可以接收上述目标业务路径中引流节点和/或业务节点发送的链路故障信息,实现了由路径中的各个节点独立完成故障监控,并独立上报控制器,使得故障信息可以及时到达控制器。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的业务链的故障诊断系统实施例一的结构示意图;
图2为本发明提供的业务链的故障诊断方法实施例一的流程示意图;
图3为本发明提供的业务链的故障诊断方法实施例二的流程示意图;
图4为本发明提供的业务链的故障诊断方法实施例三的流程示意图;
图5为本发明提供的业务链的故障诊断方法实施例四的流程示意图;
图6为本发明提供的业务链的故障诊断方法实施例五的流程示意图;
图7为本发明提供的引流节点实施例一的结构示意图;
图8为本发明提供的引流节点实施例二的结构示意图;
图9为本发明提供的业务节点实施例一的结构示意图;
图10为本发明提供的业务节点实施例二的结构示意图;
图11为本发明提供的控制器实施例一的结构示意图;
图12为本发明提供的引流节点实施例三的结构示意图;
图13为本发明提供的业务节点实施例三的结构示意图;
图14为本发明提供的控制器实施例二的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中“/”表示“或者”。
图1为本发明提供的业务链的故障诊断系统实施例一的结构示意图,本发明实施例主要基于图1的系统实现,如图1所示,该系统包括一条业务路径,具体地,包括:控制器01、引流节点02和至少一个业务节点03,图1中仅示出两个业务节点03,并不以此为限。
其中,引流节点02是租户流量在业务路径中的入口节点。
图2为本发明提供的业务链的故障诊断方法实施例一的流程示意图,如图2所示,该方法包括:
S201、引流节点接收控制器发送的目标业务路径对应的诊断选项,并将该诊断选项发送给目标业务路径上该引流节点的下一节点。
具体地,控制器可以在给引流节点发送业务路径配置时同时携带上诊断选项,也可以单独发送诊断选项。
其中,该诊断选项指示诊断方法和待诊断的内容。
具体地,控制器可以根据具体需求指定待诊断内容,例如可以包括:回声频率、回声报文类型、是否上报业务故障点、是否上报出错的流量特征等。
S202、引流节点接收上述目标业务路径上引流节点的下一节点根据上述目标业务路径对应的诊断选项以及该目标业务路径发送的回声报文。
如图1所示,一般地,引流节点的下一节点,为目标业务路径上的业务节点。诊断选项随着数据流会到达目标业务路径上的每一个节点,接收到该诊断选项的引流节点、业务节点会对自己本身进行故障监控,以及通过接收路径上下一节点的回声报文,对下一节点进行故障监控,以确认链路是否正常。
业务节点在接收到诊断选项后,会周期性地向该目标业务路径中的上一节点发送回声报文。业务节点在向目标路径上上一节点发送回声报文的时候,还是沿着原来的目标业务路径发送。
S203、若该引流节点在预设个数的周期内未接收到上述目标业务路径上该引流节点的下一节点发送的回声报文,则该引流节点向上述控制器发送第一链路故障信息。其中,该第一链路故障信息包括目标业务路径的标识、故障节点的标识以及第一故障类型标识。该第一故障类型标识用于向控制器指示没有在预设个数周期内收到回声报文。故障节点的标识可以是向控制器指示故障节点为目标路径中的第几个节点。
即引流节点在预设个数的周期内未收到上述目标业务路径上该引流节点的下一节点发送的回声报文,则该引流节点认为本节点和下一节点之间链路故障,会向控制器上报链路故障。
本实施例中,引流节点接收控制器发送的目标业务路径对应的诊断选项,并将上述诊断选项发送给目标业务路径上引流节点的下一节点,引流节点接收上述目标业务路径上引流节点的下一节点根据诊断选项发送的回声报文,若引流节点在预设个数的周期内未周到下一节点发送的回声报文,则向控制器发送链路故障信息。这样,目标业务路径中的引流节点只需要监控目标业务路径中下一节点的回声报文,在下一节点故障时直接上报给控制器,即路径中各节点彼此独立,都可以给控制器反馈故障信息,保证了故障信息可以及时反馈到控制器。
另一实施例中,上述引流节点接收控制器发送的目标业务路径对应的诊断选项之后,该引流节点建立上述目标业务路径对应的监控表项,该监控表项用于存储上述链路故障信息。
进一步地,该引流节点在上述目标业务路径对应的所有数据流都结束后,删除该目标业务路径对应的监控表项。
进一步地,引流节点接收上述目标业务路径上第一数据流的首报文,然后引流节点为上述第一数据流的首报文添加上述诊断选项,并为上述第一数据流建立第一流表以及在上述第一流表中添加诊断标记。另外,引流节点在该引流节点中查找上述目标业务路径对应的监控表项,若查找到,则建立第一流表与上述目标业务路径对应的监控表项之间的关联关系。若没有查找到,则建立该目标业务路径对应的监控表项,然后建立第一流表与该目标业务路径对应的监控表项之间的关联关系。具体地,可以通过指针将第一流表关联到该监控表项上。
具体地,上述第一数据流可以指目标路径上的任一数据流,一般地同一数据流的五元组特征相同,例如:上述第一数据流可以是租户流量,该数据流的报文到达引流节点后,在匹配了目标业务路径的流特征规则后自己就会在原始传输控制协议(英文:Transmission Control Protocol,简称TCP)/用户数据包协议(英文:User DatagramProtocol,简称UDP)载荷与IP头(英文:IP header)之间插入一个新的UDP头及内容标签(英文:context tag,简称CT)。如果该报文为一条数据流的首报文,则引流节点会在CT标签中添加目标业务路径的标识和诊断选项,对于同一条数据流,如果不是数据流的首报文,则只添加目标业务路径的标识。举例说明,引流节点处理后的报文可以如表1所示,
表1
在该例中,添加该UDP头后,将原来互联网协议(Internet Protocol,简称IP)头中的PT字段的值复制到CT的PT字段,原IP头中的PT字段则改为17,即UDP。当然,具体操作中并不以此为限,也不局限于UDP协议,可以扩展使用其他协议。
一般地,一个节点上,对于同一业务路径只会建立一个监控表项,对于一个监控表项,会有多个流表来和同一个监控表项建立关联关系。
图3为本发明提供的业务链的故障诊断方法实施例二的流程示意图,与前述实施例相应地,业务节点侧,如图3所示,该方法包括:
S301、业务节点接收目标业务路径中的上一节点发送的上述目标业务路径对应的诊断选项,并将上述诊断选项发送给目标业务路径上该业务节点的下一节点。
其中,该诊断选项指示诊断方法和待诊断的内容。
该诊断选项最初为控制器下发的,控制器先发送给引流节点,随着数据流的流动,诊断选项会发送到目标业务路径中的各个业务节点。
如图1所示,路径中,一般业务节点的下一节点还是业务节点,业务节点的上一节点可能是业务节点也可能是引流节点。
S302、业务节点接收上述目标业务路径上该业务节点的下一节点根据上述目标业务路径对应的诊断选项以及上述目标业务路径发送的回声报文。即下一节点发送回声报文时,沿该目标业务路径发送。
需要说明的是,该业务节点为目标业务路径中除尾业务节点之外的任一业务节点,但是,尾业务节点为目标业务路径中的最后一个业务节点,后面没有别的业务节点了,所以无需接收回声报文。但是,尾业务节点的其它特征与别的业务节点都相同。
S303、若上述业务节点在预设个数的周期内未收到上述目标业务路径上上述业务节点的下一节点发送的回声报文,则该业务节点向上述控制器发送第一链路故障信息。
其中,该链路故障信息包括上述目标业务路径的标识、故障节点的标识以及第一故障类型标识。该第一故障类型标识用于指示控制器没有在预设个数周期内收到回声报文。
本实施例中,业务节点接收目标业务路径中的上一节点发送的该目标业务路径对应的诊断选项,并将该诊断选项发送给目标业务路径上该业务节点的下一节点,进而,该业务节点接收目标业务路径上该业务节点的下一节点根据上述目标业务路径对应的诊断选项发送的回声报文,若该业务节点在预设个数的周期内未收到上述目标业务路径上上述业务节点的下一节点发送的回声报文,则该业务节点向上述控制器发送链路故障信息。从而实现了由路径中的每一个业务节点来监控下一个业务节点到本节点的链路情况,从而达到诊断整个路径的链路是否正常的效果,这样每个业务节点可以独立地向控制器反馈故障信息,可以使得故障信息更为及时的反馈给控制器。
另一实施例中,业务节点接收目标业务路径中的上一节点发送的上述目标业务路径对应的诊断选项之后,业务节点向目标业务路径中的上一节点发送回声报文。具体地,业务节点可以周期性地向目标业务路径中的上一节点发送回声报文,以使上一节点通过监控下一节点的回声报文来确定两个节点间的链路正常。
具体实现过程中,同时存在多条业务路径,对于同一业务节点,在不同的业务路径中的上一节点也可能是同一节点,为了节约资源,可以进行回声报文的合并。
于是,业务节点向目标业务路径中的上一节点发送回声报文,可以是,若该业务节点在多个不同路径中的上一节点为同一节点,则该业务节点向上述多个不同路径中的上一节点发送合并回声报文,该合并回声报文包括这多个不同路径的标识。
业务节点除了监控路径中下一节点,还同时监控自身业务处理是否正常,具体地,另一实施例中,在上述业务节点接收目标业务路径中上一节点发送的上述目标业务路径对应的诊断选项之后,若该业务节点确定上述业务节点业务处理异常,则该业务节点捕获业务异常信息,并向上述控制器发送业务异常信息。本实施例中,上述业务异常信息包括:目标业务路径的标识、故障节点的标识(即该业务节点自己的标识)、以及下述任一项或任意组合:业务故障的标识、异常业务特性的标识、所述异常业务特性的退出点的标识以及所述业务处理异常发生时的流量特征。该流量特征可以是流量的五元组特征,即源IP地址,源端口号,目的IP地址,目的端口号和传输层协议号。
这里,业务节点上报的异常信息的具体内容,根据诊断选项中的指示进行,即控制器在下发诊断选项时,会根据具体需求指示哪些业务异常信息需要上报。
另一实施例中,业务节点除了接收回声报文会发现链路故障之外,业务节点自身监测到发送报文失败时,也会发现链路故障。具体地,在上述业务节点接收目标业务路径中上一节点发送的上述目标业务路径对应的诊断选项之后,若该业务节点向上述目标业务路径中其它节点发送报文失败,则该业务节点向控制器发送第二链路故障信息,其中,该第二链路故障信息包括目标业务路径的标识、故障节点的标识以及第二故障类型标识。该第二故障类型标识指示控制器发送报文失败。
需要说明的是,在具体实现过程中,上述业务节点、引流节点在接收到诊断选项后,自身建立监控模块,该监控模块建立上述监控表项,具体执行时,由监控模块向上一个节点发送回声报文,并接收下一节点发送的回声报文,在本节点发现异常时,由监控模块来捕获业务异常信息,并向控制器报告链路故障和/或业务异常。
图4为本发明提供的业务链的故障诊断方法实施例三的流程示意图,如图4所示,业务节点对故障进行监控处理的方法如下:
S401、业务节点判断是否是业务处理异常,若是,则执行S402,若否,则执行S403。
S402、业务节点向控制器报告业务处理异常。
S403、业务节点判断是否是报文发送失败,若是,则执行S404,若否,则执行S405。
S404、业务节点向控制器报告业务链路异常。
S405、业务节点判断是否在预设个数的周期内未收到目标业务路径上下一节点发送的回声报文,若是,则执行S404,若否,则执行S406。
S406、业务节点在预设个数的周期内收到目标业务路径上下一节点发送的回声报文后,刷新状态。即认为当前没有故障。
进一步地,另一实施例中,业务节点接收目标业务路径中的上一节点发送的上述目标业务路径对应的诊断选项之后,业务节点建立上述目标业务路径对应的监控表项,该监控表项用于存储故障信息以及业务异常信息。
具体地,业务节点在接收到诊断选项后,建立对路径上下一节点的监控,以及对自身的业务处理进行监控,需要建立监控表项来具体存储各类故障数据。
其中,该业务节点在该目标业务路径对应的所有数据流都结束后,删除该目标业务路径对应的监控表项。
需要说明的是,一个节点可能同时属于多条业务路径,只要收到其中一条路径对应的诊断选项,就会建立监控模块,同一个节点只建立一个监控模块,但是,每一条业务路径都会有一个对应的监控表项。
一个节点会在所属的所有业务路径对应的所有数据流都结束后,删除该节点上的监控模块。
另一实施例中,上述业务节点接收上述目标业务路径上第一数据流的首报文,然后业务节点为该第一数据流建立第一流表以及在该第一流表中添加诊断标记。其中,该第一数据流的首报文中包括上述目标业务路径中引流节点添加的上述诊断选项。该业务节点在本业务节点中查找目标业务路径对应的监控表项,若查找到,则建立该第一流表与目标业务路径对应的监控表项之间的关联关系。
若未查找到,则建立该目标业务路径对应的监控表项,然后再建立第一流表与目标业务路径对应的监控表项之间的关联关系。
需要说明的是,一条业务路径只需建立一个监控表项,一般地,是在业务节点收的到第一条数据流的首报文后建立这条业务路径对应的监控表项,此后,该业务节点再接收到这条业务路径上的其它数据流的报文时,都可以查找到该监控表项,无需再建立。
具体地,报文在该业务节点处理完成后,发送到目标业务路径上的下一个业务节点,然后启动监听下一个业务节点的回声报文。目标路径的尾节点则无需执行该步骤。
图5为本发明提供的业务链的故障诊断方法实施例四的流程示意图,对于控制器侧,如图5所示,该方法包括:
S501、控制器向目标业务路径的引流节点发送该目标业务路径对应的诊断选项。其中,该诊断选项指示诊断方法和诊断内容。
具体地,诊断选项可以如表2所示,该诊断选项的形式适用于本发明所有实施例,
表2
CT︳PathId
Service Path
DiagOption︳Length
Interval︳PktType︳InfoFlag︳Reserved
其中,PathId表示业务路径的标识。
Service Path表示业务路径的具体信息,包含路径的所有业务节点以及顺序。DiagOption表示诊断选项的类型。
Length表示诊断选项的长度。
Interval表示回声报文的周期(可以以秒为单位)。
PktType表示回声报文的协议类型。
InfoFlag表示上报控制器的故障信息内容,即控制器可以根据需求指示上报故障内容,具体是一个字节的标记位,可以按照下述方式上报:第0位是“1”表明上报链路故障,第0位是“0”表明不上报链路故障;第1位是“1”表明上报业务故障,第1位是“0”表明不上报业务故障;第2位是“1”表明上报异常业务特征标识,第2位是“0”表明不上报异常业务特征标识,该异常业务特征标识可以是异常业务特征的名称;第3位是“1”表明上报异常业务特征的退出点,第3位是“0”表明不上报异常业务特征的退出点;第4位是“1”表明上报流量特征,第4位是“0”表明不上报流量特征。当然,并不以此为限,还可以根据具体需要扩展其它位。
Reserved是保留位,暂时没有使用。
S502、控制器接收上述目标业务路径中引流节点和/或业务节点根据上述诊断选项发送的第一链路故障信息。其中,该第一链路故障信息包括上述目标业务路径的标识、故障节点标识以及第一故障类型标识。该第一故障类型标识用于向控制器指示没有在预设个数周期内收到回声报文。即引流节点和/或业务节点如果在预设个数周期内未收到目标路径中下一节点发送的回声报文,就会向控制器上报第一链路故障信息。
上述诊断选项会随着数据流到达目标业务路径中的各个节点,各个节点会根据诊断选项独立地监控自身故障以及监听路径中下一节点的回声报文,且路径中的各个节点可以独立地向控制器反馈故障信息。
本实施例中,控制器向目标业务路径的引流节点发送该目标业务路径对应的诊断选项,并接收上述目标业务路径中引流节点和/或业务节点发送的链路故障信息,实现了由路径中的各个节点独立完成故障监控,并独立上报控制器,使得故障信息可以及时到达控制器。
另一实施例中,业务节点还根据诊断选项对自身业务故障进行监控诊断,具体地,控制器向目标业务路径的引流节点发送该目标业务路径对应的诊断选项之后,上述控制器接收上述目标业务路径中业务节点根据上述诊断选项发送的业务异常信息,其中,该业务异常信息可以包括:该目标业务路径的标识、故障节点的标识、以及下述任一项或其任意组合:业务故障的标识、异常业务特性的标识、所述异常业务特性的退出点的标识以及所述业务处理异常发生时的流量特征。
具体实现过程中,应当给控制器上报哪些业务异常信息,业务节点会根据诊断选项中的指示具体进行上报。
另一实施例中,控制器向目标业务路径的引流节点发送该目标业务路径对应的诊断选项之后,控制器接收上述目标业务路径中业务节点根据上述诊断选项发送的第二链路故障信息,其中,该第二链路故障信息包括:该目标业务路径的标识、故障节点的标识以及第二故障类型标识。该第二故障类型标识指示控制器发送报文失败。即业务节点在发送报文失败后,会向控制器上报第二链路故障信息。
图6为本发明提供的业务链的故障诊断方法实施例五的流程示意图,以图1所示的结构为例,假设目标业务路径为租户A的业务路径,其中包括一个控制器01、一个引流节点02和两个业务节点03,分别记为第一业务节点和第二业务节点,该第一业务节点为与引流节点连接的业务节点,假设其中引流节点02为开发虚拟交换机、业务节点为防火墙,并假设第一数据流为租户A流量。具体地,
S601、控制器向引流节点发送诊断选项。具体地,诊断选项如表2所示。
S602、引流节点收到租户A流量的首报文后,在该首报文的原始TCP/UDP载荷与IP头之间插入一个新的UDP头及CT,并在该CT中添加目标业务路径的标识和诊断选项。
S603、引流节点创建目标业务路径对应的监控表项。
该租户A流量为引流节点接收到的该目标业务路径上的第一条数据流。之后再接收到其它数据流,就无需再建立目标业务路径对应的监控表项。
该S603也可以在S602之前执行。
S604、引流节点创建租户A流量对应的流表,并将该流表关联到上述监控表项。
S605、引流节点将处理后的上述首报文发送给第一业务节点,并启动监控该第一业务节点的回声报文,若预设个数的周期内没有收到第一业务节点发送的回声报文,则向控制器发送链路故障信息。
S606、第一业务节点接收到上述首报文后,解析该首报文获取所述目标业务路径的标识和诊断选项。
S607、第一业务节点创建目标业务路径对应的监控表项。
S608、第一业务节点创建租户A流量对应的流表,并将该流表关联到上述监控表项。
S609、第一业务节点将处理后的上述首报文发送给第二业务节点,并启动监控该第二业务节点的回声报文,若预设个数的周期内没有收到第二业务节点发送的回声报文,则向控制器发送链路故障信息。
S610、第一业务节点周期性地向上述引流节点发送回声报文。
第一节点若出现业务异常,则执行S611,若未发生异常,则执行S613。
S611、第一业务节点发生业务异常退出。
S612、第一业务节点中的监控模块捕获业务异常信息,并将业务异常信息发送给控制器。
S613、第二业务节点接收到上述首报文后,解析该首报文获取所述目标业务路径的标识和诊断选项。
具体地,第二业务节点所执行的内容与第一业务节点类似,在此不再赘述,需要说明的是,第二业务节点为该目标业务路径的尾节点,无需监控回声报文。
图7为本发明提供的引流节点实施例一的结构示意图,如图7所示,该引流节点包括:收发模块701和监控模块702。其中,
收发模块701,用于接收控制器发送的目标业务路径对应的诊断选项,并将所述诊断选项发送给目标业务路径上所述引流节点的下一节点,其中,所述诊断选项指示诊断方法和待诊断的内容。
监控模块702,用于接收所述目标业务路径上所述引流节点的下一节点根据所述目标业务路径对应的诊断选项以及所述目标业务路径发送的回声报文;若在预设个数的周期内未收到所述目标业务路径上所述引流节点的下一节点发送的回声报文,则向所述控制器发送第一链路故障信息,其中,所述链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识。
本实施例中,引流节点接收控制器发送的目标业务路径对应的诊断选项,并将上述诊断选项发送给目标业务路径上引流节点的下一节点,引流节点接收上述目标业务路径上引流节点的下一节点根据诊断选项发送的回声报文,若引流节点在预设个数的周期内未周到下一节点发送的回声报文,则向控制器发送链路故障信息。这样,目标业务路径中的引流节点只需要监控目标业务路径中下一节点的回声报文,在下一节点故障时直接上报给控制器,即路径中各节点彼此独立,都可以给控制器反馈故障信息,保证了故障信息可以及时反馈到控制器。
进一步地,监控模块702,还用于在收发模块701接收控制器发送的目标业务路径对应的诊断选项之后,建立所述目标业务路径对应的监控表项,所述监控表项用于存储链路故障信息。
图8为本发明提供的引流节点实施例二的结构示意图,如图8所示,在图7的基础上,引流节点还可以包括:建立模块801,其中,
收发模块701,还用于接收所述目标业务路径上第一数据流的首报文。
相应地,建立模块801,用于为所述第一数据流的首报文添加所述诊断选项,并为所述第一数据流建立第一流表以及在所述第一流表中添加诊断标记。
监控模块702,用于在所述引流节点中查找所述目标业务路径对应的监控表项,若查找到,则建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系,若未查找到,则建立所述目标业务路径对应的监控表项,并建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系。
如图8所示,该引流节点还可以包括删除模块802,用于在所述目标业务路径对应的所有数据流都结束后,删除所述目标业务路径对应的监控表项。
图9为本发明提供的业务节点实施例一的结构示意图,如图9所示,该业务节点包括:收发模块901和监控模块902,其中,
收发模块901,用于接收目标业务路径中的上一节点发送的所述目标业务路径对应的诊断选项,并将所述诊断选项发送给目标业务路径上所述业务节点的下一节点,其中,所述诊断选项指示诊断方法和待诊断的内容。
监控模块902,用于接收所述目标业务路径上所述业务节点的下一节点根据所述目标业务路径对应的诊断选项以及所述目标业务路径发送的回声报文;若在预设个数的周期内未收到所述目标业务路径上所述业务节点的下一节点发送的回声报文,则向所述控制器发送第一链路故障信息,其中,所述第一链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识。
本实施例中,业务节点接收目标业务路径中的上一节点发送的该目标业务路径对应的诊断选项,并将该诊断选项发送给目标业务路径上该业务节点的下一节点,进而,该业务节点接收目标业务路径上该业务节点的下一节点根据上述目标业务路径对应的诊断选项发送的回声报文,若该业务节点在预设个数的周期内未收到上述目标业务路径上上述业务节点的下一节点发送的回声报文,则该业务节点向上述控制器发送链路故障信息。从而实现了由路径中的每一个业务节点来监控下一个业务节点到本节点的链路情况,从而达到诊断整个路径的链路是否正常的效果,这样每个业务节点可以独立地向控制器反馈故障信息,可以使得故障信息更为及时的反馈给控制器。
进一步地,监控模块902,还用于在收发模块901接收目标业务路径中上一节点发送的所述目标业务路径对应的诊断选项之后,若确定所述业务节点业务处理异常,则捕获业务异常信息,并向所述控制器发送所述业务异常信息。
其中,所述业务异常信息包括:所述目标业务路径的标识、故障节点的标识、以及下述任一项或其任意组合:业务故障的标识、异常业务特性的标识、所述异常业务特性的退出点的标识以及所述业务处理异常发生时的流量特征。
另一实施例中,监控模块902,还用于在收发模块901接收目标业务路径中上一节点发送的所述目标业务路径对应的诊断选项之后,若收发模块901向所述目标业务路径中其它节点发送报文失败,则向所述控制器发送第二链路故障信息,其中,所述第二链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第二故障类型标识。
监控模块902,还用于在收发模块901接收目标业务路径中上一节点发送的所述目标业务路径对应的诊断选项之后,建立所述目标业务路径对应的监控表项,所述监控表项用于存储故障信息以及业务异常信息。
图10为本发明提供的业务节点实施例二的结构示意图,如图10所示,在图9的基础上,该业务节点还包括:删除模块903。
删除模块903,用于在所述目标业务路径对应的所有数据流都结束后,删除所述目标业务路径对应的监控表项。
进一步地,参照图10,该业务节点还可以包括:建立模块904。另一实施例中:
收发模块901,还用于接收所述目标业务路径上第一数据流的首报文。
建立模块904,用于为所述第一数据流建立第一流表以及在所述第一流表中添加诊断标记,其中,所述第一数据流的首报文中包括所述目标业务路径中引流节点添加的所述诊断选项。
监控模块902,用于在所述业务节点中查找所述目标业务路径对应的监控表项,若查找到,则建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系,若未查找到,则建立所述目标业务路径对应的监控表项,并建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系。
另一实施例中,收发模块901,还用于在接收目标业务路径中上一节点发送的所述目标业务路径对应的诊断选项之后,向所述目标业务路径中的上一节点发送回声报文。
具体地,收发模块901,用于若所述业务节点在多个不同路径中的上一节点为同一节点,则向所述多个不同路径中的上一节点发送合并回声报文,所述合并回声报文包括所述多个不同路径的标识。
图11为本发明提供的控制器实施例一的结构示意图,如图11所示,该控制器包括:发送模块110和接收模块111,其中,
发送模块110,用于向目标业务路径的引流节点发送所述目标业务路径对应的诊断选项,其中,所述诊断选项指示诊断方法和待诊断的内容。
接收模块111,用于接收所述目标业务路径中所述引流节点和/或业务节点根据所述诊断选项发送的第一链路故障信息,其中,所述链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识。
本实施例中,控制器向目标业务路径的引流节点发送该目标业务路径对应的诊断选项,并接收上述目标业务路径中引流节点和/或业务节点发送的链路故障信息,实现了由路径中的各个节点独立完成故障监控,并独立上报控制器,使得故障信息可以及时到达控制器。
进一步地,另一实施例中,接收模块111,还用于接收所述目标业务路径中业务节点根据所述诊断选项发送的业务异常信息,其中,所述业务异常信息包括:所述目标业务路径的标识、故障节点的标识、以及下述任一项或其任意组合:业务故障的标识、异常业务特性的标识、所述异常业务特性的退出点的标识以及所述业务处理异常发生时的流量特征。
另一实施例中,接收模块111,还用于接收所述目标业务路径中业务节点根据所述诊断选项发送的第二链路故障信息,其中,所述第二链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第二故障类型标识。
图12为本发明提供的引流节点实施例三的结构示意图,如图3所示,引流节点包括:收发器121和处理器122,其中,
收发器121,用于接收控制器发送的目标业务路径对应的诊断选项,并将所述诊断选项发送给目标业务路径上所述引流节点的下一节点,其中,所述诊断选项指示诊断方法和待诊断的内容。
处理器122,用于接收所述目标业务路径上所述引流节点的下一节点根据所述目标业务路径对应的诊断选项以及所述目标业务路径发送的回声报文;若在预设个数的周期内未收到所述目标业务路径上所述引流节点的下一节点发送的回声报文,则向所述控制器发送第一链路故障信息,其中,所述链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识。
进一步地,处理器122,还用于建立所述目标业务路径对应的监控表项,所述监控表项用于存储链路故障信息。
另一实施例中,收发器121,还用于接收所述目标业务路径上第一数据流的首报文;处理器122,用于为所述第一数据流的首报文添加所述诊断选项,并为所述第一数据流建立第一流表以及在所述第一流表中添加诊断标记;在所述引流节点中查找所述目标业务路径对应的监控表项,若查找到,则建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系,若未查找到,则建立所述目标业务路径对应的监控表项,并建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系。
另一实施例中,处理器122,用于在所述目标业务路径对应的所有数据流都结束后,删除所述目标业务路径对应的监控表项。
图13为本发明提供的业务节点实施例三的结构示意图,如图13所示,该业务节点包括:收发器131和处理器132,其中,
收发器131,用于接收目标业务路径中的上一节点发送的所述目标业务路径对应的诊断选项,并将所述诊断选项发送给目标业务路径上所述业务节点的下一节点,其中,所述诊断选项指示诊断方法和待诊断的内容。
处理器132,用于接收所述目标业务路径上所述业务节点的下一节点根据所述目标业务路径对应的诊断选项以及所述目标业务路径发送的回声报文;若在预设个数的周期内未收到所述目标业务路径上所述业务节点的下一节点发送的回声报文,则向所述控制器发送第一链路故障信息,其中,所述第一链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识。
进一步地,处理器132,还用于在收发器131接收目标业务路径中上一节点发送的所述目标业务路径对应的诊断选项之后,若确定所述业务节点业务处理异常,则捕获业务异常信息,并向所述控制器发送所述业务异常信息。
其中,所述业务异常信息包括:所述目标业务路径的标识、故障节点的标识、以及下述任一项或其任意组合:业务故障的标识、异常业务特性的标识、所述异常业务特性的退出点的标识以及所述业务处理异常发生时的流量特征。
处理器132,还用于在收发器131接收目标业务路径中上一节点发送的所述目标业务路径对应的诊断选项之后,若收发器131向所述目标业务路径中其它节点发送报文失败,则向所述控制器发送第二链路故障信息,其中,所述第二链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第二故障类型标识。
处理器132,还用于建立所述目标业务路径对应的监控表项,所述监控表项用于存储故障信息以及业务异常信息。
另一实施例中,处理器132,还用于在所述目标业务路径对应的所有数据流都结束后,删除所述目标业务路径对应的监控表项。
另一实施例中,收发器131,还用于接收所述目标业务路径上第一数据流的首报文。
处理器132,用于为所述第一数据流建立第一流表以及在所述第一流表中添加诊断标记,其中,所述第一数据流的首报文中包括所述目标业务路径中引流节点添加的所述诊断选项。并用于在所述业务节点中查找所述目标业务路径对应的监控表项,若查找到,则建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系,若未查找到,则建立所述目标业务路径对应的监控表项,并建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系。
收发器131,还用于在接收目标业务路径中上一节点发送的所述目标业务路径对应的诊断选项之后,向所述目标业务路径中的上一节点发送回声报文。
更具体地,收发器131,用于若所述业务节点在多个不同路径中的上一节点为同一节点,则向所述多个不同路径中的上一节点发送合并回声报文,所述合并回声报文包括所述多个不同路径的标识。
图14为本发明提供的控制器实施例一的结构示意图,如图14所示,该控制器包括:发送器141和接收器142,其中,
发送器141,用于向目标业务路径的引流节点发送所述目标业务路径对应的诊断选项,其中,所述诊断选项指示诊断方法和待诊断的内容。
接收器142,用于接收所述目标业务路径中所述引流节点和/或业务节点根据所述诊断选项发送的第一链路故障信息,其中,所述链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识。
进一步地,另一实施例中,接收器142,还用于接收所述目标业务路径中业务节点根据所述诊断选项发送的业务异常信息,其中,所述业务异常信息包括:所述目标业务路径的标识、故障节点的标识、以及下述任一项或其任意组合:业务故障的标识、异常业务特性的标识、所述异常业务特性的退出点的标识以及所述业务处理异常发生时的流量特征。
另一实施例中,接收器142,还用于接收所述目标业务路径中业务节点根据所述诊断选项发送的第二链路故障信息,其中,所述第二链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第二故障类型标识。
上述装置用于执行前述方法实施例,其技术效果和实现方式类似,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (30)

1.一种业务链的故障诊断方法,其特征在于,包括:
引流节点接收控制器发送的目标业务路径对应的诊断选项,其中,所述诊断选项指示诊断方法和待诊断的内容;
所述引流节点接收所述目标业务路径上第一数据流的首报文,并为所述第一数据流的首报文添加所述诊断选项后发送给所述引流节点的下一节点,以使所述下一节点根据所述诊断选项确定在预设个数的周期内未收到自身的下一节点发送的回声报文时,向所述控制器发送第一链路故障信息;
所述引流节点接收所述目标业务路径上所述引流节点的下一节点根据所述目标业务路径对应的诊断选项以及所述目标业务路径周期性发送的回声报文;
若所述引流节点在预设个数的周期内未收到所述目标业务路径上所述引流节点的下一节点发送的回声报文,则所述引流节点向所述控制器发送第一链路故障信息,其中,所述第一链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识。
2.根据权利要求1所述的方法,其特征在于,所述引流节点接收控制器发送的目标业务路径对应的诊断选项之后,还包括:
所述引流节点建立所述目标业务路径对应的监控表项,所述监控表项用于存储链路故障信息。
3.根据权利要求1所述的方法,其特征在于,还包括:
所述引流节点为所述第一数据流建立第一流表以及在所述第一流表中添加诊断标记;
所述引流节点在所述引流节点中查找所述目标业务路径对应的监控表项,若查找到,则建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系,若未查找到,则建立所述目标业务路径对应的监控表项,并建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系。
4.根据权利要求2或3所述的方法,其特征在于,还包括:
所述引流节点在所述目标业务路径对应的所有数据流都结束后,删除所述目标业务路径对应的监控表项。
5.一种业务链的故障诊断方法,其特征在于,包括:
业务节点接收目标业务路径中的上一节点发送的所述目标业务路径上第一数据流的首报文,并将所述首报文发送给所述目标业务路径上的所述业务节点的下一节点,其中,所述第一数据流的首报文中包括所述目标业务路径中引流节点添加的诊断选项,其中,所述诊断选项指示诊断方法和待诊断的内容;
所述业务节点接收所述目标业务路径上所述业务节点的下一节点根据所述目标业务路径对应的诊断选项以及所述目标业务路径周期性发送的回声报文;
若所述业务节点在预设个数的周期内未收到所述目标业务路径上所述业务节点的下一节点发送的回声报文,则所述业务节点向控制器发送第一链路故障信息,其中,所述第一链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识。
6.根据权利要求5所述的方法,其特征在于,所述业务节点接收目标业务路径中的上一节点发送的所述目标业务路径上第一数据流的首报文之后,还包括:
若所述业务节点确定所述业务节点业务处理异常,则所述业务节点捕获业务异常信息,并向所述控制器发送所述业务异常信息;
其中,所述业务异常信息包括:所述目标业务路径的标识、故障节点的标识、以及下述任一项或其任意组合:业务故障的标识、异常业务特性的标识、所述异常业务特性的退出点的标识以及所述业务处理异常发生时的流量特征。
7.根据权利要求5所述的方法,其特征在于,所述业务节点接收目标业务路径中的上一节点发送的所述目标业务路径上第一数据流的首报文之后,还包括:
若所述业务节点向所述目标业务路径中其它节点发送报文失败,则所述业务节点向所述控制器发送第二链路故障信息,其中,所述第二链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第二故障类型标识。
8.根据权利要求6或7所述的方法,其特征在于,所述业务节点接收目标业务路径中的上一节点发送的所述目标业务路径上第一数据流的首报文之后,还包括:
所述业务节点建立所述目标业务路径对应的监控表项,所述监控表项用于存储故障信息以及业务异常信息。
9.根据权利要求8所述的方法,其特征在于,所述业务节点建立所述目标业务路径对应的监控表项,还包括:
所述业务节点在所述目标业务路径对应的所有数据流都结束后,删除所述目标业务路径对应的监控表项。
10.根据权利要求6或7所述的方法,其特征在于,还包括:
所述业务节点为所述第一数据流建立第一流表以及在所述第一流表中添加诊断标记;
所述业务节点在所述业务节点中查找所述目标业务路径对应的监控表项,若查找到,则建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系,若未查找到,则建立所述目标业务路径对应的监控表项,并建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系。
11.根据权利要求5所述的方法,其特征在于,所述业务节点接收目标业务路径中上一节点发送的所述目标业务路径对应的诊断选项之后,还包括:
所述业务节点向所述目标业务路径中的上一节点发送回声报文。
12.根据权利要求11所述的方法,其特征在于,所述业务节点向所述目标业务路径中的上一节点发送回声报文,包括:
若所述业务节点在多个不同路径中的上一节点为同一节点,则所述业务节点向所述多个不同路径中的上一节点发送合并回声报文,所述合并回声报文包括所述多个不同路径的标识。
13.一种业务链的故障诊断方法,其特征在于,包括:
控制器向目标业务路径的引流节点发送所述目标业务路径对应的诊断选项,以使所述引流节点接收所述目标业务路径上第一数据流的首报文后,为所述第一数据流的首报文添加所述诊断选项并发送给所述引流节点的下一节点;其中,所述诊断选项指示诊断方法和待诊断的内容;
所述控制器接收所述目标业务路径中引流节点和/或业务节点根据所述诊断选项发送的第一链路故障信息,其中,所述链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识,所述第一链路故障信息是所述引流节点和/或业务节点在预设个数的周期内未接收到下一节点周期性发送的回声报文时向所述控制器发送的。
14.根据权利要求13所述的方法,其特征在于,所述控制器向目标业务路径的引流节点发送所述目标业务路径对应的诊断选项之后,还包括:
所述控制器接收所述目标业务路径中业务节点根据所述诊断选项发送的业务异常信息,其中,所述业务异常信息包括:所述目标业务路径的标识、故障节点的标识、以及下述任一项或其任意组合:业务故障的标识、异常业务特性的标识、所述异常业务特性的退出点的标识以及所述业务处理异常发生时的流量特征。
15.根据权利要求13或14所述的方法,其特征在于,所述控制器向目标业务路径的引流节点发送所述目标业务路径对应的诊断选项之后,还包括:
所述控制器接收所述目标业务路径中业务节点根据所述诊断选项发送的第二链路故障信息,其中,所述第二链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第二故障类型标识。
16.一种引流节点,其特征在于,包括:
收发模块,用于接收控制器发送的目标业务路径对应的诊断选项,其中,所述诊断选项指示诊断方法和待诊断的内容;
所述收发模块,还用于接收所述目标业务路径上第一数据流的首报文,并为所述第一数据流的首报文添加所述诊断选项后发送给所述引流节点的下一节点,以使所述下一节点根据所述诊断选项确定在预设个数的周期内未收到自身的下一节点发送的回声报文时,向所述控制器发送第一链路故障信息;
监控模块,用于接收所述目标业务路径上所述引流节点的下一节点根据所述目标业务路径对应的诊断选项以及所述目标业务路径周期性发送的回声报文;若在预设个数的周期内未收到所述目标业务路径上所述引流节点的下一节点发送的回声报文,则向所述控制器发送第一链路故障信息,其中,所述链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识。
17.根据权利要求16所述的引流节点,其特征在于,所述监控模块,用于在所述收发模块接收控制器发送的目标业务路径对应的诊断选项之后,建立所述目标业务路径对应的监控表项,所述监控表项用于存储链路故障信息。
18.根据权利要求16所述的引流节点,其特征在于,还包括:建立模块;
所述建立模块,用于为所述第一数据流建立第一流表以及在所述第一流表中添加诊断标记;
所述监控模块,用于在所述引流节点中查找所述目标业务路径对应的监控表项,若查找到,则建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系,若未查找到,则建立所述目标业务路径对应的监控表项,并建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系。
19.根据权利要求17或18所述的引流节点,其特征在于,还包括:
删除模块,用于在所述目标业务路径对应的所有数据流都结束后,删除所述目标业务路径对应的监控表项。
20.一种业务节点,其特征在于,包括:
收发模块,用于接收目标业务路径中的上一节点发送的所述目标业务路径上第一数据流的首报文,并将所述首报文发送给所述目标业务路径上的所述业务节点的下一节点,其中,所述第一数据流的首报文中包括所述目标业务路径中引流节点添加的诊断选项,其中,所述诊断选项指示诊断方法和待诊断的内容;
监控模块,用于接收所述目标业务路径上所述业务节点的下一节点根据所述目标业务路径对应的诊断选项以及所述目标业务路径周期性发送的回声报文;若在预设个数的周期内未收到所述目标业务路径上所述业务节点的下一节点发送的回声报文,则向控制器发送第一链路故障信息,其中,所述第一链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识。
21.根据权利要求20所述的业务节点,其特征在于,所述监控模块,还用于在所述收发模块接收接收目标业务路径中的上一节点发送的所述目标业务路径上第一数据流的首报文之后,若确定所述业务节点业务处理异常,则捕获业务异常信息,并向所述控制器发送所述业务异常信息;
其中,所述业务异常信息包括:所述目标业务路径的标识、故障节点的标识、以及下述任一项或其任意组合:业务故障的标识、异常业务特性的标识、所述异常业务特性的退出点的标识以及所述业务处理异常发生时的流量特征。
22.根据权利要求20所述的业务节点,其特征在于,所述监控模块,还用于在所述收发模块接收目标业务路径中的上一节点发送的所述目标业务路径上第一数据流的首报文之后,若所述收发模块向所述目标业务路径中其它节点发送报文失败,则向所述控制器发送第二链路故障信息,其中,所述第二链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第二故障类型标识。
23.根据权利要求21或22所述的业务节点,其特征在于,所述监控模块,还用于在所述收发模块接收目标业务路径中的上一节点发送的所述目标业务路径上第一数据流的首报文之后,建立所述目标业务路径对应的监控表项,所述监控表项用于存储故障信息以及业务异常信息。
24.根据权利要求23所述的业务节点,其特征在于,还包括:
删除模块,用于在所述目标业务路径对应的所有数据流都结束后,删除所述目标业务路径对应的监控表项。
25.根据权利要求21或22所述的业务节点,其特征在于,还包括:建立模块;
所述建立模块,用于为所述第一数据流建立第一流表以及在所述第一流表中添加诊断标记;
所述监控模块,用于在所述业务节点中查找所述目标业务路径对应的监控表项,若查找到,则建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系,若未查找到,则建立所述目标业务路径对应的监控表项,并建立所述第一流表与所述目标业务路径对应的监控表项之间的关联关系。
26.根据权利要求20所述的业务节点,其特征在于,所述收发模块,还用于在接收目标业务路径中上一节点发送的所述目标业务路径对应的诊断选项之后,向所述目标业务路径中的上一节点发送回声报文。
27.根据权利要求26所述的业务节点,其特征在于,所述收发模块,具体用于若所述业务节点在多个不同路径中的上一节点为同一节点,则向所述多个不同路径中的上一节点发送合并回声报文,所述合并回声报文包括所述多个不同路径的标识。
28.一种控制器,其特征在于,包括:
发送模块,用于向目标业务路径的引流节点发送所述目标业务路径对应的诊断选项,以使所述引流节点接收所述目标业务路径上第一数据流的首报文后,为所述第一数据流的首报文添加所述诊断选项并发送给所述引流节点的下一节点;其中,所述诊断选项指示诊断方法和待诊断的内容;
接收模块,用于接收所述目标业务路径中所述引流节点和/或业务节点根据所述诊断选项发送的第一链路故障信息,其中,所述链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第一故障类型标识,所述第一链路故障信息是所述引流节点和/或业务节点在预设个数的周期内未接收到下一节点周期性发送的回声报文时向所述控制器发送的。
29.根据权利要求28所述的控制器,其特征在于,所述接收模块,还用于接收所述目标业务路径中业务节点根据所述诊断选项发送的业务异常信息,其中,所述业务异常信息包括:所述目标业务路径的标识、故障节点的标识、以及下述任一项或其任意组合:业务故障的标识、异常业务特性的标识、所述异常业务特性的退出点的标识以及所述业务处理异常发生时的流量特征。
30.根据权利要求28或29所述的控制器,其特征在于,所述接收模块,还用于接收所述目标业务路径中业务节点根据所述诊断选项发送的第二链路故障信息,其中,所述第二链路故障信息包括所述目标业务路径的标识、故障节点的标识以及第二故障类型标识。
CN201410663527.2A 2014-11-19 2014-11-19 业务链的故障诊断方法及装置 Active CN105610594B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410663527.2A CN105610594B (zh) 2014-11-19 2014-11-19 业务链的故障诊断方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410663527.2A CN105610594B (zh) 2014-11-19 2014-11-19 业务链的故障诊断方法及装置

Publications (2)

Publication Number Publication Date
CN105610594A CN105610594A (zh) 2016-05-25
CN105610594B true CN105610594B (zh) 2019-12-17

Family

ID=55990140

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410663527.2A Active CN105610594B (zh) 2014-11-19 2014-11-19 业务链的故障诊断方法及装置

Country Status (1)

Country Link
CN (1) CN105610594B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112398913B (zh) * 2016-12-16 2022-05-13 华为技术有限公司 一种业务调度方法及系统
CN108234317B (zh) * 2017-12-14 2021-02-23 北京华为数字技术有限公司 一种隧道环回方法及其相关设备
CN112787843B (zh) * 2020-06-16 2022-04-29 中兴通讯股份有限公司 故障节点的检测方法和存储介质及电子装置
CN114615169B (zh) * 2020-12-03 2023-10-20 腾讯科技(深圳)有限公司 路径监控方法、装置和计算机可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8856310B2 (en) * 2005-12-22 2014-10-07 Alcatel Lucent ACORN: providing network-level security in P2P overlay architectures
CN101420335B (zh) * 2007-10-26 2011-09-14 华为技术有限公司 对等网络节点故障检测/处理方法及装置
CN101499934A (zh) * 2008-01-29 2009-08-05 华为技术有限公司 在对等网络中诊断节点是否异常的方法、装置及系统
CN102624584B (zh) * 2012-03-01 2018-02-23 中兴通讯股份有限公司 链路检测方法及装置

Also Published As

Publication number Publication date
CN105610594A (zh) 2016-05-25

Similar Documents

Publication Publication Date Title
US20210152443A1 (en) Technologies for annotating process and user information for network flows
CN109391560B (zh) 网络拥塞的通告方法、代理节点及计算机设备
CN110752952B (zh) 网络故障定位方法、装置、网络设备及计算机存储介质
US10200279B1 (en) Tracer of traffic trajectories in data center networks
CN105610594B (zh) 业务链的故障诊断方法及装置
US10277493B2 (en) Packet throughput and loss ratio measurements of a service function chain
CN113411834A (zh) 报文处理方法、装置、设备及存储介质
US20220255857A1 (en) Packet Processing Method, Network Node, and System
CN112737871B (zh) 链路故障检测方法、装置、计算机设备及存储介质
US10972381B2 (en) Network operations reactive to operations data included in seamless bidirectional forwarding detection (S-BFD) packets
US20160057043A1 (en) Diagnostic routing system and method for a link access group
CN110493069A (zh) 故障检测方法、装置、sdn控制器及转发设备
US20190296988A1 (en) Reactive mechanism for in-situ operation, administration, and maintenance traffic
CN112291116A (zh) 链路故障检测方法、装置及网络设备
CN103262046A (zh) 服务器管理装置、服务器管理方法和程序
EP2858302A1 (en) Connectivity check method of service stream link, related apparatus and system
CN105763463B (zh) 一种链路探测报文的传输方法和装置
US20160248652A1 (en) System and method for classifying and managing applications over compressed or encrypted traffic
CN109218176B (zh) 一种报文处理的方法及装置
US20230318970A1 (en) Packet Processing Method and Apparatus
WO2023116457A1 (zh) 报文处理方法及装置、通信系统
CN109150707B (zh) 路由路径分析方法及设备
Muthumanikandan et al. Switch failure detection in software-defined networks
CN115152192B (zh) Pce受控网络可靠性
CN109218059A (zh) 一种实现故障检测的方法、设备和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant