CN112838944B - 诊断及管理、规则确定及部署方法、分布式设备、介质 - Google Patents

诊断及管理、规则确定及部署方法、分布式设备、介质 Download PDF

Info

Publication number
CN112838944B
CN112838944B CN202010744447.5A CN202010744447A CN112838944B CN 112838944 B CN112838944 B CN 112838944B CN 202010744447 A CN202010744447 A CN 202010744447A CN 112838944 B CN112838944 B CN 112838944B
Authority
CN
China
Prior art keywords
diagnosis
function
diagnosed
board
attribute data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010744447.5A
Other languages
English (en)
Other versions
CN112838944A (zh
Inventor
马苗苗
孙思
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN202010744447.5A priority Critical patent/CN112838944B/zh
Publication of CN112838944A publication Critical patent/CN112838944A/zh
Priority to EP21849428.4A priority patent/EP4191906A4/en
Priority to PCT/CN2021/108866 priority patent/WO2022022556A1/zh
Application granted granted Critical
Publication of CN112838944B publication Critical patent/CN112838944B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0806Configuration setting for initial configuration or provisioning, e.g. plug-and-play
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本公开提供一种故障诊断管理方法,应用于分布式设备的主控单板,所述故障诊断管理方法包括:接收至少一个待诊断功能的属性数据;根据预设诊断规则对所述至少一个待诊断功能的属性数据进行分析,并得出诊断结果。本公开还提供一种故障诊断方法、一种故障诊断规则确定方法、一种诊断功能部署方法、一种分布式设备、和一种计算机可读存储介质。

Description

诊断及管理、规则确定及部署方法、分布式设备、介质
技术领域
本发明涉及分布式设备领域,具体地,涉及一种故障诊断管理方法、一种故障诊断方法、一种故障诊断规则的确定方法、一种诊断功能部署方法、一种分布式设备和一种计算机可读存储介质。
背景技术
随着网络技术的发展,分布式设备得到了广泛地应用。例如,高端路由器便是一种具有多处理器的分布式设备。
高端路由器通常位于网络核心,主要用于数据分组选路和转发,具有较大的吞吐量。由于高端路由器位置的重要性,对其可用性的要求也非常高,通常要求高端路由器24小时不间断运行。
随着高端路由器的长时间运行,不可避免地会出现故障,如何及时发现故障、快速修复装置,成为本领域亟待解决的技术问题。
发明内容
本公开涉及一种一种故障诊断管理方法、一种故障诊断方法、一种故障诊断规则的确定方法、一种诊断功能部署方法、一种分布式设备和一种计算机可读存储介质。
作为本公开的第一个方面,提供一种故障诊断管理方法,应用于分布式设备的主控单板,所述故障诊断管理方法包括:
接收至少一个待诊断功能的属性数据;
根据预设诊断规则对所述至少一个待诊断功能的属性数据进行分析,并得出诊断结果。
作为本公开的第二个方面,提供一种故障诊断方法,应用于分布式设备的线卡单板,所述故障诊断方法包括:
接收多个处理节点发送的待诊断功能的属性数据;
根据所述线卡单板本地存储的诊断规则对与所述本地存储的诊断规则匹配的待诊断功能的属性数据进行分析,并得出诊断结果。
作为本公开的第三个方面,提供一种故障诊断规则确定方法,应用于大数据处理服务器,所述故障诊断规则确定方法包括:
接收分布式设备的各项功能的属性数据;
根据接收到的属性数据确定对所述分布式设备的各项功能产生影响的属性数据;
根据对所述分布式设备的各项功能产生影响的属性数据生成相应的诊断规则。
作为本公开的第四个方面,提供一种分布式设备的诊断功能部署方法,包括:
确定所述分布式设备的各项功能的特征信息,所述分布式设备包括多个单板,所述多个单板包括主控单板和至少一个线卡单板;
确定中心服务节点、多个处理节点和多个服务节点的分布信息,其中,所述中心服务节点配置在所述分布式设备的多个单板中的主控单板上,所述分布式设备的每项功能都对应多个所述处理节点,所述处理节点用于收集相应的功能的属性数据,所述服务节点配置于所述分布式设备至少一个单板上,所述处理节点配置于所述分布式设备的至少一个单板上;其中,
部署有中心服务节点的主控单板能够实现本公开第一个方面所提供的故障诊断管理方法;
部署有服务节点的线卡单板能够实现本公开第二个方面所提供的故障诊断方法。
作为本公开的第五个方面,提供一种分布式设备,包括多个单板,所述多个单板包括主控单板和至少一个线卡单板,所述线卡单板包括:
第二存储模块,其上存储有第二可执行程序;
一个或多个第二处理器,所述一个或多个第二处理器能够调用所述第二可执行程序,以使得所述一个或多个第一处理器实现根据本公开第二个方面所述的故障诊断方法。
作为本公开的第六个方面,提供一种计算机可读存储介质,其上存储有可执行程序,当所述可执行程序被调用时,能够实现以下方法中的任意一者:
本公开第一个方面所提供的故障诊断管理方法;
本公开第二个方面所提供的故障诊断方法;
本公开第三个方面所提供的故障诊断规则确定方法;
本公开第四个方面所提供的诊断功能部署方法。
中心服务节点部署在主控单板的CPU上,本公开第一个方面提供的故障诊断管理方法所实现的是中心服务节点的功能。配置在所述主控单板的CPU上的中心服务节点接收到该中心服务节点对应至少一个待诊断功能的属性数据后,根据所述预设诊断规则对所述至少一个待诊断功能的属性进行分析,并得出诊断结果。因此,利用所述故障诊断管理方法可以快速实现对分布式设备的故障诊断,有利于及时发现故障、降低分布式设备的维护成本,并可以减少设备故障对所述分布式设备的用户所造成的影响,提高用户体验。
本公开第二个方面所提供的故障诊断方法由部署在线卡单板上的服务节点执行,每个服务阶段所管理的区域内可以具有多项功能,所述线卡单板可以通过对接收到的属性数据进行分析判断该线卡单板上的服务节点所管理区域内的各项功能是否发生故障。
在本公开第三个方面所提供的故障诊断规则确定方法中,可以确定影响所述分布式设备各项功能的关键属性,与本公开第一个方面所提供的故障诊断管理方法、以及本公开第二个方面所提供的故障诊断方法配合,可以对分布式设备的关键属性进行针对性的优化,并最终提高所述分布式设备的性能。
附图说明
图1是本公开所涉及的故障诊断系统的逻辑图;
图2是本公开所提供的故障诊断管理方法的第一种实施方式的流程图;
图3是本公开所提供的故障诊断管理方法的第二种实施方式的流程图;
图4是步骤S114的一种实施方式的流程图;
图5是本公开所提供的故障诊断管理方法的第三种实施方式的流程图;
图6是本公开所提供的故障诊断管理方法的第四种实施方式的流程图;
图7是本公开所提供给的故障诊断方法的第一种实施方式的流程图;
图8是本公开所提供给的故障诊断方法的第二种实施方式的流程图;
图9是本公开所提供的诊断规则确定方法的第一种实施方式的流程图;
图10是本公开所提供的诊断功能部署方法的流程图;
图11是本公开所提供的分布式设备执行诊断功能时的流程示意图;
图12是本公开实施例所涉及的分布式设备的示意图;
图13是本公开实施例1中所涉及的分布式设备的示意图;
图14是本公开实施例2中所涉及的分布式设备的示意图;
图15是本公开实施例3中所涉及的分布式设备的示意图;
图16是大数据处理服务器与分布式设备的交互示意图。
具体实施方式
为使本领域的技术人员更好地理解本公开的技术方案,下面结合附图对本公开提供的故障诊断管理方法进行详细描述。
在下文中将参考附图更充分地描述示例实施例,但是所述示例实施例可以以不同形式来体现且不应当被解释为限于本文阐述的实施例。反之,提供这些实施例的目的在于使本公开透彻和完整,并将使本领域技术人员充分理解本公开的范围。
在不冲突的情况下,本公开各实施例及实施例中的各特征可相互组合。
如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。
本文所使用的术语仅用于描述特定实施例,且不意欲限制本公开。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由……制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其它特征、整体、步骤、操作、元件、组件和/或其群组。
除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。
分布式设备包括设置在不同地点的子设备,每个子设备都能够完成不同的功能。在本公开中,下文所提到的故障诊断管理方法、故障诊断方法和故障诊断系统用于诊断分布式设备的各个功能是否正常。
从硬件上来说,分布式设备包括多个单板,多个单板分别为主控单板和至少一个线卡单板。所述分布式设备能够实现多个功能。对于任意一个功能而言,可以由任意一个单板上的软件或者硬件来实现,也可以由多个单板上的软件或硬件协同实现。并且,对于所述分布式设备而言,每个功能都可以是待诊断功能。当然,也存在如下情况:分布式设备的某一项或者某几项功能为待诊断功能。
如图1所示,所述故障诊断系统在逻辑上分为三层,中心服务节点(CENTER SERVERNODE)、服务节点(SERVER NODE)和处理节点(NODE)。每个单板上都配置有多个处理节点和至少一个服务节点。其中,在主控单板上配置有一个中心服务节点,当然,主控单板上也可以配置处理节点、以及服务节点。每个服务节点管理多个处理节点,每个中心服务节点管理多个服务节点。
每个待诊断的功能都对应多个处理节点,也就是说,对于一个待诊断的功能而言,可以通过多个处理节点收集不同的属性数据,然后上报至管理这多个处理节点的服务节点,由服务节点判断相应的功能是否出现故障,如服务节点无法判断是否出现故障或无法处理出现的故障,则由该服务节点或者直接由所述处理节点将相应的待诊断功能的属性数据上报至管理该服务节点的中心服务节点,由中心服务节点对所述待诊断功能进行诊断。
在本公开中,对所述分布式设备的具体类型不做特殊的限定。作为一种可选实施方式,所述分布式设备可以为分布式路由器(即,相关技术中所述的高端路由器)。
作为本公开的一个方面,提供一种故障诊断管理方法,应用于分布式设备的主控单板,如图2所示,包括:
在步骤S110中,接收至少一个待诊断功能的属性数据;
在步骤S120中,根据预设诊断规则对所述至少一个待诊断功能的属性数据进行分析,并得出诊断结果。
上文中所提供的中心服务节点部署在主控单板的CPU上,本公开提供的上述故障诊断管理方法所实现的是中心服务节点的功能。配置在所述主控单板的CPU上的中心服务节点接收到该中心服务节点对应至少一个待诊断功能的属性数据后,根据所述预设诊断规则对所述至少一个待诊断功能的属性进行分析,并得出诊断结果。因此,利用所述故障诊断管理方法可以快速实现对分布式设备的故障诊断,有利于及时发现故障、降低分布式设备的维护成本,并可以减少设备故障对所述分布式设备的用户所造成的影响,提高用户体验。
如上文中所述,所述待诊断功能可以分布在同一个单板上,也可以分布在多个单板上。相应地,所述诊断结果可以包括如下内容:被诊断的功能是否发生故障、故障发生的位置(例如,具体到那块单板上发生故障)、以及故障类型。
在本公开中,对如何根据所述诊断结果对发生故障的功能进行故障排除和修复不做特殊的限定。例如,所述主控单板可以将所述诊断结果发送至维护人员的终端设备,由维护人员根据所述诊断结果制定故障修复方案。或者,主控单板可以直接根据所述诊断结果对发生故障的功能进行故障排除和修复。
在本公开中,对所述分布式设备的具体类型不做特殊的限定,可选地,所述分布式设备可以是高端路由器。当将所述故障诊断管理方法应用于高端路由器中时,可以快速地判断该路由器的各项功能是否发生故障、并对发生故障的功能进行定位,从而可以节约维护所述高端路由器的成本,减少因设备故障对用户造成的影响,提高用户体验。
在本公开中,对所述预设诊断规则不做特殊的限定。例如,所述预设诊断规则可以为预先存储在本地的本地诊断规则,也可以为由大数据处理服务器下发的云端诊断规则。
作为一种可选实施方式,主控单板本地存储有所述本地诊断规则和所述云端诊断规则。
需要指出的是,所述本地诊断规则可以是分布式设备的维护人员根据所述分布式设备的运行情况、以及各项功能所设定的诊断规则。
可选地,所述云端诊断规则可以是大数据处理服务器根据分布式设备的各个处理节点收集到的相应功能的属性数据所确定的诊断规则。
由于大数据处理服务器可以收集多个分布式设备的各项功能的属性数据。不同的分布式设备可以执行相同的功能,执行相同功能的不同分布式设备所出现的故障也可能各不相同。通过大数据处理服务器可以接收到的数据种类更多、生成的诊断规则也更加全面。当主控单板本地同时存储有所述云端诊断规则和所述本地诊断规则时,优先利用所述云端诊断规则对所述待诊断功能进行诊断。当云端诊断规则不可用、或者无法给出诊断结果时,可以利用本地诊断规则对待诊断功能的属性数据进行分析。
在本公开中,对大数据处理服务器如何获得所述属性数据不做特殊的限定,例如,各个处理节点所在的单板可以直接将收集到的属性数据上传至大数据处理服务器。当然,各个处理节点可以将收集到的属性数据发送给相应的服务节点、再由所述服务节点将相应的属性数据上传至所述大数据处理服务器。可选地,所述服务节点也可以将各个处理节点上传的属性数据发送至配置中心服务节点的主控单板,再由该主控单板将所述属性数据上传至所述大数据处理服务器。
针对与最后一种方式由主控单板将所述属性数据上传至所述大数据处理服务器的实施方式,如图3所示,在步骤S120之前,所述故障诊断管理方法还包括:
在步骤S112中,将所述分布式设备的至少一项功能的属性数据发送至大数据处理服务器;
在步骤S114中,存储所述大数据处理服务器下发的所述云端诊断规则。
所述大数据处理服务器根据接收到的属性数据,确定对所述待诊断功能有影响的属性(可以将其称为关键属性),并据此生成相应的诊断规则。
由于大数据处理服务器并非只不针对一个分布式设备进行服务,而是针对多个不同的分布式设备进行服务。因此,大数据处理服务器所下发的诊断规则也可能是不加筛选的。换言之,当前主控单板所接收到的大数据处理服务器下发的诊断规则,可能会包括不针对所述当前主控单板能够执行的诊断规则。在这种情况下,主控单板需要对接收到的诊断规则进行筛选。
相应地,如图4所示,步骤S114包括:
在步骤S114a中,接收所述大数据处理服务器下发的至少一个诊断规则;
在步骤S114b中,从接收到的所有诊断规则中确定与当前主控单板对应的诊断规则(即,当前主控单板能够执行的诊断规则)作为所述云端诊断规则;
在步骤S114c中,存储所述云端诊断规则。
在本公开中,对如何进行所述步骤S114b不做特殊的限定,例如,所述大数据处理服务器可以在其生成的每个诊断规则中都添加与该诊断规则相对应的主控单板的标识信息。当主控单板接收到大数据处理服务器诊断规则后,将当前主控单板的标识信息与各个诊断规则中携带的标识信息进行比较,以筛选出当前主控单板能够执行的诊断规则,并将筛选出的规则作为所述云端诊断规则存储在所述主控单板本地。
如上文中所述,分布式设备的各项功能的属性数据可以为各个服务节点上传给中心服务节点的。每个服务节点都可以具有故障诊断功能。相应地,作为一种可选实施方式,如图5所示,所述故障诊断方法还包括:
在步骤S130中,将所述大数据处理服务器下发的与当前主控单板对应的各个服务节点相匹配的诊断规则下发至部署相应的服务节点的线卡单板。
各个服务节点接收到相应的诊断规则后,可以对各个服务节点所对应的待诊断功能进行诊断。
如上文中所示,每个中心服务节点可以管理多个服务节点,每个服务节点可以管理一个或多个区域内的功能。作为一种可选实施方式,所述大数据处理服务器所下发的诊断规则中携带有该诊断规则所能够诊断的功能的标识信息。主控单板可以根据该主控单板中部署的中心服务节点所管理的服务节点所管理的区域对应的功能来确定各个服务节点所对应的诊断规则,并将所述诊断规则下发至部署相应的服务节点的线卡单板。
在本公开中,对何时执行步骤S120不做特殊的限定。作为一种可选实施方式,可以在接收到属性数据后即刻执行步骤S120。作为一种可选实施方式,在步骤S120之前,所述故障诊断方法还可以包括如下判断步骤:
判断所述待诊断功能是否满足第一诊断触发条件。
当判断结果为是时,方执行步骤S120。
在本公开中,对所述第一诊断触发条件不做特殊的限定,例如,所述第一诊断触发条件可以为所述待诊断功能为由所述主控单板上配置的中心服务节点所能够诊断的功能。
在本公开中,可以通过解析触发诊断功能的第一条件脚本的方式来判断是否满足第一诊断触发条件。
作为一种可选实施方式,可以为由所述主控单板上配置的中心服务节点所诊断的各项待诊断功能配置标识信息,并在所述第一条件脚本中记录上述标识信息。因此,通过解析所述第一条件脚本可以判断是否满足所述第一诊断触发条件。
需要指出的是,所述条件脚本可以是在主控单板上配置中心服务节点时所配置的条件脚本。
并且,在本公开中,对步骤S110和“判断是否满足第一诊断触发条件”的步骤之间的先后顺序不做特殊的限定。可以先执行步骤S110、后执行“判断是否满足第一诊断触发条件”的步骤,也可以先执行“判断是否满足第一诊断触发条件”的步骤,再执行步骤S110。
在本公开中,主控单板也对应执行分布式设备的特定功能,主控单板上也配置有对应于所述特定功能的多个处理节点。
相应地,在接收至少一个待诊断功能的属性数据的步骤(即,步骤S110)之前,如图6所示,所述故障诊断管理方法还包括:
在步骤S101中,通过部署在当前主控单板上的处理节点采集当前主控单板对应的功能的属性数据。
换言之,主控单板中配置的中心服务节点接收到的属性数据,可以既包括本地的处理节点采集到的属性数据、又包括异地的处理节点所采集到的属性数据。
在本公开中,如图6所示,在步骤S110之前,所述故障诊断管理方法还包括:
在步骤S015中,确定当前主控单板所属的分布式设备的各项待诊断功能的分布情况。
在本公开中,可以通过解析待诊断功能的分布描述脚本的方式确定所述分布式设备的各项待诊断功能的分布情况。
需要指出的是,所述分布描述脚本可以是在部署所述中心服务节点时所配置的脚本。
作为本公开的第二个方面,提供一种故障诊断方法,应用于分布式设备的线卡单板,如图7所示,所述故障诊断方法包括:
在步骤S210中,接收多个处理节点发送的待诊断功能的属性数据;
在步骤S220中,根据所述线卡单板本地存储的诊断规则对与所述本地存储的诊断规则匹配的待诊断功能的属性数据进行分析,并得出诊断记过。
上述故障诊断方法由部署在线卡单板上的服务节点执行,每个服务阶段所管理的区域内可以具有多项功能,所述线卡单板可以通过对接收到的属性数据进行分析判断该线卡单板上的服务节点所管理区域内的各项功能是否发生故障。
在本公开中,对执行步骤S220的时机不做特殊的限定,在根据所述线卡单板本地存储的诊断规则对与所述本地存储的诊断规则匹配的待诊断功能进行诊断之前,如图8所示,所述故障诊断方法还包括:
在步骤S215中,判断是否满足第二诊断触发条件。
当步骤S215的判断结果为是时,执行步骤S220。
当步骤S215的判断结果为否时,无需执行步骤S220。
在本公开中,对第二诊断条件不做特殊的限定。例如,所述第二诊断触发条件可以为“待诊断的功能为能够被当前线卡单板上配置的服务节点诊断的功能”。
作为一种可选实施,可以在各项待诊断功能内配置标识信息,并在线卡单板本地也配置能够被当前线卡单板所诊断的功能的标识信息,通过将接收的属性数据中所携带的功能标识信息与本地存储的标识信息相对比,可以判断所述待诊断功能是否满足所述第二诊断触发条件。
在本公开中,可以通过解析触发诊断功能的第二条件脚本的方式来判断是否满足第二诊断触发条件。具体地,可以在配置在所述线卡单板本地的所述第二条件脚本中携带能够被当前线卡单板所诊断的功能的标识信息。
所述第二条件脚本可以为部署所述服务节点时所配置的脚本。
为了更好地对分布式设备的待诊断功能进行诊断,可选地,如图8所示,所述故障诊断方法还可以包括:
在步骤S230中,将与所述线卡单板本地存储的诊断规则不匹配的待诊断功能对应的属性数据上报至配置有中心服务节点的主控单板。
在所述线卡单板中配置有服务节点,每个服务节点管理多个处理节点。在本公开中,线卡单板中配置的服务节点具有部分诊断功能,也就是说,线卡单板中存储的诊断规则仅能对待诊断功能的部分故障类型进行诊断和处理,一旦超出当前服务节点的处理范围,配置当前服务节点的线卡单板即将相应的诊断功能对应的属性数据上报至该服务节点对应的中心服务节点,由所述中心服务节点对所述待诊断功能进行诊断。
本公开所提供的故障诊断方法与本公开第一个方面所提供的故障诊断管理方法相配合,可以进一步提高故障诊断的效率。
在本公开中,对线卡单板如何获得存储在本地的诊断规则不做特殊的限定。例如,可以通过维护人员预先配置的方式获得存储在线卡单板本地的诊断规则。当然,也可以由和当前线卡单板上配置的服务节点相对应的中心服务节点为该服务节点下发诊断规则。具体地,中心服务节点下发的诊断规则,可以为大数据处理服务器生成的、与所述服务节点所管理的功能相对应的诊断规则。
在同一个线卡单板上,可以部署多个完整的功能,也可以只部署某项功能的一部分。也就是说,当前线卡单板上的处理节点可以和其他线卡单板上的处理节点协同完成某项功能。将需要多个线卡单板协同完成的功能称为跨板功能,在本公开中,当前线卡单板无法获取其他线卡单板上的数据,因此,与所述线卡单板本地存储的诊断规则不匹配的待诊断功能为所述跨板功能。
相应地,与所述线卡单板本地存储的诊断规则匹配的待诊断功能的处理节点均部署在所述线卡单板本地。
在本公开中,可以通过在部署服务节点时,配置处理节点描述脚本的方式来记录与各个功能项对应的处理节点的分布情况。具体地,每个处理节点都具有识别码,对应同一功能的节点,识别码至少部分相同。
除此之外,还可以在处理节点描述脚本中携带各个属性数据所对应的结论或者动作。
作为本公开的第三个方面,提供一种故障诊断规则确定方法,应用于大数据处理服务器,如图9所示,所述故障诊断规则确定方法包括:
在步骤S310中,接收分布式设备的各项功能的属性数据;
在步骤S320中,根据接收到的属性数据确定对所述分布式设备的各项功能产生影响的属性数据;
在步骤S330中,根据对所述分布式设备的各项功能产生影响的属性数据生成相应的诊断规则。
各项功能的属性数据可以由中心服务节点发送至所述大数据处理服务器,也可以由服务节点发送至所述大数据处理服务器,还可以由各个处理节点直接发送至所述大数据处理服务器。
需要指出的是,此处“对所述分布式设备的各项功能产生影响的属性数据”即为上文中所述的“关键属性”所对应的属性数据。在所述故障诊断规则确定方法中,可以确定影响所述分布式设备各项功能的关键属性,与本公开第一个方面所提供的故障诊断管理方法、以及本公开第二个方面所提供的故障诊断方法配合,可以对分布式设备的关键属性进行针对性的优化,并最终提高所述分布式设备的性能。
由于大数据处理服务器可以收集多个分布式设备的各项功能的属性数据。不同的分布式设备可以执行相同的功能,执行相同功能的不同分布式设备所出现的故障也可能各不相同。通过大数据处理服务器可以接收到的数据种类更多、生成的诊断规则也更加全面。
作为本公开的第四个方面,提供一种诊断功能部署方法,如图10所示,所述部署方法包括:
在步骤S410中,确定所述分布式设备的各项功能的特征信息;
在步骤S420中,确定中心服务节点、多个处理节点和多个服务节点的分布信息,其中,所述中心服务节点配置在所述分布式设备的多个单板中的主控单板上,所述分布式设备的每项功能都对应多个所述处理节点,所述处理节点用于收集相应的功能的属性数据,所述服务节点配置于所述分布式设备至少一个单板上,所述处理节点配置于所述分布式设备的至少一个单板上。
对于所述分布式设备的任意一项功能而言,该功能可以部署在一个单板上,也可以部署在多个单板上。因此,对于任意一项功能而言,该功能的特征信息可以包括部署该功能的单板的标识信息、以及该功能的各项属性的属性数据。
并且,此处,所述主控单板能够实现本公开第一个方面所提供的故障诊断管理方法、部署了服务节点所述线卡单板看可以实现本公开第二个方面所提供的故障诊断方法。
需要指出的是,对于同一个处理节点而言,该处理节点可以部署在同一个单板上,也可以部署在多个单板上。也就是说,多个单板上的软件或硬件可以协同完成一个处理节点的功能。
利用本公开所提供的诊断功能部署方法部署中心服务节点、服务节点、以及处理节点,能够在所述分布式设备运行的过程中实现本公开第一个方面所提供的故障诊断管理方法、本公开第二个方面所提供的故障诊断方法,并辅助大数据处理服务器实现本公开第三个方面所提供的诊断规则确定方法。
可选地,所述部署方法还可以包括:
在主控单板上配置第一诊断功能分布描述脚本,以供主控单板进行解析。主控单板通过解析所述第一诊断功能分布脚本可以确定待诊断功能在所述分布式设备上的分布情况。
可选地,所述部署方法还可以包括:
在部署有服务节点的单板上配置第二诊断功能分布描述脚本,以供部署由所述服务节点的单板进行解析。配置有所述服务节点的单板通过解析所述第二诊断功能分布脚本可以确定该服务节点所负责区域内待诊断功能的分布情况。
可选地,所述部署方法还可以包括:
配置待诊断功能的处理节点描述脚本,以供配置有相应服务节点的线卡单板进行解析。该处理节点描述脚本包括待诊断功能所分布的区域、以及在同一个待诊断功能中各个处理节点的标识信息(例如,识别码)、每个属性数据所对应的动作或结论。
进一步可选地,所述处理节点描述脚本还可以包括处理节点所采集到的属性数据在各种情况下相对应的结论或者动作。即,所述处理节点描述脚本还可以包括本地诊断规则。
可选地,所述部署方法还可以包括:
配置第一条件脚本,以供所述主控单板进行解析,并供所述主控单板根据解析结果判断所述主控单板当前的条件是否满足所述第一诊断条件。
可选地,所述部署方法还可以包括:
配置第二条件脚本,以供配置有服务节点的单板进行解析,并供所述主控单板根据解析结果判断配置所述服务节点的单板当前的条件是否满足所述第二诊断条件。
本公开还提供一种主控单板,包括:
第一存储模块,其上存储有第一可执行程序;
一个或多个第一处理器,所述一个或多个第一处理器能够调用所述第一可执行程序,以使得所述一个或多个第一处理器实现本公开第一个方面所提供的故障诊断管理方法。
上文中已经对所述故障诊断方法的工作原理以及有益效果进行了详细的描述,这里不再赘述。
需要指出的是,除了可以实现故障诊断管理方法之外,所述主控单板还可以实现主控单板的其他功能。
例如,主控单板的第一处理器可以控制和管理包括多个线卡单板的分布式设备,并对所述主控单板内部各个模块进行初始化配置和管理。
其中,第一处理器为具有数据处理能力的器件,其包括但不限于中央处理器(CPU)等;第一存储模块为具有数据存储能力的器件,其包括但不限于随机存取存储器(RAM,更具体如SDRAM、DDR等)、只读存储器(ROM)、带电可擦可编程只读存储器(EEPROM)、闪存(FLASH)。
可选地,所述主控单板还可以包括I/O接口(读写接口),该I/O接口连接在第一处理器与第一存储模块间,能实现第一处理器与第一存储模块之间的信息交互,其包括但不限于数据总线(Bus)等。
在一些实施例中,第一处理器、第一存储模块和I/O接口通过总线相互连接,进而与计算设备的其它组件连接。
本公开还提供一种线卡单板,包括:
第二存储模块,其上存储有第二可执行程序;
一个或多个第二处理器,所述一个或多个第二处理器能够调用所述第二可执行程序,以使得所述一个或多个第一处理器实现根据本公开第二个方面所提供的故障诊断方法。
需要指出的是,线卡单板为分布式设备中的业务单板,具有处理业务的功能。
当所述分布式设备为高端路由器时,所述线卡单板还可以具有负责业务流的接口接入、路由转发、调度、整形等功能。此外,所述线卡单板还可以完成控制码的管理监控、协议处理、时钟同步等多个功能。
其中,第二处理器为具有数据处理能力的器件,其包括但不限于中央处理器(CPU)等;第二存储模块为具有数据存储能力的器件,其包括但不限于随机存取存储器(RAM,更具体如SDRAM、DDR等)、只读存储器(ROM)、带电可擦可编程只读存储器(EEPROM)、闪存(FLASH)。
可选地,所述线卡单板还可以包括I/O接口(读写接口),该I/O接口连接在第二处理器与第二存储模块间,能实现第二处理器与第二存储模块之间的信息交互,其包括但不限于数据总线(Bus)等。
在一些实施例中,第二处理器、第二存储模块和I/O接口通过总线相互连接,进而与计算设备的其它组件连接。
所述分布式设备的每个功能都可以由一个线卡单板完成,也可以由多个线卡单板协同完成。
本公开还提供一种大数据处理服务器,包括:
第三存储模块,其上存储有第三可执行程序;
一个或多个第三处理器,所述一个或多个第三处理器能够调用所述第三可执行程序,以使得所述一个或多个第三处理器实现根据本公开第三个方面所提供的故障诊断规则确定方法。
其中,第三处理器为具有数据处理能力的器件,其包括但不限于中央处理器(CPU)等;第三存储模块为具有数据存储能力的器件,其包括但不限于随机存取存储器(RAM,更具体如SDRAM、DDR等)、只读存储器(ROM)、带电可擦可编程只读存储器(EEPROM)、闪存(FLASH)。
可选地,所述主控单板还可以包括I/O接口(读写接口),该I/O接口连接在第三处理器与第三存储模块间,能实现第三处理器与第三存储模块之间的信息交互,其包括但不限于数据总线(Bus)等。
在一些实施例中,第三处理器、第三存储模块和I/O接口通过总线相互连接,进而与计算设备的其它组件连接。
作为本公开的第五个方面,提供一种分布式设备,包括多个单板,所述多个单板包括主控单板和至少一个线卡单板,所述线卡单板为本公开所提供的上述线卡单板。
在本公开所提供的分布式设备中,可以部署多个服务节点以及多个处理节点。
所述分布式设备的每个单板都具有处理器(CPU),以实现相应的功能。例如,主控单板用于控制和管理具有多个处理器的分布式设备,需要指出的是,在所述分布式设备中,只有一个处于工作状态中的主控单板。
线卡单板为业务处理单板,当所述分布式设备用作高端路由器时,所述线卡单板负责业务流接口接入、路由转发、调度、整形,还能够完成控制码的管理监控、协议处理、时钟同步等多项功能。上述每项功能既可以由一个处理节点完成、也可以由多个处理节点系统完成。当然,一个处理节点也可以参与多项功能。
在所述分布式设备中,可以部署一个或零个中心服务节点。
当部署了一个中心服务节点时,所述主控单板为本公开所提供的上述主控单板。
本公开所提供的分布式设备在处理正常业务的同时,通过部署中心服务节点、服务节点和处理节点,可以快速地实现故障诊断和修复,节约了设备维护的成本,减少了对用户的影响,提高了用户体验。
下面结合图11对本公开所提供的分布式设备进行故障诊断的原理进行详细的描述。
首先,主控单板通过中心服务节点判断待诊断功能是否满足第一触发条件;
当判断结果为是时(即,满足第一诊断触发条件),主控单板通过中心服务节点获取各个处理节点的属性数据;主控单板按照诊断规则对所述属性数据进行分析,并给出诊断结果;
当判断结果为否时,(即,不满足第一诊断触发条件),由部署在单板上的服务节点继续判断待诊断功能是否满足第二诊断触发条件。
相应地,无论是否满足第一诊断触发条件,部署在单板上的服务节点均执行判断是否满足第二诊断触发条件的步骤;
当判断结果为是时(即,满足第诊断二触发条件),部署服务节点的单板获取处理节点采集的属性数据;部署服务节点的单板按照诊断规则对所述属性数据进行分析,并给出诊断结果。
图16中所示的是大数据处理服务器与所述分布式设备的交互示意图。如图所示,大数据处理服务器300接收分布式设备的各个单板(包括主控单板110和线卡单板220)上传的属性数据,并将生成的规则下发给分布式设备的主控单板。
本公开还提供一种电子设备,包括:
第四存储模块,其上存储有第四可执行程序;
一个或多个第四处理器,所述一个或多个第四处理器能够调用所述第四可执行程序,以使得所述一个或多个第四处理器实现根据本公开第四个方面所提供的诊断功能部署方法。
其中,第四处理器为具有数据处理能力的器件,其包括但不限于中央处理器(CPU)等;第四存储模块为具有数据存储能力的器件,其包括但不限于随机存取存储器(RAM,更具体如SDRAM、DDR等)、只读存储器(ROM)、带电可擦可编程只读存储器(EEPROM)、闪存(FLASH)。
可选地,所述主控单板还可以包括I/O接口(读写接口),该I/O接口连接在第四处理器与第一存储模块间,能实现第四处理器与第四存储模块之间的信息交互,其包括但不限于数据总线(Bus)等。
在一些实施例中,第四处理器、第四存储模块和I/O接口通过总线相互连接,进而与计算设备的其它组件连接。
作为本公开的第六个方面,提供一种计算机可读存储介质,其上存储有可执行程序,当所述可执行程序被调用时,能够实现以下方法中的任意一者:
本公开第一个方面所提供的故障诊断管理方法;
本公开第二个方面所提供的故障诊断方法;
本公开第三个方面所提供的故障诊断规则确定方法;
本公开第四个方面所提供的诊断功能部署方法。
计算机可读存储介质包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光盘存储、磁盒、磁带、磁盘存储或其它磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其它的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其它传输机制之类的调制数据信号中的其它数据,并且可包括任何信息递送介质。
实施例
图12中所示的是一种分布式路由器(即,上文中所述的高端路由器)的示意图,该分布式设备包括主控单板110和多个线卡单板(图中示出了两个线卡单板,分别为线卡单板210和线卡单板220)。
主控单板110用于控制和管理具有多个处理器的分布式设备,需要指出的是,在所述分布式设备中,只有一个处于工作状态中的主控单板。
线卡单板为业务处理单板,负责业务流接口接入、路由转发、调度、整形,还能够完成控制码的管理监控、协议处理、时钟同步等多项功能。上述每项功能既可以由一个处理节点完成、也可以由多个处理节点协同完成。当然,一个处理节点也可以参与多项功能。在图13中所示的实施方式中,示意性地示出了线卡单板210上的处理节点可以完成功能A、线卡单板220上的处理节点可以完成功能B。线卡单板210和线卡单板220均能够与主控单板110进行信息交互。
当然,多个线卡单板还可以协同实现某种特定的功能(为了便于描述,将其称为跨板功能)。
实施例1
如图13所示,待诊断功能C只分布在主控单板110上,主控单板110上配置有中心服务节点和多个处理节点,需要通过主控单板上的处理节点采集待诊断功能的属性数据、并由主控单板对该属性数据极性分析、并得出诊断结果。
实施例2
如图14所示,待诊断功能D分布在线卡单板210上,待诊断功能E分布在线卡单板220上。线卡单板210上配置的服务节点可以通过功能D对应的处理节点所采集的属性数据对功能D进行诊断和处理;线卡单板220上配置的服务节点可以通过功能E对应的处理节点所采集的属性数据对功能E进行诊断和处理。
并且,线卡单板210能够独立地对功能D进行诊断,无需上报给主控单板110,线卡单板220能够独立地对功能E进行诊断,无需上报给主控单板110。
实施例3
如图15所示,待诊断功能部署在不同的线卡单板上,即,所述待诊断功能为跨板功能。线卡单板210上的服务节点无法获取部署在线卡单板220上的节点的属性数据,线卡单板220也无法获取部署在线卡单板220上的节点的属性数据。此时,线卡单板210和线卡单板220将各自获取到的功能F的数据上报至主控单板110,由主控单板110对线卡单板210上报的属性数据、以及线卡单板220上报的属性数据进行分析,并对待诊断功能F进行诊断。
本文已经公开了示例实施例,并且虽然采用了具体术语,但它们仅用于并仅应当被解释为一般说明性含义,并且不用于限制的目的。在一些实例中,对本领域技术人员显而易见的是,除非另外明确指出,否则可单独使用与特定实施例相结合描述的特征、特性和/或元素,或可与其它实施例相结合描述的特征、特性和/或元件组合使用。因此,本领域技术人员将理解,在不脱离由所附的权利要求阐明的本公开的范围的情况下,可进行各种形式和细节上的改变。

Claims (18)

1.一种故障诊断管理方法,应用于分布式设备的主控单板,所述故障诊断管理方法包括:
接收至少一个待诊断功能的属性数据;
根据预设诊断规则对所述至少一个待诊断功能的属性数据进行分析,并得出诊断结果,
在接收至少一个待诊断功能的属性数据之前,所述故障诊断管理方法还包括:
确定当前主控单板所属的分布式设备的各项待诊断功能的分布情况。
2.根据权利要求1所述的故障诊断管理方法,其中,所述预设诊断规则包括预先存储在本地的本地诊断规则和/或由大数据处理服务器下发的云端诊断规则。
3.根据权利要求2所述的故障诊断管理方法,其中,所述预设诊断规则包括所述云端诊断规则,在根据预设诊断规则对所述至少一个待诊断功能的属性数据进行分析的步骤之前,所述故障诊断管理方法还包括:
将所述分布式设备的至少一项功能的属性数据发送至大数据处理服务器;
存储所述大数据处理服务器下发的所述云端诊断规则。
4.根据权利要求3所述的故障诊断管理方法,其中,存储所述大数据处理服务器下发所述云端诊断规则包括:
接收所述大数据处理服务器下发的至少一个诊断规则;
从接收到的所有诊断规则中确定与当前主控单板对应的诊断规则作为所述云端诊断规则;
存储所述云端诊断规则。
5.根据权利要求4所述的故障诊断管理方法,其中,在接收待诊断功能的属性数据的步骤中,所述属性数据由服务节点所发送,所述故障诊断方法还包括:
将所述大数据处理服务器下发的与当前主控单板对应的各个服务节点相匹配的诊断规则分别下发至部署相应的服务节点的线卡单板。
6.根据权利要求5所述的故障诊断管理方法,其中,当前主控单板上部署有处理节点,在接收至少一个待诊断功能的属性数据步骤之前,所述故障诊断管理方法还包括:
通过部署在当前主控单板上的处理节点采集当前主控单板所对应的功能的属性数据,其中,
在接收至少一个待诊断功能的属性数据的步骤中,接收到的属性数据包括部署在当前主控单板上的处理节点采集到的属性数据。
7.根据权利要求1至6中任意一项所述的故障诊断管理方法,其中,在根据预设诊断规则对所述待诊断功能进行诊断的步骤前,所述故障诊断方法还包括:
判断所述待诊断功能是否满足第一诊断触发条件;
当判断结果为是时,执行所述根据预设诊断规则对所述待诊断功能进行诊断的步骤。
8.一种故障诊断方法,应用于分布式设备的线卡单板,所述故障诊断方法包括:
接收多个处理节点发送的待诊断功能的属性数据;
根据所述线卡单板本地存储的诊断规则对与所述本地存储的诊断规则匹配的待诊断功能的属性数据进行分析,并得出诊断结果,
所述故障诊断方法还包括:
接收与当前线卡单板对应的主控单板下发的与当前线卡单板相对应的诊断规则。
9.根据权利要求8所述的故障诊断方法,其中,在根据所述线卡单板本地存储的诊断规则对与所述本地存储的诊断规则匹配的待诊断功能进行诊断之前,所述故障诊断方法还包括:
判断所述待诊断功能是否满足第二诊断触发条件;
当判断结果为是时,执行根据所述线卡单板本地存储的诊断规则对与所述本地存储的诊断规则匹配的待诊断功能进行诊断的步骤。
10.根据权利要求8所述的故障诊断方法,其中,所述故障诊断方法还包括:
将与所述线卡单板本地存储的诊断规则不匹配的待诊断功能对应的属性数据上报至主控单板。
11.根据权利要求10所述的故障诊断方法,其中,与所述线卡单板本地存储的诊断规则不匹配的待诊断功能为跨板功能,其中,跨板功能的部分处理节点部署在当前线卡单板上,其余处理节点部署在其他线卡单板上;
与所述线卡单板本地存储的诊断规则匹配的待诊断功能的处理节点均部署在所述线卡单板本地。
12.根据权利要求8至11中任意一项所述的故障诊断方法,其中,在接收多个处理节点发送的待诊断功能的属性数据的步骤之前,所述故障诊断方法还包括:
确定与当前线卡单板对应的功能。
13.一种故障诊断规则确定方法,应用于大数据处理服务器,所述故障诊断规则确定方法包括:
接收分布式设备的各项功能的属性数据;
根据接收到的属性数据确定对所述分布式设备的各项功能产生影响的属性数据;
根据对所述分布式设备的各项功能产生影响的属性数据生成相应的诊断规则。
14.根据权利要求13所述的故障诊断规则确定方法,其中,还包括:
根据对所述分布式设备的各项功能产生影响的属性数据生成相应的优化规则。
15.一种分布式设备的诊断功能部署方法,包括:
确定所述分布式设备的各项功能的特征信息,所述分布式设备包括多个单板,所述多个单板包括主控单板和至少一个线卡单板;
确定中心服务节点、多个处理节点和多个服务节点的分布信息,其中,所述中心服务节点配置在所述分布式设备的多个单板中的主控单板上,所述分布式设备的每项功能都对应多个所述处理节点,所述处理节点用于收集相应的功能的属性数据,所述服务节点配置于所述分布式设备至少一个单板上,所述处理节点配置于所述分布式设备的至少一个单板上;其中,
部署有中心服务节点的主控单板能够实现权利要求1至7中任意一项所述的故障诊断管理方法;
部署有服务节点的线卡单板能够实现权利要求8至12中任意一项所述的故障诊断方法。
16.一种分布式设备,包括多个单板,所述多个单板包括主控单板和至少一个线卡单板,
所述主控单板包括第一存储模块、一个或多个第一处理器;
所述线卡单板包括:
第二存储模块,其上存储有第二可执行程序;
一个或多个第二处理器,所述一个或多个第二处理器能够调用所述第二可执行程序,以使得所述一个或多个第一处理器实现根据权利要求8至12中任意一项所述的故障诊断方法。
17.根据权利要求16所述的分布式设备,其中,所述第一存储模块上存储有第一可执行程序;
所述一个或多个第一处理器能够调用所述第一可执行程序,以使得所述一个或多个第一处理器实现根据权利要求1至7中任意一项所述的故障诊断管理方法。
18.一种计算机可读存储介质,其上存储有可执行程序,当所述可执行程序被调用时,能够实现以下方法中的任意一者:
权利要求1至7中任意一项所述的故障诊断管理方法;
权利要求8至12中任意一项所述的故障诊断方法;
权利要求13或14所述的故障诊断规则确定方法;
权利要求15所述的诊断功能部署方法。
CN202010744447.5A 2020-07-29 2020-07-29 诊断及管理、规则确定及部署方法、分布式设备、介质 Active CN112838944B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010744447.5A CN112838944B (zh) 2020-07-29 2020-07-29 诊断及管理、规则确定及部署方法、分布式设备、介质
EP21849428.4A EP4191906A4 (en) 2020-07-29 2021-07-28 FAULT DIAGNOSIS METHODS, FAULT DIAGNOSIS RULE DETERMINATION METHOD, DIAGNOSTIC FUNCTION DEPLOYMENT METHOD, RELATED DEVICE AND STORAGE MEDIUM
PCT/CN2021/108866 WO2022022556A1 (zh) 2020-07-29 2021-07-28 故障的诊断方法及诊断规则确定方法、诊断功能部署方法,及相关设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010744447.5A CN112838944B (zh) 2020-07-29 2020-07-29 诊断及管理、规则确定及部署方法、分布式设备、介质

Publications (2)

Publication Number Publication Date
CN112838944A CN112838944A (zh) 2021-05-25
CN112838944B true CN112838944B (zh) 2022-08-12

Family

ID=75923215

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010744447.5A Active CN112838944B (zh) 2020-07-29 2020-07-29 诊断及管理、规则确定及部署方法、分布式设备、介质

Country Status (3)

Country Link
EP (1) EP4191906A4 (zh)
CN (1) CN112838944B (zh)
WO (1) WO2022022556A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112838944B (zh) * 2020-07-29 2022-08-12 中兴通讯股份有限公司 诊断及管理、规则确定及部署方法、分布式设备、介质
US20230300068A1 (en) * 2020-08-03 2023-09-21 Drivenets Ltd. Synchronization in Distributed Communication Systems
CN115242612B (zh) * 2022-07-22 2024-04-26 烽火通信科技股份有限公司 一种故障诊断方法和装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060112061A1 (en) * 2004-06-24 2006-05-25 Masurkar Vijay B Rule based engines for diagnosing grid-based computing systems
US7536370B2 (en) * 2004-06-24 2009-05-19 Sun Microsystems, Inc. Inferential diagnosing engines for grid-based computing systems
US8028196B2 (en) * 2008-11-18 2011-09-27 Gtech Corporation Predictive diagnostics and fault management
US8280835B2 (en) * 2009-01-29 2012-10-02 Telcordia Technologies, Inc. Method for automated distributed diagnostics for networks
CN101702661B (zh) * 2009-11-19 2012-06-13 中兴通讯股份有限公司 一种诊断信息的获取方法及装置
CN102055624A (zh) * 2010-12-30 2011-05-11 中兴通讯股份有限公司 连通性故障检测方法和系统
CN102158359B (zh) * 2011-04-01 2015-05-20 中兴通讯股份有限公司 单板故障定位装置及方法
CN102769539B (zh) * 2012-07-04 2015-07-08 杭州华三通信技术有限公司 一种分布式网络设备转发故障诊断方法及设备
CN103838637A (zh) * 2014-03-03 2014-06-04 江苏智联天地科技有限公司 基于数据挖掘的终端自主故障诊断与恢复方法
CN105740140A (zh) * 2014-12-10 2016-07-06 中兴通讯股份有限公司 软件系统故障诊断方法、服务器及系统
CN109581995B (zh) * 2017-09-28 2021-09-17 上海微电子装备(集团)股份有限公司 一种智能诊断系统与方法
CN110535710A (zh) * 2019-09-09 2019-12-03 锐捷网络股份有限公司 网络设备的远程诊断方法及系统、网络设备及云服务器
CN112838944B (zh) * 2020-07-29 2022-08-12 中兴通讯股份有限公司 诊断及管理、规则确定及部署方法、分布式设备、介质

Also Published As

Publication number Publication date
CN112838944A (zh) 2021-05-25
WO2022022556A1 (zh) 2022-02-03
EP4191906A1 (en) 2023-06-07
EP4191906A4 (en) 2024-09-25

Similar Documents

Publication Publication Date Title
CN112838944B (zh) 诊断及管理、规则确定及部署方法、分布式设备、介质
US8347143B2 (en) Facilitating event management and analysis within a communications environment
US8370466B2 (en) Method and system for providing operator guidance in network and systems management
US9893940B1 (en) Topologically aware network device configuration
US8990778B1 (en) Shadow test replay service
US8769081B2 (en) Remotely monitoring a data processing system via a communications network
US7607043B2 (en) Analysis of mutually exclusive conflicts among redundant devices
US20180067795A1 (en) Systems and methods for automatic replacement and repair of communications network devices
US8245079B2 (en) Correlation of network alarm messages based on alarm time
CN108710673A (zh) 实现数据库高可用方法、系统、计算机设备和存储介质
GB2505644A (en) Managing network configurations
US7995485B1 (en) Method and apparatus for providing automated diagnostics of networks
Xu et al. Logdc: Problem diagnosis for declartively-deployed cloud applications with log
CN113973042A (zh) 用于网络问题的根本原因分析的方法和系统
JP2007208633A (ja) ネットワーク設計装置、ネットワーク設計方法およびネットワーク設計プログラム
WO2006117833A1 (ja) 監視シミュレーション装置,方法およびそのプログラム
CN112068935A (zh) kubernetes程序部署监控方法、装置以及设备
CN116016123A (zh) 故障处理方法、装置、设备及介质
CN112468330B (zh) 一种故障节点的设置方法、系统、设备以及介质
CN113055203B (zh) Sdn控制平面的异常恢复方法及装置
US10999128B2 (en) System and method for automatically repairing a faultily connected network element
WO2016026510A1 (en) Hardware fault identification management in a network
CN112882892B (zh) 数据处理方法和装置、电子设备及存储介质
CN113938399A (zh) 专线开通方法及装置
CN113010432A (zh) 基于流量时序回放的白盒仿真测试方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant