CN107947999A - 一种确定告警发生顺序的方法及装置 - Google Patents

一种确定告警发生顺序的方法及装置 Download PDF

Info

Publication number
CN107947999A
CN107947999A CN201711384900.0A CN201711384900A CN107947999A CN 107947999 A CN107947999 A CN 107947999A CN 201711384900 A CN201711384900 A CN 201711384900A CN 107947999 A CN107947999 A CN 107947999A
Authority
CN
China
Prior art keywords
alarm
time
network element
element device
origin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711384900.0A
Other languages
English (en)
Inventor
张晨芳
张贺
郑滟雷
赵良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN201711384900.0A priority Critical patent/CN107947999A/zh
Publication of CN107947999A publication Critical patent/CN107947999A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/02Details
    • H04J3/06Synchronising arrangements
    • H04J3/0635Clock or time synchronisation in a network
    • H04J3/0638Clock or time synchronisation among nodes; Internode synchronisation
    • H04J3/0658Clock or time synchronisation among packet nodes
    • H04J3/0661Clock or time synchronisation among packet nodes using timestamps
    • H04J3/0667Bidirectional timestamps, e.g. NTP or PTP for compensation of clock drift and for compensation of propagation delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供一种确定告警发生顺序的方法及装置。用以准确判断不同告警发生的先后顺序,从而能够很好地为故障分析和定位提供依据。应用于包含网管服务器和至少两个网元设备的网管系统,该网管系统中各个网元设备之间保持时间同步;该方法包括:该网管服务器接收至少一个网元设备发送的至少一个告警上报信息,该告警上报信息包括告警信息和告警发生时间;该网管服务器根据所接收到的每个告警上报信息包含的告警发生时间,确定各个告警信息发生的先后顺序。本申请涉及通信技术领域。

Description

一种确定告警发生顺序的方法及装置
技术领域
本申请涉及通信技术领域,尤其涉及一种确定告警发生顺序的方法及装置。
背景技术
随着通信网络建设的不断深入发展,在追求高带宽、高速率的同时,通信网络的安全性和高效性也变得越来越重要,运维工作不断向精细化、高效化发展。针对网络运维而言,网元设备能主动向网管系统上报产生的告警信息,是通信网络管理系统的基本功能之一。
目前,对于承载网络的网元设备和网管系统,网管服务器上可查看的告警报表,其中的告警时间为网管服务器接收到告警的时刻,网管服务器接收到告警的时刻不是只由告警在设备上的产生时刻确定,还受告警上报时延和网管系统接口性能的影响。其中,告警上报时延指从实时告警(实际告警产生)发生到被管设备发出告警的延迟时间,如果每台设备对告警信息的处理能力不同,则每台设备的告警上报时延不同。由于现网中每个网管服务器所管理设备(网元)的数目都很大,因此,用网管服务器接收到告警的时刻来表示告警产生时间并不准确。特别是现网运维过程中,当出现某一故障告警(根告警),会引起一系列大量的衍生告警的情况,尤其是当大量网元设备在很短时间内(几秒或十几秒)都产生了告警的情况下,由于不同的网元设备传输所需的时延不同,网管服务器接收到告警的时刻不能准确反映各告警产生的先后顺序,给告警相关性分析、故障定位以及确定故障根源等工作增加了不利条件。
发明内容
为了解决上述技术问题,本申请提供一种确定告警发生顺序的方法及装置,用以准确判断不同告警发生的先后顺序,从而能够很好地为故障分析和定位提供依据。
第一方面,本发明实施例提供一种确定告警发生顺序的方法,应用于包含网管服务器和至少两个网元设备的网管系统,该网管系统中各个网元设备之间保持时间同步;该方法包括:该网管服务器接收至少一个网元设备发送的至少一个告警上报信息,每个所述告警上报信息分别包括对应的网元设备的告警信息和告警发生时间;该网管服务器根据所接收到的每个告警上报信息包含的告警发生时间,确定各个告警信息发生的先后顺序。
结合第一方面,在第一种可能的实现方式中,该告警上报信息为报文形式,包括时间字段和保留字段,该时间字段用于设置该告警发生时间。
结合第一方面或第一方面的第一种可能的实现方式,在第二种可能的实现方式中,各个网元设备通过跟踪GPS的方式保持时间同步;或者,各个网元设备通过PTP或者NTP协议保持时间同步。
第二方面,本发明实施例提供一种确定告警发生顺序的方法,应用于包含网管服务器和至少两个网元设备的网管系统;该方法包括:第一网元设备保持与该网管系统中除该第一网元设备之外的网元设备时间同步;该第一网元设备为该网管系统中的任意一个网元设备;在该第一网元设备发生告警时,采集第一告警发生时间;该第一网元设备向该网管服务器发送告警上报信息,该告警上报信息包括告警信息和第一告警发生时间。
结合第二方面,在第一种可能的实现方式中,在采集第一告警发生时间之后,该方法还包括:存储该第一网元设备采集的该第一告警发生时间。
结合第二方面的第一种可能的实现方式,在第二种可能的实现方式中,存储该第一网元设备采集的该第一告警发生时间,包括:若该第一网元设备中存储有第二告警发生时间,则将第二告警发生时间更新为该第一告警发生时间。
结合第二方面、第二方面的第一种可能的实现方式或第二方面的第二种可能的实现方式,在第三种可能的实现方式中,该告警上报信息为报文形式,包括时间字段和保留字段,该时间字段用于设置该告警发生时间。
结合第二方面、第二方面的第一种可能的实现方式、第二方面的第二种可能的实现方式或第二方面的第三种可能的实现方式,在第四种可能的实现方式中,各个网元设备通过跟踪GPS的方式保持时间同步;或者,各个网元设备通过PTP或者NTP协议保持时间同步。
第三方面,本发明实施例提供一种确定告警发生顺序的装置,应用于包含网管服务器和至少两个网元设备的网管系统,该网管系统中各个网元设备之间保持时间同步;该装置包括:
接收模块;该接收模块用于接收告警上报信息,该告警上报信息包括告警信息和告警发生时间;
确定模块,该确定模块用于根据每个告警上报信息包含的告警发生时间,确定各个告警信息发生的先后顺序。
第四方面,本发明实施例提供一种确定告警发生顺序的装置,应用于包含网管服务器和至少两个网元设备的网管系统,该装置包括:
时间同步模块,该时间同步模块用于保持第一网元设备与该网管系统中除第一网元设备以外的网元设备时间同步,该第一网元设备为该网管系统中的任意一个网元设备;
采集模块,该采集模块用于在该第一网元设备发生告警信息时,采集第一告警发生时间;
告警上报模块,该告警上报模块用于向该网管服务器发送告警上报信息,该告警上报信息包括告警信息和第一告警发生时间。
结合第四方面,在第一种可能的实现方式中,该装置还包括:存储模块,该存储模块用于存储该采集模块采集的第一告警发生时间。
结合第四方面的第一种可能的实现方式,在第二种可能的实现方式中,该装置还包括:更新模块,该更新模块用于在该存储模块存储该采集模块采集的第一告警发生时间时,若该存储模块中存储有第二告警发生时间,将第二告警发生时间更新为该第一告警发生时间。
本发明实施例提供的一种确定告警发生顺序的方法及装置,通过将各个网元设备之间保持时间同步,并在各个网元设备发生告警时,将告警发生时间作为告警上报信息的一部分上报给该网管服务器,该告警上报信息可以准确标记不同的网元设备的告警发生时间,并且能够排除不同告警上报信息在从网元设备传输到网管服务器的过程中时延不同的影响,从而能够准确判断不同告警信息发生的先后顺序,很好地为故障分析和定位提供依据,例如,当产生在第一网元设备上的一个告警(根告警)引起一系列衍生告警在第二网元设备上发生时,网管服务器接受到的告警发生时间就能够准确地反映告警发生的先后顺序,从而能够准确确定根告警和衍生告警。
附图说明
图1为本发明实施例提供的一种网管系统的架构示意图;
图2为本发明实施例提供的一种确定告警发生顺序的方法流程图;
图3为本发明实施例提供的又一种确定告警发生顺序的方法流程图;
图4为本发明实施例提供的又一种确定告警发生顺序的方法流程图;
图5为本发明实施例提供的一种确定告警发生顺序的装置的组成示意图;
图6为本发明实施例提供的又一种确定告警发生顺序的装置的组成示意图;
图7为本发明实施例提供的又一种确定告警发生顺序的装置的组成示意图;
图8为本发明实施例提供的又一种确定告警发生顺序的装置的组成示意图;
图9为本发明实施例提供的又一种确定告警发生顺序的装置的组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为一种确定告警发生顺序的系统架构图,该系统包括网管服务器101和至少两个网元设备102。各个不同的网元设备102之间可以相互通信,且各个网元设备102均可以与该网管服务器101进行通信,并且在任意一个网元设备102发生故障告警事件时,该网元设备102能够主动将包含有有关故障信息的告警信息(如故障类型,故障的发生位置等)上报给该网管服务器101。其中,网元设备由一个或多个机盘或机框组成,能够独立完成一定的传输功能,网元设备即网络中的设备,网元是网络管理中可以监视和管理的最小单位。网管服务器是检视网络上所有节点如何执行命令的网络管理器或者网络控制器等。具体的,该网元设备102可以为路由器、交换机等设备,网络管理器通常为计算机等,用于对各个网元设备102的通信状况进行监视、控制和调节等,以使得该网管系统在网络运维过程中稳定有序运行。
基于以上系统架构图,为了实现网络高速运行,故障诊断及报警是网络管理系统重要的管理功能之一。网络管理系统配置了大量网络管理软件,可对整个网络状况进行快速、全面、智能化的检测,然而,由于网管系统中存在至少两个网元设备102,而当不同的网元设备102发生故障时,各个网元设备102均主动向网管服务器101上报产生的告警信息,在现有技术中,在网管服务器101上查看的告警报表中的告警时间为网管服务器101接收到告警信息的时间,而不是实时告警发生的时间即网元设备102发生告警的时间,因此,网管服务器101中的告警时间还受告警上报时延和网管系统接口性能的影响,其中,告警上报时延是指从实时告警发生到被管设备即网元设备发出告警的延迟时间,在网管系统中,每台网元设备102对告警信息的处理能力不同,则每台网元设备102的告警上报时延也不同,因此,用网管服务器101接收到的告警时间来表示告警发生时间并不准确。特别是当大量网元设备102在很短的时间内都发生告警的情况下,例如,在现网运维过程中,会出现某一故障告警(根告警)而引起一系列大量衍生告警的情况,由于两者产生的时间间隔在毫秒级或是更小,所以网管系统会在1秒内接收到根告警及其衍生的大量告警,这样就不能准确判断各个告警发生的先后顺序,给告警相关性分析、故障定位以及确定故障根源等工作增加了不利条件。
第一方面,本发明实施例提供一种确定告警发生顺序的方法,如图1所示,应用于包含网管服务器101和至少两个网元设备102的网管系统,该网管系统中各个网元设备102之间保持时间同步,且该网管系统中的网管服务器101可以执行该确定告警发生顺序的方法,本发明实施例以网管服务器为例对确定告警发生顺序的方法进行说明。参见图2,该方法包括:
S201、该网管服务器接收至少一个网元设备发送的至少一个告警上报信息;其中,每个该告警上报信息分别包括对应的网元设备的告警信息和告警发生时间。相应地,第一网元设备向该网管服务器发送告警上报信息,该第一网元设备为该网管系统中的任意一个网元设备。
其中,在网管系统中,各个网元设备可以通过跟踪GPS(Global PositioningSystem,全球定位系统)的方式保持时间同步;或者,各个网元设备可以通过PTP(PrecisionTime Synchronization Protocol,精确时间同步协议)或者NTP(Network Time Protocol,网络时间协议)保持时间同步。GPS(Global Positioning System,全球定位系统)可以为地球表面绝大部分地区(98%)提供准确的定位、测速和高精度的时间标准。PTP(PrecisionTime Synchronization Protocol,精确时间同步协议)和NTP(Network Time Protocol,网络时间协议)可以把计算机的时钟同步到世界协调时UTC,其精度在局域网内可达0.1ms,在互联网上绝大多数的地方其精度可以达到1-50ms。
其中,该告警发生时间可以为各个网元设备发生告警时采集到的当地时间,由于该网管系统中各个网元设备之间保持时间同步,因此,当任意一个网元设备发生告警时采集到的当地时间较为准确,可以用来标识告警实时发生的时间。
具体的,这里以该网管系统中的任意两个网元设备为例对告警发生时间的采集以及告警信息的上报进行说明。
其中,为了方便描述,将该网管系统中的任意两个网元设备分别记为第一网元设备和第二网元设备,在当地时间为第一时刻时,若第一网元设备发生故障告警事件,则该第一网元设备采集当地时间即第一时刻作为告警发生时间,并将采集到的告警发生时间和告警信息(如故障类型、故障发生的位置等)一同上报给该网管服务器,这时,该网管服务器接收该告警上报信息,该告警上报信息携带的告警发生时间即为第一时刻;在当地时间为第二时刻时,若第二网元设备发生故障告警事件,则该第二网元设备采集当地时间即第二时刻作为告警发生时间,并将采集到的告警发生时间和告警信息(如故障类型、故障发生的位置等)一同上报给该网管服务器,这时,该网管服务器接收该告警上报信息,该告警上报信息携带的告警发生时间即为第二时刻。
可选的,该告警上报信息可以为报文形式,包括时间字段和保留字段,该时间字段用于设置该告警发生时间。其中,各个网元设备与网管服务器之间通过网管接口进行数据传输,因此,该告警上报信息可以采用网管接口支持用于上报告警信息的协议报文,该时间字段可以精确到秒,采用时间字段和某一指定保留字段共两个字段来作为传输精确到毫秒的告警发生时间的报文字段。
进一步地,该网管服务器接收告警上报信息之后,该方法还包括:该网管服务器将告警上报信息转存为报表,并从告警上报信息中提取告警发生时间。
这里的报表可以为csv或者xls格式的报表,当告警上报信息为报文形式时,从上述接收到的报文字段中提取告警发生时间。
S202、该网管服务器根据所接收到的每个告警上报信息包含的告警发生时间,确定各个告警信息发生的先后顺序。
示例性的,如上所述,当该网管服务器接收到第一网元设备和第二网元设备发送的告警上报信息后,可以根据第一时刻和第二时刻的先后顺序来确定第一网管设备和第二网元设备发生告警的先后顺序。
本发明实施例提供一种确定告警发生顺序的方法,通过将各个网元设备之间保持时间同步,在各个网元设备发生告警信息时,将告警发生时间作为告警上报信息的一部分上报给该网管服务器,该告警上报信息可以准确标记不同的网元设备的告警发生时间,并且能够排除不同告警上报信息在从网元设备传输到网管服务器的过程中时延不同的影响,从而能够准确判断不同告警信息发生的先后顺序,很好地为故障分析和定位提供依据,例如,当产生在第一网元设备上的一个告警引起一系列衍生告警在第二网元设备上发生时,网管服务器接受到的告警发生时间就能够准确地反映告警发生的先后顺序,从而能够准确确定根告警和衍生告警。
第二方面,本发明实施例提供一种确定告警发生顺序的方法,如图1所示,应用于包含网管服务器101和至少两个网元设备102的网管系统;网管系统中每个网元设备102可以独立执行该确定告警发生顺序的方法,本发明实施例仅以第一网元设备为例进行说明。参见图3,该方法包括:
S301、第一网元设备保持与该网管系统中除该第一网元设备之外的网元设备时间同步;该第一网元设备为该网管系统中的任意一个网元设备。
其中,第一网元设备可以通过跟踪GPS(Global Positioning System,全球定位系统)的方式与该网管系统中除该第一网元设备之外的网元设备保持时间同步;或者,第一网元设备可以通过PTP(Precision Time Synchronization Protocol,精确时间同步协议)或者NTP(Network Time Protocol,网络时间协议)与该网管系统中除该第一网元设备之外的网元设备保持时间同步。其中,GPS(Global Positioning System,全球定位系统)可以为地球表面绝大部分地区(98%)提供准确的定位、测速和高精度的时间标准。PTP(PrecisionTime Synchronization Protocol,精确时间同步协议)和NTP(Network Time Protocol,网络时间协议)可以把计算机的时钟同步到世界协调时UTC,其精度在局域网内可达0.1ms,在互联网上绝大多数的地方其精度可以达到1-50ms。
S302、在该第一网元设备发生告警时,采集第一告警发生时间。
具体的,若该第一网元设备发生故障告警事件,则该第一网元设备生成告警信息(包含有故障类型、故障发生的位置等信息),同时,该第一网元设备采集当地时间作为第一告警发生时间。
其中,该第一网元设备在采集该第一告警发生时间之后,该方法还可以包括:存储该第一网元设备采集的该第一告警发生时间。这里,可以设置存储的时间精确到毫秒,存储时的初始值可以为0。示例性的,该第一告警发生时间可以存储在寄存器中。寄存器是中央处理器的组成部分,有限存储量的高速存储部件,可暂存指令、数据和地址。
在一种可能的实现方式中,存储该第一网元设备采集的该第一告警发生时间,包括:若该第一网元设备中存储有第二告警发生时间,则将第二告警发生时间更新为该第一告警发生时间。采用寄存器对该第一告警时间进行暂存,寄存器本身的存储量有限,在这种可能的实现方式中,通过采用不断进行数据覆盖的方式即可实现该第一告警发生时间的暂存。
示例性的,若第一网元设备t1时刻发生第一次告警,则采集t1时刻作为告警发生时间,并将t1时刻存储至寄存器;若第一网元设备t2时刻发生第二次告警,则采集t2时刻作为第一告警发生时间,并将寄存器中的t1时刻更新为t2时刻。
S303、该第一网元设备向该网管服务器发送告警上报信息,该告警上报信息包括告警信息和第一告警发生时间。
可选的,该告警上报信息可以为报文形式,包括时间字段和保留字段,该时间字段用于设置该告警发生时间。各个网元设备与网管服务器之间通过网管接口进行数据传输,因此,该告警上报信息可以采用网管接口支持用于上报告警信息的协议报文,该时间字段可以精确到秒,采用时间字段和某一指定保留字段共两个字段来作为传输精确到毫秒的告警发生时间的报文字段。
本发明实施例提供一种确定告警发生顺序的方法,通过将各个网元设备之间保持时间同步,在各个网元设备发生告警信息时,将告警发生时间作为告警上报信息的一部分上报给该网管服务器,该告警上报信息可以准确标记不同的网元设备的告警发生时间,并且能够排除不同告警上报信息在从网元设备传输到网管服务器的过程中时延不同的影响,从而能够准确判断不同告警信息发生的先后顺序,很好地为故障分析和定位提供依据,例如,当产生在第一网元设备上的一个告警引起一系列衍生告警在第二网元设备上发生时,网管服务器接受到的告警发生时间就能够准确地反映告警发生的先后顺序,从而能够准确确定根告警和衍生告警。
第三方面,本发明实施例提供一种确定告警发生顺序的方法,应用于包含网管服务器1和至少两个网元设备2的网管系统。参见图4,该方法包括:
S401、各个网元设备保持时间同步;
示例性的,该网管系统可以包括N个网元设备,这里可以将这些网元设备分别记为第一网元设备、第二网元设备、第三网元设备、…和第N网元设备,这些网元设备可以通过跟踪GPS(Global Positioning System,全球定位系统)保持时间同步;也可以通过PTP(Precision Time Synchronization Protocol,精确时间同步协议)或者NTP(NetworkTime Protocol,网络时间协议)保持时间同步。
S402、发生告警的网元设备采集告警发生时间,并将告警上报信息发送给网管服务器;其中,告警上报信息包括告警信息和告警发生时间。
这里,该告警发生时间即为发生告警的网元设备采集到的本地时间,假设在T1时刻,第一网元设备发生告警,则该第一网元设备采集本地时间即T1时刻,并将该第一网元设备生成的告警信息和T1时刻发送给网管服务器。
S403、发生告警的网元设备采集告警发生时间,并将告警上报信息发送给网管服务器;其中,告警上报信息包括告警信息和告警发生时间。
这里,该告警发生时间即为发生告警的网元设备采集到的本地时间,假设在T2时刻,发生告警的网元设备为第二网元设备,则该第二网元设备采集本地时间即T2时刻,并将该第二网元设备生成的告警信息和T2时刻发送给网管服务器。
S404、网管服务器接收各个网元设备发送的告警上报信息。
其中,需要说明的是,由于在一组根告警和衍生告警中,一个网元设备可能会发送多个告警,这里,假设网管服务器接收到M个网元设备发送的J个告警上报信息,其中,M小于等于N,J大于等于M。
S405、网管服务器根据所接收到的告警上报信息所包含的告警发生时间,确定各个告警信息发生的先后顺序。
这里,假设该网管服务器接收到M个网元设备发送的M+1个告警上报信息,并假设该M个网元设备分别为第一网元设备、第二网元设备、…和第M网元设备,且第一网元设备分别在T1时刻和T2时刻发生告警,而第二网元设备、第三网元设备、…和第M网元设备分别在T3时刻、T4时刻、…和TM+1时刻发生告警,则该网元服务器可以依据T1时刻、T2时刻、…和TM+1时刻的先后顺序对第一网元设备、第二网元设备、…和第M网元设备发生告警的先后顺序进行排序。这样一来,当产生在一个网元设备上的一个告警引起一系列衍生告警(这些衍生告警可以与根告警发生在同一个网元设备上,也可以与根告警发生在不同的网元设备上)时,根据告警发生时间的先后顺序能够准确确定根告警和衍生告警。
本发明实施例提供一种确定告警发生顺序的方法,通过将各个网元设备之间保持时间同步,在各个网元设备发生告警信息时,将告警发生时间作为告警上报信息的一部分上报给该网管服务器,该告警上报信息可以准确标记不同的网元设备的告警发生时间,并且能够排除不同告警上报信息在从网元设备传输到网管服务器的过程中时延不同的影响,从而能够准确判断不同告警信息发生的先后顺序,很好地为故障分析和定位提供依据,例如,当产生在第一网元设备上的一个告警引起一系列衍生告警在第二网元设备上发生时,网管服务器接受到的告警发生时间就能够准确地反映告警发生的先后顺序,从而能够准确确定根告警和衍生告警。
第四方面,本发明实施例提供一种确定告警发生顺序的装置,用于执行图2或者图4中网管服务器的功能。
该确定告警发生顺序的装置应用于包含网管服务器和至少两个网元设备的网管系统,该网管系统中各个网元设备之间保持时间同步。该确定告警发生顺序的装置可以配置在网管服务器上,也可以单独配置,本发明实施例对此不进行限定。
图5示出了上述实施例中所涉及的网管服务器的一种可能的结构示意图。
该网管服务器包括:接收模块501;该接收模块501用于接收告警上报信息,该告警上报信息包括告警信息和告警发生时间;
确定模块502,该确定模块502用于根据每个告警上报信息包含的告警发生时间,确定各个告警信息发生的先后顺序。
可选的,该告警上报信息可以为报文形式,包括时间字段和保留字段,该时间字段用于设置该告警发生时间。其中,各个网元设备与网管服务器之间通过网管接口进行数据传输,因此,该告警上报信息可以采用网管接口支持用于上报告警信息的协议报文,该时间字段可以精确到秒,采用时间字段和某一指定保留字段共两个字段来作为传输精确到毫秒的告警发生时间的报文字段。
可选的,参见图6,该网管服务器还可以包括:转存模块503,该转存模块503用于将所接收到的告警上报信息转存为报表。
可选的,继续参见图6,该网管服务器还可以包括:提取模块504,该提取模块504用于在该告警上报信息为报文形式时,从所接收到的告警上报信息中提取告警发生时间。
本发明实施例提供一种确定告警发生顺序的装置,通过将各个网元设备之间保持时间同步,在各个网元设备发生告警信息时,将告警发生时间作为告警上报信息的一部分上报给该网管服务器,该告警上报信息可以准确标记不同的网元设备的告警发生时间,并且能够排除不同告警上报信息在从网元设备传输到网管服务器的过程中时延不同的影响,从而能够准确判断不同告警信息发生的先后顺序,很好地为故障分析和定位提供依据,例如,当产生在第一网元设备上的一个告警引起一系列衍生告警在第二网元设备上发生时,网管服务器接受到的告警发生时间就能够准确地反映告警发生的先后顺序,从而能够准确确定根告警和衍生告警。
第五方面,本发明实施例提供一种确定告警发生顺序的装置,用于执行图3或者图4中第一网元设备的功能。
该确定告警发生顺序的装置应用于包含网管服务器和至少两个网元设备的网管系统。图7示出了上述实施例中所涉及的第一网元设备的一种可能的结构示意图。
该第一网元设备包括:时间同步模块701,该时间同步模块701用于保持第一网元设备与该网管系统中除第一网元设备以外的网元设备时间同步,该第一网元设备为该网管系统中的任意一个网元设备;
采集模块702,该采集模块702用于在该第一网元设备发生告警信息时,采集第一告警发生时间;
告警上报模块703,该告警上报模块703用于向该网管服务器发送告警上报信息,该告警上报信息包括告警信息和第一告警发生时间。
可选的,参见图8,该第一网元设备还包括:存储模块704,该存储模块704用于存储该采集模块702采集的第一告警发生时间。这里该存储模块704可以为寄存器。
可选的,继续参见图8,该第一网元设备还包括:更新模块705,该更新模块705用于在该存储模块704存储该采集模块702采集的第一告警发生时间时,若该存储模块704中存储有第二告警发生时间,则将第二告警发生时间更新为该第一告警发生时间。
本发明实施例提供一种确定告警发生顺序的装置,通过将各个网元设备之间保持时间同步,在各个网元设备发生告警信息时,将告警发生时间作为告警上报信息的一部分上报给该网管服务器,该告警上报信息可以准确标记不同的网元设备的告警发生时间,并且能够排除不同告警上报信息在从网元设备传输到网管服务器的过程中时延不同的影响,从而能够准确判断不同告警信息发生的先后顺序,很好地为故障分析和定位提供依据,例如,当产生在第一网元设备上的一个告警引起一系列衍生告警在第二网元设备上发生时,网管服务器接受到的告警发生时间就能够准确地反映告警发生的先后顺序,从而能够准确确定根告警和衍生告警。
第六方面,本发明实施例提供一种确定告警发生顺序的装置,用于执行图2、图3或者图4中网管服务器和网元设备的功能。
该确定告警发生顺序的装置应用于包含网管服务器和至少两个网元设备的网管系统,在采用集成的单元的情况下,图9示出了上述实施例中所涉及的确定告警发生顺序的装置900的一种可能的结构示意图。
该确定告警发生顺序的装置900包括:至少一个处理器901,通信总线902,存储器903以及至少一个通信接口904。
处理器901可以是一个通用中央处理器(central processing unit,简称CPU),微处理器,特定应用集成电路(application-specific integrated circuit,简称ASIC),或一个或多个用于控制本申请方案程序执行的集成电路。
通信总线902可包括一通路,在上述组件之间传送信息。总线704可以是扩展工业标准结构(Extended Industry Standard Architecture,EISA)总线等。总线704可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口904,可以为任何收发器一类的装置,用于与其他设备或通信网络通信,如以太网,RAN,无线局域网(wireless local area networks,简称WLAN)等。
存储器903可以是只读存储器(read-only memory,简称ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,简称RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,简称EEPROM)、只读光盘(compact disc read-only memory,简称CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。
其中,存储器903用于存储执行本申请方案的应用程序代码,并由处理器901来控制执行。处理器901用于执行存储器903中存储的应用程序代码,从而实现下文中本申请实施例提供的方法。
在具体实现中,作为一种实施例,处理器901可以包括一个或多个CPU。
当该装置900为网元设备时,处理器901用于对网元设备的动作进行控制管理,例如,处理器901用于支持网元设备执行图3中的步骤301-302,图4中的步骤401和步骤402或步骤403。通信接口904用于支持网元设备与其他网元设备的通信,例如,图1中第一网元设备与其他网元设备的通信,存储器903用于存储网元设备的程序代码和数据,如用于存储网元设备采集到的告警发生时间。
当该装置900为网管服务器时,处理器901用于对网管服务器的动作进行控制管理,例如,处理器901用于支持网管服务器执行图2中的步骤202,图4中的步骤401和405,和/或本申请实施例中所描述的其他过程中的网管服务器执行的动作。通信接口904用于支持网管服务器与其他网络实体的通信,例如,与图1中的网元设备的通信,存储器903用于存储网管服务器的程序代码和数据。
结合本发明公开内容所描述的方法或者算法的步骤可以由硬件的方式来实现,也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于RAM、闪存、ROM、可擦除可编程只读存储器(easable programmable ROM,EPROM)、电可擦可编程只读存储器(electrically EPROM,EEPROM)、寄存器、硬盘、移动硬盘、只读光盘(CD-ROM)或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:快闪存储器、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (12)

1.一种确定告警发生顺序的方法,其特征在于,应用于包含网管服务器和至少两个网元设备的网管系统,所述网管系统中各个网元设备之间保持时间同步;所述方法包括:
所述网管服务器接收至少一个网元设备发送的至少一个告警上报信息,每个所述告警上报信息分别包括对应的网元设备的告警信息和告警发生时间;
所述网管服务器根据每个告警上报信息包含的告警发生时间,确定各个告警信息发生的先后顺序。
2.根据权利要求1所述的方法,其特征在于,
所述告警上报信息为报文形式,包括时间字段和保留字段,所述时间字段用于设置所述告警发生时间。
3.根据权利要求1所述的方法,其特征在于,
各个网元设备通过跟踪GPS的方式保持时间同步;或者,
各个网元设备通过PTP或者NTP协议保持时间同步。
4.一种确定告警发生顺序的方法,其特征在于,应用于包含网管服务器和至少两个网元设备的网管系统;所述方法包括:
第一网元设备保持与所述网管系统中除所述第一网元设备之外的网元设备时间同步;所述第一网元设备为所述网管系统中的任意一个网元设备;
在所述第一网元设备发生告警时,采集第一告警发生时间;
所述第一网元设备向所述网管服务器发送告警上报信息,所述告警上报信息包括告警信息和第一告警发生时间。
5.根据权利要求4所述的方法,其特征在于,在所述采集第一告警发生时间之后,所述方法还包括:
存储所述第一网元设备采集的所述第一告警发生时间。
6.根据权利要求5所述的方法,其特征在于,存储所述第一网元设备采集的所述第一告警发生时间,包括:
若所述第一网元设备中存储有第二告警发生时间,则将第二告警发生时间替换为所述第一告警发生时间。
7.根据权利要求4所述的方法,其特征在于,
所述告警上报信息为报文形式,包括时间字段和保留字段,所述时间字段用于设置所述告警发生时间。
8.根据权利要求4所述的方法,其特征在于,
各个网元设备通过跟踪GPS的方式保持时间同步;或者,
各个网元设备通过PTP或者NTP协议保持时间同步。
9.一种确定告警发生顺序的装置,其特征在于,应用于包含网管服务器和至少两个网元设备的网管系统,所述网管系统中各个网元设备之间保持时间同步;所述装置包括:
接收模块;所述接收模块用于接收告警上报信息,所述告警上报信息包括告警信息和告警发生时间;
确定模块,所述确定模块用于根据每个告警上报信息中包含的告警发生时间,确定各个告警信息发生的先后顺序。
10.一种确定告警发生顺序的装置,其特征在于,应用于包含网管服务器和至少两个网元设备的网管系统,包括:
时间同步模块,所述时间同步模块用于保持第一网元设备与所述网管系统中除第一网元设备以外的网元设备时间同步,所述第一网元设备为所述网管系统中的任意一个网元设备;
采集模块,所述采集模块用于在所述第一网元设备发生告警信息时,采集第一告警发生时间;
告警上报模块,所述告警上报模块用于向所述网管服务器发送告警上报信息,所述告警上报信息包括告警信息和第一告警发生时间。
11.根据权利要求10所述的装置,其特征在于,
所述装置还包括:存储模块,所述存储模块用于存储所述采集模块采集的第一告警发生时间。
12.根据权利要求11所述的装置,其特征在于,
所述装置还包括:更新模块,所述更新模块用于在所述存储模块存储所述采集模块采集的第一告警发生时间时,若所述存储模块中存储有第二告警发生时间,将第二告警发生时间替换为所述第一告警发生时间。
CN201711384900.0A 2017-12-20 2017-12-20 一种确定告警发生顺序的方法及装置 Pending CN107947999A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711384900.0A CN107947999A (zh) 2017-12-20 2017-12-20 一种确定告警发生顺序的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711384900.0A CN107947999A (zh) 2017-12-20 2017-12-20 一种确定告警发生顺序的方法及装置

Publications (1)

Publication Number Publication Date
CN107947999A true CN107947999A (zh) 2018-04-20

Family

ID=61941396

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711384900.0A Pending CN107947999A (zh) 2017-12-20 2017-12-20 一种确定告警发生顺序的方法及装置

Country Status (1)

Country Link
CN (1) CN107947999A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111210029A (zh) * 2019-12-26 2020-05-29 中国建设银行股份有限公司 辅助分析业务的装置、方法及相关设备
CN112422303A (zh) * 2019-08-21 2021-02-26 大唐移动通信设备有限公司 告警数据的处理方法、管理者实体和网元
CN112543076A (zh) * 2019-09-20 2021-03-23 北京朗立科技有限公司 一种分布式告警传感器信息同步处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040029578A1 (en) * 2002-04-24 2004-02-12 Chung Jong-Tae Wireless data communication protocol diagnosis system
CN101364892A (zh) * 2007-08-08 2009-02-11 中兴通讯股份有限公司 基于不同时区的网元的时间转换方法
CN101854262A (zh) * 2010-06-24 2010-10-06 华为技术有限公司 告警同步方法、装置和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040029578A1 (en) * 2002-04-24 2004-02-12 Chung Jong-Tae Wireless data communication protocol diagnosis system
CN101364892A (zh) * 2007-08-08 2009-02-11 中兴通讯股份有限公司 基于不同时区的网元的时间转换方法
CN101854262A (zh) * 2010-06-24 2010-10-06 华为技术有限公司 告警同步方法、装置和系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112422303A (zh) * 2019-08-21 2021-02-26 大唐移动通信设备有限公司 告警数据的处理方法、管理者实体和网元
CN112422303B (zh) * 2019-08-21 2022-04-05 大唐移动通信设备有限公司 告警数据的处理方法、管理者实体和网元
CN112543076A (zh) * 2019-09-20 2021-03-23 北京朗立科技有限公司 一种分布式告警传感器信息同步处理方法
CN111210029A (zh) * 2019-12-26 2020-05-29 中国建设银行股份有限公司 辅助分析业务的装置、方法及相关设备

Similar Documents

Publication Publication Date Title
CN107947999A (zh) 一种确定告警发生顺序的方法及装置
CN105934929B (zh) 一种集群脑裂后仲裁处理方法、仲裁存储装置以及系统
CN103761309B (zh) 一种运营数据处理方法及系统
CN103338243B (zh) Web节点的缓存数据更新方法和系统
CN108055144A (zh) 一种网络设备的监控方法及系统
CN109639516A (zh) 分布式网络系统的监控方法、装置、设备及存储介质
CN106843930A (zh) 基于zookeeper的流式动态配置更新架构及方法
CN108259194A (zh) 网络故障预警方法及装置
CN107040395A (zh) 一种告警信息的处理方法、装置和系统
CN106161090A (zh) 一种分区集群系统的监测方法及装置
CN103970907A (zh) 一种动态扩展数据库集群的方法
CN111552701B (zh) 确定分布式集群中数据一致性的方法及分布式数据系统
CN110417586A (zh) 服务监控方法、服务节点、服务器及计算机可读存储介质
CN113259148A (zh) 基于联邦学习的告警关联检测方法、系统、网络及介质
CN109005076A (zh) 一种智能变电站交换机监控系统及交换机监控方法
CN112910743B (zh) 一种区块链性能检测系统
CN110196780A (zh) 确定服务器状态的方法、装置、存储介质和电子装置
CN109981377A (zh) 一种分布式数据中心链路监控方法及系统
CN103973489A (zh) 一种异构设备集中监控系统
CN106330698A (zh) 一种局部路由的恢复方法及装置
CN109446291B (zh) 一种路网状态统计方法、装置和计算机可读存储介质
CN104301159B (zh) 一种服务器集群的监控方法和系统
CN111010226A (zh) 一种基于云计算的光纤测试系统
CN101631347B (zh) 基站及其业务操作方法
CN110430091A (zh) 适用于redis的主从时延监控方法及装置、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180420