CN101350735A - 一种告警同步方法 - Google Patents
一种告警同步方法 Download PDFInfo
- Publication number
- CN101350735A CN101350735A CNA2007101299576A CN200710129957A CN101350735A CN 101350735 A CN101350735 A CN 101350735A CN A2007101299576 A CNA2007101299576 A CN A2007101299576A CN 200710129957 A CN200710129957 A CN 200710129957A CN 101350735 A CN101350735 A CN 101350735A
- Authority
- CN
- China
- Prior art keywords
- alarm
- management system
- network management
- network element
- element device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明涉及一种告警同步方法,包括:网管系统区分网元设备正常、重启或倒换情况下的告警信息;在网管系统上,对重启或倒换后的告警信息在重启或倒换完成后采用网元设备直接发送的方式进行一次更新,而对倒前的活动告警信息采用与网元设备比较同步的方式进行更新。这种方法,重启时网管系统恢复所有活动告警,然后网元设备重发所有告警,不用对活动告警进行比较同步;而倒换时,网管系统恢复倒换后的活动告警,然后网元设备重发该部分告警,仅对倒换前的活动告警进行比较同步。与现有的每次都将所有的活动告警发往网元系统进行比较同步不同,尽可能减少网元设备与网管系统之间的消息流量,提高告警同步效率,避免重复告警发送。
Description
技术领域
本发明涉及电信网络管理,具体涉及一种告警同步方法。
背景技术
电信网络管理系统,主要包括配置管理、故障管理、性能管理、计费管理和安全管理等功能模块。其中故障管理是电信网络管理的一个主要管理功能。故障管理(Fault Management)是提供对一个电信网及其环境的异常情况进行检测报告和处理的管理功能。故障管理具有一些主要特点。一是实时性,实时监视网元状态及其变化,及时通报异常的发生;二是准确性,对异常情况的报告力求准确,要求不漏警、不虚警;三是自动性,对故障的处理要求系统有一些智能自动处理的功能,除了操作员发出故障处理命令这种方法外,系统需要有部分自控能力--自动隔离故障、防止故障扩散、启动备份资源以及自动恢复。可见,网元设备告警消息能够实时、准确地呈现在用户面前,是故障管理的特点。在现有的电信系统中,通讯设备由多个网元设备组成,当网元设备重启或倒换后,如何让网管系统中的告警与设备告警快度达到一致,就成为故障管理追求的目标之一。
在现有的前后台告警同步的方法中,一般采用与网元设备比较同步的方式,具体包括以下步骤:(1)后台网管在本地获取要同步前台网元的当前活动告警的唯一标识,组织成告警同步消息发送到对应的前台网元;(2)前台网元接收到所述告警同步消息,获得其中包括的告警标识,并和前台网元本地的当前活动告警的告警标识比较;(3)根据上一步的比较结果,前台网元发送相应的告警消息或者告警恢复消息给后台网管。
这种同步方法并没有对网元设备的重启和倒换做任何特殊处理,不论何时的告警同步都是将该网元所有活动告警的唯一标识从后台网管系统发往前台网元设备,进行比较后前台网元设备发送告警消息或者告警恢复消息到后台网管系统。这样做在网元设备倒换次数较多的情况下,会多次的重复比较和发送告警消息,告警同步速度慢,接口间消息流量大,浪费网络资源。
发明内容
本发明需要解决的技术问题是提供一种告警同步方法,能够减少网元设备重启或倒换次数较多情况下的同步比较次数。
本发明的上述技术问题这样解决,提供一种告警同步方法,包括以下步骤:
1.1)网管系统区分网元设备正常、重启或倒换情况下的告警信息;
1.2)在网管系统上,对重启或倒换后的告警信息在重启或倒换完成后采用网元设备直接发送的方式进行一次更新,而对倒前的活动告警信息采用与网元设备比较同步的方式进行更新。
按照本发明提供的同步方法,所述步骤1.2)还包括在正常情况下对网管系统上的所有告警信息采用与网元设备比较同步的方式进行更新;一般地,所述一次更新完成后,返回所述正常情况。
按照本发明提供的同步方法,所述步骤1.2)包括对倒换前后的告警信息进行划分,该划分具体是利用从零开始、顺序分配的告警信息数字标示和对应数字门限进行比较判断。
按照本发明提供的同步方法,所述数字标示是整数,并在网管系统中唯一,即:唯一标示。
按照本发明提供的同步方法,所述步骤1.2)中倒换后的告警信息是:
倒换期间前后台链路正常:(一)网管系统上对应数字标示大于网元设备告警缓冲区中最后一条告警的数字标识的告警信息;所述门限是网元设备告警缓冲区中最后一条告警的数字标识。
倒换期间前后台链路断链:(二)网管系统上对应数字标示大于网元设备向网管系统已发送的最后一条告警的数字标识的告警信息;所述门限是网元设备向网管系统已发送的最后一条告警的数字标识。
如果倒换期间前后台链路正常时缓冲区中无告警,或者倒换期间前后台链路断链时没有已发送告警:(三)网管系统上对应数字标示大于等于零的告警信息;所述门限是零。
按照本发明提供的同步方法,重启时所述数字标示复位,所述步骤1.2)中重启后的告警信息是网管系统上对应数字标示大于等于零的告警信息,即:网管系统上全部的活动告警;所述门限是零;这样可以与倒换过程进行逻辑合并,优化软件实现。
按照本发明提供的同步方法,所述步骤1.1)还包括网元设备通过通知消息发送所述门限给网管系统,所述门限也称为通知消息中的告警唯一标识。
按照本发明提供的同步方法,所述网管系统是网管系统告警模块;所述网元设备是网元设备告警模块。
按照本发明提供的同步方法,所述重启或倒换是网元设备告警模块所在的单板重启或倒换。
本发明提供的一种告警同步方法,针对经常出现的网元设备告警模块所在的单板重启或主备倒换进行优化:重启时是网管系统恢复所有活动告警,重启完成后,网元设备将所有告警重发到网管系统,不用对活动告警进行比较同步;而倒换时,网元设备对告警进行了主备同步,对倒换前的活动告警进行比较同步,主备倒换完成后直接发送倒换后的活动告警,不用对该部分活动告警进行比较同步。与现有电信网管系统中的告警同步不同,并不是每次都将所有的活动告警发往网元系统进行比较同步,这样尽可能减少了网元设备与网管系统之间的消息流量,提高了告警同步效率,避免了重复的告警发送。
附图说明
下面结合附图和具体实施例进一步对本发明进行详细说明。
图1是本发明网元设备告警模块所在单板重启后告警的同步方法流程示意图;
图2是本发明网元设备告警模块所在单板主备倒换后告警的同步方法流程示意图;
图3是本发明主备倒换后网元设备生成通知消息中的告警唯一标识的流程示意图。
具体实施方式
首先,说明本发明原理:
网元设备告警模块生成发往网管系统的通知中的告警唯一标识,网管系统收到消息后将系统中大于等于唯一标识的活动告警恢复,然后将余下的活动告警组包发往网元进行比较同步。
其次,说明本发明方法,具体包括两种情况,分别说明如下:
(一)网元设备告警模块重启后,告警的同步方法,如图1所示,包括以下步骤:
(1)重启后,网元设备告警模块之前的告警全部丢失,网元设备重新收集告警并为每条告警分配唯一标识,唯一标识从0开始顺序分配。
(2)重启后,网元设备立即向网管系统发送一条通知消息,消息中带有网元设备重启后重新分配的第一条告警唯一标识。
(3)网管系统收到通知消息,解析得到告警唯一标识,将系统中大于等于告警唯一标识的活动告警恢复。
(4)网元设备将重新收集到的告警发往网管系统。
(5)发送完成后网元设备和网管系统的告警达成一致。
(二)网元设备告警模块所在单板主备倒换后,告警的同步方法,如图2所示,包括以下步骤:
(1)主备倒换期间,网元设备上主板的告警全部被同步到备板,倒换后产生告警的唯一标识仍沿用之前的告警继续分配。
(2)主备倒换完成后,先生成发往网管系统的通知中的告警唯一标识。如果①倒换期间前后台链路正常,此告警唯一标识为目前主板告警缓冲区中最后一条告警的唯一标识+1,如果缓冲区中无告警则为0;如果②倒换期间前后台链路断链,则此告警唯一标识为向网管系统已发送的最后一条的唯一标识+1,如果没有已发送告警则为0。
(3)主备倒换完成后,向网管系统发送一条通知消息,消息中带有步骤(2)中生成的告警唯一标识。
(4)网管系统收到通知消息,解析得到告警唯一标识,将系统中大于等于告警唯一标识的活动告警恢复。
(5)网管系统向网元设备发出同步请求,并将系统中目前的活动告警组包发往网元设备。
(6)网元设备收到网管系统的同步请求后,将网管系统发来的告警包中的告警与网元设备告警模块中的告警相比较,将网元设备中有而网管系统无的告警发告警消息到网管系统,将网元设备中无而网管系统中有的告警发告警恢复消息到网管系统。
(7)同步流程完成后网元设备和网管系统的告警达成一致。
进一步,详细说明本发明方法:
(一)必要性:网元告警模块所在单板重启和主备倒换后对设备告警的处理方式:
(1)告警模块所在单板重启后,之前的存在缓冲池的告警全部丢失,告警模块重新收集设备告警,并重新为每条告警分配告警唯一标识,从0开始分配。所以需要网管系统重新发送该网元的所有告警。
(2)告警模块所在单板主备倒换时,主板上缓冲池中的告警被同步到备板,也就是新的主板,这样倒换完成后,主板上还存有之前的告警,接下来上报的告警仍延续原来的告警唯一标识继续分配。因为主备倒换期间可能出现主备间断链,这时新主板上的告警将不完全,若对后来新收集的告警继续分配告警标识,会造成前后台告警的不一致,所以也需要网管系统同步告警。
(二)具体方式:网元设备如何生成发往网管系统的通知中的告警唯一标识,网管系统通过此唯一标识确定恢复的告警和组包发送的告警。
如图3所示,倒换完成后生成消息中告警唯一标识的具体步骤如下:
(1)主备倒换完成后,检测网元设备和网管系统间链路通断情况;
(2)若网元设备和网管系统间链路通,检测告警缓冲池中是否有告警;若网元设备和网管系统间链路断到步骤(3);
a)缓冲池中有告警,告警唯一标识=目前缓冲区中最后一条告警标识+1;
b)缓冲池中无告警,告警唯一标识=0
(3)若网元设备和网管系统间链路断,检测告警缓冲池中是否有已发往网管系统的告警
a)有已发往网管系统的告警,告警唯一标识=已发送的最后一条告警标识+1;
b)没有已发往网管系统的告警,告警唯一标识=0
最后,结合GSM系统实例进一步说明本发明:
(1)网管系统告警模块收到网元设备发来的通知消息,通知中带有告警唯一标识,即最大告警流水号,和网元设备号BSCID等
(2)解析通知消息,获取其中的最大告警流水号和BSCID等
(3)清除网管系统告警模块内存告警链表中该BSCID下大于等于最大告警流水号的记录
(4)恢复数据库中该BSCID下大于等于最大告警流水号的当前活动告警
(5)如果最大告警流水号!=0,则创建同步状态机进行同步。也就是说网元设备重启不创建同步状态机,仅主备倒换且告警唯一表示大于0时才创建同步状态机进行同步。
(6)同步状态机从数据库中取出小于最大告警流水号的当前活动告警唯一标识,组包发往网元设备
(7)收到网元设备经过比较前后台告警后发送来的批量告警恢复消息或告警消息,存入数据库和内存告警链表
从网管系统侧的同步处理流程看到,网元设备告警模块重启和主备倒换都可以使用一个流程,通过通知消息中的告警唯一标识的不同来进行区分处理。这样减少了实现的复杂度,便于开发和维护。
上述具体实施方式和较佳实施例对本发明进行了说明,但这只是为了便于理解而举的一个形象化的实例,不应被视为是对本发明范围的限制。同样,根据本发明的技术方案及其较佳实施例的描述,能够做出各种可能的等同改变或替换,而所有这些改变或替换都应属于本发明权利要求的保护范围。
Claims (10)
1、一种告警同步方法,其特征在于,包括以下步骤:
1.1)网管系统区分网元设备正常、重启或倒换情况下的告警信息;
1.2)在网管系统上,对重启或倒换后的告警信息在重启或倒换完成后采用网元设备直接发送的方式进行一次更新,而对倒前的活动告警信息采用与网元设备比较同步的方式进行更新。
2、根据权利要求1所述同步方法,其特征在于,所述步骤1.2)还包括在正常情况下对网管系统上的所有告警信息采用与网元设备比较同步的方式进行更新。
3、根据权利要求1所述同步方法,其特征在于,所述步骤1.2)包括对倒换前后的告警信息进行划分,该划分具体是利用从零开始、顺序分配的告警信息数字标示和对应数字门限进行比较判断。
4、根据权利要求3所述同步方法,其特征在于,所述数字标示是整数,并在网管系统中唯一。
5、根据权利要求3所述同步方法,其特征在于,所述步骤1.2)中倒换后的告警信息是网管系统上对应数字标示大于网元设备告警缓冲区中最后一条告警的数字标识的告警信息;所述门限是网元设备告警缓冲区中最后一条告警的数字标识。
6、根据权利要求3所述同步方法,其特征在于,所述步骤1.2)中倒换后的告警信息是网管系统上对应数字标示大于网元设备向网管系统已发送的最后一条告警的数字标识的告警信息;所述门限是网元设备向网管系统已发送的最后一条告警的数字标识。
7、根据权利要求3所述同步方法,其特征在于,所述步骤1.2)中倒换后的告警信息是网管系统上对应数字标示大于等于零的告警信息;所述门限是零。
8、根据权利要求3所述同步方法,其特征在于,重启时所述数字标示复位,所述步骤1.2)中重启后的告警信息是网管系统上对应数字标示大于等于零的告警信息;所述门限是零。
9、根据权利要求1-8任一项所述同步方法,其特征在于,所述步骤1.1)还包括网元设备通过通知消息发送所述门限给网管系统。
10、根据权利要求1-8任一项所述同步方法,其特征在于,所述网管系统是网管系统告警模块(2);所述网元设备是网元设备告警模块(1)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007101299576A CN101350735A (zh) | 2007-07-20 | 2007-07-20 | 一种告警同步方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007101299576A CN101350735A (zh) | 2007-07-20 | 2007-07-20 | 一种告警同步方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101350735A true CN101350735A (zh) | 2009-01-21 |
Family
ID=40269332
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2007101299576A Pending CN101350735A (zh) | 2007-07-20 | 2007-07-20 | 一种告警同步方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101350735A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102882700A (zh) * | 2012-08-03 | 2013-01-16 | 中国科学院声学研究所 | 一种网管系统中的告警信息管理方法及设备 |
CN103684876A (zh) * | 2013-12-30 | 2014-03-26 | 大唐移动通信设备有限公司 | 告警信息同步的方法及其装置 |
CN103840962A (zh) * | 2012-11-26 | 2014-06-04 | 深圳中兴力维技术有限公司 | 服务器告警输出方法及系统 |
CN107360013A (zh) * | 2016-05-10 | 2017-11-17 | 北京数码视讯科技股份有限公司 | 一种告警同步方法及系统 |
CN108476149A (zh) * | 2016-03-14 | 2018-08-31 | 富士通株式会社 | 操作管理维护系统 |
CN113965452A (zh) * | 2021-11-02 | 2022-01-21 | 烽火通信科技股份有限公司 | 一种设备倒换状态获取方法及装置 |
-
2007
- 2007-07-20 CN CNA2007101299576A patent/CN101350735A/zh active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102882700A (zh) * | 2012-08-03 | 2013-01-16 | 中国科学院声学研究所 | 一种网管系统中的告警信息管理方法及设备 |
CN102882700B (zh) * | 2012-08-03 | 2016-07-06 | 中国科学院声学研究所 | 一种网管系统中的告警信息管理方法及设备 |
CN103840962A (zh) * | 2012-11-26 | 2014-06-04 | 深圳中兴力维技术有限公司 | 服务器告警输出方法及系统 |
CN103840962B (zh) * | 2012-11-26 | 2017-09-05 | 深圳中兴力维技术有限公司 | 服务器告警输出方法及系统 |
CN103684876A (zh) * | 2013-12-30 | 2014-03-26 | 大唐移动通信设备有限公司 | 告警信息同步的方法及其装置 |
CN103684876B (zh) * | 2013-12-30 | 2017-10-10 | 大唐移动通信设备有限公司 | 告警信息同步的方法及其装置 |
CN108476149A (zh) * | 2016-03-14 | 2018-08-31 | 富士通株式会社 | 操作管理维护系统 |
CN108476149B (zh) * | 2016-03-14 | 2020-12-15 | 富士通株式会社 | 操作管理维护系统 |
CN107360013A (zh) * | 2016-05-10 | 2017-11-17 | 北京数码视讯科技股份有限公司 | 一种告警同步方法及系统 |
CN113965452A (zh) * | 2021-11-02 | 2022-01-21 | 烽火通信科技股份有限公司 | 一种设备倒换状态获取方法及装置 |
CN113965452B (zh) * | 2021-11-02 | 2023-11-03 | 烽火通信科技股份有限公司 | 一种设备倒换状态获取方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101350735A (zh) | 一种告警同步方法 | |
CN102014012B (zh) | 一种告警同步的方法及装置 | |
CN104378232A (zh) | 主备集群组网模式下的脑裂发现、恢复方法及装置 | |
CN103036719A (zh) | 一种基于主备集群服务器的跨地区服务容灾方法及装置 | |
CN102681917A (zh) | 一种操作系统及其修复方法 | |
CN105095008A (zh) | 一种适用于集群系统的分布式任务故障冗余方法 | |
CN110535924B (zh) | 一种轨道交通服务器通信方法及系统 | |
CN105790965A (zh) | 链路切换方法、装置及线卡 | |
CN111800484B (zh) | 机动边缘信息服务系统的服务抗毁接替方法 | |
CN101741635A (zh) | 一种同步告警信息的方法、系统及设备 | |
CN109802995A (zh) | 消息推送方法、装置、设备及存储介质 | |
CN113688144A (zh) | 一种记录数据同步方法、装置、设备和存储介质 | |
CN103812697A (zh) | 一种分布式通信网络的异地容灾方法和系统 | |
CN108445857B (zh) | 一种scada系统的1+n冗余机制设计方法 | |
CN101110608B (zh) | 一种主备板数据检测的方法、系统和装置 | |
CN106330698A (zh) | 一种局部路由的恢复方法及装置 | |
CN101553004B (zh) | 移动通信系统中资源共享的系统和方法 | |
CN103414591A (zh) | 一种端口故障恢复时的快速收敛方法和系统 | |
CN101202644A (zh) | 数据备份和恢复方法 | |
CN108196441B (zh) | 一种面向系统应用的热备冗余的实现方法 | |
CN102523620A (zh) | 数据同步的方法、装置及系统 | |
CN114785849A (zh) | 一种基于多级节点网络实现的应用高可用方法 | |
CN107835097A (zh) | 告警信息同步方法及装置、网元 | |
CN101453754B (zh) | 一种数据备份的方法和装置 | |
CN103684821A (zh) | 告警消息的处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20090121 |