CN101090340A - 一种告警信息缓冲的系统、方法及装置 - Google Patents

一种告警信息缓冲的系统、方法及装置 Download PDF

Info

Publication number
CN101090340A
CN101090340A CN 200710126047 CN200710126047A CN101090340A CN 101090340 A CN101090340 A CN 101090340A CN 200710126047 CN200710126047 CN 200710126047 CN 200710126047 A CN200710126047 A CN 200710126047A CN 101090340 A CN101090340 A CN 101090340A
Authority
CN
China
Prior art keywords
buffer
server
warning information
warning
buffer memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200710126047
Other languages
English (en)
Inventor
贺炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN 200710126047 priority Critical patent/CN101090340A/zh
Publication of CN101090340A publication Critical patent/CN101090340A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种告警信息缓冲的系统、方法及装置,该系统包括网管系统和服务器组,其中,网管系统包括:告警采集模块,采集网络中的告警信息后,发送给告警缓冲器;告警缓冲器,在本地缓冲工作模式下将接收的告警信息进行缓存;在远程缓冲工作模式下,将接收的告警信息发送给服务器组,当在远程缓冲工作模式下且检测到自身缓存容量空闲时,接收服务器组发送的告警信息进行缓存;告警处理模块,从告警缓冲器提取缓存的告警信息;所述服务器组,用于将从所述告警缓冲器接收到的告警信息缓存,并在所述告警缓冲器的自身缓存空闲时将缓存的相应告警信息返回给所述告警缓冲器。本发明能使缓存告警信息的容量动态扩充。

Description

一种告警信息缓冲的系统、方法及装置
技术领域
本发明涉及在网络中对告警信息的处理技术,特别涉及一种告警信息缓冲的系统、方法及装置。
背景技术
在网络中,对网络产生的告警信息进行采集和处理是网络中网管系统的一项重要功能。在正常情况下,网络单位时间内产生的告警信息数量不会很多。但是,当网络的规模较大且发生了某些特定的故障时,网络有可能在短时间内产生大量的告警信息并上报给网络中的网管系统,这种短时间内大量告警信息的上报称为告警风暴。
告警风暴会带来许多负面的影响。例如:受到网管系统处理速度的限制,上报给网管系统的告警信息可能无法被及时接收和处理,从而导致告警信息的丢失;告警风暴往往意味着网络存在严重的故障,这时需要通过网管系统对网络下发相关指令用于故障检测、修复或隔离,此时的网管系统正忙于处理上报的告警信息,往往不能及时下发相关指令或响应网络发送的操作请求,而这些相关指令和操作请求得不到执行的后果是告警风暴持续的时间会更长,从而形成恶性循环,甚至造成网管系统的挂起或崩溃。
因此,如何有效地抵御告警风暴带来的负面影响是评价网管系统的一项重要指标。
当网管系统对告警信息进行处理时,需要对采集的告警信息进行分析、计算以及保存到数据库等处理。但是,受到网管系统中的处理器速度、输入输出设备以及其他软、硬件环境的限制,网管系统的告警处理速度在达到某个极限后就无法再提高了,而当告警风暴发生导致告警信息上报的速度高于网管系统处理告警信息的速度时,就可能造成告警信息的丢失。为了解决这个问题,目前采用在网管系统中的告警采集模块和告警处理模块之间引入一个告警缓冲器,如图1所示,图1为现有技术处理告警信息的网管系统的结构一示意图。在图中,网管系统101与网络相连接,用于接收网络上报的告警信息。网管系统101包括告警采集模块102、告警缓冲器103以及告警处理模块104。其中,告警采集模块102按顺序接收网络上报的告警信息,按顺序发送给告警缓冲器103进行缓存;告警处理模块104按顺序从告警缓冲器103中提取所缓存的告警信息进行处理。对于告警缓冲器103,从告警采集模块102接收到告警信息的速度大于告警处理模块104提取告警信息的速度时,告警缓冲器103中缓存的告警信息数量就会增长,反之,缓存的告警信息数量就会减少。
采用图1所示的网管系统处理告警信息,当告警风暴发生导致大量告警信息上报时,如果网管系统处理告警信息的速度跟不上告警信息上报的速度,则告警缓冲器103可以将来不及处理的告警信息进行缓存,等告警风暴过去后,告警处理模块104会继续从告警缓冲器103中提取出告警信息进行处理,直到告警缓冲器103中缓存的告警信息被全部提取。此外,告警处理模块104还可以采用从告警缓冲器103中批量提取告警信息进行处理的策略,从而提高告警信息处理的效率。
采用图1所示的网管系统进行告警信息的处理,主要缺点是告警缓冲器103的缓存容量受到限制,在告警风暴产生的告警信息上报速度过快或告警风暴持续时间较长时,仍然可能导致告警缓冲器103中缓存的告警信息溢出,从而造成告警信息的丢失。造成告警缓冲器103容量受限的原因是由于网管系统内存总量是有限的,除了给告警缓冲器103预留内存外,还需要给其他应用以及其他模块预留内存,因此,为告警缓冲器103预留的缓存容量不可能无限扩充。
图2为现有技术处理告警信息的网管系统的结构二示意图,该网管系统采用分布式的告警采集前置机的方式,将告警信息采集过程分布到另一台主机上,并引入两级告警缓冲器。该网管系统包括网管系统主机201和告警采集前置机202,其中,告警采集前置机202位于网管系统主机201和网络之间,包括告警采集模块203和告警缓冲器204;网管系统主机201包括告警缓冲器205和告警处理模块206。其中,告警采集模块203按顺序接收网络上报的告警信息,按顺序发送给告警缓冲器204进行缓存;告警缓冲器205从告警缓冲器204中按顺序提取缓存的告警信息进行缓存;告警处理模块206按顺序从告警缓冲器205中提取所缓存的告警信息进行处理。
从图2所示的网管系统可以看出,该网管系统有两个告警缓冲器,缓存告警信息的缓存容量为两个告警缓冲器的容量之和,与图1所示的网管系统比较,提高了缓存告警信息的缓存容量。但是,该网管系统需要改动现有网管系统的结构,增加了网管系统部署的复杂度,且缓存告警信息的容量虽然增大,但是容量仍受限于两个告警缓冲器的缓存容量。
发明内容
本发明实施例提供一种告警信息缓冲的系统,该系统能够使缓存告警信息的容量动态扩充。
本发明实施例还提供一种告警信息缓冲的方法,该方法能够使缓存告警信息的容量动态扩充。
本发明实施例还提供一种告警信息缓存的装置,该装置能够支持缓存告警信息的容量动态扩充。
本发明实施例还提供一种告警信息缓存的网管系统,该系统能够支持缓存告警信息的容量动态扩充。
根据上述目的,本发明实施例的技术方案是这样实现的:
一种告警信息缓冲的系统,该系统包括网管系统和服务器组,其中,所述网管系统包括:
告警采集模块,用于采集网络中的告警信息后,发送给告警缓冲器;
告警缓冲器,用于在本地缓冲工作模式下将接收的告警信息缓存;在远程缓冲工作模式下时,将接收的告警信息发送给服务器组,当在远程缓冲工作模式下且检测到自身缓存容量空闲时,获取服务器组缓存的告警信息并缓存;
告警处理模块,用于从所述告警缓冲器提取缓存的告警信息;
所述服务器组,用于将从所述告警缓冲器接收的告警信息进行缓存。
一种告警信息缓冲的装置,包括:缓冲模块、状态机、收发模块和缓存容量检测模块,其中,
所述收发模块,用于接收告警信息,从状态机获取当前工作模式以及从缓存容量检测模块接收当前缓存容量,当获取的工作模式为本地缓冲工作模式时,将所述告警信息缓存到所述缓冲模块;当获取的工作模式为远程缓冲工作模式信息时,将所述告警信息发送给与其级联的服务器;当获取的工作模式为远程缓冲工作模式信息且当前缓存容量空闲时,从所述与其级联的服务器获取所缓存的告警信息缓存到所述缓冲模块;
所述状态机,用于根据缓存容量检测模块发送的当前缓存容量和所级联服务器的缓存容量指示进行工作模式的切换:当当前缓存容量指示为满且工作模式为本地缓冲工作模式时,切换成远程缓冲工作模式;当所级联服务器的缓存容量指示为空且工作模式为远程缓冲工作模式时,切换成本地缓冲工作模式;将当前的工作模式发送给收发模块;
所述缓存容量检测模块,用于检测当前缓存容量以及所级联的服务器缓存容量,将当前缓存容量和所级联服务器的缓存容量指示发送给状态机;将当前缓存容量发送给收发模块,所述当前缓存容量指示为当前缓存容量满、空或空闲,所述级联服务器的缓存容量指示为所级联服务器的缓存容量满、空或空闲。
一种告警信息缓冲的网管系统,该网管系统包括:
告警采集模块,用于采集网络中的告警信息后,发送给告警缓冲器;
告警缓冲器,用于在本地缓冲工作模式下将接收到的告警信息进行缓存;在远程缓冲工作模式下时,将接收到的告警信息发送给服务器组,当在远程缓冲工作模式下且检测到自身缓存容量空闲时,接收服务器组返回的告警信息进行缓存;
告警处理模块,用于从告警缓冲器提取缓存的告警信息。
从上述方案可以看出,本发明实施例将网管系统中的告警缓冲器与具有告警缓冲服务功能的服务器组相联,由于具有告警缓冲服务功能的服务器组可以包括一个具有告警缓冲服务功能的服务器或多个级联的具有告警缓冲服务功能的服务器,为告警缓冲器缓存不下的告警信息提供缓存空间,提供的缓存空间可以根据告警信息的数量动态确定。如果告警缓冲器缓存不下的告警信息的数量多,则提供多个级联的告警缓冲服务器分别存储告警信息;如果告警缓冲器缓存不下的告警信息的数量少,则提供一个具有告警缓冲服务功能的服务器即可。因此,本发明实施例提供的系统、方法及装置使缓存告警信息的容量动态扩充,进一步提升网管系统抵御告警风暴的能力。本发明实施例通过分布式告警缓冲服务,突破单网管系统内存限制带来的网管系统中告警信息缓存容量的限制,有效地提高了网管系统抵御告警风暴的能力。本发明实施例将网管系统和具有告警缓冲服务功能的服务器组相联,从而对已有的网管系统结构冲击小。
综上所述,本发明实施例提供的方法、系统及装置可以使缓存告警信息的容量动态扩充。
附图说明
图1为现有技术处理告警信息的网管系统的结构一的示意图;
图2为现有技术处理告警信息的网管系统的结构二的示意图;
图3为本发明实施例提供的告警信息缓存系统一的示意图;
图4为本发明实施例提供的工作模式切换状态图;
图5为本发明实施例缓冲告警信息的处理流程图;
图6为本发明实施例将告警信息缓存到具有告警缓冲服务功能的服务器或下一级具有告警缓冲服务功能的服务器的方法流程图;
图7为本发明实施例将告警信息从具有告警缓冲服务功能的服务器或下一级具有告警缓冲服务功能的服务器获取的方法流程图;
图8为本发明实施例的告警信息缓存系统二的示意图;
图9为本发明实施例的告警信息缓存系统三的示意图;
图10为本发明实施例的告警信息缓存系统四的示意图;
图11为本发明实施例的告警信息缓存系统五的示意图;
图12为本发明实施例的告警信息缓存的本地告警缓冲器的结构示意图。
具体实施方式
以下举具体实施例并参照附图,进一步详细的说明。
本发明提供的实施例为了使缓存告警信息的容量动态扩充,从而进一步提升网管系统抵御告警风暴的能力,提供了具有告警缓冲服务功能的服务器组与网管系统中的告警缓冲器相连,该服务器组包括一个具有告警缓冲服务功能的服务器或多个级联的具有告警缓冲服务功能的服务器,该服务器组可以提供缓存告警信息的内存。
在本发明实施例中,为了使网管系统中的告警缓冲器缓存不下告警信息时,可以将告警信息发送给具有告警缓冲服务功能的服务器组进行缓存。为了支持将缓存不下的告警信息发送给具有告警缓冲服务功能的服务器组或者从具有告警缓冲服务功能的服务器组获取告警信息,在本发明实施例中,网管系统的告警缓冲器也具有告警缓冲服务功能。
以下对该服务器组只有一个具有告警缓冲服务功能的服务器的实施例进行详细说明。
图3为本发明实施例提供的告警信息缓存系统一的示意图:该系统包括网管系统和具有告警缓冲服务的服务器,网管系统包括告警采集模块、告警处理模块以及告警缓冲器。其中,告警采集模块用于采集网络上报的告警信息并将采集到的告警信息放入告警缓冲器进行缓存;告警处理模块用于从告警缓冲器中提取缓存的告警信息进行处理。告警缓冲器包括一个静态或动态分配的缓存空间,在本地缓冲工作模式下,缓存告警采集模块放入的告警信息。只要告警缓冲器中存在告警信息,告警处理模块就不断从其中提取告警信息进行处理。当告警信息的缓存速度高于告警处理模块的取出速度时,告警缓冲器中缓存的告警信息数量就会增长,反之则告警信息的数据会减少。
在本发明实施例中,告警缓冲器与具有告警缓冲服务功能的服务器相连接,当告警缓冲器检测到自身缓存容量已满时(检测过程可以采用现有技术进行),就会由本地缓冲工作模式切换到远程缓冲工作模式。在远程缓冲工作模式下,告警缓冲器将告警采集模块放入的告警信息发送给具有告警缓冲服务功能的服务器进行缓存。此后,当告警缓冲器检测到自身缓存空间有空闲且在远程缓冲工作模式时,通过连接向具有告警缓冲服务功能的服务器请求获取其缓存的告警信息(可以一次获取多个或一个),且将从具有告警缓冲服务功能的服务器获取到的告警信息进行缓存。当告警缓冲器检测到具有告警缓冲服务功能的服务器缓存的报警信息被告警缓冲器全部获取完后,告警缓冲器切换到本地缓冲工作模式。这样,整个告警信息的缓存容量就被提高为告警缓冲器缓存容量和具有告警缓冲服务功能的服务器缓存容量之和。
在本发明实施例,告警缓存器具有检测自身缓存容量以及与其级联服务器容量的功能,且具有根据检测自身缓存容量切换工作模式的功能。
在本发明实施例中,具有告警缓冲服务功能的服务器通过级联方式实现告警信息缓存容量地不断扩充。在级联方式下,具有告警缓冲服务功能的服务器与下一级具有告警缓冲服务功能的服务器建立连接,它们之间缓冲告警信息的过程与告警缓冲器和具有告警缓冲服务功能的服务器的过程相同。这里可以将具有告警缓冲服务功能的服务器和下一级具有告警缓冲服务功能的服务器均称为具有告警缓冲服务功能的远程服务器。
图4为本发明实施例提供的工作模式切换状态图,在图中,工作模式切换不仅适用于告警缓冲器,还适用于与下一级具有告警缓冲服务功能的服务器级联的具有告警缓冲服务功能的服务器。在告警缓冲器或服务器启动后,告警缓冲器或服务器设置工作在本地缓冲工作模式,放入的告警信息保存在自身的缓存中,当检测到本地缓存容量满后则切换到远程缓冲工作模式,放入的告警信息通过连接发送给具有告警缓冲服务功能的服务器或下一级具有告警缓冲服务功能的服务器的缓存中。在检测到本地缓存容量有空闲且当前工作在远程缓冲工作模式时,则通过连接获取具有告警缓冲服务功能的服务器或下一级具有告警缓冲服务功能的服务器缓存的一个或一批告警信息进行本地缓存,直到检测到告警信息被获取空后,切换到本地缓冲工作模式。
图5为本发明实施例缓冲告警信息的处理流程图,该处理流程适用于告警缓冲器以及与下一级具有告警缓冲服务功能的服务器级联的具有告警缓冲服务功能的服务器,该处理流程实现时通过两线程实现,其具体步骤为:
告警缓冲器或服务器启动后进入第一线程:
步骤501、将放入的告警信息进行缓存。
步骤502、判断当前的工作模式,如果是本地缓冲工作模式,则执行步骤503;如果是远程缓冲工作模式,则执行步骤505。
步骤503、判断本地缓存空间是否已满,如果是,执行步骤504;如果否,执行步骤506。
步骤504、切换到远程缓冲工作模式,激活第二线程,同时执行步骤505。
步骤505、通过连接将获取的告警信息传递给具有告警缓冲服务功能的服务器或下一级具有告警缓冲服务功能的服务器的缓存中,返回步骤501继续执行。
步骤506、将放入的告警信息缓存在本地缓存空间中,返回步骤501继续执行。
进入第二线程:
步骤507、第二线程等待激活。
步骤508、等待本地缓存空间空闲,当检测到本地缓存出现空闲空间后,转步骤509。
步骤509、从具有告警缓冲服务功能的服务器或下一级具有告警缓冲服务功能的服务器的缓存中获取到告警信息后,缓存在本地缓存空间中。
步骤510、判断具有告警缓冲服务功能的服务器或下一级具有告警缓冲服务功能的服务器的缓存空间是否已空,如果是,执行步骤511;如果否,返回步骤508。
步骤511、切换到本地缓冲工作模式,转入步骤501。
在本发明实施例中,告警缓冲器与具有告警缓冲服务功能的服务器通过传输控制协议(TCP)相连接,或者是具有告警缓冲服务功能的服务器和与其级联的下一级具有告警缓冲服务功能的服务器通过TCP相连接,例如:与告警缓冲器相连的第一服务器与第二服务器通过TCP相连接,其中所述第一服务器、第二服务器分别是具有告警缓冲服务功能的服务器;在此连接上执行一种告警缓冲服务接口协议,下面给出了通过抽象文法标记语言一(ASN.1)定义的该协议消息原语。
BufferServerRequest::=SEQUENCE  //包括放入告警信息请求(putRequest)和获取告警信息请求(getRequest)的请求消息
{
  messageID  INTEGER    //请求消息的标识(整数)
  request   CHOICE    //请求消息的名称(可选)
  {
    putRequest[0]    putAlarmRequest,//放入告警信息请求
    getRequest[0]    getAlarmRequest  //获取告警信息请求
  }
 }
 BufferServerResponse::=SEQUENCE  //包括放入告警信息响应(putResponse)和获取出告警信息响应(getResponse)的响应消息
{
  messageID   INTEGER  //响应消息的标识(整数)
  response    CHOICE   //响应消息的名称(可选)
  {
   putResponse[0]  putAlarmResponse,//放入告警信息响应
   getResponse[0]  getAlarmResponse  //获取出告警信息响应
  }
}
在该协议消息原语中,BufferServerRequest为告警缓冲器或与下一级具有告警缓冲服务功能的服务器级联的具有告警缓冲服务功能的服务器,发送给具有告警缓冲服务功能的服务器或下一级具有告警缓冲服务功能的服务器的请求消息,请求消息的原语包括放入告警信息请求(putRequest)和获取告警信息请求(getRequest)两类。
BufferServerResponse为告警缓冲器或与下一级具有告警缓冲服务功能的服务器级联的具有告警缓冲服务功能的服务器返回响应消息,响应消息的原语包括放入告警信息响应(putResponse)和获取出告警信息(getResponse)两类,分别对应相应的请求消息。其中,putResponse对应于putRequest,getResponse对应于getRequest。
请求消息和响应消息通过消息号(messageID)对应,即响应消息的messageID与其对应的请求消息的messageID是相同的,而每次发出请求消息的messageID是不同的。
下面给出了消息内部数据结构的ASN.1定义。
PutAlarmRequest::=SEQUENCE  //放入告警信息请求消息
{
  key     INTEGER        //一个消息发送者产生的唯一标识
  alarmList AlarmList    //请求放入缓存空间的告警信息列表
}
PutAlarmResponse::=SEQUENCE  //放入告警信息响应消息
{
  ok(0),             //放入告警信息执行成功
  bufferFull(1),   //缓存空间已满,放入告警信息失败
    unknownError(2)  //不确定因素导致放入告警信息失败
}
GetAlarmRequest∷=SEQUENCE  //获取出告警信息请求消息
{
  key    INTEGER    //放入告警信息时由消息发送者产生的唯一标识
  size   INTEGER    //一次希望最多取出的告警信息数量
}
GetAlarmResponse::=SEQUENCE  //获取出告警信息请求消息
{
  alarmList AlarmList  //放入告警信息时由消息发送者产生的唯一标识
  rest   INTEGER     //取出告警信息后缓存中剩余下的key值相同的告警数量
}
AlarmList::=SEQUENCE OF AlarmData  //告警信息列表包括顺序的告警信息
AlarmData::=OCTET STRING         //告警信息用八字节的字符串表示
PutAlarmRequest为放入告警信息请求消息的数据结构,其中,key为一个消息发送者产生的唯一标识,alarmlist为请求放入缓存空间的告警信息列表。PutAlarmResponse为放入告警信息响应消息的数据结构,定义为一个返回码,ok表示放入告警信息执行成功;bufferFull表示缓存空间已满,放入告警信息失败;unknownError表示不确定因素导致放入告警信息失败。
GetAlarmRequest为获取出告警信息请求消息的数据结构。其中,key为放入告警信息时由消息发送者产生的唯一标识,size表示一次希望最多取出的告警信息数量。GetAlarmResponse为获取告警响应消息的数据结构,其中,alarmlist为取出的告警信息列表,rest表示取出告警信息后缓存中剩余下的key值相同的告警数量。
告警缓冲器与具有告警缓冲服务功能的服务器之间的网络连接,或者是具有告警缓冲服务功能的服务器和与其级联的下一级具有告警缓冲服务功能的服务器之间的网络连接也可采用其他非TCP协议,如;用户数据报协议(UDP,User Data Protocol)。
告警缓冲服务协议消息也可采用非ASN.1的方式定义,如:二进制格式形式或SML的方式定义。
图6为本发明实施例将告警信息缓存到具有告警缓冲服务功能的服务器或下一级具有告警缓冲服务功能的服务器的方法流程图,其具体步骤为:
步骤601、向具有告警缓冲服务功能的服务器或下一级具有告警缓冲服务功能的服务器发送放入告警信息请求消息;
放入告警信息请求消息为BufferServeRequest(request=putRequest),其携带消息发送者的唯一标识和请求放入缓存空间的告警信息列表。
步骤602、具有告警缓冲服务功能的服务器或下一级具有告警缓冲服务功能的服务器处理该请求消息后,返回放入告警信息响应消息;
处理该请求消息的过程为根据告警信息列表,对应于消息发送者的标识将请求放入缓存空间的告警信息进行缓存。
放入告警信息响应消息为BufferServeResponse(response=putResponse),携带用于标识成功的标识。
如果处理该请求消息不成功,即无法根据告警信息列表,对应于消息发送者的标识将请求放入缓存空间的告警信息进行缓存,则在BufferServeResponse(response=putResponse)中返回不成功的标识并携带原因值(缓存空间已满或不确定因素)。
图7为本发明实施例将告警信息从具有告警缓冲服务功能的服务器或下一级具有告警缓冲服务功能的服务器获取的方法流程图,其具体步骤为:
步骤701、向具有告警缓冲服务功能的服务器或下一级具有告警缓冲服务功能的服务器(即具有告警缓冲服务功能的远程服务器)发送获取告警信息请求消息;
获取告警信息请求消息为BufferServerRequest(request=getRequest),其中携带放入告警信息时由消息发送者产生的唯一标识和表示一次希望最多取出的告警信息数量。
步骤702、具有告警缓冲服务功能的服务器或下一级具有告警缓冲服务功能的服务器处理该请求消息后,返回携带告警信息的获取告警信息响应消息。
处理该请求消息的过程为:提取一次希望最多取出的告警信息数量的所缓存的对应于消息发送者产生的唯一标识的告警信息,携带在获取告警信息响应消息中发送。
如果缓存的告警信息不够一次希望最多取出的告警信息数量,则直接将所有缓存的告警信息提取。
获取告警信息响应消息为BufferServerResponse(response=getResponse),其中携带取出的告警信息列表和取出告警信息后缓存中剩余下的key值相同的告警数量。
在本发明实施例中,具有告警缓冲服务功能的服务器为具有空余内存和处理器资源的计算机服务器。
以下举四个具体的实施例进行说明。
实施例一
如图3所示,本发明实施例告警信息缓存系统包括:
网管系统,用于采集和处理告警信息;
具有告警缓冲服务功能的服务器,一台具有空余内存和处理器资源的计算机服务器,其具有告警缓冲服务功能,用于为网管系统提供告警缓冲服务,即接收网管系统发送的告警信息进行缓存,将缓存的告警信息发送给网管系统进行处理。
其中,该网管系统包括:
告警采集模块,用于采集该网管系统所管理的网络上报的告警信息,并将所述采集的告警信息发送到告警缓冲器中。
告警缓冲器,用于判断当前的工作模式,如果为本地缓冲工作模式,则直接将接收的告警信息进行缓存;当告警缓冲器的缓存容量已满时,告警缓冲器切换到远程缓冲工作模式,将接收的告警信息传递给具有告警缓冲服务功能的服务器,激活第二线程;具有告警缓冲服务功能的服务器将传递来的告警信息进行自身缓存;告警缓冲器第二线程判断自身缓存空间是否有空闲,如果是,则从具有告警缓冲服务功能的服务器获取到告警信息缓存到自身缓存中,实时判断远程缓存,即具有告警缓冲服务功能的服务器是否已经被获取空,如果是,则切换到本地缓冲工作模式。
告警处理模块,用于从告警缓冲器中取出告警信息进行处理。
实施例二
如图8所示,本发明实施例告警信息缓存系统包括:
网管系统,用于采集和处理告警信息;
具有告警缓冲服务功能的服务器一,一台具有空余内存和处理器资源的计算机服务器,其具有告警缓冲服务功能,包括:启动后,工作在本地缓冲工作模式下,接收网管系统发送的告警信息进行缓存,检测到自己的缓存容量已满时,切换到远程缓冲工作模式,将从网管系统新接收的告警信息发送给具有告警缓冲服务功能的服务器二,激活第二线程,具有告警缓冲服务功能的服务器二将发送来的告警信息进行自身缓存;具有告警缓冲服务功能的服务器一的第二线程判断自身缓存空间是否有空闲,如果是,则从具有告警缓冲服务功能的服务器二获取到告警信息缓存到自身缓存中,实时判断具有告警缓冲服务功能的服务器二是否已经被获取空,如果是,则切换到本地缓冲工作模式。
具有告警缓冲服务功能的服务器二,一台具有空余内存和处理器资源的计算机服务器,其具有告警缓冲服务功能,用于为具有告警缓冲服务功能的服务器一提供告警缓冲服务,即接收告警缓冲服务功能的服务器一发送的告警信息进行缓存,将缓存的告警信息发送给告警缓冲服务功能的服务器一进行处理。
具有告警缓冲服务功能的服务器一和具有告警缓冲服务功能的服务器二级联。
其中,该网管系统包括:
告警采集模块,用于采集该网管系统所管理的网络上报的告警信息,并将所述采集的告警信息发送到告警缓冲器中;
告警缓冲器,用于判断当前的工作模式,如果为本地缓冲工作模式,则直接将接收的告警信息进行缓存;当告警缓冲器地缓存容量已满时,告警缓冲器切换到远程缓冲工作模式,将接收的告警信息传递给具有告警缓冲服务功能的服务器一,激活第二线程,具有告警缓冲服务功能的服务器一将传递来的告警信息进行自身缓存;告警缓冲器第二线程判断自身缓存空间是否有空闲,如果是,则从具有告警缓冲服务功能的服务器一获取到告警信息缓存到自身缓存中,实时判断具有告警缓冲服务功能的服务器一是否已经被获取空,如果是,则切换到本地缓冲工作模式。
告警处理模块,用于从告警缓冲器中取出告警信息进行处理。
在该实施例中,还可以采用类似的方法级联具有告警缓冲服务功能的服务器三等,这可以根据实际情况选择级联具有告警缓冲服务功能的服务器的个数。
实施例三
如图9所示,所述系统与实施例一的区别在于两个网管系统与一个具有告警缓冲服务功能的服务器相连接。该系统的告警信息采集和告警信息处理的过程与实施例一相同,区别在于具有告警缓冲服务功能的服务器可以同时缓存两个网管系统的告警信息,通过前述协议消息中的key值来区分不同网管系统的告警信息。
在该实施例中,虽然给出了两个网管系统共享一个具有告警缓冲服务功能的服务器,但是不限制共享具有告警缓冲服务功能的服务器的数量,不限制共享具有告警缓冲服务功能的服务器的网管系统的数量;共享方式可以是直接共享如图9所示,也可以是间接共享如图11所示,如网管系统一与第一服务器相连,再通过第一服务器与第二服务器相连,以及网管系统二与第二服务器相连。
实施例四
如图10所示,所述系统实施例是实施例二和实施例三的结合应用,同时具备多网管系统共享同一具有告警缓冲服务功能的服务器以及多个具有告警缓冲服务功能的服务器的级联特征。
网管系统二不限于图10的连接方式,网管系统二也可以与具有告警缓冲服务功能的服务器二相连。
在本发明实施例中,告警缓冲器和具有告警缓冲服务功能的服务器之间的连接,以及互相级联的具有告警缓冲服务功能的服务器之间的连接也可以不采用TCP,采用非ASN.1的方式定义。
在本发明实施例中,网管系统中的告警采集模块、告警缓冲器和告警处理模块可以部署在不同的服务器上。
在本发明实施例中,还有一种情况,即网管系统中的告警采集模块将采集到的告警信息发送给告警缓冲器,如果告警缓冲器的缓存容量有空闲且工作在远程缓存工作模式下,则仍会将该告警信息发送给与其级联的服务器进行处理,同时,也会从与其级联的服务器获取前期缓存的告警信息后,进行自身缓存;如果工作在本地缓存工作模式下,则会直接缓存告警采集模块发来的告警信息。
本发明实施例还提供一种告警信息缓冲的本地告警缓冲器,如图12所示,包括:缓冲模块、状态机、收发模块和缓存容量检测模块,其中,
所述收发模块,用于接收网管系统中的告警采集模块发来的告警信息,从状态机获取当前工作模式以及从缓存容量检测模块接收当前缓存容量,当获取的工作模式为本地缓冲工作模式时,将所述告警信息缓存到所述缓冲模块;当获取的工作模式为远程缓冲工作模式信息时,将所述告警信息发送给级联的服务器;当获取的工作模式为远程缓冲工作模式信息且当前缓存容量空闲时,从级联的服务器获取先前所缓存的告警信息缓存到所述缓冲模块;
所述状态机,用于根据缓存容量检测模块发送的当前缓存容量和所级联服务器的缓存容量指示进行工作模式的切换:当当前缓存容量指示为满且工作模式为本地缓冲工作模式时,切换成远程缓冲工作模式;当所级联服务器的缓存容量指示为空且工作模式为远程缓冲工作模式时,切换成本地缓冲工作模式;将当前的工作模式发送给收发模块。
所述缓存容量检测模块,用于检测当前缓存容量以及所级联的服务器缓存容量,将当前缓存容量和所级联服务器的缓存容量指示发送给状态机,将当前缓存容量发送给收发模块,所述当前缓存容量指示为当前缓存容量满、当前缓存容量空或当前缓存容量空闲,所述级联服务器的缓存容量指示为所级联服务器的缓存容量满、空或空闲。
本发明实施例提供的本地告警缓冲器也可以是中间级联的服务器,这时,收发模块,从本地告警缓存器接收告警信息,从状态机获取当前工作模式以及从缓存容量检测模块接收当前缓存容量,当获取的工作模式为本地缓冲工作模式时,将所述告警信息缓存到所述缓冲模块;当获取的工作模式为远程缓冲工作模式信息时,将所述告警信息发送给与其级联的服务器;当获取的工作模式为远程缓冲工作模式信息且当前缓存容量空闲时,从与其级联的服务器中获取先前所缓存的告警信息缓存到所述缓冲模块。
对于本发明实施例最后级联的服务器,在缓存容量满时,其无法将所要缓存的告警信息再缓存到别的服务器上,其也不需要对工作模式以及缓存容量进行判断。
本发明实施例还提供一种告警信息缓冲的网管系统,该网管系统如图3中所示的网管系统,该网管系统包括告警采集模块、告警缓冲器和告警处理模块,其中,
所述告警采集模块,用于采集网络中的告警信息后,发送给告警缓冲器;
所述告警缓冲器,用于在本地缓冲工作模式下将接收到的告警信息进行缓存;在远程缓冲工作模式下时,将接收到的告警信息发送给服务器组,当在远程缓冲工作模式下且检测到自身缓存容量空闲时,接收服务器组返回的告警信息进行缓存;
所述告警处理模块,用于从告警缓冲器提取缓存的告警信息。
综上,本发明实施例提供的方法、系统及装置将网管系统中的告警缓冲器与具有告警缓冲服务功能的服务器组相联,由于具有告警缓冲服务功能的服务器组可以包括一个具有告警缓冲服务功能的服务器或多个级联的具有告警缓冲服务功能的服务器,为告警缓冲器缓存不下的告警信息提供缓存空间,提供的缓存空间可以根据告警信息的数量动态确定。因此,本发明实施例提供的方法、系统及装置使缓存告警信息的容量动态扩充,进一步提升网管系统抵御告警风暴的能力。本发明实施例通过分布式告警缓冲服务,突破单网管系统内存限制带来的网管系统中告警信息缓存容量的限制,有效地提高了网管系统抵御告警风暴的能力。本发明实施例将网管系统和具有告警缓冲服务功能的服务器组相联,从而对已有的网管系统结构冲击小。
本领域普通技术人员可以理解实现上述实施例方法(图5、图6和图7)中在同一设备中的步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于该设备的可读取存储介质中,该程序在执行时执行上述方法中的对应步骤。所述的存储介质可以如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所做的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (11)

1、一种告警信息缓冲的系统,其特征在于,该系统包括网管系统和服务器组,其中,所述网管系统包括:
告警采集模块,用于采集网络中的告警信息后,发送给告警缓冲器;
告警缓冲器,用于在本地缓冲工作模式下将接收的告警信息进行缓存;在远程缓冲工作模式下时,将接收的告警信息发送给服务器组,当在远程缓冲工作模式下且检测到自身缓存容量空闲时,获取服务器组缓存的告警信息并缓存;
告警处理模块,用于从所述告警缓冲器提取缓存的告警信息;
所述服务器组,用于将从所述告警缓冲器接收的告警信息缓存。
2、如权利要求1所述的系统,其特征在于,所述网管系统为至少两个,分别与所述服务器组相联,其中,
所述网管系统中的告警缓冲器为第一告警缓冲器,用于在远程缓冲工作模式下时,将接收到的告警信息对应于自身告警缓冲器标识发送给所述服务器组,在远程缓冲工作模式下且检测到自身缓存容量空闲时发送携带自身标识的获取请求,接收所述服务器组发送的对应于所述自身标识的相应告警信息缓存;
所述服务器组为第一服务器组,用于将从所述告警缓冲器接收到的告警信息对应于所述告警缓冲器标识分别缓存;根据获取请求将对应于所述告警缓冲器标识的相应告警信息发送给所述告警缓冲器。
3、如权利要求1或2所述的系统,其特征在于,所述服务器组包括至少一个服务器,所述服务器之间级联;
所述中间级联的服务器,用于在本地缓冲工作模式下将从所述告警缓冲器或与其级联的上一级服务器接收的告警信息缓存;在远程缓冲工作模式下时,将从所述告警缓冲器或与其级联的上一级服务器接收的告警信息发送给与其级联的下一级服务器,当在远程缓冲工作模式下且检测到自身缓存容量空闲时,接收与其级联的下一级服务器发送的告警信息缓存;
所述最后级联的服务器,用于将从所述告警缓冲器或与其级联的上一级服务器接收的告警信息缓存。
4、一种告警信息缓冲的方法,其特征在于,该方法包括:
在本地缓冲工作模式下将接收的告警信息缓存;
在远程缓冲工作模式下时,将接收的告警信息发送给级联的服务器组,在远程缓冲工作模式下且检测到自身缓存容量空闲时,接收级联的服务器组发送的告警信息缓存。
5、如权利要求4所述的方法,其特征在于,应用于包括多个网管系统的系统时,所述告警信息对应于所述网管系统自身标识发送给级联的服务器组;
所述服务器组将告警信息对应于所述网管系统自身标识缓存。
6、如权利要求4或5所述的方法,其特征在于,所述服务器组包括至少一个服务器,所述多个服务器之间级联,当所述服务器组包括多个级联服务器时,
所述将接收的告警信息发送给所述服务器组的步骤为:
将接收的告警信息发送给所述服务器组中直接级联的第一服务器,该方法进一步包括:
确定所述第一服务器当前是否为本地缓冲工作模式,如果是,则缓存接收到的告警信息;如果否,则将接收到的告警信息发送给与所述第一服务器级联的第二服务器进行处理,在检测到自身缓存容量空闲时从与所述第一服务器级联的第二服务器获取缓冲的告警信息。
7、如权利要求6所述的方法,其特征在于,所述与所述第一服务器级联的第二服务器进行处理的过程为:
确定当前是否为本地缓冲工作模式,如果是,则缓存接收到的告警信息;如果否,则将接收到的告警信息发送给与其级联的下一级服务器进行处理,在检测到自身缓存容量空闲时从与其级联的下一级服务器获取缓冲的告警信息。
8、如权利要求7所述的方法,其特征在于,所述将接收到的告警信息发送的过程为:
发送携带所述发送者标识和告警信息列表的放入告警请求消息,发送接收到的告警信息;
所述缓存接收到的告警信息的过程为:如果成功缓存所述告警信息,则发送携带成功标识的放入告警响应消息;如果不能成功缓存所述告警信息,发送携带失败原因值的放入告警响应消息。
9、如权利要求7所述的方法,其特征在于,所述获取缓冲的告警信息的过程为:
发送携带发送者标识和一次取出告警信息数量值的获取告警请求消息;
接收返回的获取告警响应消息,所述获取告警响应消息携带对应于所述发送者标识的具有所述取出告警信息数量值的告警信息,所述获取告警响应消息还携带有告警信息列表和对应于所述发送者标识的剩余的告警信息数量值。
10、一种告警信息缓冲的装置,其特征在于,包括:缓冲模块、状态机、收发模块和缓存容量检测模块,其中,
所述收发模块,用于接收告警信息,从状态机获取当前工作模式以及从缓存容量检测模块接收当前缓存容量,当获取的工作模式为本地缓冲工作模式时,将所述告警信息缓存到所述缓冲模块;当获取的工作模式为远程缓冲工作模式信息时,将所述告警信息发送给与其级联的服务器;当获取的工作模式为远程缓冲工作模式信息且当前缓存容量空闲时,从所述与其级联的服务器获取所缓存的告警信息缓存到所述缓冲模块;
所述状态机,用于根据缓存容量检测模块发送的当前缓存容量和所级联服务器的缓存容量指示进行工作模式的切换:当当前缓存容量指示为满且工作模式为本地缓冲工作模式时,切换成远程缓冲工作模式;当所级联服务器的缓存容量指示为空且工作模式为远程缓冲工作模式时,切换成本地缓冲工作模式;将当前的工作模式发送给收发模块;
所述缓存容量检测模块,用于检测当前缓存容量以及所级联的服务器缓存容量,将当前缓存容量和所级联服务器的缓存容量指示发送给状态机;将当前缓存容量发送给收发模块,所述当前缓存容量指示为当前缓存容量满、空或空闲,所述级联服务器的缓存容量指示为所级联服务器的缓存容量满、空或空闲。
11、一种告警信息缓冲的网管系统,其特征在于,该网管系统包括:
告警采集模块,用于采集网络中的告警信息后,发送给告警缓冲器;
告警缓冲器,用于在本地缓冲工作模式下将接收到的告警信息进行缓存;在远程缓冲工作模式下时,将接收到的告警信息发送给服务器组,当在远程缓冲工作模式下且检测到自身缓存容量空闲时,接收服务器组返回的告警信息进行缓存;
告警处理模块,用于从告警缓冲器提取缓存的告警信息。
CN 200710126047 2007-06-29 2007-06-29 一种告警信息缓冲的系统、方法及装置 Pending CN101090340A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200710126047 CN101090340A (zh) 2007-06-29 2007-06-29 一种告警信息缓冲的系统、方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200710126047 CN101090340A (zh) 2007-06-29 2007-06-29 一种告警信息缓冲的系统、方法及装置

Publications (1)

Publication Number Publication Date
CN101090340A true CN101090340A (zh) 2007-12-19

Family

ID=38943519

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200710126047 Pending CN101090340A (zh) 2007-06-29 2007-06-29 一种告警信息缓冲的系统、方法及装置

Country Status (1)

Country Link
CN (1) CN101090340A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101924662B (zh) * 2009-06-15 2012-07-18 中兴通讯股份有限公司 一种告警传递方法
CN103795647A (zh) * 2012-11-01 2014-05-14 鼎点视讯科技有限公司 数据采集方法、数据采集器和系统
CN105302768A (zh) * 2015-10-16 2016-02-03 浙江宇视科技有限公司 一种从cpu异常处理方法及装置
CN106375103A (zh) * 2015-07-23 2017-02-01 杭州海康威视数字技术股份有限公司 一种告警数据采集和发送方法
CN106385378A (zh) * 2016-08-31 2017-02-08 北京神州绿盟信息安全科技股份有限公司 一种带内管理控制下控制报文的处理方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101924662B (zh) * 2009-06-15 2012-07-18 中兴通讯股份有限公司 一种告警传递方法
CN103795647A (zh) * 2012-11-01 2014-05-14 鼎点视讯科技有限公司 数据采集方法、数据采集器和系统
CN106375103A (zh) * 2015-07-23 2017-02-01 杭州海康威视数字技术股份有限公司 一种告警数据采集和发送方法
CN106375103B (zh) * 2015-07-23 2020-02-21 杭州海康威视数字技术股份有限公司 一种告警数据采集和发送方法
CN105302768A (zh) * 2015-10-16 2016-02-03 浙江宇视科技有限公司 一种从cpu异常处理方法及装置
CN106385378A (zh) * 2016-08-31 2017-02-08 北京神州绿盟信息安全科技股份有限公司 一种带内管理控制下控制报文的处理方法及装置

Similar Documents

Publication Publication Date Title
CN107390650B (zh) 一种基于物联网的数据采集系统及基于该系统的数据压缩方法
CN101547113B (zh) 告警信息过滤系统、装置及方法
CN101184003B (zh) 基于网络管理协议的前后台告警管理系统及其管理方法
CN1795446B (zh) 计算机集群及其中的计算机节点和传送状态信息的方法
CN112118174B (zh) 软件定义数据网关
CN101090340A (zh) 一种告警信息缓冲的系统、方法及装置
WO2012146026A1 (zh) 一种物联网监控方法及系统
CN111538563A (zh) 一种对Kubernetes的事件分析方法及装置
CN106201739A (zh) 一种基于Redis的Storm的远程调用方法
CN110231998B (zh) 分布式定时任务的检测方法、装置及存储介质
CN110688280A (zh) 一种告警事件的管理系统、方法、设备和存储介质
CN103150324A (zh) 一种基于链式处理的数据收集系统及其方法
CN108462598A (zh) 一种日志生成方法、日志分析方法及装置
CN107135088A (zh) 云计算系统中处理日志的方法和装置
CN112101589B (zh) 一种基于云计算的船舶远程技术保障系统
CN101645736A (zh) 历史性能数据的有效性检测方法及装置
CN110324208B (zh) 一种数据丢失处理方法、智能终端及存储介质
CN101409654A (zh) 一种网络管理系统中处理snmp信息的方法
CN1291571C (zh) 以太网冗余网络系统中数据传输模式的自适应选择方法
CN107395768A (zh) 用于文件安全传输的双机自适应负载均衡方法
CN101826145B (zh) 射频识别系统中实现标签清点的装置及方法
CN116489223A (zh) 数据上报方法、数据上报装置、电子设备及存储介质
CN116225843A (zh) 基于异步消息机制的监控采集数据告警方法、系统及装置
CN114584593A (zh) 一种基于集群状态感知的数据采集系统及方法
CN114629786A (zh) 日志实时分析方法、装置、存储介质及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20071219