CN103109498B - 用于对多级别层级式计算机管理系统的事件进行集中的方法 - Google Patents
用于对多级别层级式计算机管理系统的事件进行集中的方法 Download PDFInfo
- Publication number
- CN103109498B CN103109498B CN201180041484.9A CN201180041484A CN103109498B CN 103109498 B CN103109498 B CN 103109498B CN 201180041484 A CN201180041484 A CN 201180041484A CN 103109498 B CN103109498 B CN 103109498B
- Authority
- CN
- China
- Prior art keywords
- gatherer
- event
- subordinate
- higher level
- source device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000012795 verification Methods 0.000 claims abstract description 12
- 238000004891 communication Methods 0.000 claims description 13
- 230000005540 biological transmission Effects 0.000 claims description 7
- 239000000463 material Substances 0.000 claims description 5
- 230000000737 periodic effect Effects 0.000 claims description 4
- 238000007726 management method Methods 0.000 description 20
- 230000015654 memory Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- RFHAOTPXVQNOHP-UHFFFAOYSA-N fluconazole Chemical compound C1=NC=NN1CC(C=1C(=CC(F)=CC=1)F)(O)CN1C=NC=N1 RFHAOTPXVQNOHP-UHFFFAOYSA-N 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/542—Event management; Broadcasting; Multicasting; Notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/04—Network management architectures or arrangements
- H04L41/044—Network management architectures or arrangements comprising hierarchical management structures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0604—Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
- H04L41/0618—Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time based on the physical or logical position
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer And Data Communications (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明涉及一种用于对多级别层级式计算机管理系统的事件进行集中的方法,所述系统包括生成事件的多个源设备以及每个级别的多个事件收集器,所述方法包括步骤:-由上级收集器根据下级收集器的操作参数和/或链接服务质量来选择所述下级收集器;-由所述收集器从所述选择的下级收集器接收事件;-定期验证选择的下级收集器是否可用以及在不可用的情况下重复选择步骤;以及-由所述上级收集器对其事件与来自未选择的下级收集器的事件进行比较,并且从这些未被选择的下级收集器之一接收不同的事件。
Description
技术领域
本发明涉及用于对多级别层级式计算机管理系统的事件进行集中的方法。本发明还涉及支持实现所述方法的多级别层级式计算机管理系统。
本发明特别适用于管理多个站点的计算机网络管理中心的领域。
背景技术
在计算机网络管理中心的领域中,用于对多级别层级式计算机管理系统的事件进行集中的已知现有技术方法包括步骤:在第一事件收集器中记录来自每个源设备的事件。如果此第一收集器故障,则有操作者人工激活第二收集器以替代故障的第一收集器来记录事件。
这种现有技术的缺点在于在检测到第一收集器的故障的时刻与第二收集器就位的时刻之间的延迟。由此,在此延迟期间事件被丢失。而且,对该第二收集器的人工就位难于管理。
发明内容
本发明的目的是定义一种对多级别层级式计算机管理系统中的事件日志进行集中的方法,其能够使上述问题得以解决。
该目的是通过一种用于对多级别层级式计算机管理系统的事件进行集中的方法来实现的,所述系统包括生成事件的多个源设备以及每个级别的多个事件收集器,所述方法包括步骤:
-由上级收集器根据下级收集器的操作参数和/或链接服务质量来选择所述下级收集器;
-由所述收集器从所述选择的下级收集器接收事件;
-定期验证选择的下级收集器是否可用以及在不可用的情况下重复选择步骤;以及
-由所述上级收集器对其事件与来自未选择的下级收集器的事件进行比较,并且从这些未被选择的下级收集器之一接收不同的事件。
如随后将会详细看到的,防止选择给定时刻的最佳收集器并且验证来自上级收集器的事件与来自下级收集器的事件之间的一致性的自动方法确保了在无需人工干预的情况下对最高层级式级别处的所有事件进行集中。而且,该方法确保了可靠的集中,因为事件的集中在所选收集器变为不可用的情况下不会停止。
根据非限制性实施例,该方法还可以包括以下一个或多个附加特征:
-该集中方法包括将源设备生成的所有事件记录在该源设备的相同层级式级别的收集器中的附加步骤。
-对来自上级收集器的事件与来自未被选择的下级收集器的事件进行比较的步骤被定期执行。如果事件已被丢失,这允许事件恢复过程被加载并且由此确保所有事件总是被移动到上级收集器。
-对来自上级收集器的事件与来自未被选择的下级收集器的事件进行比较的步骤根据与事件相关联的标记而被执行。这使得事件能够被彼此区分并且每个事件被唯一地标识。
-对来自上级收集器的事件与来自未被选择的下级收集器的事件进行比较的步骤还根据时间戳执行。这使得事件能够根据其出现的日期和时间被分类并且事件能够按日期和时间被搜索。
-在下级收集器选择步骤处使用的操作参数包括事件的数目和/或材料能力和/或消耗参数。由此,收集器的静态能力(即,材料的物理能力)和动态能力(在使用期间的)被纳入考虑。
-接收不同事件的子步骤例如根据TCP/IP通信协议被执行。该协议是使事件能够被稳定递送的协议。它验证数据分组(事件)已经达到其目的地,并且保证其按序到达。
-该集中方法还包括由上级收集器搜索下级收集器的初始步骤。这允许获知所有的下级收集器,并且由此在下级收集器选择步骤中具有附加标准,允许从所有下级收集器中选择最佳下级收集器。
-该方法包括由一个收集器将其自己的事件传输给相同层级式级别中的所有其他收集器的附加步骤。由此,集中事件可以应用于特定于收集器的事件。
-该传输步骤例如根据UDP通信协议被执行。该协议易于实现。
而且,还提出了一种用于多级别层级式计算机管理系统的收集器,所述系统包括生成事件的多个源设备以及每个级别的多个事件收集器,所述收集器能够对所述多级别层级式计算机管理系统的源设备生成的事件进行日志记录,所述系统包括:
-用于根据下级收集器的操作参数和/或链接服务质量来选择所述下级收集器的装置;
-用于从所述选择的下级收集器接收事件的装置;
-用于定期验证选择的下级收集器的可用性的装置以及在不可用的情况下用于重复选择步骤的装置;
-用于对其事件与来自未被选择的下级收集器的事件进行比较的装置;以及
-用于从这些未被选择的下级收集器之一接收不同的事件的装置。
根据非限制性实施例,该收集器还包括用于记录相同层级式级别的源设备生成的所有事件的装置。
而且,还提出了一种能够对源设备生成的事件进行日志记录的多级别层级式计算机管理系统,所述系统包括生成事件的多个源设备以及每个级别的多个事件收集器,收集器根据上述任一特征来表征。
而且,还提出一种计算机程序产品,包括信息处理单元可执行的一个或多个指令序列,当其被加载到计算机上时,所述指令序列的执行允许根据上述任一特征的方法的实现。
通过阅读下文描述和研究附图,将会更好地理解本发明及其各种应用。
附图说明
附图是出于示意性目的而给出的,而并非意在限制本发明。
-图1是根据本发明的集中方法被实现于其中的多级别层级式计算机管理系统的非限制性示例的简化示意图,该系统包括生成事件的多个源设备以及多个事件收集器;
-图2是根据本发明的集中方法的非限制性实施例的简化流程图;
-图3、图4、图5和图6示意性地示出了在根据图2方法的非限制性实施例的不同级别的收集器之间对事件进行集中的步骤;
-图7是示意性地示出来自图2的集中方法的一个步骤,即验证收集器可用性的步骤的时序图;以及
-图8以简化方式示出了包括能够巩固执行图2的集中方法的步骤的收集器的多级别层级式计算机管理系统。
具体实施方式
用于多级别层级式计算机管理系统的事件集中方法在图2中的非限制性实施例中描述。
它被实现在多级别层级式计算机管理系统中,所述系统包括生成事件的多个源设备以及每个级别的多个事件收集器。
应理解,在非限制性示例中,源设备是指诸如服务器、路由器或者个人计算机的任何计算机设备。
应理解,事件是指由源设备S传输的任何事件,在非限制性示例中诸如安全性事件(用户连接至源设备,过程重启,源设备重启,建立对敏感信息的连接,源的状态改变被执行,等等),调试事件或者由收集器本身传输的其他事件。
应理解,收集器的可用性是指操作中的并且其与高层收集器的网络链接未断的收集器。将会注意,在非限制性实施例中,收集器是服务器,其可以专用于收集事件的功能,或者可以与其他服务共享。
将会理解,在描述中,术语计算机管理系统或者信息系统可互换使用。
图1中示意性地示出了多级别层级式计算机系统SYS的非限制性示例。在此示例中,SYS信息系统是用于公司内的计算机设备池的计算机管理系统。该系统包括三个层级式级别:
-相对于公司部门的第一级别L1;
-相对于公司房产所在地的第二级别L2;
-相对于公司建立国的第三级别L3。
在图1的非限制性示例中:
-第一级别L1包括源设备S和多个第一收集器C1:C1_1到C1_n。
-第二级别L2包括多个第二收集器C2:C2_1到C2_n。
-第三级别L3包括称为主收集器的第三收集器C3。
第三级别L3也称为关于第二级别L2的上级LSUP,第二级别L2称为关于第三级别L3的下级。以相同的方式,第二级别L2也称为相对于第一级别L1的上级LSUP,第一级别L1称为相对于第二级别L2的下级LINF。
由此,第一收集器C1称为关于第二收集器C2的下级收集器CINF(或者下收集器)。这些第二收集器C2称为关于C1收集器的上级收集器CSUP(或者上收集器),但是称为关于第三收集器C3的下级收集器CINF。第三收集器C3称为关于第二收集器C2的上级收集器CSUP(或上收集器)。
将会注意到,在多级别层级式系统中,上级收集器仅知道来自直接低于它的级别的收集器。由此,收集器C3只知道C2收集器。它不知道(并且由此不能直接访问)C1收集器。
在非限制性实施例中,用于对多级别层级式管理系统SYS的事件进行集中的方法包括步骤(如图2所示):
-由来自上级LSUP的收集器CSUP根据下级LINF收集器CINF的操作参数POP和/或链接服务质量NTWL从下级LINF选择收集器CINF(步骤SELECT_CINF(POP(NB,HDW,CONS),NTWL));
-由所述收集器CSUP从所述所选下级收集器CINF接收事件(步骤RXs(CINF));
-定期验证所选下级收集器CINF可用以及在不可用的情况下重复选择步骤(步骤VERIF_DISP(CINF));以及
-由上级LSUP收集器CSUP将其事件E与来自未被选择的下级收集器CINF的事件进行比较(步骤COMP(CSUP(E),CINF(E),TMS,HSH))以及从这些未被选择的下级收集器CINF之一接收不同的事件E(步骤RXd(CINF))。
在非限制性实施例中,事件E集中方法还包括由上级LSUP收集器CSUP搜索下级LINF收集器CINF的初始步骤(步骤FND(CINF))。
在非限制性实施例中,事件E集中方法包括将源设备S生成的所有事件E记录在源设备S的相同层级式级别的收集器C中的附加步骤(步骤COLLECT_E(S,C))。
在非限制性实施例中,对来自上级收集器的事件与来自未被选择的下级收集器的事件进行比较的步骤被定期执行。
对于说明书的其余部分,在所描述方法的非限制性实施例中,该方法包括此初始步骤和这些附加步骤。
由此,下面将参考图1到图7详述事件集中方法的步骤。
在图2所示的初始步骤0)中,由上级LSUP收集器CSUP搜索下级LINF收集器CINF。
在图1的非限制性示例中,每个上级收集器C2将搜索所有下级收集器C1。
在第一非限制性示例中,下收集器C1被先前记录在每个上收集器C2的配置中,使得后者知道哪些下收集器C2属于下级L1。此配置是由信息系统SYS管理员在上游完成的,该管理员有权修改所述配置。在非限制性示例中,该配置是利用收集器C1的IP地址执行的。
在第二非限制性示例中,每个上级收集器C2向下级L1发送广播消息。可用的所有下级收集器C1接收到此广播消息,并且在它们接收到所述广播消息时发送答复消息。收集器C2由此识别哪些下级收集器C1属于下级L1。在非限制性示例中,本领域技术人员公知的UDP(用户数据报协议)协议被用于发送广播消息。该协议易于实现,不需要显著的网络资源,并且允许数据(这里的消息)被快送发送。
在第三非限制性示例中,当下级收集器C1被安装时,它向所有上级L2收集器C2发送广播消息。可用的所有上级收集器C2在它们接收到所述广播消息时发送回复消息。收集器C1由此识别上级收集器C2。在非限制性示例中,UDP协议被用于发送广播消息。
在图2和图3所示的第一步骤1)中,源设备S生成的所有事件E被记录在源设备S的相同层级式级别的收集器C中。
在图1的多级别层级式计算机系统SYS的非限制性示例中,该记录在最下级即第一级别L1处被执行。当然,在第二级别L2和/或第三级别L3也包括源设备S的其他示例中,此步骤将适用于第二级别和/或第三级别。
在第一非限制性示例中,记录的执行由源设备S即事件E的传送方发起。该模型称为“推”模型。一旦源设备S传输事件E,它将事件发送给与自己相同层级式级别的所有收集器。在实施例的非限制性示例中,使用本领域技术人员公知的SYSLOGUDP协议。
在第二非限制性实施例中,记录是由收集器C即事件E的接收方发起的。这种模式称为“拉”模式。
在这种情况下,收集器远程访问(通过本领域技术人员已知的任何通信协议,在非限制性示例中,诸如FTP(文件传输协议)、ODBC(开放数据库连通性)或者WMI(窗口管理工具))相同层级式级别的源设备,并且收集器C在其位置本地重复事件。
在第三非限制性实施例中,记录是借助于部署在源设备S中的代理完成的。当事件发送功能没有驻留在源设备中时,此示例是感兴趣的。在此例中,代理执行本地过程,其从源设备恢复事件并且将其发送给关联的收集器(相同层级式级别)。在实施例的非限制性示例中,使用编码的通信协议,诸如TLS(传输层安全性)协议,其允许在将事件发送给收集器C之前编码事件。
将会注意到,在图2和图3的附加步骤1’)中,每个收集器C将其自己的事件E传输给相同层级式级别L的所有其他收集器(图1中的水平箭头以及图2和图3中所示的步骤COLLECT_E(C,C))。在非限制性示例中,使用本领域技术人员公知的UDP协议。例如,收集器可以包括用于对在所述收集器上经过认证的用户或者与应用在所述收集器上的加载或停止有关的其他事件进行认证的元件。
由此,所有事件E被记录在相同级别的收集器中(图2中由称为“收集”的虚线框所示的阶段)。
将会注意到,搜索下级收集器的初始步骤0)独立于事件记录阶段,并且由此可以并行、在其之前或者之后完成。
在图2和图3所示的第二步骤2)中,来自上级LSUP的收集器CSUP根据下级LINF收集器CINF的操作参数POP和/或链接服务质量NTWL选择来自下层LINF的所述收集器CINF。
该选择将允许在给定时刻选择最佳的下层LINF收集器CINF。
在非限制性实施例中,操作参数POP包括所述下级LINF收集器的:
-事件E的数目NB,和/或
-材料能力HDW,即静态能力,诸如:
-CPU(例如,功率)
-存储器(例如,容量)
-磁盘特性(例如,速度、稳定性级别、访问性能),和/或
-消耗参数CONS,即操作动态,诸如:
-CPU(例如,速度),
-加载时间等,
-存储器(例如,消耗),
-IO状态(例如,磁盘访问)
由此,例如,具有小于50%的CPU加载时间的收集器将被认为优于具有较长CPU加载时间的收集器。
在非限制性示例中,链接服务质量NTWL涉及分配给记录事件的带宽、网络链接的过载等。由此,例如,在网络链接上具有较快事件移动的收集器将优于由于在其网络通信链接上的数据过载而使其移动较慢的收集器。
由此,来自下级CINF的最佳收集器特别地根据上述标准而被选择。将会注意到,收集器是给定时刻的最佳收集器。实际上,优于操作参数POP(特别是动态参数)和链路服务质量NTWL随时间变化,给定时刻的最佳收集器可能随后不再是最佳的。由此,下级收集器CINF可被一个上级收集器CSUP选为最佳,但是未被另一个CSUP选为最佳。例如每当上级收集器CSUP重启时,这种情况可能发生。在这种情况下,所述收集器CSUP将根据上述标准对最佳下级收集器CINF进行新的搜索。由此,收集器CSUP将与最佳下级CINF重新同步。
在图1的非限制性示例中,上级收集器C2_1和C2_2选择下级收集器C1_1作为最佳(实线箭头),而上级收集器C2_n选择收集器C1_2作为最佳(虚线箭头)。
由此,在选择最佳下级C1_1之后,事件E可被移动至上级收集器C2_1和C2_2(图2中称为RETRV的虚线框所示)。
同理将事件从收集器C1_2移动至收集器C2_n。为清晰起见,下面仅描述收集器C2_1和C1_1的示例。
在图2和图4所示的第三步骤3)中,来自所选下级收集器CINF的事件由所述上级收集器CSUP接收。
在非限制性示例中,接收事件E例如是根据TCP/IP通信协议执行的。此协议允许上级CSUP对事件的可靠接收,因为所述协议确保数据(事件)无改变地、按序达到,在丢失的情况下具有重传,并且消除重复数据。
在图4的示例中,上收集器C2_1和C2_2由此从下收集器C1_1接收事件E。
在图2和图4的第四步骤4)中,当选择来自下级CINF的最佳收集器时,定期验证所选收集器CINF是否可用,并且如果不可用则重复先前的选择步骤(或步骤2)。
验证是基于用于验证下收集器仍然在工作中的信号的定期生成。
在第一非限制性示例中,可以使用本领域技术人员公知的统称为“心跳”的验证机制。在此例中,下收集器CINF通过向上收集器CSUP发送消息来通知所述上收集器CSUP它是可用的。
在第二非限制性示例中,可以使用本领域技术人员公知的“ping”(包因特网探测)应用软件工具。在此例中,验证是由向下收集器CINF发送消息以验证其可用性的每个上收集器CSUP完成的。
由此,如果所选下级收集器CINF变为不可用(即,上收集器CSUP不再能够访问所述下收集器CINF),则另一下收集器CINF将被选择就位。由此,在此执行先前的选择步骤以及稍后描述的比较和接收步骤。
由此,即使一个下收集器CINF变为不可用仍然将对事件进行集中。请注意,在非限制性示例中,下收集器在其不再工作时变为不可用,例如在它与上收集器之间的通信链接断开时,等等。
图7是示意性地示出了上收集器C2_1的这一验证步骤的时序图。
-在时刻t0,下收集器C1_1已经被选择并且可用。事件E由收集器C2_1从收集器C1_1恢复。收集器C1_2以及收集器C1_3不可用。
-在时刻t1,进行第一验证,下收集器C1_1仍然可用,收集器C1_3已经变为可用,收集器C1_2仍然不可用。
-在时刻t2,进行第二验证,下收集器C1_1仍然可用,收集器C1_3仍然可用,收集器C1_2已经变为可用。
-在时刻t3,进行第三验证,下收集器C1_1仍然可用,收集器C1_3已经变为不可用,收集器C1_2仍然可用。由此,到时刻t4为止,事件E由收集器C2_1从收集器C1_1恢复。
-在时刻t4,进行第四验证,下收集器C1_1已经变为不可用,收集器C1_3再次变为可用,收集器C1_2仍然可用。此时,选择步骤(参见早前的步骤2)被重复。在该示例中,收集器C1_3将被选为最佳。上收集器C2_1由此从该最佳收集器C1_3中恢复事件。
-在时刻t5,进行第五验证,下收集器C1_1仍然不可用,收集器C1_3变为不可用,收集器C1_2仍然可用。此时,选择步骤(参见早前的步骤2)被重复。在该示例中,收集器C1_2将被选为最佳。上收集器C2_1由此从该最佳收集器C1_2恢复事件E。
在非限制性示例中,重复选择另一下收集器CINF这一步骤的步骤从接收自先前选择的下级收集器的最后事件E被执行。
上收集器CSUP通过将接收自先前选择的下收集器CINF的最后记录的事件E纳入考虑来选择另一最佳下收集器CINF。由此,从该最后事件E(由此将其时间戳和标记纳入考虑),上收集器CSUP与新的下收集器CINF重新同步。由此,它从新的下收集器CINF接收在接收自先前下收集器CINF的最后事件E之后接收到的事件E(通过将其标记和时间戳与来自所述最后事件E的标记和时间戳进行比较)。
如果上收集器CSUP在新选择的下收集器CINF中没有找到该最后事件E,它请求从后者接收如下事件E,这些事件E具有的时间戳(具体地,小时)TMP具有早于所述最后事件E(接收自最佳的先前下收集器)的时间戳TMP的给定时间T。
由此,在先前描述的示例中,在时刻t4,例如上收集器C2_1将从新选择的下收集器C1_3接收所有如下事件E,这些事件E具有比接收自先前选择的最佳收集器C1_1的最后记录的事件早一分钟的时间戳TMP。当然,一分钟的周期仅仅是非限制性示例,可以应用不同的周期。
在图4的示例中,上文描述的验证可用性的内容以相同的方式适用于关于下收集器C1_1的上收集器C2_2。
当然,将会注意到,可以在上收集器选择最佳收集器以及每次新的最佳收集器被上收集器选择时就激活每个步骤。
这对于下文阐释的步骤5)的事件的定期比较同样成立。
将会注意到,在非限制性实施例中,该验证步骤或者与后续事件的移动5)和6)异步进行,或者同步进行,即,在每个事件移动之前或者之后,或者在每组事件移动之前或者之后。
在图2和图4的第五步骤5)中,所述上级LSUP收集器CSUP将其事件E与来自未被选择的下级收集器CINF的事件进行比较。
在非限制性实施例中,对来自上级收集器CSUP的事件与来自未被选择的下级收集器CINF的事件的比较步骤根据与来自所述下级收集器CINF的事件相关联的标记HSH(称为哈希标记)而被执行。
标记HSH使得事件能够被标识。标记利用由哈希函数计算,其支持对数据完整性的控制。由于哈希函数是本领域技术人员公知的,在此不对其进行描述。由此,标记HSH使得事件能够被唯一地标识。
在非限制性实施例中,对来自上级收集器CSUP的事件E与来自未被选择的下级收集器CNIF的事件进行比较的步骤还根据时间戳TMS被执行。将会注意到,时间戳TMS允许证明事件的发生事件(每个事件具有相同的时间参考)。时间戳一般地包括事件发生的日期和时间。这还允许支持在比较过程中对事件的分类及其搜索。
由此,时间戳TMS与HSH标记相结合。
在图4的示例中,上收集器C2_1和C2_2将其事件与来自未被选择的下级收集器C1_2到C1_n的事件进行比较。
由此,在比较期间,如果上收集器CSUP发现它是关于保存在未被选择的下收集器CINF中的事件的错失事件,则它从所述未被选择的下收集器CINF恢复所述事件。这意味着未被选择的下级收集器CINF丢失了记录的事件E,并且如果是这样,上级收集器CSUP从另一下级收集器CINF接收丢失的事件(图2和图4中所示的步骤RXd(CINF))。
将会注意到,该比较适用于未被选择的收集器中记录的所有事件,即,从所有源设备S发出的事件、特定于所述未被选择的下收集器的事件以及特定于来自相同层级式级别的其他收集器的事件(因为后者的事件也被传输给未被选择的下收集器)。
在非限制性实施例中,对来自上级收集器的事件与来自未被选择的下级收集器的事件进行比较的步骤被定期执行。
在非限制性实施例中,比较以如下方式执行。
在图5的示例中,上收集器C2_1定期向所有未被选择的下收集器C1查询其事件E。在非限制性示例中,询问每分钟进行。每个未被选择的下收集器(在此是C1_2到C1_n)发送具有如下信息的响应:
-从前一分钟起算收集器包括的每个事件E的时间戳TMP和标记HSH。
上收集器C2_1由此将其从上一分钟接收的事件E与来自每个未被选择的下收集器C1(C1_2、C1_n)的事件E进行比较,并且如果至少一个事件E的标识信息(时间戳+标记)是不同的,这意味着未被选择的下收集器C1_1具有丢失的事件E。
在这种情况下,上收集器C2_1请求从包括错失事件的未被选择的下收集器C1接收错失的一个或多个事件E。为此目的,上收集器C2_1通过向相关的未被选择的下收集器C1发送错失事件E(其先前比较的)时间戳TMP和标记HSH来指定错失事件。在图4的非限制性示例中,上收集器C2_1从未被选择的下收集器C1_2恢复错失事件。
在该示例中,上文描述的内容也适用于上收集器C2_2。
将会注意到,比较是由每个上收集器CSUP完成的。
由此,在图2和图4的第六步骤6)中,上收集器CSUP从这些未被选择的下级收集器CINF之一接收与它自己的事件不同的事件(经由标记或者经由标记加时间戳)。
在非限制性实施例中,接收事件E例如是根据TCP/IP通信协议执行的。此协议确保上收集器CSUP对事件的稳定接收,因为所述协议确保数据(事件)未被改变地、按序达到,在丢失情况下具有重传,并且消除重复数据。
在图4的示例中,上收集器C2_1和C2_2由此从未被选择的下收集器C1_2接收事件E。
由此,当每个收集器C2已经经由至少一个最佳下收集器C1接收下级L1事件时,高于收集器C2的收集器(或者这里如图2所示的上级L3的收集器C3)对收集器C2(后者变为下收集器)重复集中方法的步骤。
由此,该事件集中方法允许主收集器CSUP中来自多级别层级式系统的所有事件被自动回复而不会丢失事件。
该事件集中方法由能够对源设备S生成的事件E进行日志记录的多级别层级式计算机系统SYS实现,所述系统包括生成事件E的多个源设备S和每个级别的事件E的多个收集器C,如根据非限制性实施例的图8中示意性示出的。
更具体地,用于包括生成事件E的多个源设备S和每个级别的多个事件E收集器C的多级别层级式计算机系统SYS的收集器C适于对所述多级别层级式计算机管理系统SYS的源设备S生成的事件E进行日志记录,并且包括:
-用于根据下级LINF收集器CINF的操作参数POP和/或链接服务质量NTWL来选择来自所述下级LINF的所述收集器CINF的装置;
-用于从所述选择的下级收集器CINF接收事件的装置;
-用于定期验证选择的下级收集器CINF的可用性以及在不可用的情况下用于重复选择步骤的装置;
-用于对其事件E与来自未被选择的下级收集器CINF的事件进行比较的装置;以及
-用于从这些未被选择的下级收集器CINF之一接收不同的事件E的装置。
在非限制实施例中,收集器C还包括用于记录相同层级式级别的源设备S所生成的所有事件E的装置。
将会注意到,上述方法的实现可以借助于微编程的“软件”设备、有线逻辑和/或硬件电子组件来执行。
由此,多级别层级式计算机管理系统SYS可以包括一个或多个计算机程序产品PG,其包括诸如微处理器或者微控制器处理单元ASIC、计算机等信息处理单元可执行的一个或多个指令序列,所述指令序列的执行允许所描述方法的实现。
这种计算机程序PG可以编写在ROM类型的可写非易失性存储中或者EEPROM或闪存类型的可写非易失性存储器中。所述计算机程序PG可在工厂被写入存储器,或者可以被载入存储器或者被远程下载到存储器。指令序列可以是机器指令序列或者在执行时由处理单元解释的命令语言的序列。
在图8的非限制性示例中,计算机程序PG被写入收集器C的存储器。在此例中,在非限制性实施例中,可以取决于程序是否在上级收集器或者在下级收集器或者在属于最低级别(或者说,图2的示例中的级别L1)的下级收集器中被执行而计划激活指令序列的执行。实际上,在后一种情况中,将只执行记录相同层级式级别的源设备S所生成的所有事件E的步骤。
当然,描述不限于上文描述的实施例或示例的应用、模式。
由此,可以考虑除上文描述之外的其他参数用于选择最佳下收集器。由此,在非限制性示例中,可以考虑限制下收集器可向其移动事件的上收集器的数目的标准。实际上,该数目越小,下收集器与上收集器之间的网络链接的过载越小,并且事件的传输将越好。
由此,如果来自下级的收集器都不可用,在非限制性实施例中,可以在上收集器中设置一个超时用于验证下收集器是否已经再次变为可用。
由此,特别地,所描述的发明具有如下优点:
-本发明易于实现;
-本发明防止将来自一个级别的收集器的所有事件复制到另一级别的所有收集器中;
-本发明允许在给定时刻选择最佳下收集器;
-本发明在例如收集器故障或者下收集器与上收集器紫华剑的链接断开的情况下避免事件丢失;
-本发明允许包含在上收集器中的事件与来自给定时刻的最佳下收集器的事件同步,这例如防止了具有重复以及由此避免假入侵警告;
-本发明由于TCP/IP协议的使用而支持事件在下级别与上级别之间的稳定移动;
-本发明允许事件在给定时刻从单个收集器被移动,这防止了通信链接的拥塞;
-本发明确保在上级别对来自最佳下收集器的事件的收集将是丢失最少事件的收集器,并且由此特别地将是由源设备生成的最具代表性的事件;
-由于对所选收集器的可用性的验证,本发明确保良好的事件集中操作。实际上,不存在一个上收集器信任一个不再可用的下收集器的风险,因此事件的移动错误的风险小得多;
-本发明允许位于最高级别的上收集器对来自多级别层级式计算机系统的所有时间的完整监管;以及
-本发明允许位于最高级别的上收集器实时地执行数学计算(例如,聚集或相关),即使在收集器的可用性或者下收集器与位于最高级别的上收集器之间的链接丢失的情况下。
Claims (23)
1.一种用于对多级别层级式计算机管理系统的事件进行集中的方法,所述系统包括生成事件的多个源设备以及每个级别的多个事件收集器,所述方法包括步骤:
-由上级收集器根据下级收集器的操作参数和/或链接服务质量来选择所述下级收集器;
-由所述上级收集器从所选择的所述下级收集器接收事件;
-定期验证所选择的所述下级收集器是否可用,并且在所选择的所述下级收集器不可用的情况下重复所述选择的步骤;以及
-由所述上级收集器将来自所述上级收集器的事件与来自未被选择的下级收集器的事件进行比较,并且从这些未被选择的下级收集器之一接收不同的事件。
2.根据权利要求1所述的方法,还包括:将源设备生成的所有事件记录在源设备的相同层级式级别的收集器中。
3.根据权利要求1或2所述的方法,其中对来自所述上级收集器的所述事件与来自所述未被选择的下级收集器的事件进行比较的步骤被定期执行。
4.根据权利要求1或2所述的方法,其中对来自上级收集器的事件与来自未被选择的下级收集器的事件进行比较的步骤根据与所述事件相关联的标记而被执行。
5.根据权利要求4所述的方法,其中对来自上级收集器的事件与来自未被选择的下级收集器的事件进行比较的步骤还根据时间戳而被执行。
6.根据权利要求1或2所述的方法,其中在选择下级收集器的步骤中使用的所述操作参数包括事件的数目和/或材料能力和/或消耗参数。
7.根据权利要求1或2所述的方法,其中不同事件根据TCP/IP通信协议而被接收。
8.根据权利要求1或2所述的方法,还包括由上级收集器搜索下级收集器的初始步骤。
9.根据权利要求1或2所述的方法,还包括由收集器将来自该收集器自己的事件传输给来自相同层级式级别的所有其他收集器的附加步骤。
10.根据权利要求9所述的方法,其中所述传输的步骤根据UDP通信协议而执行。
11.一种用于多级别层级式计算机管理系统的收集器,所述系统包括生成事件的多个源设备以及每个级别的多个事件收集器,所述收集器能够对由所述多级别层级式计算机管理系统的所述源设备生成的事件进行日志记录,所述收集器包括:
-用于根据下级收集器的操作参数和/或链接服务质量来选择所述下级收集器的装置;
-用于从所选择的所述下级收集器接收事件的装置;
-用于定期验证所选择的所述下级收集器的可用性的装置以及用于在所选择的所述下级收集器不可用的情况下重复所述选择的装置;
-用于将来自所述收集器的事件与来自未被选择的下级收集器的事件进行比较的装置;以及
-用于从这些未被选择的下级收集器之一接收不同的事件的装置。
12.根据权利要求11所述的收集器,还包括:用于记录由相同层级式级别的源设备生成的所有所述事件的装置。
13.一种能够对由源设备生成的事件进行日志记录的多级别层级式计算机管理系统,所述系统包括生成事件的多个源设备以及每个级别的多个事件收集器,所述收集器根据权利要求11或12中任一项来表征。
14.一种用于对多级别层级式计算机管理系统的事件进行集中的装置,所述系统包括生成事件的多个源设备以及每个级别的多个事件收集器,所述装置包括:
-使上级收集器根据下级收集器的操作参数和/或链接服务质量来选择所述下级收集器的部件;
-使所述上级收集器从所选择的所述下级收集器接收事件的部件;
-定期验证所选择的所述下级收集器是否可用并且在所选择的所述收集器不可用的情况下重复所述选择的部件;以及
-使所述上级收集器将来自所述上级收集器的事件与来自未被选择的下级收集器的事件进行比较并且从这些未被选择的下级收集器之一接收不同的事件的部件。
15.根据权利要求14所述的装置,还包括:将源设备生成的所有事件记录在源设备的相同层级式级别的收集器中的部件。
16.根据权利要求14或15所述的装置,其中对来自所述上级收集器的所述事件与来自所述未被选择的下级收集器的事件进行比较的部件定期执行。
17.根据权利要求14或15所述的装置,其中对来自上级收集器的事件与来自未被选择的下级收集器的事件进行比较的部件根据与所述事件相关联的标记而执行。
18.根据权利要求17所述的装置,其中对来自上级收集器的事件与来自未被选择的下级收集器的事件进行比较的部件还根据时间戳而执行。
19.根据权利要求14或15所述的装置,其中在选择下级收集器的部件中使用的所述操作参数包括事件的数目和/或材料能力和/或消耗参数。
20.根据权利要求14或15所述的装置,其中不同事件根据TCP/IP通信协议而被接收。
21.根据权利要求14或15所述的装置,还包括使上级收集器搜索下级收集器的部件。
22.根据权利要求14或15所述的装置,还包括使收集器将来自该收集器自己的事件传输给来自相同层级式级别的所有其他收集器的部件。
23.根据权利要求22所述的装置,其中所述传输根据UDP通信协议而执行。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1056830 | 2010-08-27 | ||
FR1056830A FR2964280B1 (fr) | 2010-08-27 | 2010-08-27 | Procede de centralisation d?evenements pour systeme d?information hierarchique multi-niveaux |
PCT/EP2011/064771 WO2012025631A1 (en) | 2010-08-27 | 2011-08-26 | Method for centralizing events for a multilevel hierarchical computer management system |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103109498A CN103109498A (zh) | 2013-05-15 |
CN103109498B true CN103109498B (zh) | 2016-01-20 |
Family
ID=43901064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180041484.9A Expired - Fee Related CN103109498B (zh) | 2010-08-27 | 2011-08-26 | 用于对多级别层级式计算机管理系统的事件进行集中的方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9747142B2 (zh) |
EP (1) | EP2609715B1 (zh) |
CN (1) | CN103109498B (zh) |
BR (1) | BR112013004618A2 (zh) |
FR (1) | FR2964280B1 (zh) |
WO (1) | WO2012025631A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106201942B (zh) * | 2015-05-08 | 2019-05-28 | 阿里巴巴集团控股有限公司 | 将计算机设备间事件相关联的方法、设备及系统 |
CN107704522A (zh) * | 2017-09-11 | 2018-02-16 | 郑州云海信息技术有限公司 | 一种违规日志分级管理方法与系统 |
CN107911228B (zh) * | 2017-10-09 | 2023-02-03 | 西安交大捷普网络科技有限公司 | 一种多级设备系统的管理方法 |
CN109660426B (zh) * | 2018-12-14 | 2021-03-05 | 泰康保险集团股份有限公司 | 监控方法及系统、计算机可读介质和电子设备 |
CN111966595B (zh) * | 2020-08-13 | 2024-04-05 | 安徽芯纪元科技有限公司 | 一种软件调试系统内芯片定位方法及调试报文传输方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6421676B1 (en) * | 1999-06-30 | 2002-07-16 | International Business Machines Corporation | Scheduler for use in a scalable, distributed, asynchronous data collection mechanism |
CN1761212A (zh) * | 2004-10-15 | 2006-04-19 | 戴尔产品有限公司 | 链接系统事件日志中的日志的方法 |
EP1471428B1 (en) * | 2003-04-23 | 2006-10-25 | Comptel Corporation | Event Mediation |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6370494B1 (en) * | 1998-02-05 | 2002-04-09 | Matsushita Electric Industrial Co., Ltd. | Simulator and computer-readable recordable medium having program for execution on computer realizing the simulator recorded thereon |
AU4962300A (en) * | 1999-05-21 | 2000-12-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Scalable component clustering for event management networks |
JP2005524125A (ja) * | 2001-10-12 | 2005-08-11 | スイス リインシュアランス カンパニー | 再保険をプレースするためのシステムおよび方法 |
US8122122B1 (en) * | 2005-11-08 | 2012-02-21 | Raytheon Oakley Systems, Inc. | Event monitoring and collection |
US7926069B2 (en) * | 2007-02-26 | 2011-04-12 | International Business Machines Corporation | Apparatus, system, and method for extending a device driver to facilitate a network connection to a remote event manager |
EP2171919A1 (en) * | 2007-06-29 | 2010-04-07 | Telefonaktiebolaget LM Ericsson (PUBL) | Method of processing event notifications and event subscriptions |
US8095684B2 (en) * | 2009-09-15 | 2012-01-10 | Symantec Corporation | Intelligent device and media server selection for optimized backup image duplication |
-
2010
- 2010-08-27 FR FR1056830A patent/FR2964280B1/fr not_active Expired - Fee Related
-
2011
- 2011-08-26 US US13/818,801 patent/US9747142B2/en not_active Expired - Fee Related
- 2011-08-26 WO PCT/EP2011/064771 patent/WO2012025631A1/en active Application Filing
- 2011-08-26 CN CN201180041484.9A patent/CN103109498B/zh not_active Expired - Fee Related
- 2011-08-26 EP EP11748956.7A patent/EP2609715B1/en not_active Not-in-force
- 2011-08-26 BR BR112013004618A patent/BR112013004618A2/pt not_active IP Right Cessation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6421676B1 (en) * | 1999-06-30 | 2002-07-16 | International Business Machines Corporation | Scheduler for use in a scalable, distributed, asynchronous data collection mechanism |
EP1471428B1 (en) * | 2003-04-23 | 2006-10-25 | Comptel Corporation | Event Mediation |
CN1761212A (zh) * | 2004-10-15 | 2006-04-19 | 戴尔产品有限公司 | 链接系统事件日志中的日志的方法 |
Also Published As
Publication number | Publication date |
---|---|
FR2964280B1 (fr) | 2012-09-28 |
EP2609715A1 (en) | 2013-07-03 |
WO2012025631A1 (en) | 2012-03-01 |
BR112013004618A2 (pt) | 2019-09-24 |
US9747142B2 (en) | 2017-08-29 |
US20130160030A1 (en) | 2013-06-20 |
CN103109498A (zh) | 2013-05-15 |
FR2964280A1 (fr) | 2012-03-02 |
EP2609715B1 (en) | 2014-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103109498B (zh) | 用于对多级别层级式计算机管理系统的事件进行集中的方法 | |
CN104978259B (zh) | 移动设备软件自动化测试集群系统及其测试方法 | |
CN101194233A (zh) | 测试无线组件应用程序的系统和方法 | |
CN104219316A (zh) | 一种分布式系统中的调用请求处理方法及装置 | |
CN108293063B (zh) | 用于网络挂毯和瞬间粒度上的信息弹弓的系统和方法 | |
CN105141448B (zh) | 一种日志的采集方法及装置 | |
US20170272354A1 (en) | Method and Device for Establishing Performance Measurement Task and Processing Performance Measurement Result | |
CN109753433A (zh) | 基于区块链的自动化测试方法、装置及电子设备 | |
CN109634612A (zh) | 持续集成方法、系统、计算机设备和存储介质 | |
US20080109568A1 (en) | Method and System for Detecting Device Configuration Changes | |
CN105589782A (zh) | 基于浏览器的用户行为采集方法 | |
WO2016155492A1 (zh) | 一种数据库的远程数据同步方法和装置 | |
CN108718347A (zh) | 一种域名解析方法、系统、装置及存储介质 | |
CN112737856B (zh) | 链路追踪方法和装置、存储介质及电子装置 | |
CN106330988B (zh) | 一种超文本传输请求的补发方法、装置及客户端 | |
CN105488974A (zh) | 一种采集数据无线传输方法 | |
CN108877188B (zh) | 一种环保数据并发采集及多网络发布方法和装置 | |
Eridani et al. | Performance of sensors monitoring system using raspberry Pi through MQTT protocol | |
CN105991308A (zh) | 网络管理方法和装置 | |
CN103595761B (zh) | 基于分布式文件系统的数据处理方法和服务器 | |
CN105681478A (zh) | 通过对网络资源调度提高网络爬虫抓取效率的方法和装置 | |
KR101807429B1 (ko) | 스마트미터의 일괄 파라미터 설정을 위한 원격 관리 시스템 및 그 방법 | |
CN103905268A (zh) | Gre链路检测方法、主控板、装置及通信防护系统 | |
US9819741B1 (en) | Device for sensor simulation using constrained application protocol | |
AU2021230848B2 (en) | Communication apparatus, program, communication method, information processing method, information processing apparatus, and communication system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160120 Termination date: 20210826 |
|
CF01 | Termination of patent right due to non-payment of annual fee |