CN103236949A - 一种服务器集群的监控方法、装置与系统 - Google Patents

一种服务器集群的监控方法、装置与系统 Download PDF

Info

Publication number
CN103236949A
CN103236949A CN2013101530087A CN201310153008A CN103236949A CN 103236949 A CN103236949 A CN 103236949A CN 2013101530087 A CN2013101530087 A CN 2013101530087A CN 201310153008 A CN201310153008 A CN 201310153008A CN 103236949 A CN103236949 A CN 103236949A
Authority
CN
China
Prior art keywords
node
server
acquisition
responsible
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013101530087A
Other languages
English (en)
Other versions
CN103236949B (zh
Inventor
周星
彭毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sohu New Media Information Technology Co Ltd
Original Assignee
Beijing Sohu New Media Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sohu New Media Information Technology Co Ltd filed Critical Beijing Sohu New Media Information Technology Co Ltd
Priority to CN201310153008.7A priority Critical patent/CN103236949B/zh
Publication of CN103236949A publication Critical patent/CN103236949A/zh
Application granted granted Critical
Publication of CN103236949B publication Critical patent/CN103236949B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种服务器集群的监控装置,所述装置包括:一个控制节点、所述控制节点包括至少一个任务分配节点,每个任务分配节点包括至少一个采集节点;所述任务分配节点,用于为其包括的至少一个采集节点中的每个采集节点分配多个待采集服务器;每个采集节点,用于从多个待采集服务器中采集服务器运行状态信息,并将服务器运行状态信息通过所属的任务分配节点转发给控制节点进行保存。本发明中,每个采集节点负责采集多个服务器的信息,节点与服务器之间是一点对多点的关系,多个采集节点之间不需要进行通信。当服务器集群的规模扩大时,只需增加采集节点的数目或业务分配节点的数目即可实现大规模服务器集群的监控。

Description

一种服务器集群的监控方法、装置与系统
技术领域
本发明涉及集群通信技术领域,更具体的说是涉及一种服务器集群的监控方法、装置与系统。
背景技术
集群是由一些互相连接在一起的计算机构成的一个并行或分布式系统,服务器集群就是指将很多服务器集中起来一起进行同一种服务,在客户端看来就像只有一个服务器。随着分布式集群系统的应用,集群的规模也越来越大,为了保证集群整体的良好运行,集群中服务器的负载数据采集和运行状态监控就显得极为重要。Ganglia就是现有技术中使用的一种主要的集群监控开源软件。
参考图1所示,图1为Ganglia的架构图,其中,Ganglia是基于分层设计的,主要包括gmond进程、gmetad进程,以及一个Web前端(Clint)。集群中每台被监控的服务器(节点Node)上都运行一个采集服务器运行状态信息的gmond进程,所述服务器运行状态信息包括操作系统信息、CPU信息、网络流量使用信息等。每个gmond进程获取一台服务器的信息,同一子集群中的不同服务器的gmond进程之间传递彼此采集的信息,实现服务器信息的共享;然后,gmetad通过单播路由的方式与子集群中的任一服务器中的gmond进程通信以获取子集群中所有服务器运行状态信息,并将获取的信息保存到数据库中,以便对集群的运行状况进行分析。
发明内容
发明人在研究过程中发现,Ganglia监控架构是基于分层设计的,在一定程度上可以满足集群规模的扩大,但是随着gmetad管辖的子集群规模的扩大,gmond进程就需要频繁的与同一子集群内的其他服务器进行通信以实现服务器运行状态信息共享,占用较多服务器资源和网络资源,gmetad管辖的子集群规模越大,服务器运行状态信息采集对服务器正常运行的影响越大,基于Ganglia架构的集群监控限制了服务器集群的扩展。
本发明提供一种服务器集群的监控方法、装置与系统,以解决现有技术中监控服务器运行状态信息时因大量占用服务器资源对服务器集群的扩展造成限制的技术问题,在实现集群监控的条件下,提高服务器集群的扩展性。
为解决上述技术问题,本发明提供一种服务器集群的监控方法、装置与系统,本发明提供如下技术方案:
一种服务器集群的监控装置,该装置包括:
一个控制节点、所述控制节点包括至少一个任务分配节点,每个任务分配节点包括至少一个采集节点;
所述任务分配节点,用于为其包括的至少一个采集节点中的每个采集节点分配多个待采集服务器;
采集节点,用于根据预设采集协议及所述采集协议对应的采集周期,从其所属的任务分配节点分配的多个待采集服务器中采集服务器运行状态信息,并将服务器运行状态信息通过任务分配节点转发给控制节点进行保存。
优选的,控制节点还用于根据保存的服务器运行状态信息调整采集周期,所述调整包括:若采集服务器运行状态信息时,服务器响应时间大于预设阈值,增大采集周期。
优选的,控制节点还用于更新当前业务配置节点负责分配的待采集服务器的范围,所述更新包括:增加、减少当前业务配置节点负责分配的服务器或将所述当前业务配置节点负责分配的部分服务器替换为其他业务配置节点负责分配的服务器。
优选的,控制节点还用于删除当前业务配置节点,以撤销对所述当前业务配置节点负责的服务器运行状态信息的采集。
优选的,当前业务分配节点还用于更新当前采集节点负责采集服务器的范围,所述更新包括:增加、减少当前采集节点负责采集的服务器或将所述当前采集节点负责采集的部分服务器替换为其他采集节点负责的服务器。
优选的,当前业务分配节点还用于当前采集节点出现故障而无法采集服务器信息时,将所述当前采集节点负责采集的多个服务器分配给当前业务分配节点包括的其他采集节点进行采集。
本发明还提供一种服务器集群的监控方法,所述方法包括:
当前采集节点根据预设采集协议及所述采集协议对应的采集周期,从当前任务分配节点为其配置的多个待采集服务器中采集服务器运行状态信息,所述当前任务分配节点包括多个采集节点;
当前采集节点将采集的多个服务器的运行状态信息通过当前业务分配节点转发给控制节点保存,所述控制节点包括多个任务分配节点。
优选的,所述采集协议包括简单网络管理协议SNMP和智能平台管理协议IPMI。
优选的,所述方法还包括:控制节点根据保存的服务器运行状态信息调整采集周期,所述调整包括:若采集服务器运行状态信息时,服务器响应时间大于预设阈值,增大采集周期。
优选的,所述方法还包括:控制节点更新当前业务配置节点负责分配的待采集服务器的范围,所述更新包括:增加、减少当前业务配置节点负责分配的服务器或将所述当前业务配置节点负责分配的部分服务器替换为其他业务配置节点负责分配的服务器。
优选的,所述方法还包括:控制节点删除当前业务配置节点,以撤销对所述当前业务配置节点负责的服务器的运行状态信息采集。
优选的,所述方法还包括:当前业务分配节点更新当前采集节点负责采集服务器的范围,所述更新包括:增加、减少当前采集节点负责采集的服务器或将所述当前采集节点负责采集的部分服务器替换为其他采集节点负责采集的服务器。
优选的,所述方法还包括:若当前采集节点出现故障而无法采集服务器运行状态信息时,当前业务分配节点将所述当前采集节点负责采集的多个服务器分配给当前业务分配节点包括的其他采集节点进行采集。
优选的,所述当前采集节点将采集的多个服务器的运行状态信息通过当前业务分配节点转发给控制节点保存,包括:
当前采集节点将采集的服务器运行状态信息根据对应的采集协议进行封装;
当前采集节点将封装后的信息发送到当前业务分配节点进行解析和数据结构转化;
当前业务分配节点将转化后的信息发送到控制节点进行保存;
或,
当前采集节点将采集的服务器运行状态信息根据对应的采集协议进行封装;
当前采集节点将封装后的信息通过当前业务分配节点转发给控制节点进行解析和数据结构转化;
控制节点保存转化后的信息。
本发明还提供一种服务器集群的监控系统,所述系统包括服务器集群和上述任一所述监控装置。
本发明的技术方案中,使用了与现有技术完全不同的服务器集群的监控架构,具体的,设置了业务分配节点,且每个业务分配节点包括了多个采集节点,每个采集节点负责采集业务分配节点为其分配的多个待采集服务器的信息,最后将采集的服务器信息发送给控制节点进行保存。本发明中,每个采集节点负责采集多个服务器的信息,节点与服务器之间是一点对多点的关系,多个采集节点之间不需要进行通信,直接将采集的数据转发给控制节点保存,不会占用额外的服务器资源或者网络资源。当服务器集群的规模扩大时,如果服务器数量小规模的增加,则可以通过增加采集节点的数目即可实现服务器集群的规模扩大;若服务器数量大规模的增加,则通过增加业务分配节点的数目即可实现大规模服务器集群,本发明的技术方案采用的监控架构,有利于服务器集群的大规模扩展并对其实施监控。
进一步的,本发明可以在除控制节点之外的节点出现故障时,实现功能的转移,使整个服务器集群的监控可以正常运行;控制节点通过调整服务器运行状态信息采集周期,可以适当的减小信息采集对负载较大的服务器带来的影响,避免与服务器业务程序的资源竞争。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术中Ganglia的架构图;
图2本发明一种服务器集群的监控方法实施例1的流程图;
图3为本发明一种服务器集群的监控方法实施例2的流程图;
图4为本发明采用的服务器集群监控架构图;
图5为本发明一种服务器集群的监控装置实施例1的结构示意图;
图6为本发明一种服务器集群的监控系统实施例1的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了便于对本发明中服务器集群监控装置的理解,首先对所述装置对应的方法实施例进行说明。参考图2所示,为本发明提供的一种服务器集群的监控方法实施例1的流程图,本实施例具体可以包括:
步骤201:当前采集节点从当前任务分配节点为其配置的多个待采集服务器中采集服务器运行状态信息。
在实际应用中,如果要进行数据采集,需要实现设定数据采集周期以及数据采集使用的通信协议,本实施例中数据采集周期以及数据采集使用的通信协议均由控制节点进行设置。控制节点包括多个业务分配节点(控制节点的二级节点),每个业务分配节点负责一定数目的服务器的采集任务,其中每个业务分配节点又包括多个采集节点(业务分配节点的二级节点)。业务分配节点将其负责的服务器的采集任务分配给下级的多个采集节点,由采集节点具体进行服务器运行状态信息的采集。以控制节点包括的当前业务分配节点、和当前业务节点包括的当前采集节点为例进行本实施例的说明。
当前采集节点从当前任务分配节点为其配置的多个待采集服务器中采集服务器运行状态信息时,可以采用数据抓取技术,按照不同的采集协议分别实施数据抓取。所述采集协议包括SNMP协议(Simple NetworkManagement Protocol,简单网络管理协议)和IPMI(Intelligent PlatformManagement Interface,智能平台管理接口)协议,通过SNMP协议抓取服务器上的数据前,必须保证被采集服务器安装并运行了SNMP服务,一般服务器中均内置了SNMP服务。所述SNMP协议和IPMI协议分别可以对应不同的采集周期,因为根据不同的协议采集的数据不同,所以上述协议可以并行进行。
当前采集节点根据不同协议的周期向服务器分别发送基于SNMP协议的信息抓取请求和基于IPMI协议的信息抓取请求。基于SNMP协议抓取的服务器信息为服务器的负载数据,主要包括:磁盘IO(传输流量)、网卡IO(传输流量)、RAID(磁盘阵列,Redundant Arrays of Inexpensive Disks)卡信息和服务器Proc(负载信息)。基于IPMI协议采集服务器运行状态信息又称为带外采集,所述带外采集可以这样理解:当企业网络建成后,网络上会传输各种企业的业务数据,如果网络出现问题,仍然通过这个网络排除故障,这种方式称为带内管理;如果另外再建一套网络系统,通过这新建系统去管理业务网络,这种就是带外管理。互联网公司中带外采集特指采集端通过IPMI协议访问服务器的BMC(Baseboard ManagementController,基板管理控制器),获取服务器上相关传感器的值。基于IPMI协议抓取的服务器信息为服务器物理状态信息,主要包括:服务器运行时的温度、电压和电流等物理信息。
步骤202:当前采集节点将采集的多个服务器的运行状态信息通过当前业务分配节点转发给控制节点保存。
因为当前采集节点抓取服务器信息时,使用的采集协议不同,所以采集到的数据要分别处理。当前采集节点从多个服务器抓取到服务器运行状态信息后,根据采集协议对抓取到的服务器运行状态信息进行封装,将封装后的运行状态信息通过当前业务分配节点转发到控制节点。其中运行状态信息通过当前业务分配节点转发到控制节点可以包括以下两种方式:
1)、当前采集节点将采集的服务器运行状态信息根据对应的采集协议进行封装;数据封装后,当前采集节点将封装后的信息发送到当前业务分配节点进行数据解析和数据结构的转化;由当前业务分配节点将转化后的信息发送到控制节点进行保存;
2)、当前采集节点将采集的服务器运行状态信息根据对应的采集协议进行封装;当前采集节点直接将封装后的信息通过当前业务分配节点转发给控制节点,由控制节点本身进行数据解析和数据结构的转化,然后,将转化后的数据进行保存。
优选的,当前业务分配节点可以备份所述信息,当向控制节点转发数据不成功时,重发采集的信息。控制节点是以一定的数据格式来存储数据,所以要对解析得到的数据进行格式转化,便于控制节点对服务器信息的存储。
在实际应用中,控制节点存储数据后,可以对存储的数据进一步处理,比如使用RRDTool(基于Round Robin Database的存储和绘图工具)对根据存储的数据处理,将服务器运行状态以图形显示,以Web方式直观的提供给客户端。
本实施例的技术方案中,使用了与现有技术完全不同的服务器集群的监控架构,具体的,设置了业务分配节点,且每个业务分配节点包括了多个采集节点,每个采集节点负责采集业务分配节点为其分配的多个待采集服务器的信息,最后将采集的服务器信息发送给控制节点进行保存。本发明中,每个采集节点负责采集多个服务器的信息,节点与服务器之间是一点对多点的关系,多个采集节点之间不需要进行通信,直接将采集的数据转发给控制节点保存,不会占用额外的服务器资源或者网络资源。当服务器集群的规模扩大时,如果服务器数量小规模的增加,则可以通过增加采集节点的数目即可实现服务器集群的规模扩大;若服务器数量大规模的增加,则通过增加业务分配节点的数目即可实现大规模服务器集群。
同时采用SNMP协议和IPMI协议,基于SNMP协议的信息采集依赖于操作系统,当服务器的操作系统出现故障时,无法对操作系统出现故障的服务器进行监控,服务器信息的采集会受影响甚至中断。会失去对所述服务器的监控能力,集群的运行稳定性将收到一定的影响。采用基于IPMI协议的采集不需要依赖操作系统,而是通过服务器中独立的BMC获取服务器的物理健康特征,如温度,电压,电扇工作状态,电源状态等。不需要与服务器的操作系统进行通信,不会对操作系统的运行造成负担,业务程序消耗的是操作系统内的计算和存储资源,基于IPMI协议采集不会与被采集服务器上运行的业务程序竞争资源,对被采集服务器带来的影响几乎为零。在服务器出现严重故障甚至宕机时,采用本实施例的技术方案仍然可以获取服务器的电流、电压和温度信息,并进行远程控制服务器的操作,比如服务器的开关机或重启。与现有技术相比,使得服务器集群监控系统的健壮性得到了保证。
为了进一步的理解本发明的技术方案,本发明还提供了一种服务器集群的监控方法实施例2,参考图3所示,为本发明提供的一种服务器集群的监控方法实施例2的流程图,本实施例可以看作是在所述实施例1基础上的一个具体实现,本实施例中与实施例1中相关的步骤的实现方式,可以参考实施例1,本实施例中不再作详细说明。
所述实施例2要借助图4所示的架构图来进行说明,参考图4所示,为服务器集群的监控架构图,图4所示监控架构分为四部分:控制节点(Central Control Node,以下简称Central),业务分配节点(Master Node,以下简称Master),采集节点(Slave Node,以下简称Slave),数据缓冲池(DataPool Node,以下简称DataPool)。图4仅仅是示意性的说明本实施例的监控架构图,其中所包括的每级节点的个数并不局限于图4中所示的情况。其中在业务分配节点和控制节点中均有数据缓冲池,如果将数据缓冲池与其所在的业务分配节点或控制节点作为一个节点看待的话,本监控架构也可以分为三部分,在实际实施中,所述的控制节点、业务分配节点、采集节点和数据缓冲池可以集成在一台服务器中,或者所述多个节点中任意的两个或者三个组合在一起集成在一台服务器,或者每个节点均由单独的服务器或多个服务器来实现,这里不做具体限制。当每个节点均由单独的服务器来实现时,对服务器集群的监控部分也可以看作是一个小的服务器集群。
其中,Central节点负责Master节点的辖域管理和全局采集周期管理;Master节点负责为其辖域的服务器生成具体的采集任务,并且派发,监听,动态调整此类任务以实现负载均衡;Slave节点负责采集任务的具体执行;DataPool节点负责采集结果的解析,结构化抽取和数据存储,一般情况下每个Master节点都有与其对应的Datapool节点,其辖域内采集数据均存储到此DataPool节点中。各节点之间通过套接字(Socket)通信,以保证模块间较低的耦合度,Central节点与Master节点,Master节点与Slave节点间都是一对多的关系。
基于图4所示的监控架构,以Master1节点为当前业务分配节点、Slave1节点为当前采集节点为例,所述实施例2具体可以包括:
步骤301:Central节点为Master1节点划分子集群,并设定采集周期。实际运行场景下,Central节点要为所有的Master节点划分子集群和设定采集周期,这里以Master1节点为例,其他Master节点的操作均可以参考Master1节点。
Central节点可以采用为Master1节点划分子集群的方式为Master1节点分配待采集的多个服务器。Central节点为Master1节点划分子集群后,在对服务器集群的监控过程中,还可以对Master1节点子集群的划分进行更新,比如,为Master1节点增加新的子集群,修改Master1节点管辖的子集群的范围。另外,Central节点还可以撤销Master1节点,以达到采集部分服务器信息的目的,当Master1节点出现故障时,Central节点可以将Master1节点管辖的子集群分配给Master2节点管辖,以保证监控系统的稳定性。
Central节点为Master1节点划分子集群的同时,还要为服务器信息采集设定采集周期,因为采集服务器信息时使用了SNMP协议和IPMI协议,所以要分别设置采集周期。在数据采集过程中,如果采集某个服务器信息时,该服务器响应的时间较长(可以根据实际应用场景设置一个服务器响应阈值,如果大于该阈值,则时间较长),说明该服务器的负载较大,为了减轻服务器的负载,可以适当的增大该服务器的采集周期,在采集过程中尽量少的占用服务器资源,不影响服务器业务程序的正常运行。如果采集某个服务器信息时,该服务器响应的时间较短,说明该服务器的负载较小,此时,可以保持采集周期不变或者适当的减小该服务器的采集周期。
步骤302:Master1节点发起采集任务。
Central节点为Master1节点设置管辖的子集群后,具体的服务器采集任务由Master1节点发起,具体的由Master1节点包括的多个Slave节点执行采集任务。参考图4所示,以Master1节点包括Slave1节点和Slave2节点为例,具体的Master1节点从本地数据库中读取待采集服务器的标识信息,并生成携带服务器标识信息的采集任务。Master1节点向下级Slave1节点和Slave2节点发送的采集任务中包括Slave1节点和Slave2节点需要采集的所有服务器的身份信息,优选的,这些信息以数组的形式发送,以单个服务器的标识信息为例,参考表1所示,为Master1与Slave1节点和Slave2节点之间的信息传递格式。
表1Master1与Slave1节点和Slave2节点之间的信息传递格式
参数名称 参数变量 附注
服务器ID server_id
服务器类型 server_type
RAID类型 raid_type
服务器IP(带内采集) server_ip
BMC IP地址(带外采集) bmc_ip
BMC用户名(IPMI) bmc_user
BMC密码(IPMI) bmc_password 经过RSA加密的密文
IPMI采集周期 ipmi_period
SNMP采集周期 snmp_period
Master1节点可以实时更新Slave1节点和Slave2节点负责采集的服务器的范围,包括增大、减小或者替换部分服务器。同样,Master1节点可以将需要更新的服务器的标识信息以数组的形式发送给Slave1节点和Slave2节点,采用表1所示的信息传递格式。当Slave1节点出现故障时,Master1节点可以将Slave1节点负责采集的服务器的采集任务转给Slave2节点负责。优选的,Master1节点选择负载较小的Slave节点负责出现故障的Slave1节点的采集任务。
步骤303:Slave1节点执行采集任务。
以Slave1节点执行采集任务为例进行说明,Slave1节点接收到采集任务后,根据任务执行的时间周期向其负责的多个服务器派发SNMP和IPMI数据抓取请求,采集预设的多个服务器的运行状态信息,对应不同的协议,Slave1节点将抓取的数据按协议封装并发送给Master1的DataPool。参考表2所示,为Slave1节点与Master1的DataPool之间传递的单个SNMP信息包的格式。
表2Slave1节点与Master1的DataPool之间传递的单个SNMP信息包的格式
Figure BDA00003118022800121
RAID服务器中磁盘阵列,因为磁盘组成的阵列方式不同,采集服务器运行状态信息时使用的采集逻辑是不同的,在表2中用ir、no_ir、hp三种类型代表RAID的不同阵列形式。
参考表3所示,为Slave1与Master1的DataPool之间传递的单个IPMI信息包的格式。
表3Slave1与Master1的DataPool之间传递的单个IPMI信息包的格式
Figure BDA00003118022800131
表3中的日志类数据是由BMC记录的,因为在服务器出现任何物理故障时,BMC会记录故障发生的时间、故障类型等信息。
Slave节点通过主动拉取数据的方式从服务器获取数据,这个过程中,Slave根据采集数据时间间隔的变化可以确定是否调整信息采集周期,如果需要调整,以消息的形式告知Central节点,得到Central节点确认后,根据确认后的采集周期进行采集。这样可以使数据采集和监控过程中对服务器造成的性能影响降到最低,避免与被采集服务器上运行的业务程序争夺资源。
步骤304:Master1节点的Datapool对采集数据进行处理,或转发给Central节点的Datapool对采集数据进行处理。
Master1节点的Datapool对采集的数据进行的处理主要包括:对采集数据进行解析获取原始采集数据,然后对原始采集数据进行结构化抽取和转化,最终将采集的数据转化为Ctenral节点的数据池的数据存储格式。或者Master1节点的Datapool对采集的数据不进行处理直接转发到Ctenral节点进行解析、结构化抽取、转化和存储。其中,对采集的信息进行解析、结构化抽取和转化可以参考现有技术的实现方式。对采用Master节点转发信息的方式,减少了所有Slave节点同时发送数据给Central节点上Datapool带来的并发压力。优选的,为了避免数据传输过程中出现数据丢失,Master1节点可以备份采集的数据,在数据传输失败时,重发采集的数据到控制节点。
本实施例的技术方案除了可以实现实施例1带来的有益效果外,进一步的,本实施例的技术方案在除控制节点之外的节点出现故障时,可以实现功能的转移,使整个服务器集群的监控可以正常运行;另外,常规方式采集服务器运行状态信息时,会增加被采集服务器的性能开销,当采集程序与被采集服务器上的业务程序争夺网络IO,计算能力和存储能力时,运行在被采集服务器上的业务应用会受到影响。本实施例中,可以根据服务器采集数据时的响应情况调整服务器运行状态信息采集周期,可以适当的减小信息采集对负载较大的服务器带来的影响,避免与服务器业务程序的资源竞争。
以上内容详细描述了本发明装置对应的方法实施例,相应地,本发明实施例还提供与前述方法实施例对应的装置实施例。参见图5所示,为本发明提供的一种服务器集群的监控装置实施例1的结构示意图,所述装置可以包括:
包括一个控制节点501、至少一个任务分配节点502,每个任务分配节点包括至少一个信息采集节点503;
所述任务分配节点501,用于为其包括的至少一个采集节点中的每个节点分配多个待采集服务器;
采集节点502,用于根据预设采集协议及所述采集协议对应的采集周期,从所述任务分配节点分配的多个待采集服务器中抓取服务器信息,并将获取的服务器信息通过任务分配节点转发给控制节点503进行保存;
其中,控制节点503,还用于根据保存的服务器运行状态信息调整采集周期,所述调整包括:若采集服务器运行状态信息时,服务器响应时间大于预设阈值,增大采集周期;还用于更新业务配置节点负责分配的待采集服务器的范围,所述更新包括:增加、减少业务配置节点负责分配的服务器或将所述业务配置节点负责分配的部分服务器替换为其他业务配置节点负责分配的服务器;还用于删除业务配置节点,以撤销对所述业务配置节点负责的服务器运行状态信息的采集;
业务分配节点501,还用于更新采集节点负责采集服务器的范围,所述更新包括:增加、减少采集节点负责采集的服务器或将所述采集节点负责采集的部分服务器替换为其他采集节点负责的服务器;还用于采集节点出现故障而无法采集服务器信息时,将所述采集节点负责采集的多个服务器分配给所述业务分配节点包括的其他采集节点进行采集。
本实施例的技术方案提高了模块内的高内聚,使得模块间的耦合度尽量低,保证监控架构上的可扩展性:当局部集群内服务器数量增加时,增加业务分配节点以增强采集和监控能力;当集群规模成区域性增加时,为新增区域添加业务分配节点和配套的采集节点以扩大采集和监控的能力。
参见图6所示,为本发明提供的一种服务器集群的监控系统实施例1的结构示意图,所述系统可以包括图5所示的监控装置601和服务器集群602。
需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对于系统实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (15)

1.一种服务器集群的监控装置,其特征在于,所述装置包括一个控制节点、所述控制节点包括至少一个任务分配节点,每个任务分配节点包括至少一个采集节点;
所述任务分配节点,用于为其包括的至少一个采集节点中的每个采集节点分配多个待采集服务器;
每个采集节点,用于根据预设采集协议及所述采集协议对应的采集周期,从其所属的任务分配节点分配的多个待采集服务器中采集服务器运行状态信息,并将服务器运行状态信息通过所属的任务分配节点转发给控制节点进行保存。
2.根据权利要求1所述的装置,其特征在于,控制节点还用于根据保存的服务器运行状态信息调整采集周期,所述调整包括:若采集服务器运行状态信息时,服务器响应时间大于预设阈值,增大采集周期。
3.根据权利要求1所述的装置,其特征在于,控制节点还用于更新当前业务配置节点负责分配的待采集服务器的范围,所述更新包括:增加、减少当前业务配置节点负责分配的服务器或将所述当前业务配置节点负责分配的部分服务器替换为其他业务配置节点负责分配的服务器。
4.根据权利要求1所述的装置,其特征在于,控制节点还用于删除当前业务配置节点,以撤销对所述当前业务配置节点负责的服务器运行状态信息的采集。
5.根据权利要求1所述的装置,其特征在于,当前业务分配节点还用于更新当前采集节点负责采集服务器的范围,所述更新包括:增加、减少当前采集节点负责采集的服务器或将所述当前采集节点负责采集的部分服务器替换为其他采集节点负责的服务器。
6.根据权利要求1所述的装置,其特征在于,当前业务分配节点还用于当前采集节点出现故障而无法采集服务器信息时,将所述当前采集节点负责采集的多个服务器分配给当前业务分配节点包括的其他采集节点进行采集。
7.一种服务器集群的监控方法,其特征在于,所述方法包括:
当前采集节点根据预设采集协议及所述采集协议对应的采集周期,从当前任务分配节点为其配置的多个待采集服务器中采集服务器运行状态信息,所述当前任务分配节点包括多个采集节点;
当前采集节点将采集的多个服务器的运行状态信息通过当前业务分配节点转发给控制节点保存,所述控制节点包括多个任务分配节点。
8.根据权利要求7所述的方法,其特征在于,所述采集协议包括简单网络管理协议SNMP和智能平台管理协议IPMI。
9.根据权利要求7所述的方法,其特征在于,所述方法还包括:
控制节点根据保存的服务器运行状态信息调整采集周期,所述调整包括:若采集服务器运行状态信息时,服务器响应时间大于预设阈值,增大采集周期。
10.根据权利要求7所述的方法,其特征在于,所述方法还包括:
控制节点更新当前业务配置节点负责分配的待采集服务器的范围,所述更新包括:增加、减少当前业务配置节点负责分配的服务器或将所述当前业务配置节点负责分配的部分服务器替换为其他业务配置节点负责分配的服务器。
11.根据权利要求7所述的方法,其特征在于,所述方法还包括:
控制节点删除当前业务配置节点,以撤销对所述当前业务配置节点负责的服务器的运行状态信息采集。
12.根据权利要求7所述的方法,其特征在于,当前业务分配节点更新当前采集节点负责采集服务器的范围,所述更新包括:增加、减少当前采集节点负责采集的服务器或将所述当前采集节点负责采集的部分服务器替换为其他采集节点负责采集的服务器。
13.根据权利要求7所述的方法,其特征在于,所述方法还包括:若当前采集节点出现故障而无法采集服务器运行状态信息时,当前业务分配节点将所述当前采集节点负责采集的多个服务器分配给当前业务分配节点包括的其他采集节点进行采集。
14.根据权利要求7所述的方法,其特征在于,所述当前采集节点将采集的多个服务器的运行状态信息通过当前业务分配节点转发给控制节点保存,包括:
当前采集节点将采集的服务器运行状态信息根据对应的采集协议进行封装;
当前采集节点将封装后的信息发送到当前业务分配节点进行解析和数据结构转化;
当前业务分配节点将转化后的信息发送到控制节点进行保存;
或,
当前采集节点将采集的服务器运行状态信息根据对应的采集协议进行封装;
当前采集节点将封装后的信息通过当前业务分配节点转发给控制节点进行解析和数据结构转化;
控制节点保存转化后的信息。
15.一种服务器集群的监控系统,其特征在于,所述系统包括服务器集群和权利要求1至6任一项所述的监控装置。
CN201310153008.7A 2013-04-27 2013-04-27 一种服务器集群的监控方法、装置与系统 Expired - Fee Related CN103236949B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310153008.7A CN103236949B (zh) 2013-04-27 2013-04-27 一种服务器集群的监控方法、装置与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310153008.7A CN103236949B (zh) 2013-04-27 2013-04-27 一种服务器集群的监控方法、装置与系统

Publications (2)

Publication Number Publication Date
CN103236949A true CN103236949A (zh) 2013-08-07
CN103236949B CN103236949B (zh) 2016-12-28

Family

ID=48884967

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310153008.7A Expired - Fee Related CN103236949B (zh) 2013-04-27 2013-04-27 一种服务器集群的监控方法、装置与系统

Country Status (1)

Country Link
CN (1) CN103236949B (zh)

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103607314A (zh) * 2013-12-10 2014-02-26 浪潮电子信息产业股份有限公司 一种使用snmp协议对服务器监控管理的系统
CN103746837A (zh) * 2013-12-27 2014-04-23 乐视网信息技术(北京)股份有限公司 监控数据库的方法、数据库监控装置及系统
CN103812699A (zh) * 2014-02-17 2014-05-21 无锡华云数据技术服务有限公司 基于云计算的监控管理系统
CN104158878A (zh) * 2014-08-18 2014-11-19 浪潮(北京)电子信息产业有限公司 一种自适应调度的分布式监控数据采集方法和系统
CN104156297A (zh) * 2014-08-07 2014-11-19 浪潮(北京)电子信息产业有限公司 告警方法和装置
CN104639351A (zh) * 2013-11-11 2015-05-20 卫信科技有限公司 用以建构网络结构部署图的处理系统及其方法
CN104935482A (zh) * 2015-06-26 2015-09-23 曙光信息产业(北京)有限公司 分布式监控系统及方法
CN105357069A (zh) * 2015-11-04 2016-02-24 浪潮(北京)电子信息产业有限公司 分布式节点服务状态监测的方法、装置及系统
CN105681405A (zh) * 2016-01-06 2016-06-15 山东中创软件工程股份有限公司 一种网络传输监控的方法
CN105721595A (zh) * 2016-03-03 2016-06-29 上海携程商务有限公司 IOS系统的app的打包方法及系统
CN105718351A (zh) * 2016-01-08 2016-06-29 北京汇商融通信息技术有限公司 一种面向Hadoop集群的分布式监控管理系统
CN105933453A (zh) * 2016-06-28 2016-09-07 广州华多网络科技有限公司 一种传输数据的方法和系统
CN106254109A (zh) * 2016-08-02 2016-12-21 深圳中兴网信科技有限公司 日志采集方法、日志采集系统和服务器
CN106301913A (zh) * 2016-08-15 2017-01-04 努比亚技术有限公司 运维数据采集系统及运维数据采集方法
CN106330567A (zh) * 2016-09-14 2017-01-11 郑州云海信息技术有限公司 一种服务器集群的服务器管理控制方法及系统
CN106534259A (zh) * 2016-09-30 2017-03-22 山东大学 基于Docker的Web数据采集方法、Web服务器及Web数据采集系统
CN106844168A (zh) * 2017-02-13 2017-06-13 郑州云海信息技术有限公司 一种多节点服务器状态显示控制装置及节点切换方法
CN106909451A (zh) * 2017-02-28 2017-06-30 郑州云海信息技术有限公司 一种分布式任务调度系统及方法
CN106936888A (zh) * 2015-12-30 2017-07-07 五八同城信息技术有限公司 数据收集的方法、装置及系统
CN107104858A (zh) * 2017-06-09 2017-08-29 携程旅游信息技术(上海)有限公司 Web负载均衡系统的监控系统
CN107994943A (zh) * 2017-12-05 2018-05-04 中盈优创资讯科技有限公司 参数采集系统、方法及计算机可读存储介质
CN108206847A (zh) * 2016-12-19 2018-06-26 腾讯科技(深圳)有限公司 Cdn管理系统、方法及装置
CN108234170A (zh) * 2016-12-15 2018-06-29 北京神州泰岳软件股份有限公司 一种服务器集群的监控方法和装置
CN108259631A (zh) * 2016-12-29 2018-07-06 腾讯科技(深圳)有限公司 一种基于名称服务的数据处理方法、系统以及相关设备
CN108540353A (zh) * 2018-06-14 2018-09-14 平安科技(深圳)有限公司 一种网络节点的监测方法与系统
CN108737984A (zh) * 2018-05-17 2018-11-02 湖南国奥电力设备有限公司 一种地下电缆检测系统
CN109067621A (zh) * 2018-09-28 2018-12-21 郑州云海信息技术有限公司 设备监控方法、装置及系统
CN109086155A (zh) * 2018-07-27 2018-12-25 郑州云海信息技术有限公司 服务器故障定位方法、装置、设备及计算机可读存储介质
CN109491786A (zh) * 2018-11-01 2019-03-19 郑州云海信息技术有限公司 一种基于云平台的任务处理方法和装置
CN109918190A (zh) * 2017-12-13 2019-06-21 华为技术有限公司 一种数据采集方法及相关设备
CN110347557A (zh) * 2019-07-16 2019-10-18 深圳市网心科技有限公司 节点资源监控方法、电子设备、介质及采集方法
CN110661824A (zh) * 2018-06-28 2020-01-07 阿里巴巴集团控股有限公司 分布式集群中服务器的流量调控方法以及装置
CN110730103A (zh) * 2019-10-24 2020-01-24 苏州盈虚有数信息科技有限公司 一种网络质量分析方法和装置
WO2020019724A1 (zh) * 2018-07-27 2020-01-30 郑州云海信息技术有限公司 服务器中传感器数据的获取方法、获取系统和相关装置
CN110781065A (zh) * 2019-10-28 2020-02-11 北京北信源软件股份有限公司 一种业务应用的监控方法及装置
CN111614716A (zh) * 2020-04-10 2020-09-01 厦门网宿有限公司 一种采集远程设备数据的方法及系统
CN112559022A (zh) * 2020-12-16 2021-03-26 同盾控股有限公司 Jenkins高可用的系统及方法
CN112995307A (zh) * 2021-02-09 2021-06-18 中国工商银行股份有限公司 日志处理方法、系统、装置、电子设备及存储介质
CN113438129A (zh) * 2021-06-22 2021-09-24 上海哔哩哔哩科技有限公司 数据采集方法及装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636097B (zh) * 2018-11-01 2021-09-21 中车工业研究院有限公司 一种产品设计任务的分配方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101072133A (zh) * 2007-05-23 2007-11-14 华中科技大学 一种基于对等网络的高性能计算系统
CN102479099A (zh) * 2010-11-22 2012-05-30 中兴通讯股份有限公司 虚拟机管理系统及其使用方法
CN103001824A (zh) * 2012-11-14 2013-03-27 北京奇虎科技有限公司 一种监控多台服务器的监控系统及监控方法
CN103067529A (zh) * 2013-02-06 2013-04-24 厦门神州鹰软件科技有限公司 一种远程监控系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101072133A (zh) * 2007-05-23 2007-11-14 华中科技大学 一种基于对等网络的高性能计算系统
CN102479099A (zh) * 2010-11-22 2012-05-30 中兴通讯股份有限公司 虚拟机管理系统及其使用方法
CN103001824A (zh) * 2012-11-14 2013-03-27 北京奇虎科技有限公司 一种监控多台服务器的监控系统及监控方法
CN103067529A (zh) * 2013-02-06 2013-04-24 厦门神州鹰软件科技有限公司 一种远程监控系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高建平等: "基于Web的服务器群带外集中监控系统设计与实现", 《计算机与数字工程》, no. 8, 20 August 2010 (2010-08-20) *

Cited By (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104639351B (zh) * 2013-11-11 2018-03-09 卫信科技有限公司 用以建构网络结构部署图的处理系统及其方法
CN104639351A (zh) * 2013-11-11 2015-05-20 卫信科技有限公司 用以建构网络结构部署图的处理系统及其方法
CN103607314A (zh) * 2013-12-10 2014-02-26 浪潮电子信息产业股份有限公司 一种使用snmp协议对服务器监控管理的系统
CN103746837A (zh) * 2013-12-27 2014-04-23 乐视网信息技术(北京)股份有限公司 监控数据库的方法、数据库监控装置及系统
CN103812699A (zh) * 2014-02-17 2014-05-21 无锡华云数据技术服务有限公司 基于云计算的监控管理系统
CN104156297A (zh) * 2014-08-07 2014-11-19 浪潮(北京)电子信息产业有限公司 告警方法和装置
CN104158878A (zh) * 2014-08-18 2014-11-19 浪潮(北京)电子信息产业有限公司 一种自适应调度的分布式监控数据采集方法和系统
CN104158878B (zh) * 2014-08-18 2019-02-15 浪潮(北京)电子信息产业有限公司 一种自适应调度的分布式监控数据采集方法和系统
CN104935482A (zh) * 2015-06-26 2015-09-23 曙光信息产业(北京)有限公司 分布式监控系统及方法
CN104935482B (zh) * 2015-06-26 2018-08-24 曙光信息产业(北京)有限公司 分布式监控系统及方法
CN105357069A (zh) * 2015-11-04 2016-02-24 浪潮(北京)电子信息产业有限公司 分布式节点服务状态监测的方法、装置及系统
CN106936888A (zh) * 2015-12-30 2017-07-07 五八同城信息技术有限公司 数据收集的方法、装置及系统
CN105681405A (zh) * 2016-01-06 2016-06-15 山东中创软件工程股份有限公司 一种网络传输监控的方法
CN105718351B (zh) * 2016-01-08 2018-02-09 北京汇商融通信息技术有限公司 一种面向Hadoop集群的分布式监控管理系统
CN105718351A (zh) * 2016-01-08 2016-06-29 北京汇商融通信息技术有限公司 一种面向Hadoop集群的分布式监控管理系统
CN105721595B (zh) * 2016-03-03 2019-04-09 上海携程商务有限公司 IOS系统的app的打包方法及系统
CN105721595A (zh) * 2016-03-03 2016-06-29 上海携程商务有限公司 IOS系统的app的打包方法及系统
CN105933453A (zh) * 2016-06-28 2016-09-07 广州华多网络科技有限公司 一种传输数据的方法和系统
CN106254109A (zh) * 2016-08-02 2016-12-21 深圳中兴网信科技有限公司 日志采集方法、日志采集系统和服务器
CN106301913B (zh) * 2016-08-15 2019-08-09 努比亚技术有限公司 运维数据采集系统及运维数据采集方法
CN106301913A (zh) * 2016-08-15 2017-01-04 努比亚技术有限公司 运维数据采集系统及运维数据采集方法
CN106330567A (zh) * 2016-09-14 2017-01-11 郑州云海信息技术有限公司 一种服务器集群的服务器管理控制方法及系统
CN106534259B (zh) * 2016-09-30 2019-08-13 山东大学 基于Docker的Web数据采集方法、Web服务器及Web数据采集系统
CN106534259A (zh) * 2016-09-30 2017-03-22 山东大学 基于Docker的Web数据采集方法、Web服务器及Web数据采集系统
CN108234170A (zh) * 2016-12-15 2018-06-29 北京神州泰岳软件股份有限公司 一种服务器集群的监控方法和装置
CN108234170B (zh) * 2016-12-15 2021-06-22 北京神州泰岳软件股份有限公司 一种服务器集群的监控方法和装置
CN108206847A (zh) * 2016-12-19 2018-06-26 腾讯科技(深圳)有限公司 Cdn管理系统、方法及装置
US10812597B2 (en) 2016-12-19 2020-10-20 Tencent Technology (Shenzhen) Company Limited Content delivery network (CDN) management system, method, and apparatus
CN108259631A (zh) * 2016-12-29 2018-07-06 腾讯科技(深圳)有限公司 一种基于名称服务的数据处理方法、系统以及相关设备
CN108259631B (zh) * 2016-12-29 2021-06-25 腾讯科技(深圳)有限公司 一种基于名称服务的数据处理方法、系统以及相关设备
CN106844168A (zh) * 2017-02-13 2017-06-13 郑州云海信息技术有限公司 一种多节点服务器状态显示控制装置及节点切换方法
CN106909451A (zh) * 2017-02-28 2017-06-30 郑州云海信息技术有限公司 一种分布式任务调度系统及方法
CN107104858A (zh) * 2017-06-09 2017-08-29 携程旅游信息技术(上海)有限公司 Web负载均衡系统的监控系统
CN107994943A (zh) * 2017-12-05 2018-05-04 中盈优创资讯科技有限公司 参数采集系统、方法及计算机可读存储介质
CN107994943B (zh) * 2017-12-05 2020-04-10 中盈优创资讯科技有限公司 参数采集系统、方法及计算机可读存储介质
CN109918190A (zh) * 2017-12-13 2019-06-21 华为技术有限公司 一种数据采集方法及相关设备
CN108737984A (zh) * 2018-05-17 2018-11-02 湖南国奥电力设备有限公司 一种地下电缆检测系统
CN108540353A (zh) * 2018-06-14 2018-09-14 平安科技(深圳)有限公司 一种网络节点的监测方法与系统
CN108540353B (zh) * 2018-06-14 2021-11-05 平安科技(深圳)有限公司 一种网络节点的监测方法与系统
CN110661824A (zh) * 2018-06-28 2020-01-07 阿里巴巴集团控股有限公司 分布式集群中服务器的流量调控方法以及装置
CN110661824B (zh) * 2018-06-28 2022-04-12 阿里巴巴集团控股有限公司 分布式集群中服务器的流量调控方法及存储介质
WO2020019724A1 (zh) * 2018-07-27 2020-01-30 郑州云海信息技术有限公司 服务器中传感器数据的获取方法、获取系统和相关装置
CN109086155A (zh) * 2018-07-27 2018-12-25 郑州云海信息技术有限公司 服务器故障定位方法、装置、设备及计算机可读存储介质
CN109067621A (zh) * 2018-09-28 2018-12-21 郑州云海信息技术有限公司 设备监控方法、装置及系统
CN109491786A (zh) * 2018-11-01 2019-03-19 郑州云海信息技术有限公司 一种基于云平台的任务处理方法和装置
CN110347557A (zh) * 2019-07-16 2019-10-18 深圳市网心科技有限公司 节点资源监控方法、电子设备、介质及采集方法
CN110730103A (zh) * 2019-10-24 2020-01-24 苏州盈虚有数信息科技有限公司 一种网络质量分析方法和装置
CN110781065A (zh) * 2019-10-28 2020-02-11 北京北信源软件股份有限公司 一种业务应用的监控方法及装置
CN111614716A (zh) * 2020-04-10 2020-09-01 厦门网宿有限公司 一种采集远程设备数据的方法及系统
CN111614716B (zh) * 2020-04-10 2022-12-16 厦门网宿有限公司 一种采集远程设备数据的方法及系统
CN112559022A (zh) * 2020-12-16 2021-03-26 同盾控股有限公司 Jenkins高可用的系统及方法
CN112995307A (zh) * 2021-02-09 2021-06-18 中国工商银行股份有限公司 日志处理方法、系统、装置、电子设备及存储介质
CN112995307B (zh) * 2021-02-09 2023-12-12 中国工商银行股份有限公司 日志处理方法、系统、装置、电子设备及存储介质
CN113438129A (zh) * 2021-06-22 2021-09-24 上海哔哩哔哩科技有限公司 数据采集方法及装置

Also Published As

Publication number Publication date
CN103236949B (zh) 2016-12-28

Similar Documents

Publication Publication Date Title
CN103236949A (zh) 一种服务器集群的监控方法、装置与系统
CN103338163B (zh) 支持动态弹性资源调度的软件定义网络控制器
CN101207550B (zh) 负载均衡系统及多种业务实现负载均衡的方法
CN104488238A (zh) 用于网络环境中集群链路聚合控制的系统和方法
CN109698757A (zh) 切换主备设备、恢复用户数据的方法、服务器及网络设备
CN103152352A (zh) 一种基于云计算环境的全信息安全取证监听方法和系统
CN104380277A (zh) 用于管理云调度环境中的服务器硬件资源的方法、系统和设备
CN101502144A (zh) 无线通信网络中的元件管理系统
CN103475722A (zh) 一种业务协同平台实现系统
CN109842868B (zh) 一种帧聚合、网络设置帧发送方法及设备
US20160344582A1 (en) Call home cluster
CN105656645A (zh) 堆叠系统的故障处理的决策方法和装置
CN103795575A (zh) 一种面向多数据中心的系统监控方法
CN103974140A (zh) 一种基于tr069协议的大规模交互电视终端管理方法及系统
WO2013146808A1 (ja) コンピュータシステム、及び通信経路変更方法
WO2016193118A1 (en) Load balancing server for forwarding prioritized traffic from and to one or more prioritized auto-configuration servers
WO2020078381A1 (zh) 数据汇聚方法、装置、设备、存储介质和系统
CN112543222B (zh) 一种数据处理方法、装置、计算机设备及存储介质
CN106027287A (zh) 一种配电通信网统一管控平台
CN110855481B (zh) 数据采集系统及方法
CN103152420B (zh) 一种避免Ovirt虚拟管理平台单点失效的方法
US10382349B2 (en) Server for distributed controller system
CN103957124A (zh) 一种采集任务的分布式采集方法及采集系统
CN105515844A (zh) 一种提高软件定义网络可靠性的系统
CN104205730A (zh) 网元数据访问方法、装置以及网络管理系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 100086 12, 1201, 3 building, 2 South Road, Haidian District Academy of Sciences, Beijing.

Patentee after: BEIJING SOHU NEW MEDIA INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 100084 Beijing Haidian District Zhongguancun East Road 1 hospital 9 building Sohu cyber building 15 Floor

Patentee before: BEIJING SOHU NEW MEDIA INFORMATION TECHNOLOGY Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20161228