CN102546256B - 用于对云计算服务进行监控的系统及方法 - Google Patents

用于对云计算服务进行监控的系统及方法 Download PDF

Info

Publication number
CN102546256B
CN102546256B CN201210008734.5A CN201210008734A CN102546256B CN 102546256 B CN102546256 B CN 102546256B CN 201210008734 A CN201210008734 A CN 201210008734A CN 102546256 B CN102546256 B CN 102546256B
Authority
CN
China
Prior art keywords
monitoring
node
main
cloud
monitoring node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210008734.5A
Other languages
English (en)
Other versions
CN102546256A (zh
Inventor
张继勇
杜佳庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yi Cloud Feilingjiexun Technology (beijing) Co Ltd
Original Assignee
Yi Cloud Feilingjiexun Technology (beijing) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yi Cloud Feilingjiexun Technology (beijing) Co Ltd filed Critical Yi Cloud Feilingjiexun Technology (beijing) Co Ltd
Priority to CN201210008734.5A priority Critical patent/CN102546256B/zh
Publication of CN102546256A publication Critical patent/CN102546256A/zh
Application granted granted Critical
Publication of CN102546256B publication Critical patent/CN102546256B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种用于对云计算服务进行监控的系统,用于对包含有云服务节点的云计算服务系统进行监控;包括至少一个云管理节点,多个监测节点,至少一个主监控节点;其中监测节点根据从主监控节点所接收到的监控命令对云计算服务系统中的云服务节点进行监测,并将监测结果返回给主监控节点;主监控节点用于向监测节点发送监控命令,收集各个监测节点所返回的监测结果,并展示给管理员;云管理节点用于提供管理功能,所述管理功能包括:创建或删除所述云服务节点、主监控节点、监测节点;动态调整所述云服务节点的配置。本发明中所采用的监测节点造价低廉,用户可以在相同的成本下布设更多的监测节点,有利于提高监控效率,节省监控成本。

Description

用于对云计算服务进行监控的系统及方法
技术领域
本发明涉及分布式计算领域,特别涉及一种用于对云计算服务进行监控的系统及方法。
背景技术
云计算(Cloud Computing)是网格计算(Grid Computing)、分布式计算(Distributed Computing)、并行计算(Parallel Computing)、效用计算(Utility Computing)、网络存储(Network StorageTechnologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机技术和网络技术发展融合的产物。它旨在通过网络把多个成本相对较低的计算实体整合成一个具有强大计算能力的完美系统,并借助SaaS(Software-as-a-service,软件即服务)、PaaS(Platform-as-a-Service,平台即服务)、IaaS(Infrastructure as aService,基础设施即服务)、MSP(Managed Service Provider,管理服务提供商)等先进的商业模式把这强大的计算能力分布到终端用户手中。
为了了解并提高云计算服务的性能,需要对云计算服务进行监控。由于云计算服务本身的特点,使得不同地域的用户访问云计算服务器时会因为网络速度不同而得到不同的服务。因此,为了准确、完整地监控云计算服务的性能,需要在很多不同的地域部署监测节点来进行监控。
在现有技术中,针对诸如计算机群等分布式计算系统已经存在相应的监控系统。这些监控系统一般部署少量的高性能的服务器作为监测节点,运营成本很高,以一个服务器费用支出为1万元/每年来计算,10万元只能最多部署10个监测节点。运营成本高的缺陷也使得监控系统中的监测节点的数量不可能很多,一个监测地点通常只有一个监测节点,这也使得整个监控系统的鲁棒性很低,一旦有监测节点发生故障,整个监控系统的监测结果就会受到影响。此外,现有的监控系统仅仅针对一般的网络服务,并没有针对云计算服务领域,因此它无法自动创建云服务节点,无法自动监控云服务节点,更无法根据监测结果自动调整云服务的性能。
发明内容
本发明的目的是现有的监控系统布设成本高、鲁棒性低,不适用于云计算服务领域的缺陷,从而提供一种成本低廉、鲁棒性高,适用于云计算服务领域的监控系统。
为了实现上述目的,本发明提供了一种用于对云计算服务进行监控的系统,对包含有云服务节点的云计算服务系统进行监控;包括至少一个云管理节点,多个监测节点,至少一个主监控节点以及监测结果选择模块;其中,所述的监测节点根据从所述主监控节点所接收到的监控命令对所述云计算服务系统中的云服务节点进行监测,并将监测结果返回给所述主监控节点;所述的主监控节点用于向所述的监测节点发送监控命令,收集各个监测节点所返回的监测结果,并展示给管理员;所述的云管理节点用于提供管理功能,所述管理功能包括:创建或删除所述云服务节点、主监控节点、监测节点;动态调整所述云服务节点的配置;所述的监测结果选择模块用于对监测节点所返回的监测结果进行选择,在所述主监控节点的帮助下根据需要将管理员感兴趣的监测结果展示给管理员。
上述技术方案中,还包括有至少一个从监控节点,所述从监控节点为所述主监控节点的备份,当所述主监控节点发生故障时,所述从监控节点代替所述主监控节点进行工作。
上述技术方案中,所述的监测节点采用虚拟主机实现,所述云服务节点至少有一个对应的监测节点。
上述技术方案中,所述的主监控节点根据监控任务表向所述的监测节点发送监控命令,所述的主监控节点根据监测节点状态表从所述的多个监测节点中选择需要发送监控命令的监测节点;其中,
所述的监控任务表包括所要监测的云服务节点的ID、监控类型、云服务访问信息、监控任务启动时间、是否为重复监控任务标识、监控任务周期;
所述的监测节点状态表记录了监测节点处于空闲、忙碌、故障三种状态中的哪一种。
上述技术方案中,所述的从监测节点定期向主监控节点发送应答请求,当主监控节点超过一定时间持续无应答时,从监控节点通知所述云管理节点;由云管理节点删除主监控节点,并将从监控节点提升为主监控节点,最后创建一个新的从监控节点以作为备份。
本发明还提供了一种应用于所述的云计算服务监控系统的云计算服务监控方法,包括:
步骤1)、所述主监控节点查询监控任务表以获取监控任务;
步骤2)、所述主监控节点检查监测节点状态表,根据所述监控任务的要求从所述监测节点状态表中选择能够满足监控任务的且状态为“空闲”的监测节点;
步骤3)、所述主监控节点根据所述监控任务向步骤2)得到的空闲的监测节点发送监控命令;
步骤4)、所述的空闲的监测节点接收到监控命令后,向所述主监控节点返回状态“忙碌”,并开始监测过程;
步骤5)、所述的监测节点在监测过程中返回监测数据,直到满足所述监控任务的终止条件;
步骤6)、所述监测节点向所述主控制节点返回监控任务完成的信息,所述主控制节点在监测节点状态表中将这些节点的状态改为“空闲”。
上述技术方案中,在所述的步骤1)之前还包括在所述监控任务表中添加监控任务的步骤,该步骤包括:
当要为一新创建的或者已有的云服务节点设立新的监控任务时,根据所述云服务节点的类型以及管理员所设定的监控频率生成监控任务,并将该监控任务添加到所述监控任务表中。
上述技术方案中,该方法还包括当一监测节点发生故障时,对故障监测节点进行冗余替换的步骤;该步骤包括:
所述的主监控节点将发生故障的监测节点的状态设置为“故障”,然后查找监测节点状态表,从余下的状态为“空闲”的监测节点中选择一个替代的监测节点,并向该替代的监测节点发送监控命令,由该监测节点执行监测过程。
上述技术方案中,该方法还包括根据监测结果对云服务节点的性能进行调整的步骤;该步骤包括:
步骤101)、主监控节点检查监控结果是否符合用户需求,当不符合时,执行下一步;
步骤102)、检查是否设定了自动调节,如果有,执行下一步,否则,发出警告信息后结束操作;
步骤103)、主监控节点计算出云服务节点与当前任务相适应的配置,然后将这一计算结果通知云管理节点;
步骤104)、云服务节点接收到新的配置信息后,按照该信息重新配置自身的资源。
本发明的优点在于:
1、本发明中所采用的监测节点造价低廉,用户可以在相同的成本下布设更多的监测节点,有利于提高监控效率,节省监控成本。
2、当监控系统中的部分监测节点发生故障时,系统能以一定的流程来进行容错处理,不影响监控的最终效果。
3、当主监控节点发生故障时,利用从监测节点,整个监控系统能自动修复,具有极强的鲁棒性。
4、系统能根据监控结果自动调整云服务的性能,提高了云计算环境的性能。
5、监测节点可以动态加入整个系统,使得监控过程更为灵活、高效。
附图说明
图1为在一个实施例中带有本发明的云计算服务监控系统的云计算环境的示意图;
图2为监测节点动态加入本发明的云计算服务监控系统的流程图;
图3为本发明的云计算服务监控系统中的监测节点进行监测的流程图;
图4为利用云管理节点添加监控任务的流程图;
图5为从监控节点替代主监控节点的流程图;
图6为对云服务节点的配置做动态调整的流程图。
具体实施方式
下面结合附图和具体实施方式对本发明进行说明。
在图1中给出了一个已有的云计算服务系统的示意图,从图中可以看出,该系统包括有N个云服务节点,每个云服务节点都为一个特定的云计算服务,如服务器、网站或者网络应用;多个云服务节点可以在一个云中(即多个云服务节点从属于同一个云服务提供商),也可以在多个云中(即多个云服务节点从属于不同的云服务提供商)。
针对上述云计算服务系统,在本实施例中采用了如图1中所示的监控系统,该监控系统包括有至少一个云管理节点,M个监测节点以及至少一个主监控节点。其中,所述的云管理节点用于提供管理功能,如创建或删除所述的云服务节点、所述的监测节点以及所述的主监控节点,动态调整云服务节点的配置等;所述的监测节点根据从主监控节点所接收到的监控命令对云计算服务系统中的云服务节点进行监测,并将监测结果返回给主监控节点;所述的主监控节点用于向所述的监测节点发送监控命令,收集各个监测节点所返回的监测结果,并展示给管理员。
在本实施例中,所述的监测节点采用虚拟主机作为监测节点,由于所述监测节点所要完成的工作较为简单,对计算与存储性能并无太高要求,因此可以在诸如普通的支持Php编程语言的网页空间上实现。监测节点只需要能够通过编程语言访问Internet网络即可。每个监测节点至少有三种状态,即“空闲”、“忙碌”与“故障”。监测节点属于“空闲”状态,则标志着该监测节点实际上并未工作,即事实上未对云服务节点进行监测,此时,该监测节点会将自己的状态信息传递给主监控节点,一旦从主监控节点接收到监控命令后,该监测节点的状态就由“空闲”转为“忙碌”,进行监测数据的采集与发送。上述过程也是监测节点动态加入监测网络的过程,在图2中对这一过程做了说明。当监测节点发生故障时,该节点会进入“故障”状态,一旦发生故障,该监测节点会被其它监测节点代替。监测节点的上述状态信息会被保存在监测节点状态表中,关于监测节点状态表的详细信息会在下文中有进一步的说明。
主监控节点在对各个监测节点进行控制的过程中采用了监控任务表与监测节点状态表,在下面的表1中给出了监控任务表的示意图,在下面的表2中给出了监测节点状态表的示意图。
表1
表2
在本实施例中,上述的监控任务表与监测节点状态表被保存在一个数据库中,且该数据库中的数据可以被所述的主监控节点、从监控节点以及云管理节点访问。该数据库可以是一个独立的节点,也可以位于一个共享的存储空间里。
参考图3,主监控节点在工作过程中,首先通过查询监控任务表来获取任务;接着检查监测节点状态表,根据前述所获取任务的要求从所述监测节点状态表中选择一定数量的符合监控需求的空闲监测节点;然后,主监控节点向之前选出的空闲监测节点发送任务命令;这些空闲监测节点接收到任务命令后,根据命令开始监测工作,同时向主监控节点返回状态“忙碌”,以避免主监控节点向其重复发送任务命令;监测节点在监测过程中,会按照任务命令的要求或者按照默认设置,在一定的时间周期内向主监控节点返回监测数据,直到任务命令中所包含的任务执行时间到达,或者满足了其他的任务终止条件;一旦任务终止,监测节点向主监控节点返回任务完成的信息,主监控节点等待与此次监控过程有关的各个监测节点的任务都完成后,将这些监测节点的状态都改为“空闲”,并更新监控结果以返回给用户。
在上述的监控过程中,由于各种原因,某个或某些监测节点在监测过程中发生故障,无法将监测数据返回给主监控节点,此时主监控节点会将该监测节点的状态设置为“故障”,然后从余下的状态为“空闲”的监测节点中选择一个替代的监测节点,向该监测节点发送任务命令,由该监测节点执行监测过程。其中,选择替代监测节点的方法有多种,最基本的方法是随机挑选:即系统从余下的状态为“空闲”的监测节点中随机选择一个来替代。作为一种优选实现方式,在本实施例中可采用就近挑选的方法:对发生故障的节点,系统从余下的状态为“空闲”的监测节点中选择一个离它最近的节点来替代。
考虑到云计算服务系统中,云服务节点是动态变化的,因此,还要对当云服务计算环境中的云服务节点发生变化时,主监控节点的相关操作进行说明。
云服务节点的变化不外乎云服务节点的增加与删除,下面以云服务节点的增加为例,对相关过程进行说明。以云服务节点的增加操作为参考,本领域技术人员很容易实现云服务节点的删除操作。
在增加云服务节点时,如图4所示,管理员可通过所述的云管理节点来创建云服务节点,若创建成功,则对新创建的云服务节点是否需要监控进行判断,如果是的话,由管理员设定监控频率以及云服务类型,并通过云管理节点向监控任务表中增加记录。如果不需要监控的话,则无需完成上述操作。管理员除了通过所述的云管理节点创建云服务节点外,还可以手动创建云服务节点,此时可手动增加监控任务,若云服务节点已经存在或者由其他方式创建,管理员也可将监控任务手动添加到监控任务表中。这些在监控任务表中手动添加任务的过程与前文并无本质上的差异,因此不再重复。
作为一种优选实现方式,在本发明的另一个实施例中,云计算服务监控系统中还包括从监控节点,所述的从监控节点为所述主监控节点的备份,一旦所述主监控节点发生故障,所述从监控节点即要代替所述主监控节点进行工作。从监控节点的创建、删除、管理也由所述的云管理节点实现。从监控节点作为主监控节点的备份,能以共享的方式访问监控任务表,并能定期向主监控节点发送应答请求。下面重点就当主监控节点发生故障时,如何利用从监控节点排除故障的过程进行说明。参考图5,从监控节点定期向主监控节点发送应答请求,若主监控节点有应答,证明主监控节点在正常工作,自然无需做其他的处理。若主监控节点超过一定时间持续无应答,证明主监控节点发生故障,此时,从监控节点通知云管理节点;云管理节点删除主监控节点;云管理节点将从监控节点提升为主监控节点;新的主监控节点将自身的信息报告给云管理节点,同时云管理节点还要再创建一个新的从监控节点以作为备份。
在本发明的又一个实施例中,作为一种优选实现方式,所述的主监控节点还要根据监测结果计算是否需要对云服务节点的性能进行调整,一旦要进行调整,则计算出调整后的云服务节点的相关配置信息,将这些信息通知所述的云管理节点,由该节点对相关云服务节点进行调整。在图6中,根据监控结果对云服务节点的性能进行自动调节的流程有详细描述,下面结合图6,对此做详细说明。
根据前文所提到的监测过程生成监控结果后,主监控节点检查监控结果是否符合用户需求,如果符合,自然不需要进行调整。如果不符合,则检查管理员是否设定了自动调节功能,如果没有,向管理员发出警告信息即可,如果有,则由主监控节点计算出云服务节点与当前任务相适应的配置,然后将这一计算结果通知云管理节点,由该节点调整对应的云服务节点的配置;相应的云服务节点接收到新的配置信息后,按照该信息重新配置自身的资源,然后重启,重新提供服务。其中,主监控节点计算云服务节点与当前任务相适应的配置时,主要考虑当前云服务的性能与当前任务中预先设定的参数是否匹配,然后根据匹配与否做相应的调整。例如,如果监测结果显示云服务节点的CPU使用率过高,同时服务器的响应速度变慢,则可以通过云管理节点来给该云服务节点升级,从而增加CPU计算能力。反之,如果CPU使用率过低,则可以给该云服务节点降级,减少CPU计算能力。
在本发明的又一个实施例中,云计算服务监控系统中还包括有监测结果选择模块,所述的监测结果选择模块用于对监测节点监测到的数据做进一步的选择,用户或管理员利用监测结果选择模块可以从监测节点的结果中根据自己的需要选择部分监测结果数据加以显示。例如,用户或管理员需要知道CPU使用率超过50%的云服务节点,对于CPU使用率低于50%的云服务节点并不关心,那么就可以通过所述的监测结果选择模块设定只显示CPU使用率超过50%的云服务节点的情况。这样做显然能够使得用户或管理员能够更为关注他们所关心的内容。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (7)

1.一种用于对云计算服务进行监控的系统,对包含有云服务节点的云计算服务系统进行监控;其特征在于,包括至少一个云管理节点,多个监测节点,至少一个主监控节点以及监测结果选择模块;其中,
所述的监测节点根据从所述主监控节点所接收到的监控命令对所述云计算服务系统中的云服务节点进行监测,并将监测结果返回给所述主监控节点;所述的主监控节点用于向所述的监测节点发送监控命令,收集各个监测节点所返回的监测结果,并展示给管理员;所述的云管理节点用于提供管理功能,所述管理功能包括:创建或删除所述云服务节点、主监控节点、监测节点;动态调整所述云服务节点的配置;所述的监测结果选择模块用于对监测节点所返回的监测结果进行选择,在所述主监控节点的帮助下根据需要将管理员感兴趣的监测结果展示给管理员;
所述的主监控节点还要根据监测结果计算是否需要对云服务节点的性能进行调整,一旦要进行调整,则计算出调整后的云服务节点的相关配置信息,将这些信息通知所述的云管理节点;
所述的主监控节点根据监控任务表向所述的监测节点发送监控命令,所述的主监控节点根据监测节点状态表从所述的多个监测节点中选择需要发送监控命令的监测节点;其中,
所述的监控任务表包括所要监测的云服务节点的ID、监控类型、云服务访问信息、监控任务启动时间、是否为重复监控任务标识、监控任务周期;
所述的监测节点状态表记录了监测节点处于空闲、忙碌、故障三种状态中的哪一种;
所述系统还包括有至少一个从监控节点,所述从监控节点为所述主监控节点的备份,当所述主监控节点发生故障时,所述从监控节点代替所述主监控节点进行工作。
2.根据权利要求1所述的用于对云计算服务进行监控的系统,其特征在于,所述的监测节点采用虚拟主机实现,所述云服务节点至少有一个对应的监测节点。
3.根据权利要求1所述的用于对云计算服务进行监控的系统,其特征在于,所述的从监测节点定期向主监控节点发送应答请求,当主监控节点超过一定时间持续无应答时,从监控节点通知所述云管理节点;由云管理节点删除主监控节点,并将从监控节点提升为主监控节点,最后创建一个新的从监控节点以作为备份。
4.一种应用于权利要求1-3之一的用于对云计算服务进行监控的系统的云计算服务监控方法,包括:
步骤1)、所述主监控节点查询监控任务表以获取监控任务;
步骤2)、所述主监控节点检查监测节点状态表,根据所述监控任务的要求从所述监测节点状态表中选择能够满足监控任务的且状态为“空闲”的监测节点;
步骤3)、所述主监控节点根据所述监控任务向步骤2)得到的空闲的监测节点发送监控命令;
步骤4)、所述的空闲的监测节点接收到监控命令后,向所述主监控节点返回状态“忙碌”,并开始监测过程;
步骤5)、所述的监测节点在监测过程中返回监测数据,直到满足所述监控任务的终止条件;
步骤6)、所述监测节点向所述主监控节点返回监控任务完成的信息,所述主监控节点在监测节点状态表中将这些节点的状态改为“空闲”。
5.根据权利要求4所述的用于对云计算服务进行监控的方法,其特征在于,在所述的步骤1)之前还包括在所述监控任务表中添加监控任务的步骤,该步骤包括:
当要为一新创建的或者已有的云服务节点设立新的监控任务时,根据所述云服务节点的类型以及管理员所设定的监控频率生成监控任务,并将该监控任务添加到所述监控任务表中。
6.根据权利要求4所述的用于对云计算服务进行监控的方法,其特征在于,该方法还包括当一监测节点发生故障时,对故障监测节点进行冗余替换的步骤;该步骤包括:
所述的主监控节点将发生故障的监测节点的状态设置为“故障”,然后查找监测节点状态表,从余下的状态为“空闲”的监测节点中选择一个替代的监测节点,并向该替代的监测节点发送监控命令,由该监测节点执行监测过程。
7.根据权利要求4所述的用于对云计算服务进行监控的方法,其特征在于,该方法还包括根据监测结果对云服务节点的性能进行调整的步骤;该步骤包括:
步骤101)、主监控节点检查监控结果是否符合用户需求,当不符合时,执行下一步;
步骤102)、检查是否设定了自动调节,如果有,执行下一步,否则,发出警告信息后结束操作;
步骤103)、主监控节点计算出云服务节点与当前任务相适应的配置,然后将这一计算结果通知云管理节点;
步骤104)、云服务节点接收到新的配置信息后,按照该信息重新配置自身的资源。
CN201210008734.5A 2012-01-12 2012-01-12 用于对云计算服务进行监控的系统及方法 Active CN102546256B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210008734.5A CN102546256B (zh) 2012-01-12 2012-01-12 用于对云计算服务进行监控的系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210008734.5A CN102546256B (zh) 2012-01-12 2012-01-12 用于对云计算服务进行监控的系统及方法

Publications (2)

Publication Number Publication Date
CN102546256A CN102546256A (zh) 2012-07-04
CN102546256B true CN102546256B (zh) 2015-05-06

Family

ID=46352261

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210008734.5A Active CN102546256B (zh) 2012-01-12 2012-01-12 用于对云计算服务进行监控的系统及方法

Country Status (1)

Country Link
CN (1) CN102546256B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102780780B (zh) * 2012-07-25 2014-11-19 中国联合网络通信集团有限公司 云计算模式下的数据处理方法、设备和系统
CN104541247B (zh) * 2012-08-07 2018-12-11 超威半导体公司 用于调整云计算系统的系统和方法
CN102801585A (zh) * 2012-08-24 2012-11-28 上海和辰信息技术有限公司 基于云计算网络环境的信息监控系统与方法
CN102882709A (zh) * 2012-09-05 2013-01-16 浪潮(北京)电子信息产业有限公司 一种云计算环境下监控系统和方法
CN104731648B (zh) * 2012-09-28 2017-12-12 北京搜狐新媒体信息技术有限公司 一种分布式系统中心节点构建、提交、监控方法及装置
CN102970183A (zh) * 2012-11-22 2013-03-13 浪潮(北京)电子信息产业有限公司 一种云监控系统及其数据回流方法
CN103546313A (zh) * 2013-09-26 2014-01-29 福州宙斯盾信息技术有限公司 基于云计算的it运维管理系统
CN103490938A (zh) * 2013-10-15 2014-01-01 河海大学 一种基于分层的云服务组合失效的恢复系统和方法
CN104539479A (zh) * 2014-12-16 2015-04-22 北京中交兴路车联网科技有限公司 一种分布式服务监控系统及方法
US10855515B2 (en) * 2015-10-30 2020-12-01 Netapp Inc. Implementing switchover operations between computing nodes
CN106936649A (zh) * 2015-12-29 2017-07-07 中国电信股份有限公司 业务监控方法、系统以及系统模块和监控器
CN106161090A (zh) * 2016-07-12 2016-11-23 许继集团有限公司 一种分区集群系统的监测方法及装置
CN106487599B (zh) * 2016-11-30 2020-02-04 上海斐讯数据通信技术有限公司 云接入控制器运行状态分布式监控的方法和系统
CN108206768A (zh) * 2016-12-20 2018-06-26 阿里巴巴集团控股有限公司 集群监测和切换方法及装置
CN107257305B (zh) * 2017-08-02 2020-05-15 苏州浪潮智能科技有限公司 一种多节点系统的监控方法和装置
CN107729184B (zh) * 2017-10-23 2021-07-30 国云科技股份有限公司 一种系统组件服务自愈方法
CN108306791A (zh) * 2018-02-01 2018-07-20 上海鑫鼎信息科技有限公司 小型机维保云计算服务系统
CN111371635B (zh) * 2018-12-26 2023-09-01 北京奇虎科技有限公司 网络节点的监测方法、装置及系统
CN116594847A (zh) * 2023-07-18 2023-08-15 太平金融科技服务(上海)有限公司 服务器巡检方法、系统、装置、服务器、介质和程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090063122A (ko) * 2007-12-13 2009-06-17 한국전자통신연구원 다중 시스템 워크로드 관리 시스템 및 방법
CN201657029U (zh) * 2010-04-15 2010-11-24 王鹏 基于云计算构架的云存储系统
CN102164184A (zh) * 2011-04-22 2011-08-24 广州杰赛科技股份有限公司 云计算网络中计算机实体的接入和管理方法及云计算网络
CN102223254A (zh) * 2011-06-17 2011-10-19 南京中兴新软件有限责任公司 监控系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090063122A (ko) * 2007-12-13 2009-06-17 한국전자통신연구원 다중 시스템 워크로드 관리 시스템 및 방법
CN201657029U (zh) * 2010-04-15 2010-11-24 王鹏 基于云计算构架的云存储系统
CN102164184A (zh) * 2011-04-22 2011-08-24 广州杰赛科技股份有限公司 云计算网络中计算机实体的接入和管理方法及云计算网络
CN102223254A (zh) * 2011-06-17 2011-10-19 南京中兴新软件有限责任公司 监控系统及方法

Also Published As

Publication number Publication date
CN102546256A (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
CN102546256B (zh) 用于对云计算服务进行监控的系统及方法
CN102882909B (zh) 云计算服务监控系统及方法
CN104486445A (zh) 一种基于云平台的分布式可扩展资源监控系统及方法
CN112162821B (zh) 容器集群资源监视方法、装置及系统
WO2012056596A1 (ja) 計算機システム及び処理制御方法
CN105357296A (zh) 一种Docker云平台下弹性缓存系统
CN107368369B (zh) 分布式容器管理方法及系统
EP2625604A2 (en) Automatic replication of virtual machines
CN113949707A (zh) 基于OpenResty和K8S的容器云服务发现和负载均衡方法
US20160142262A1 (en) Monitoring a computing network
CN103533063A (zh) 一种可实现web应用资源动态扩展的方法及装置
CN106452836B (zh) 主节点设置方法及装置
CN107666493B (zh) 一种数据库配置方法及其设备
CN113742031A (zh) 节点状态信息获取方法、装置、电子设备及可读存储介质
CN107656705B (zh) 一种计算机存储介质和一种数据迁移方法、装置及系统
CN111343219B (zh) 计算服务云平台
CA3030504A1 (en) Blockchain network and task scheduling method therefor
CN106302640A (zh) 数据请求处理方法及装置
CN103581332A (zh) HDFS架构及HDFS架构中NameNode节点的压力分解方法
CN103561055A (zh) 基于会话的云计算环境下Web应用自动弹性扩展方法
CN103152416A (zh) 一种提高在线集群组高可用性能的动态管理方法
CN103117874A (zh) 一种刀片服务器管理网络快速配置方法
CN105095103A (zh) 用于云环境下的存储设备管理方法和装置
CN104753992A (zh) 一种数据存储、虚拟平台故障恢复的方法、设备和系统
CN117389830A (zh) 集群日志采集方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant