CN102868736B - 一种云计算监控框架设计及实现方法及云计算处理设备 - Google Patents

一种云计算监控框架设计及实现方法及云计算处理设备 Download PDF

Info

Publication number
CN102868736B
CN102868736B CN201210316388.7A CN201210316388A CN102868736B CN 102868736 B CN102868736 B CN 102868736B CN 201210316388 A CN201210316388 A CN 201210316388A CN 102868736 B CN102868736 B CN 102868736B
Authority
CN
China
Prior art keywords
node
nodes
cloud computing
monitoring data
service process
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210316388.7A
Other languages
English (en)
Other versions
CN102868736A (zh
Inventor
罗登亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201210316388.7A priority Critical patent/CN102868736B/zh
Publication of CN102868736A publication Critical patent/CN102868736A/zh
Application granted granted Critical
Publication of CN102868736B publication Critical patent/CN102868736B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种云计算监控框架设计及实现方法及云计算处理设备,所述方法包括:在节点上设置唯一性软件标识作为节点的身份标识,节点自动扫描发现其它节点,根据节点的身份标识进行注册并生成节点组织关系表,根据所述节点组织关系表对节点进行下述操作中的一种或多种:节点间心跳检查、节点初始化或运行中检查、路由故障通知告警消息、推送节点监控数据。本方案可以方便的移植和应用到其他的分布式系统,具有一定的通用性,可以省略人工操作过程,可以自动完成云计算的运行,提高云计算系统的智能性。

Description

一种云计算监控框架设计及实现方法及云计算处理设备
技术领域
本发明涉及计算机软件和云计算领域,尤其涉及一种云计算监控框架设计及实现方法及云计算处理设备。
背景技术
云计算基础设施平台是一个复杂的服务平台,具有多样化、异构性和动态变化的特点。云计算系统的正常运行离不开监控系统的支持,云监控系统能够实时反映出云平台的健康状况,能够及时发现和处理云计算平台已发生和潜在的问题,这对于管理和调度云计算系统资源起到了关键性的作用。因此,一个好的监控框架对于系统的正常运维起着决定性的作用。然而,当前对于一个好的监控框架没有一个确切的规定。
发明内容
本发明要解决的技术问题是提供一种云计算监控框架设计及实现方法及云计算处理设备,为云计算监控框架设计提供新的解决方案。
为了解决上述技术问题,本发明提供了一种云计算监控框架设计及实现方法,所述方法包括:在节点上设置唯一性软件标识作为节点的身份标识,节点自动扫描发现其它节点,根据节点的身份标识进行注册并生成节点组织关系表,根据所述节点组织关系表对节点进行下述操作中的一种或多种:节点间心跳检查、节点初始化或运行中检查、路由故障通知告警消息、推送节点监控数据。
进一步地,上述方法还可以具有以下特点:
在节点上设置唯一性软件标识是指对不同类型节点安装不同的程序包或进程,根据节点上运行的所述程序包或进程识别节点身份。
进一步地,上述方法还可以具有以下特点:
所述节点采用组播或Avahi方式进行自动扫描;
将注册信息注册到本地的配置文件中,并在所述配置文件中记录或更新注册时间。
进一步地,上述方法还可以具有以下特点:
所述节点间心跳检查包括根据节点的注册时间的刷新间隔作为网络心跳间隔用于检查节点间的网络连通性。
进一步地,上述方法还可以具有以下特点:
所述节点初始化或运行中检查包括在每个节点开机时自动检测服务进程是否启动、存储挂载是否就绪,在节点运行中检查服务进程是否僵死、服务进程是否退出,存储挂载目录是否就绪,检查到异常后杀死僵死进程、启动服务进程、挂载可用的存储。
进一步地,上述方法还可以具有以下特点:
使用RabbitMQ消息队列机制对故障通知告警消息进行路由和传输。
进一步地,上述方法还可以具有以下特点:
所述推送节点监控数据包括将对节点的监控数据实时刷新到Redis数据库,监控数据包括以下参数中的一种或多种:CPU使用率,CPU负载,内存使用率,磁盘空间使用率,磁盘输入和/或输出,网络流量,系统进程运行情况信息。
进一步地,上述方法还可以具有以下特点:
采用事件循环轮询机制对节点轮询执行所述操作。
为了解决上述技术问题,本发明还提供了一种云计算处理设备,所述设备包括管理模块、操作执行模块、监控数据存储模块;
所述管理模块,用于在节点上设置唯一性软件标识作为节点的身份标识,自动扫描发现其它节点,根据节点的身份标识进行注册并生成节点组织关系表;
所述操作执行模块,用于根据所述节点组织关系表对节点进行下述操作中的一种或多种:节点间心跳检查、节点初始化或运行中检查、路由故障通知告警消息、推送节点监控数据;
所述监控数据存储模块,用于存储和更新节点监控数据。
进一步地,上述云计算处理设备还可以具有以下特点:
所述管理模块,还用于在节点上设置唯一性软件标识是指对不同类型节点安装不同的程序包或进程,根据节点上运行的所述程序包或进程识别节点身份;采用组播或Avahi方式进行自动扫描,将注册信息注册到本地的配置文件中,并在所述配置文件中记录或更新注册时间;
所述操作执行模块,还用于根据节点的注册时间的刷新间隔作为网络心跳间隔用于检查节点间的网络连通性;还用于在每个节点开机时自动检测服务进程是否启动、存储挂载是否就绪,在节点运行中检查服务进程是否僵死、服务进程是否退出,存储挂载目录是否就绪,检查到异常后杀死僵死进程、启动服务进程、挂载可用的存储;还用于使用RabbitMQ消息队列机制对故障通知告警消息进行路由和传输;将对节点的监控数据实时刷新到Redis数据库,监控数据包括以下参数中的一种或多种:CPU使用率,CPU负载,内存使用率,磁盘空间使用率,磁盘输入和/或输出,网络流量,系统进程运行情况信息;还用于采用事件循环轮询机制对节点轮询执行所述操作。
本方案可以方便的移植和应用到其他的分布式系统,具有一定的通用性,可以省略人工操作过程,可以自动完成云计算的运行,提高云计算系统的智能性。
附图说明
图1是云计算监控框架设计及实现方法的流程图;
图2是云计算处理设备的结构图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
如图1所示,云计算监控框架设计及实现方法包括:在节点上设置唯一性软件标识作为节点的身份标识,节点自动扫描发现其它节点,根据节点的身份标识进行注册并生成节点组织关系表,根据所述节点组织关系表对节点进行下述操作中的一种或多种:节点间心跳检查、节点初始化或运行中检查、路由故障通知告警消息、推送节点监控数据。
下面对各步骤进行详细说明。
1节点身份自动识别
云计算系统的节点身份具有多样化,可简单分为计算节点、管理主控节点、分布式存储master节点、分布式存储chunkserver节点和集中式存储节点等等,并且某些节点可能重复身份,比如某些节点具有管理节点和计算节点双重身份等。面对如此多的节点类型可以通过手动修改配置文件来指定身份,但是当有上千台节点时,手动修改配置文件确定节点身份存在耗时而繁琐的问题,因此自动化确定节点身份至关重要,只要安装好监控程序,上千台节点自动识别各自的身份并确立起节点间的关系,能够减少大量的部署和维护工作量。
本方案中,在节点上设置唯一性软件标识是指对不同类型节点安装不同的程序包或进程,根据节点上运行的所述程序包或进程识别节点身份。每种类型的节点会安装不同的程序包,启动不同的进程,可以简单根据某些进程是否安装和运行作为确定节点身份的标识,当然不能随意安装这些特殊程序包到节点,需要严格的控制,不然会导致节点身份识别混淆。避免该问题最简单的方式就是定制化安装光盘,该光盘预先配置各种节点的安装选项并保证最精简的包安装。除此方式外,还也可以采用其他方式作为确定节点身份的标识。
2节点自动扫描与自动注册
云计算平台具有多种多样的节点类型,各种节点相互配合完成共同的资源管理和调度任务,如计算节点在主控节点的控制下有条不紊的进行着虚拟机生命周期的管理,计算节点实时反馈管理节点关于计算节点的实时资源使用情况,而计算节点上的虚拟机也时刻与存储交互,实时读写数据到存储节点等等。节点集群如此有条理的配合工作离不开一种潜在的节点关系维护。当然我们可以手动配置文件设定每个节点的身份,并手动填写一张关于其他节点身份关系的关系表,这样每个节点就能自动找到各自的合作节点,事实上当前大部分系统都是这样设计的。但是,当云计算系统规模达到一定程度后,手动维护每个节点的节点关系身份表存在一定的难度,同时配置上千台节点工作量较大。
本方案中,节点采用组播或Avahi方式进行自动扫描;将注册信息注册到本地的配置文件中,并在所述配置文件中记录或更新注册时间。组播协议中同一组播组的节点能够收到组播消息,因此可以用来扫描和搜索节点;Avahi是zeroconf协议的实现,它可以在没有DNS服务的局域网里发现基于zeroconf协议的设备和服务,因此也可以用来发现和扫描节点。本发明组播方式,稳定且可靠。当节点扫描和发现后,自动注册到本地的配置文件中,比如xml文件,同时在配置文件记录注册时间。
本方案中可以为每个节点动态生成一张各种节点的关系表,该关系表能够根据节点身份的改变实时变化,具有一定的智能性和实时性。
3节点间的网络心跳检查
云计算系统的节点集群通过数据中心网络互连,是网络就会存在丢包的情况,当出现网络断开,需使其他节点实时感知节点的网络故障。
本方案中,节点间心跳检查包括根据节点的注册时间的刷新间隔作为网络心跳间隔用于检查节点间的网络连通性。
本方案中采用一种被动式的网络心跳检测方法,通过节点关系注册时实时记录注册时间,节点注册是持续随机的,每次注册都会刷新上次注册时记录的注册时间,注册时间频率可以指定,两次注册的注册时间差可以用来当作网络心跳间隔,事实证明,通过这样的方法既实现了节点注册,也间接实现了节点间心跳的检查,同时避免了使用一些故障诊断协议如ICMP带来的额外网络开销。
4节点的初始化检查或运行中检查
云计算系统的智能化不止包括节点身份自动识别和节点间关系自动维护,还包括节点自动初始化操作,如节点服务进程的故障检查与自动恢复功能,存储就绪检查等。
本方案中,节点初始化或运行中检查包括在每个节点开机时自动检测服务进程是否启动、存储挂载是否就绪,在节点运行中检查服务进程是否僵死、服务进程是否退出,存储挂载目录是否就绪,检查到异常后杀死僵死进程、启动服务进程、挂载可用的存储,具有一定的智能性。本过程通过节点组织关系表实时查询当前的目标管理节点,然后将数据发送到目标节点,该过程不需要人工参与配置,是自动完成的,因此具有一定的智能性。
5使用RabbitMQ消息队列机制对故障通知告警消息进行路由和传输
高级消息队列协议(AMQP,Advanced Message Queuing Protocol)是应用层协议的一个开放标准,为面向消息的中间件设计。AMQP的主要特征是面向消息、队列、路由(包括点对点和发布/订阅)、可靠性、安全性要求很严格。AMQP允许来自不同供应商的消息生产者和消费者实现真正的互操作扩展。AMQP是一个线路级的协议,它描述了通过网络传输的字节流的数据格式。RabbitMQ是AMQP的开源实现,基于Erlang语言,具有高性能、健壮以及Scalability的优点。
本发明基于RabbitMQ的这些特征,实现了一个可靠的监控框架,该框架对监控消息进行路由并将监控响应数据发送到指定的处理队列。该方案成熟可靠,效率高效,最主要是简化编程,让开发者不用去关心底层的数据传输和实现,并且能够大大降低云计算系统模块的耦合性。
6监控数据的获取,内存数据库Redis的数据推送
本方案中,所述推送节点监控数据包括将对节点的监控数据实时刷新到Redis数据库,监控数据包括以下参数中的一种或多种:CPU使用率,CPU负载,内存使用率,磁盘空间使用率,磁盘输入和/或输出,网络流量,系统进程运行情况信息。Redis是一种开源的基于Key-Value的轻量级NoSQL数据库,Redis的所有数据可以保存在内存中,也可以持久化到磁盘,具有高性能、高效存储、高可用性和高可扩展性等诸多优势。它结构简单,读写效率高,支持服务器集群,能够处理海量数据,可以应对高并发访问。因此本发明中监控数据的存取基于Redis也具有这些相应的特性。
本过程通过节点组织关系表实时查询当前redis所在的节点,然后将数据发送到目标节点,该过程不需要人工参与配置,是自动完成的,因此具有一定的智能化。
7采用事件循环(Event Loop)轮询机制对节点轮询执行各操作。
GLib中的Main Event Loop可以监控管理所有可用的事件资源。GLib内部实现了Timeout,Idle,Child Watch三种类型的事件源,如文件描述符(普通文件、管道或者套接字)或者超时。用户也可以定义自己的其它类型资源,但这需要使用g_source_attach()进行关联。在Main Event Loop中每一个事件资源都被赋予一个优先级。用户可以指定默认优先级,默认的优先级是G_PRIORITY_DEFAULT,它的值是0。值比0小的意味着更高的优先级。值比0大的意味着更低的优先级。高优先级的事件资源总是比低优先级的事件资源得到优先处理。
通过GSource结构创建新的事件资源类型,新的事件资源类型包括步骤一到步骤六的事件资源,新事件资源类型用一个结构体表示。可以调用g_source_new()创建一个新事件资源类型的实例,这需要将一张函数表(GSourceFuncs)和事件资源结构体的大小传递给g_source_new()函数。其中函数表中的函数决定了新的资源事件的行为。GMainLoop、GMainContext和GSource具有一定的关系,其中每个GMainLoop中只能有一个CMainContext,而每个CMainContext中可以有多个GSource,也就是用户可以同时对多个资源进行轮询。创建好新的资源类型后使用g_source_attach()进行关联,即向GMainLoop中添加关联的资源。向其中添加初始化事件资源之后,就可以调用g_main_loop_run()函数进行轮询,在没有调用g_main_loop_quit()的情况下,程序将阻塞到该函数。继续检查新的从每个事件资源发出的新事件并处理它们。最后,当某个资源发出的事件中调用g_main_loop_quit()时,将会退出Main Event Loop,同时g_main_loop_run()返回。
Event Loop轮询机制中prepare()、check()和dispatch()函数与轮询有关,这三个函数在轮询过程的不同阶段被调用。prepare()在所有的文件描述符被轮询前调用,对于超时事件资源该函数返回TRUE时说明已到定时时间,返回FALSE则说明未到。当所有文件描述符都被轮询完之后将会调用check()函数,对于超时事件资源该函数的返回值的意义与prepare()函数一致。dispatch()函数用于发送事件资源,当prepare()或者check()任意一个返回TRUE时,该函数将被调用。其主要是调用用户的回调函数,实现相应的功能。这三个函数的具体功能需要用户根据需要来实现。
如图2所示,云计算处理设备包括管理模块、操作执行模块、监控数据存储模块。
所述管理模块,用于在节点上设置唯一性软件标识作为节点的身份标识,自动扫描发现其它节点,根据节点的身份标识进行注册并生成节点组织关系表;
所述操作执行模块,用于根据所述节点组织关系表对节点进行下述操作中的一种或多种:节点间心跳检查、节点初始化或运行中检查、路由故障通知告警消息、推送节点监控数据;
所述监控数据存储模块(也称为Redis模块),用于存储和更新节点监控数据。
所述管理模块,还用于在节点上设置唯一性软件标识是指对不同类型节点安装不同的程序包或进程,根据节点上运行的所述程序包或进程识别节点身份;采用组播或Avahi方式进行自动扫描,将注册信息注册到本地的配置文件中,并在所述配置文件中记录或更新注册时间;
所述操作执行模块,还用于根据节点的注册时间的刷新间隔作为网络心跳间隔用于检查节点间的网络连通性;还用于在每个节点开机时自动检测服务进程是否启动、存储挂载是否就绪,在节点运行中检查服务进程是否僵死、服务进程是否退出,存储挂载目录是否就绪,检查到异常后杀死僵死进程、启动服务进程、挂载可用的存储。
所述操作执行模块中包括RabbitMQ子模块,RabbitMQ子模块用于使用RabbitMQ消息队列机制对故障通知告警消息进行路由和传输。
所述操作执行模块,还用于将对节点的监控数据实时刷新到Redis数据库,监控数据包括以下参数中的一种或多种:CPU使用率,CPU负载,内存使用率,磁盘空间使用率,磁盘输入和/或输出,网络流量,系统进程运行情况信息;还用于采用事件循环轮询机制对节点轮询执行所述操作。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。

Claims (7)

1.一种云计算监控框架设计及实现方法,其特征在于,所述方法包括:
在节点上设置唯一性软件标识作为节点的身份标识,节点自动扫描发现其它节点,根据节点的身份标识进行注册并生成节点组织关系表,根据所述节点组织关系表对节点进行下述操作中的一种或多种:节点间心跳检查、节点初始化或运行中检查、路由故障通知告警消息、推送节点监控数据;其中,
所述节点间心跳检查包括根据节点的注册时间的刷新间隔作为网络心跳间隔用于检查节点间的网络连通性;
在节点上设置唯一性软件标识是指对不同类型节点安装不同的程序包或进程,根据节点上运行的所述程序包或进程识别节点身份;
所述节点采用组播或Avahi方式进行自动扫描;
将注册信息注册到本地的配置文件中,并在所述配置文件中记录或更新注册时间。
2.如权利要求1所述的方法,其特征在于,
所述节点初始化或运行中检查包括在每个节点开机时自动检测服务进程是否启动、存储挂载是否就绪,在节点运行中检查服务进程是否僵死、服务进程是否退出,存储挂载目录是否就绪,检查到异常后杀死僵死进程、启动服务进程、挂载可用的存储。
3.如权利要求2所述的方法,其特征在于,
使用RabbitMQ消息队列机制对故障通知告警消息进行路由和传输。
4.如权利要求3所述的方法,其特征在于,
所述推送节点监控数据包括将对节点的监控数据实时刷新到Redis数据库,监控数据包括以下参数中的一种或多种:CPU使用率,CPU负载,内存使用率,磁盘空间使用率,磁盘输入和/或输出,网络流量,系统进程运行情况信息。
5.如权利要求4所述的方法,其特征在于,
采用事件循环轮询机制对节点轮询执行所述操作。
6.一种云计算处理设备,其特征在于,
所述设备包括管理模块、操作执行模块、监控数据存储模块;
所述管理模块,用于在节点上设置唯一性软件标识作为节点的身份标识,自动扫描发现其它节点,根据节点的身份标识进行注册并生成节点组织关系表;
所述操作执行模块,用于根据所述节点组织关系表对节点进行下述操作中的一种或多种:节点间心跳检查、节点初始化或运行中检查、路由故障通知告警消息、推送节点监控数据;
所述监控数据存储模块,用于存储和更新节点监控数据;其中,
所述操作执行模块,还用于根据节点的注册时间的刷新间隔作为网络心跳间隔用于检查节点间的网络连通性;
所述管理模块,还用于在节点上设置唯一性软件标识是指对不同类型节点安装不同的程序包或进程,根据节点上运行的所述程序包或进程识别节点身份;采用组播或Avahi方式进行自动扫描,将注册信息注册到本地的配置文件中,并在所述配置文件中记录或更新注册时间。
7.如权利要求6所述云计算处理设备,其特征在于,
所述操作执行模块,还用于在每个节点开机时自动检测服务进程是否启动、存储挂载是否就绪,在节点运行中检查服务进程是否僵死、服务进程是否退出,存储挂载目录是否就绪,检查到异常后杀死僵死进程、启动服务进程、挂载可用的存储;还用于使用RabbitMQ消息队列机制对故障通知告警消息进行路由和传输;将对节点的监控数据实时刷新到Redis数据库,监控数据包括以下参数中的一种或多种:CPU使用率,CPU负载,内存使用率,磁盘空间使用率,磁盘输入和/或输出,网络流量,系统进程运行情况信息;还用于采用事件循环轮询机制对节点轮询执行所述操作。
CN201210316388.7A 2012-08-30 2012-08-30 一种云计算监控框架设计及实现方法及云计算处理设备 Active CN102868736B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210316388.7A CN102868736B (zh) 2012-08-30 2012-08-30 一种云计算监控框架设计及实现方法及云计算处理设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210316388.7A CN102868736B (zh) 2012-08-30 2012-08-30 一种云计算监控框架设计及实现方法及云计算处理设备

Publications (2)

Publication Number Publication Date
CN102868736A CN102868736A (zh) 2013-01-09
CN102868736B true CN102868736B (zh) 2015-09-02

Family

ID=47447322

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210316388.7A Active CN102868736B (zh) 2012-08-30 2012-08-30 一种云计算监控框架设计及实现方法及云计算处理设备

Country Status (1)

Country Link
CN (1) CN102868736B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103095533A (zh) * 2013-02-22 2013-05-08 浪潮电子信息产业股份有限公司 一种云计算系统平台中的定时监控方法
CN103297542A (zh) * 2013-06-24 2013-09-11 浪潮电子信息产业股份有限公司 一种支持构件在线伸缩的云操作系统总线及均衡方法
CN103500140A (zh) * 2013-09-27 2014-01-08 浪潮电子信息产业股份有限公司 一种快速获知分布式集群节点失效的方法
CN103533058B (zh) * 2013-10-17 2017-02-08 南京大学镇江高新技术研究院 面向HDFS/Hadoop存储集群的资源监控系统及方法
CN104735394B (zh) * 2013-12-19 2019-03-05 广州地铁集团有限公司 一种用于城轨列车的视频点播方法和系统
CN104753968B (zh) * 2013-12-25 2018-01-09 中国电信股份有限公司 云计算跨地域多数据中心及其的调度管理方法
CN103780696A (zh) * 2014-01-23 2014-05-07 北京荣之联科技股份有限公司 基于分布式推送的云监控方法、装置及系统
CN104301159B (zh) * 2014-11-13 2019-01-25 中国建设银行股份有限公司 一种服务器集群的监控方法和系统
CN105357296B (zh) * 2015-10-30 2018-10-23 河海大学 一种Docker云平台下弹性缓存系统
CN105740326B (zh) * 2016-01-21 2021-01-15 腾讯科技(深圳)有限公司 浏览器的线程状态监测方法及装置
CN106997304B (zh) * 2016-01-22 2020-12-04 阿里巴巴集团控股有限公司 输入输出事件的处理方法及设备
CN105912446A (zh) * 2016-04-29 2016-08-31 深圳市永兴元科技有限公司 分布式数据系统失效检测处理方法及装置
CN106899515B (zh) * 2016-08-12 2020-06-16 阿里巴巴集团控股有限公司 监控业务的选取方法及装置、业务监控系统
CN106487599B (zh) * 2016-11-30 2020-02-04 上海斐讯数据通信技术有限公司 云接入控制器运行状态分布式监控的方法和系统
WO2019158975A1 (en) * 2018-02-16 2019-08-22 Pratik Sharma Notification mechanism for cloud administrator
CN109639794B (zh) * 2018-12-10 2021-07-13 杭州数梦工场科技有限公司 一种有状态集群恢复方法、装置、设备及可读存储介质
CN110768862B (zh) * 2019-09-23 2021-03-09 烽火通信科技股份有限公司 一种云平台物理链路连通性检测装置、方法及系统
CN113986444A (zh) * 2021-11-19 2022-01-28 深圳前海移联科技有限公司 软件系统提示语的通用管理方法、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1924810A (zh) * 2005-09-02 2007-03-07 中兴通讯股份有限公司 一种业务进程的分布式分优先级监控方法
CN101207517A (zh) * 2007-12-12 2008-06-25 浙江大学 一种分布式企业服务总线节点可靠性维护方法
CN101227479A (zh) * 2008-02-02 2008-07-23 杭州华三通信技术有限公司 拓扑联动方法及装置
CN102118274A (zh) * 2009-12-30 2011-07-06 中国移动通信集团公司 一种状态监控方法、装置和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1924810A (zh) * 2005-09-02 2007-03-07 中兴通讯股份有限公司 一种业务进程的分布式分优先级监控方法
CN101207517A (zh) * 2007-12-12 2008-06-25 浙江大学 一种分布式企业服务总线节点可靠性维护方法
CN101227479A (zh) * 2008-02-02 2008-07-23 杭州华三通信技术有限公司 拓扑联动方法及装置
CN102118274A (zh) * 2009-12-30 2011-07-06 中国移动通信集团公司 一种状态监控方法、装置和系统

Also Published As

Publication number Publication date
CN102868736A (zh) 2013-01-09

Similar Documents

Publication Publication Date Title
CN102868736B (zh) 一种云计算监控框架设计及实现方法及云计算处理设备
CN111506412B (zh) 基于Airflow的分布式异步任务构建、调度系统及方法
CN111447103B (zh) 虚拟设备的管理系统及方法、电子设备及介质
CN109150987B (zh) 基于主机层和容器层的两层式容器集群弹性扩容方法
US10275326B1 (en) Distributed computing system failure detection
CN102880503A (zh) 数据分析系统及数据分析方法
CN110795503A (zh) 分布式存储系统的多集群数据同步方法及相关装置
CN112394947B (zh) 一种基于微服务架构的信息系统
US10498817B1 (en) Performance tuning in distributed computing systems
CN107491371B (zh) 一种监控部署的方法以及装置
CN107908488B (zh) 消息请求接口交互方法、装置、计算机设备及存储介质
CN104579792A (zh) 多适配方式实现多种类型虚拟资源集中管理架构及方法
US20110246748A1 (en) Managing Sensor and Actuator Data for a Processor and Service Processor Located on a Common Socket
CN112230987B (zh) 一种分布式模块化插件框架实现系统及方法
CN112882792B (zh) 信息加载方法、计算机设备及存储介质
CN113656195A (zh) 服务消息通道管理方法、装置和电子设备
CN111078238A (zh) 容器环境下应用配置集中处理方法及装置
CN111064626A (zh) 配置更新方法、装置、服务器及可读存储介质
CN116708266A (zh) 一种云服务拓扑图实时更新方法、装置、设备及介质
CN115562757A (zh) 数据处理方法、配置中心系统、电子设备及存储介质
CN113760447A (zh) 服务管理方法、装置、设备、存储介质及程序产品
CN115037757B (zh) 一种多集群服务管理系统
US10110502B1 (en) Autonomous host deployment in managed deployment systems
CN110913018A (zh) 一种分布式调控服务系统
CN103067507A (zh) 互联网云计算资源虚拟化封装系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant