CN105915405A - 一种大型集群节点性能监控系统 - Google Patents

一种大型集群节点性能监控系统 Download PDF

Info

Publication number
CN105915405A
CN105915405A CN201610186971.9A CN201610186971A CN105915405A CN 105915405 A CN105915405 A CN 105915405A CN 201610186971 A CN201610186971 A CN 201610186971A CN 105915405 A CN105915405 A CN 105915405A
Authority
CN
China
Prior art keywords
agent
node
agent node
management platform
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610186971.9A
Other languages
English (en)
Inventor
李发明
张建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Toyou Feiji Electronics Co., Ltd.
Original Assignee
SHENZHEN ZHONGBO KECHUANG INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN ZHONGBO KECHUANG INFORMATION TECHNOLOGY Co Ltd filed Critical SHENZHEN ZHONGBO KECHUANG INFORMATION TECHNOLOGY Co Ltd
Priority to CN201610186971.9A priority Critical patent/CN105915405A/zh
Publication of CN105915405A publication Critical patent/CN105915405A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0246Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols
    • H04L41/0273Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols using web services for network management, e.g. simple object access protocol [SOAP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及一种大型集群节点的性能监控系统,其特征在于:包括监控管理平台、代理节点集群和代理客户端。本发明提供的性能监控系统,其监控管理平台负责代理节点集群内所有成员的监控任务分配和调度,监控配置文件统一由监控管理平台推送至代理节点集群内的成员;而代理节点集群内所有节点间进行冗余检查和数据同步,当有代理节点失效时,监控管理平台根据剩余节点的负载将原本由该失效代理节点执行的监控任务分配给其他正常的节点,该过程不会影响或中断监控,从而有效地保证了监控系统的正常运行。

Description

一种大型集群节点性能监控系统
技术领域
本发明涉及一种大型集群节点的性能监控系统,尤其涉及一种安全、高可用且便于大规模动态扩展大型集群节点的性能监控系统。
背景技术
目前的数据中心管理员一般是通过监控系统及时了解和监管服务器的运行情况,并在服务器发生异常情况时快速解决问题,以保证服务器的安全、稳定与可靠。监控信息也为业务运行情况分析和改进提供了重要的参考数据。
当前主流的监控系统通常的框架为监控服务端、代理客户端两层架构模式或者是监控服务端、代理节点、代理客户端三层架构。这些主流监控系统无论有无代理节点,其服务端冗余多采用双机备份技术节点,因此扩展受到限制,其次,这些监控系统的多个代理节点间都是各自监控各自的目标互不通信,一个代理节点损坏则其所有监控业务中断。因此现有的监控系统难以满足监控资源庞大的环境,尤其是不能适应云计算技术成熟应用的环境。
发明内容
本发明要解决的技术问题,是提供一种安全、高可用且便于大规模动态扩展大型集群节点的性能监控系统。
本发明要解决的第一个技术问题,可以通过以下的技术方案来实现:一种大型集群节点的性能监控系统,其特征在于:包括监控管理平台、代理节点集群和代理客户端,其中,
所述监控管理平台,用于为每个代理节点分配监控任务,并根据各代理节点报告的状态将无法提供服务的节点的监控任务分配到正常的节点;
所述代理节点集群,其由若干互为冗余的代理节点配置后形成,各代理节点用于根据接收到的监控管理平台分配的任务,向代理客户端提取数据,且各代理节点对获取的数据进行同步;各代理节点还用于向监控管理平台主动报告自己的运行状态;
所述代理客户端,用于获取数据,并在接收到上层代理节点发送的请求后将数据提供给上层代理节点集群内相应的代理节点。
本发明提供的性能监控系统,其监控管理平台负责代理节点集群内所有成员的监控任务分配和调度,监控管理平台将记录着代理节点集群的成员信息、配置同步时间、向管理平台提交自己状态的时间等配置文件推送至代理节点集群内的成员;而代理节点集群内每个代理节点间均可互相通信,依据监控管理平台推送的配置信息以使所有代理节点间进行冗余检查和数据同步,当有代理节点失效时,监控管理平台将原本由该失效代理节点执行的监控任务分配给其他正常的节点,由于这一过程时间极短,该过程不会影响或中断监控,从而有效地保证了监控系统的正常运行。即本发明提供的监控系统可根据代理节点集群当前的运行情况进行动态任务分配和负载均衡管理,大幅度提升监控系统的高可靠性和安全性。同时由于代理节点集群内成员互为冗余,本监控系统可根据监控业务量的增大,动态地向代理节点集群中加入新的节点,而不会影响现有代理节点和监控业务。当有新节点加入到代理节点集群中时,代理节点集群和监控管理平台都会更新现有集群内节点信息,进行任务的负载均衡调整理。
作为本发明的一个优选实施例,所述监控管理平台,用于按照代理节点集群中各代理节点的性能设置权重为每个代理节点分配监控任务,并根据各代理节点报告的状态将无法提供服务的节点的监控任务依据正常节点的负载状态和权重分配到正常的节点。本实施例提供的监控系统在具体重新分配失效代理节点的监控任务时可根据实际环境选择正常代理节点的负载状态优先或者权重优先。各代理节点的权重取值可依据该代理节点的计算能力,依次由该节点的CPU处理能力、内存、网络质量,权重越大,节点分配的任务较其他节点则越多;CPU处理能力越强,内存越大、网络质量越好则负载状态由节点操作系统的loadaverage值决定,越小则可承载的任务较其他节点越多。
本发明所述代理节点集群通过网络心跳机制检测集群内各代理节点是否良好运行。
在上述基础上,本发明所述代理节点集群中各代理节点按预设的时间间隔向监控管理平台发送自己当前的负载信息,成功则表示其运行正常,不成功则视为异常,按节点失效处理;设置简单、方便。
本发明所述代理节点集群,其各代理节点还用于对接受到来自代理客户端的数据进行格式处理后输出至外部数据库;格式处理主要是提取有用的指标数据,在实际设置时,可根据后续分析的需求选择合适的格式处理,以便去除多余信息、方便数据库存储并节省空间。比如load average值、cpu利用率、磁盘利用率、内存利用率等,以便为监控管理平台进行数据展示、异常报警、趋势分析提供源数据。数据库可以采用比较成熟的MySQL Cluster技术,也可以采用其他支持集群技术的商用数据库。
在上述基础上,本发明所述监控管理平台,还用于预设接收地址,并在获取的数据中有异常状态或指标时,自动触发报警服务,向预设的接收地址发送异常报警信息。在实际应用时,可选择预设邮件地址和/或短信地址,以便管理员及时、方便地接收相应的报警信息,实时作出适当的处理。
在上述基础上,本发明所述监控管理平台,还用于配置用作报警服务的依据的监控指标阀值;比如管理员经由管理平台设置load average、cpu利用率、磁盘利用率、内存利用率等指标的阀值,当超过阀值时即触发邮件和/或短信报警服务。
本发明所述代理客户端,用于向所在应用服务器不间断的获取相应的资源数据,并将数据提供给上层的代理节点。考滤到对应用服务器的影响代理客户端的CPU和内存占用不应超过应用服务器的1%。
本发明所述代理客户端安装在监控主机上。
本发明所述监控管理平台为一基于WEB服务的管理平台;该WEB服务管理平台可实现数据展示及所有监控业务的管理功能,包括代理节点集群、监控任务调度、应用服务器监控资源和指标配置、监控异常情况的邮件或短信报警,同时提供监控数据的处理、图表展示、报警、日志、业务趋势分析等,实现合理高效的整合和管理所有监控框架中涉及的所有资源;同时还可以结合开源领域已有的成熟双机热备或其他集群技术来实现统一监控管理平台的冗余性,提高其安全和可用性。
附图说明
图1是本发明的结构示意图。
具体实施方式
图1所示的大型集群节点性能监控系统是本发明的实施例,其包括监控统管理平台、代理节点集群和代理客户端。
其中,监控管理平台,其为一基于WEB服务的管理平台;用于按照代理节点集群中各代理节点的性能设置权重为每个代理节点分配监控任务,并根据各代理节点报告的状态将无法提供服务的节点的监控任务依据正常节点的负载状态和权重分配到正常的节点。各代理节点的权重取值依据每个节点的计算能力,一般依次为节点的CPU处理能力、内存、网络质量,CPU处理能力越强,内存越大、网络质量越好则权重越大,节点分配的任务较其他节点则越多。负载状态由节点操作系统的load average值决定,越小则可承载的任务较其他节点越多。监控管理平台还用于配置用作报警服务的依据的监控指标阀值和预设接收地址,并在获取的数据中有异常状态或指标时(即当超过阀值时即触发邮件和/或短信报警服务),自动触发报警服务,向预设的接收地址发送异常报警信息。
代理节点集群,其由若干互为冗余的代理节点配置后形成,每个节点间均可互相通信,并保存一份所有节点的IP、主机名等信息,通过网络心跳机制检测集群内节点是否良好运行;各代理节点用于根据接收到的监控管理平台分配置的任务、向代理客户端提取数据,且各代理节点对获取的数据进行同步;各代理节点还用于向监控管理平台主动报告自己的状态;即按设定的时间间隔向监控管理平台发送自己当前的负载信息,成功则表示其运行正常,一段时间内不成功则视为异常,按节点失效处理;各代理节点还用于对接受到来自代理客户端的数据进行格式处理后输出至外部数据库。各代理节点还用于对接受到来自代理客户端的数据进行格式处理后输出至外部数据库。
代理客户端,其安装在监控主机上;用于获取数据,并在接收到上层代理节点发送的请求后向所在应用服务器不间断的获取相应的资源数据,并将数据提供给上层的代理节点。
本发明提供的性能监控系统,其监控管理平台负责代理节点集群内所有成员的监控任务分配和调度,监控管理平台将记录着代理节点集群的成员信息、配置同步时间、向管理平台提交自己状态的时间等配置文件推送至代理节点集群内的成员;而代理节点集群内所有节点间均可互相通信,依据监控管理平台推送的配置信息以使所有代理节点间进行冗余检查和数据同步,当有代理节点失效时,监控管理平台根据剩余节点的负载或者权重将原本由该失效代理节点执行的监控任务分配给其他正常的节点,如图1所示,其中实线部分即为该节点当前的监控对象,虚拟部分即为其他节点坏掉后该节点可以接管的监控对象。该对正常代理节点重新分配监控任务过程不会影响或中断监控,从而有效地保证了监控系统的正常运行。即本发明提供的监控系统可根据代理节点集群当前的运行情况进行动态任务分配和负载均衡管理,大幅度提升监控系统的高可靠性和安全性。同时由于代理节点集群内成员互为冗余,本监控系统可根据监控业务量的增大,动态地向代理节点集群中加入新的节点,而不会影响现有代理节点和监控业务。当有新节点加入到集群中时,集群和统一监控管理平台都会更新现有集群内节点信息,统一监控管理平台还会根据新集群的负载状态和权重,进行任务的负载均衡调整理。

Claims (10)

1.一种大型集群节点的性能监控系统,其特征在于:包括监控统一管理平台、代理节点集群和代理客户端,其中,
所述监控管理平台,用于为每个代理节点分配监控任务,并将无法提供服务的节点的监控任务分配到正常的节点;
所述代理节点集群,其由若干互为冗余的代理节点配置后形成,各代理节点用于根据接收到的监控管理平台分配的任务,向代理客户端提取数据;且各代理节点对获取的数据进行同步;各代理节点还用于向监控管理平台主动报告自己的状态;
所述代理客户端,用于获取数据,并在接收到上层代理节点发送的请求后将数据提供给上层代理节点集群内相应的代理节点。
2.根据权利要求1所述的系统,其特征在于:所述监控管理平台,用于按照代理节点集群中各代理节点的性能设置权重为每个代理节点分配监控任务,并根据各代理节点报告的状态将无法提供服务的节点的监控任务依据正常节点的负载状态和权重分配到正常的节点。
3.根据权利要求1所述的系统,其特征在于:所述代理节点集群通过网络心跳机制检测集群内各代理节点是否良好运行。
4.根据权利要求2所述的系统,其特征在于:所述代理节点集群中各代理节点按预设的时间间隔向监控管理平台发送自己当前的负载信息,成功则表示其运行正常,不成功则视为异常,按节点失效处理。
5.根据权利要求1所述的系统,其特征在于:所述代理节点集群,其各代理节点接还用于对接受到来自代理客户端的数据进行格式处理后输出至外部数据库。
6.根据权利要求5所述的系统,其特征在于:所述监控管理平台,还用于预设接收地址,并在获取的数据中有异常状态或指标时,自动触发报警服务,向预设的接收地址发送异常报警信息。
7.根据权利要求5或6所述的系统,其特征在于:所述监控管理平台,还用于配置用作报警服务的依据的监控指标阀值。
8.根据权利要求1所述的系统,其特征在于:所述代理客户端,用于向所在应用服务器不间断的获取相应的资源数据,并将数据提供给上层的代理节点。
9.根据权利要求1所述的系统,其特征在于:所述代理客户端安装在监控主机上。
10.根据权利要求1所述的系统,其特征在于:所述监控管理平台为一基于WEB服务的管理平台。
CN201610186971.9A 2016-03-29 2016-03-29 一种大型集群节点性能监控系统 Pending CN105915405A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610186971.9A CN105915405A (zh) 2016-03-29 2016-03-29 一种大型集群节点性能监控系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610186971.9A CN105915405A (zh) 2016-03-29 2016-03-29 一种大型集群节点性能监控系统

Publications (1)

Publication Number Publication Date
CN105915405A true CN105915405A (zh) 2016-08-31

Family

ID=56745143

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610186971.9A Pending CN105915405A (zh) 2016-03-29 2016-03-29 一种大型集群节点性能监控系统

Country Status (1)

Country Link
CN (1) CN105915405A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106713014A (zh) * 2016-11-30 2017-05-24 华为技术有限公司 一种监控系统中的被监控主机、监控系统以及监控方法
CN106851213A (zh) * 2017-03-06 2017-06-13 深圳市博信诺达经贸咨询有限公司 监控系统中云平台的分组任务分配方法及系统
CN107018010A (zh) * 2017-03-07 2017-08-04 杭州承联通信技术有限公司 一种pdt集群核心网系统及其容灾切换方法
CN107276849A (zh) * 2017-06-15 2017-10-20 北京奇艺世纪科技有限公司 一种集群的性能分析方法及装置
CN107453909A (zh) * 2017-08-08 2017-12-08 北京盛华安信息技术有限公司 安全事件的处理方法
CN108055342A (zh) * 2017-12-26 2018-05-18 北京奇艺世纪科技有限公司 一种数据监控方法及装置
CN108199896A (zh) * 2018-01-16 2018-06-22 中电福富信息科技有限公司 基于RabbitMQ的分布式消息发布系统
CN108881437A (zh) * 2018-05-22 2018-11-23 四川斐讯信息技术有限公司 一种智能终端的代理决策方法
CN109240126A (zh) * 2018-11-21 2019-01-18 国网湖北省电力有限公司电力科学研究院 一种具有模拟操作功能的分布式应用服务监测系统及方法
CN109614283A (zh) * 2018-10-24 2019-04-12 世纪龙信息网络有限责任公司 分布式数据库集群的监控系统
CN109660426A (zh) * 2018-12-14 2019-04-19 泰康保险集团股份有限公司 监控方法及系统、计算机可读介质和电子设备
CN109743230A (zh) * 2019-02-18 2019-05-10 国家计算机网络与信息安全管理中心 基于统计信息的监控数据传输系统
CN109962951A (zh) * 2017-12-25 2019-07-02 航天信息股份有限公司 云平台监控数据系统
CN110377483A (zh) * 2019-06-28 2019-10-25 浪潮电子信息产业股份有限公司 服务器监控系统及方法
CN111092754A (zh) * 2019-11-29 2020-05-01 贝壳技术有限公司 实时接入服务系统及其实现方法
CN112115016A (zh) * 2020-08-06 2020-12-22 北京健康之家科技有限公司 应用性能监控系统
CN115904822A (zh) * 2022-12-21 2023-04-04 长春吉大正元信息技术股份有限公司 一种集群修复方法及装置
CN117435338A (zh) * 2023-10-15 2024-01-23 三一智能装备有限公司 负载均衡方法、装置、电子设备及存储介质
CN117596175A (zh) * 2024-01-17 2024-02-23 苏州元脑智能科技有限公司 一种交换机分层监控方法、装置、设备、系统及存储介质
WO2024139937A1 (zh) * 2022-12-28 2024-07-04 天翼数字生活科技有限公司 一种基于边缘计算的直播拉流监测方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030005091A1 (en) * 2001-06-29 2003-01-02 International Business Machines Corporation Method and apparatus for improved monitoring in a distributed computing system
CN103401947A (zh) * 2013-08-20 2013-11-20 曙光信息产业(北京)有限公司 多个服务器的任务分配方法和装置
CN103701661A (zh) * 2013-12-23 2014-04-02 浪潮(北京)电子信息产业有限公司 一种实现节点监控的方法及系统
CN104252401A (zh) * 2014-08-29 2014-12-31 北京阅联信息技术有限公司 一种基于权重的设备状态判断方法及其系统
CN104935482A (zh) * 2015-06-26 2015-09-23 曙光信息产业(北京)有限公司 分布式监控系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030005091A1 (en) * 2001-06-29 2003-01-02 International Business Machines Corporation Method and apparatus for improved monitoring in a distributed computing system
CN103401947A (zh) * 2013-08-20 2013-11-20 曙光信息产业(北京)有限公司 多个服务器的任务分配方法和装置
CN103701661A (zh) * 2013-12-23 2014-04-02 浪潮(北京)电子信息产业有限公司 一种实现节点监控的方法及系统
CN104252401A (zh) * 2014-08-29 2014-12-31 北京阅联信息技术有限公司 一种基于权重的设备状态判断方法及其系统
CN104935482A (zh) * 2015-06-26 2015-09-23 曙光信息产业(北京)有限公司 分布式监控系统及方法

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106713014A (zh) * 2016-11-30 2017-05-24 华为技术有限公司 一种监控系统中的被监控主机、监控系统以及监控方法
CN106713014B (zh) * 2016-11-30 2020-01-10 华为技术有限公司 一种监控系统中的被监控主机、监控系统以及监控方法
CN106851213A (zh) * 2017-03-06 2017-06-13 深圳市博信诺达经贸咨询有限公司 监控系统中云平台的分组任务分配方法及系统
CN107018010A (zh) * 2017-03-07 2017-08-04 杭州承联通信技术有限公司 一种pdt集群核心网系统及其容灾切换方法
CN107276849A (zh) * 2017-06-15 2017-10-20 北京奇艺世纪科技有限公司 一种集群的性能分析方法及装置
CN107453909A (zh) * 2017-08-08 2017-12-08 北京盛华安信息技术有限公司 安全事件的处理方法
CN109962951A (zh) * 2017-12-25 2019-07-02 航天信息股份有限公司 云平台监控数据系统
CN108055342A (zh) * 2017-12-26 2018-05-18 北京奇艺世纪科技有限公司 一种数据监控方法及装置
CN108199896A (zh) * 2018-01-16 2018-06-22 中电福富信息科技有限公司 基于RabbitMQ的分布式消息发布系统
CN108881437A (zh) * 2018-05-22 2018-11-23 四川斐讯信息技术有限公司 一种智能终端的代理决策方法
CN109614283B (zh) * 2018-10-24 2022-04-08 天翼数字生活科技有限公司 分布式数据库集群的监控系统
CN109614283A (zh) * 2018-10-24 2019-04-12 世纪龙信息网络有限责任公司 分布式数据库集群的监控系统
CN109240126A (zh) * 2018-11-21 2019-01-18 国网湖北省电力有限公司电力科学研究院 一种具有模拟操作功能的分布式应用服务监测系统及方法
CN109240126B (zh) * 2018-11-21 2024-03-08 国网湖北省电力有限公司电力科学研究院 一种具有模拟操作功能的分布式应用服务监测系统及方法
CN109660426A (zh) * 2018-12-14 2019-04-19 泰康保险集团股份有限公司 监控方法及系统、计算机可读介质和电子设备
CN109743230A (zh) * 2019-02-18 2019-05-10 国家计算机网络与信息安全管理中心 基于统计信息的监控数据传输系统
CN110377483A (zh) * 2019-06-28 2019-10-25 浪潮电子信息产业股份有限公司 服务器监控系统及方法
CN110377483B (zh) * 2019-06-28 2022-07-22 浪潮电子信息产业股份有限公司 服务器监控系统及方法
CN111092754B (zh) * 2019-11-29 2022-07-29 贝壳技术有限公司 实时接入服务系统及其实现方法
CN111092754A (zh) * 2019-11-29 2020-05-01 贝壳技术有限公司 实时接入服务系统及其实现方法
CN112115016A (zh) * 2020-08-06 2020-12-22 北京健康之家科技有限公司 应用性能监控系统
CN115904822A (zh) * 2022-12-21 2023-04-04 长春吉大正元信息技术股份有限公司 一种集群修复方法及装置
WO2024139937A1 (zh) * 2022-12-28 2024-07-04 天翼数字生活科技有限公司 一种基于边缘计算的直播拉流监测方法及装置
CN117435338A (zh) * 2023-10-15 2024-01-23 三一智能装备有限公司 负载均衡方法、装置、电子设备及存储介质
CN117596175A (zh) * 2024-01-17 2024-02-23 苏州元脑智能科技有限公司 一种交换机分层监控方法、装置、设备、系统及存储介质
CN117596175B (zh) * 2024-01-17 2024-04-16 苏州元脑智能科技有限公司 一种交换机分层监控方法、装置、设备、系统及存储介质

Similar Documents

Publication Publication Date Title
CN105915405A (zh) 一种大型集群节点性能监控系统
CN106776212B (zh) 容器集群部署多进程应用的监管系统及方法
US7657580B2 (en) System and method providing virtual applications architecture
CN103677967B (zh) 一种数据库的远程数据服务系统及任务调度方法
US9641449B2 (en) Variable configurations for workload distribution across multiple sites
CN112084098A (zh) 资源监控系统及工作方法
CN112565415B (zh) 一种基于云边协同的跨地域资源纳管系统和纳管方法
CN102664747B (zh) 一种云计算平台系统
CN105703940A (zh) 一种面向多级调度分布式并行计算的监控系统及监控方法
US20150026125A1 (en) System and method for synchronizing data between communication devices in a networked environment without a central server
US9164864B1 (en) Minimizing false negative and duplicate health monitoring alerts in a dual master shared nothing database appliance
CN112506702B (zh) 数据中心容灾方法、装置、设备及存储介质
US9047126B2 (en) Continuous availability between sites at unlimited distances
CN110175089A (zh) 一种具有读写分离功能的双活灾备系统
CN105302670B (zh) 一种采用多机冗余方式对车站进行监控的方法及装置
CN114265753A (zh) 消息队列的管理方法、管理系统和电子设备
CN110545197B (zh) 节点状态监控方法及装置
CN116185697B (zh) 容器集群管理方法、装置、系统、电子设备及存储介质
CN112631756A (zh) 一种应用于航天测控软件的分布式调控方法及装置
CN104486447A (zh) 基于Big-Cluster的大平台集群系统
CN109510730A (zh) 分布式系统及其监控方法、装置、电子设备及存储介质
Imran et al. Cloud-niagara: A high availability and low overhead fault tolerance middleware for the cloud
CN116010169A (zh) 一种基于云原生技术的云平台rds数据库迁移容灾方法
CN102185720A (zh) 一种北向通知管理接口装置及其管理方法
CN116233245A (zh) 异地多活系统及其信息处理方法、配置服务器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20190905

Address after: 100089 Floor 1-4, No. 2 Building, No. 9 Courtyard, Dijin Road, Haidian District, Beijing

Applicant after: Beijing Toyou Feiji Electronics Co., Ltd.

Address before: 518000 Room 1402, Feiyada Science and Technology Building, Nanshan District, Shenzhen City, Guangdong Province

Applicant before: Shenzhen Zhongbo Kechuang Information Technology Co., Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20160831

RJ01 Rejection of invention patent application after publication