CN111026602A - 一种云平台的健康巡检调度管理方法、装置及电子设备 - Google Patents

一种云平台的健康巡检调度管理方法、装置及电子设备 Download PDF

Info

Publication number
CN111026602A
CN111026602A CN201911006893.XA CN201911006893A CN111026602A CN 111026602 A CN111026602 A CN 111026602A CN 201911006893 A CN201911006893 A CN 201911006893A CN 111026602 A CN111026602 A CN 111026602A
Authority
CN
China
Prior art keywords
inspection
routing
task
health
routing inspection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911006893.XA
Other languages
English (en)
Inventor
陈秉蔚
张洪涛
李寒雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fiberhome Telecommunication Technologies Co Ltd
Original Assignee
Fiberhome Telecommunication Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fiberhome Telecommunication Technologies Co Ltd filed Critical Fiberhome Telecommunication Technologies Co Ltd
Priority to CN201911006893.XA priority Critical patent/CN111026602A/zh
Publication of CN111026602A publication Critical patent/CN111026602A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种云平台的健康巡检调度管理方法、装置及电子设备,该方法包括:获取用户自定义的巡检策略和巡检阈值,根据所述巡检策略、云平台中的节点数量以及节点类型创建巡检任务,生成远程调用请求并将其异步发送至各节点;响应于远程调用请求选择执行与巡检任务对应的巡检脚本,采集对应节点的巡检数据;获取巡检数据,根据巡检数据和巡检阈值分别判断各节点的巡检对象是否健康,并基于判断结果生成巡检结果表;本发明将巡检任务异步发送至各节点上,巡检任务通过各节点异步执行并主动上报来完成,巡检请求与巡检任务的执行属于异步过程,巡检效率高,对系统性能影响小;且多个巡检任务同时执行但互不影响,容错率高。

Description

一种云平台的健康巡检调度管理方法、装置及电子设备
技术领域
本发明属于云平台巡检技术领域,更具体地,涉及一种云平台的健康巡检调度管理方法、装置及电子设备。
背景技术
传统的数据中心服务模式下,运维人员需要对物理资源、云服务状态、云平台组件等进行周期性巡检。随着国内外云计算技术以及产品逐步成熟,云平台在各行业中的应用更加广泛,基于云计算产品的数据中心数量规模以及复杂度逐步上升,运维人员的手工巡检方式已经无法适应新的需求,因此基于云平台的数据中心需要更多的依赖自动化运维系统来完成周期性的巡检。
对于大规模的数据中心,其包含的节点数量庞大,每次完整巡检的任务量大、时间长,需要对复杂的巡检任务进行编排处理,满足更为灵活的应用场景,因此对于巡检的任务编排能力提出了较高的要求。
一般情况下,自动化运维过程中巡检任务如图1所示,平台健康巡检系统会根据设置的巡检时间自动开始对平台中的各节点进行巡检,在各节点上通过巡检脚本的执行获取到各节点上的巡检结果,生成巡检报告并通过FTP服务器、邮箱服务器等发送,整个过程几乎是个同步的流程,通过一次巡检请求来完成。然而在某些应用场景下,该方法会产生以下问题:
1、单次巡检任务请求流程太长,资源利用效率太低。
2、在云平台规模较大的情况下,由于巡检任务量较大,整体时间长,同步巡检请求会对巡检节点造成较大的负载压力。并且在openstack环境下长时间可能导致认证过期的问题。
3、容错率较低,某些节点的巡检失败可能导致整个巡检任务不成功,而使得其他节点的巡检数据无法被成功获取到。
发明内容
针对现有技术的至少一个缺陷或改进需求,本发明提供了一种云平台的健康巡检调度管理方法、装置及电子设备,其目的在于解决现有的自动化巡检方式存在的巡检任务请求流程太长、资源利用效率太低,同步巡检请求会对巡检节点造成较大的负载压力以及容错率低的问题。
为实现上述目的,按照本发明的第一个方面,提供了一种云平台的健康巡检调度管理方法,其特征在于,包括:
获取用户自定义的巡检策略和巡检阈值,根据所述巡检策略、云平台中的节点数量以及节点类型创建巡检任务,生成远程调用请求并将其异步发送至各节点;
响应于所述远程调用请求选择执行与巡检任务对应的巡检脚本,采集对应节点的巡检数据;
获取所述巡检数据,根据所述巡检数据和巡检阈值分别判断各节点的巡检对象是否健康,并基于判断结果生成巡检结果表。
优选的,上述健康巡检调度管理方法还包括:
实时监测和更新巡检任务的执行状态,所述执行状态包括任务建立、任务失败、执行中和任务完成。
优选的,上述健康巡检调度管理方法,所述巡检任务包括本次巡检需要执行的子任务以及各子任务对应的巡检策略。
优选的,上述健康巡检调度管理方法,所述巡检策略包括巡检节点、各巡检节点中的巡检对象及其所包含的巡检子对象、各巡检子对象对应的巡检开始时间和/或频率;所述巡检阈值为各巡检子对象的健康标准值。
按照本发明的第二个方面,还提供了一种云平台的健康巡检调度管理装置,包括:
调度管理模块,用于获取用户自定义的巡检策略和巡检阈值,根据所述巡检策略、云平台中的节点数量以及节点类型创建巡检任务,生成远程调用请求并将其异步发送至各执行模块;
并用于获取各执行模块的巡检数据,根据所述巡检阈值和巡检数据分别判断各节点的巡检对象是否健康,并基于判断结果生成巡检结果表;
多个执行模块,分别配置于待巡检的各节点上,响应于调度管理模块发送的远程调用请求选择执行与巡检任务对应的巡检脚本,采集对应节点的巡检数据。
优选的,上述健康巡检调度管理装置还包括状态监测模块,用于实时监测和更新巡检任务的执行状态,所述执行状态包括任务建立、任务失败、执行中和任务完成。
优选的,上述健康巡检调度管理装置还包括存储模块和查询模块;
所述存储模块用于存储用户自定义的巡检策略和巡检阈值,以及调度管理模块生成的巡检结果表;
所述查询模块用于接收外部的查询请求,根据查询请求提取并输出所述存储模块中的巡检结果表。
优选的,上述健康巡检调度管理装置,所述巡检任务包括本次巡检需要执行的子任务以及各子任务对应的巡检策略。
优选的,上述健康巡检调度管理方法,所述巡检策略包括巡检节点、各巡检节点中的巡检对象及其所包含的巡检子对象、各巡检子对象对应的巡检开始时间和/或频率;
所述巡检阈值为各巡检子对象的健康标准值。
按照本发明的第三个方面,还提供了一种电子设备,包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行上述任一项所述方法的步骤。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
本发明提供的一种云平台的健康巡检调度管理方法、装置及电子设备,调度管理模块将巡检任务异步发送至各节点上的执行模块,由执行模块去执行巡检脚本对对应的节点进行巡检,并在对应节点上的巡检任务完成后主动请求调度管理模块去更新巡检任务状态,巡检请求与巡检任务的执行属于异步过程,优点在于:
(1)容错率高,部分节点巡检异常出错不影响其他节点的巡检结果以及巡检任务进程;
(2)对各个节点的巡检任务通过各节点异步执行并主动上报来完成,效率高,对系统性能影响小;
(3)在多个巡检任务同时进行的时候,互不影响,且在大规模场景下不会出现超时等问题。
附图说明
图1是传统的自动化运维过程的巡检流程图;
图2是实施例一提供的健康巡检调度管理方法的流程图;
图3是实施例一提供的健康巡检调度管理装置的逻辑框图;
图4是实施例二提供的健康巡检调度管理装置的组成架构示意图;
图5是实施例二提供的健康巡检调度管理方法的交互流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
实施例一
图2是本实施例提供的一种云平台的健康巡检调度管理方法的流程图,参见图2,该方法包括以下步骤:
S1:获取用户自定义的巡检策略和巡检阈值,根据所述巡检策略、云平台中的节点数量以及节点类型创建巡检任务,生成远程调用请求并将其异步发送至各节点;
首先采集用户自行设置的巡检策略和巡检阈值并存储在数据库中,根据该巡检策略、云平台中的节点数量和节点类型创建巡检任务并记录本次巡检的所有子任务;该巡检任务包括本次巡检需要执行的子任务以及各子任务对应的巡检策略;巡检策略包括巡检节点、各巡检节点中的巡检对象及其所包含的巡检子对象、各巡检子对象对应的巡检开始时间和/或频率;巡检阈值代表各巡检子对象的健康标准值;本实施例中,将各节点中不同的巡检对象或巡检子对象的巡检事件定义为本次巡检任务中的一个子任务。
另外,创建的巡检任务具有一个唯一标识码,该唯一标识码作为后续请求的标示;巡检任务创建完成后,生成针对该巡检任务的远程调用请求并将该远程调用请求异步发送至各节点,本实施例中采用广播的方式发送远程调用请求。
S2:响应于所述远程调用请求选择执行与巡检任务对应的巡检脚本,采集对应节点的巡检数据;
各节点接收到远程调用请求后,根据与远程调用请求对应的巡检任务判断需要执行的巡检脚本,执行对应的巡检脚本并采集巡检数据。
S3:获取所述巡检数据,根据所述巡检数据和巡检阈值分别判断各节点的巡检对象是否健康,并基于判断结果生成巡检结果表。
获取各节点的巡检数据,根据数据库中存储的巡检阈值判断各节点中的巡检对象是否健康,并将结果写入巡检结果表中,该巡检结果表同样存储在数据库中。
作为本实施例的一个优选示例,上述健康巡检调度管理方法还包括:
S4:接收用户的查询请求,根据该查询请求提取数据库中的巡检结果表并进行输出显示。
作为本实施例的一个优选示例,上述健康巡检调度管理方法还包括:实时监测和更新巡检任务的执行状态,该执行状态包括任务建立、任务失败、执行中和任务完成。
本实施例还提供了一种云平台的健康巡检调度管理装置,该装置可以采用软件和/或硬件的方式实现,并可集成在电子设备上。参见图3所示,该装置包括调度管理模块和多个执行模块,其中,
调度管理模块用于获取用户自定义的巡检策略和巡检阈值,根据巡检策略、云平台中的节点数量以及节点类型创建巡检任务,生成远程调用请求并将其异步发送至各执行模块;
本实施例中,巡检任务包括本次巡检需要执行的子任务以及各子任务对应的巡检策略;巡检策略包括巡检节点、各巡检节点中的巡检对象及其所包含的巡检子对象、各巡检子对象对应的巡检开始时间和/或频率;巡检阈值为各巡检子对象的健康标准值。
多个执行模块分别配置于待巡检的各节点上,响应于调度管理模块发送的远程调用请求选择执行与巡检任务对应的巡检脚本,采集对应节点的巡检数据;
调度管理模块还用于获取各执行模块的巡检数据,根据巡检阈值和巡检数据分别判断各节点的巡检对象是否健康,并基于判断结果生成巡检结果表。
作为本实施例的一个优选示例,上述健康巡检调度管理装置还包括状态监测模块,该状态监测模块用于实时监测和更新巡检任务的执行状态,所述执行状态包括任务建立、任务失败、执行中和任务完成。
作为本实施例的一个优选示例,上述健康巡检调度管理装置还包括存储模块和查询模块;其中,
存储模块用于存储用户自定义的巡检策略和巡检阈值,以及调度管理模块生成的巡检结果表;
查询模块用于接收外部的查询请求,根据查询请求提取存储模块中的巡检结果表并进行显示,便于用户直观获取各节点的巡检结果。
实施例二
本实施例提供了一种云平台的健康巡检调度管理装置,该装置采用基于pecan框架的health模块实现,图4是本实施例提供的健康巡检调度管理装置的组成架构示意图,参见图4,该健康巡检调度管理装置包括health-client、health-api、health-conductor和health-agent几个组件,通过keystone进行token认证;其中,
health-client为health模块的一个客户端,封装RESTful请求供其他组件调用;
health-api用于接收所有外部请求,提供一整套RESTful api接口,通过远程过程调用(Remote Procedure Call,RPC)请求和health-conductor交互,通过dbapi实现和数据库的交互;
本实施例在每个节点上配置一个health-agent服务,用于周期获取各个节点的节点信息以及执行巡检脚本,并通过rpc请求上报health-conductor;
health-conductor接收health-api和各个节点health-agent发送的rpc请求,进行数据处理,并通过封装的数据库接口和数据库进行交互,health-conductor中还实现了自动化巡检任务调度管理系统以及巡检任务状态机。
本实施例还提供了一种基于上述健康巡检调度管理装置的方法,图5是本实施例提供的健康巡检调度管理方法的交互流程图;本方法主要使用四种数据库表:
(1)巡检策略:用来记录巡检对象、巡检子对象、巡检开始时间或频率、巡检节点等信息;巡检对象主要有物理资源、云服务状态、性能数据、配置检查等,巡检子对象是对于巡检对象更细的分类,例如对于巡检对象为云服务状态的策略中,巡检子对象可以是nova、neutron等;
(2)巡检阈值:用来记录相应巡检对象中的巡检子对象的健康标准,例如:将物理资源的CPU温度的巡检阈值设置为50℃,表示物理资源的CPU温度在50℃以下为健康;
(3)巡检任务:该数据表记录了巡检任务的唯一标识码、巡检任务中包含的巡检子任务数,各个巡检子任务对应的任务状态、开始时间、巡检完成时间等信息,该数据表实际上是对每次巡检任务的一次生命周期管理;
(4)巡检结果:用来记录巡检任务的每个子任务完成情况,包括巡检任务的唯一标识码、各巡检子任务中的巡检对象、各巡检对象包含的巡检子对象,各巡检子对象的巡检完成时间、健康状况、巡检数据、巡检详情等。
参见图4,本实施例提供的健康巡检调度管理方法包括以下执行步骤:
(1)用户通过portal或者命令行创建巡检策略和巡检阈值,health-api根据预置的校验策略对该巡检策略和巡检阈值进行校验,校验通过后将它们存储在数据库db中;
(2)Health-conductor中的调度管理系统根据数据库中存储的巡检策略以及云平台规模创建相应巡检任务并将该巡检任务存储在数据库中,记录本次巡检的所有子任务,并将该任务的唯一标识码作为后续请求的标示;巡检任务状态机将数据库中巡检任务的状态设置为Created;
(3)health-conductor中的调度管理系统根据巡检策略执行不同巡检对象的巡检方法,到这一步为止均为同步请求,这一步之前若请求出错,巡检任务状态机会捕获异常并更新巡检任务状态为Failed;
(4)health-conductor中的调度管理系统向所有节点发送异步rpc巡检请求,巡检任务状态机更新数据库中巡检任务状态为Doing;
(5)各节点上health-agent服务接收到异步的rpc请求后,根据rpc请求中的巡检节点判断该节点上需要执行的巡检脚本,执行巡检脚本并采集巡检数据,将巡检数据通过同步rpc请求发送到health-conductor;
(6)Health-conductor中的调度管理系统接收到各节点返回的巡检数据后,根据数据库中存储的巡检阈值判断各节点的巡检对象是否健康,并将结果写到巡检结果表中,巡检任务状态机同时更新巡检任务中的子任务;若巡检任务表中所有子任务都有结果返回,任务状态变更为Done;
(7)Health-conductor中的调度管理系统还会监控巡检任务状态,若巡检任务超时后,数据库中巡检任务的任务状态不是Done,会将巡检任务状态设置为Failed;
(8)Portal或命令行可以根据巡检结果表里记录的所有信息灵活的生成各种巡检结果报告,用户通过Portal或命令行访问由health-api提供的查询接口,获取数据库中的巡检任务表。
实施例三
本实施例还提供了一种电子设备,其包括至少一个处理器、以及至少一个存储器,其中,存储器中存储有计算机程序,当计算机程序被处理器执行时,使得处理器执行实施例一中健康巡检调度管理方法的步骤,具体步骤参见实施例一,此处不再赘述;本实施例中,处理器和存储器的类型不作具体限制,例如:处理器可以是微处理器、数字信息处理器、片上可编程逻辑系统等;存储器可以是易失性存储器、非易失性存储器或者它们的组合等。
该电子设备也可以与一个或多个外部设备(如键盘、指向终端、显示器等)通信,还可与一个或者多个使得用户能与该电子设备交互的终端通信,和/或与使得该电子设备能与一个或多个其它计算终端进行通信的任何终端(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口进行。并且,电子设备还可以通过网络适配器与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网(Wide Area Network,WAN)和/或公共网络,例如因特网)通信。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种云平台的健康巡检调度管理方法,其特征在于,包括:
获取用户自定义的巡检策略和巡检阈值,根据所述巡检策略、云平台中的节点数量以及节点类型创建巡检任务,生成远程调用请求并将其异步发送至各节点;
响应于所述远程调用请求选择执行与巡检任务对应的巡检脚本,采集对应节点的巡检数据;
获取所述巡检数据,根据所述巡检数据和巡检阈值分别判断各节点的巡检对象是否健康,并基于判断结果生成巡检结果表。
2.如权利要求1所述的健康巡检调度管理方法,其特征在于,还包括:
实时监测和更新巡检任务的执行状态,所述执行状态包括任务建立、任务失败、执行中和任务完成。
3.如权利要求1或2所述的健康巡检调度管理方法,其特征在于,所述巡检任务包括本次巡检需要执行的子任务以及各子任务对应的巡检策略。
4.如权利要求3所述的健康巡检调度管理方法,其特征在于,所述巡检策略包括巡检节点、各巡检节点中的巡检对象及其所包含的巡检子对象、各巡检子对象对应的巡检开始时间和/或频率;所述巡检阈值为各巡检子对象的健康标准值。
5.一种云平台的健康巡检调度管理装置,其特征在于,包括:
调度管理模块,用于获取用户自定义的巡检策略和巡检阈值,根据所述巡检策略、云平台中的节点数量以及节点类型创建巡检任务,生成远程调用请求并将其异步发送至各执行模块;
并用于获取各执行模块的巡检数据,根据所述巡检阈值和巡检数据分别判断各节点的巡检对象是否健康,并基于判断结果生成巡检结果表;
多个执行模块,分别配置于待巡检的各节点上,响应于调度管理模块发送的远程调用请求选择执行与巡检任务对应的巡检脚本,采集对应节点的巡检数据。
6.如权利要求5所述的健康巡检调度管理装置,其特征在于,还包括状态监测模块,用于实时监测和更新巡检任务的执行状态,所述执行状态包括任务建立、任务失败、执行中和任务完成。
7.如权利要求5或6所述的健康巡检调度管理装置,其特征在于,还包括存储模块和查询模块;
所述存储模块用于存储用户自定义的巡检策略和巡检阈值,以及调度管理模块生成的巡检结果表;
所述查询模块用于接收外部的查询请求,根据查询请求提取并输出所述存储模块中的巡检结果表。
8.如权利要求5所述的健康巡检调度管理装置,其特征在于,所述巡检任务包括本次巡检需要执行的子任务以及各子任务对应的巡检策略。
9.如权利要求8所述的健康巡检调度管理方法,其特征在于,所述巡检策略包括巡检节点、各巡检节点中的巡检对象及其所包含的巡检子对象、各巡检子对象对应的巡检开始时间和/或频率;
所述巡检阈值为各巡检子对象的健康标准值。
10.一种电子设备,其特征在于,包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行权利要求1~4任一项所述方法的步骤。
CN201911006893.XA 2019-10-22 2019-10-22 一种云平台的健康巡检调度管理方法、装置及电子设备 Pending CN111026602A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911006893.XA CN111026602A (zh) 2019-10-22 2019-10-22 一种云平台的健康巡检调度管理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911006893.XA CN111026602A (zh) 2019-10-22 2019-10-22 一种云平台的健康巡检调度管理方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN111026602A true CN111026602A (zh) 2020-04-17

Family

ID=70200144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911006893.XA Pending CN111026602A (zh) 2019-10-22 2019-10-22 一种云平台的健康巡检调度管理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111026602A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111752637A (zh) * 2020-06-23 2020-10-09 平安普惠企业管理有限公司 多服务巡检管理方法、装置、计算机设备及存储介质
CN111917599A (zh) * 2020-06-03 2020-11-10 烽火通信科技股份有限公司 一种云平台主机状态的管理系统与方法
CN112532487A (zh) * 2020-11-27 2021-03-19 上海八彦图信息科技有限公司 自动化巡检方法和装置
CN113472577A (zh) * 2021-06-30 2021-10-01 济南浪潮数据技术有限公司 一种集群巡检方法、装置及系统
CN113935613A (zh) * 2021-10-11 2022-01-14 北京京东乾石科技有限公司 一种设备巡检方法、装置、电子设备及计算机可读介质
CN115511132A (zh) * 2022-10-19 2022-12-23 太原市海通自动化技术有限公司 基于发电厂的设备巡点检管理平台及系统
CN115934300A (zh) * 2023-03-08 2023-04-07 浙江九州云信息科技有限公司 一种云计算平台巡检任务调度方法及系统
CN117421255A (zh) * 2023-12-19 2024-01-19 北京博点智合科技有限公司 一种接口的自动巡检方法、装置、设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108282355A (zh) * 2017-11-28 2018-07-13 中国电子科技集团公司电子科学研究院 云桌面系统中设备巡检装置
CN109639464A (zh) * 2018-11-23 2019-04-16 武汉烽火技术服务有限公司 基于web界面的idc网络巡检方法及系统
CN109857613A (zh) * 2018-12-25 2019-06-07 南京南瑞信息通信科技有限公司 一种基于采集集群的自动化运维系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108282355A (zh) * 2017-11-28 2018-07-13 中国电子科技集团公司电子科学研究院 云桌面系统中设备巡检装置
CN109639464A (zh) * 2018-11-23 2019-04-16 武汉烽火技术服务有限公司 基于web界面的idc网络巡检方法及系统
CN109857613A (zh) * 2018-12-25 2019-06-07 南京南瑞信息通信科技有限公司 一种基于采集集群的自动化运维系统

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111917599A (zh) * 2020-06-03 2020-11-10 烽火通信科技股份有限公司 一种云平台主机状态的管理系统与方法
CN111752637B (zh) * 2020-06-23 2023-09-01 钥棠(厦门)网络科技有限公司 多服务巡检管理方法、装置、计算机设备及存储介质
CN111752637A (zh) * 2020-06-23 2020-10-09 平安普惠企业管理有限公司 多服务巡检管理方法、装置、计算机设备及存储介质
CN112532487A (zh) * 2020-11-27 2021-03-19 上海八彦图信息科技有限公司 自动化巡检方法和装置
CN113472577B (zh) * 2021-06-30 2023-07-25 济南浪潮数据技术有限公司 一种集群巡检方法、装置及系统
CN113472577A (zh) * 2021-06-30 2021-10-01 济南浪潮数据技术有限公司 一种集群巡检方法、装置及系统
CN113935613A (zh) * 2021-10-11 2022-01-14 北京京东乾石科技有限公司 一种设备巡检方法、装置、电子设备及计算机可读介质
CN115511132B (zh) * 2022-10-19 2023-08-11 太原海通智慧信息技术有限公司 基于发电厂的设备巡点检管理平台及系统
CN115511132A (zh) * 2022-10-19 2022-12-23 太原市海通自动化技术有限公司 基于发电厂的设备巡点检管理平台及系统
CN115934300B (zh) * 2023-03-08 2023-06-23 浙江九州云信息科技有限公司 一种云计算平台巡检任务调度方法及系统
CN115934300A (zh) * 2023-03-08 2023-04-07 浙江九州云信息科技有限公司 一种云计算平台巡检任务调度方法及系统
CN117421255A (zh) * 2023-12-19 2024-01-19 北京博点智合科技有限公司 一种接口的自动巡检方法、装置、设备和存储介质
CN117421255B (zh) * 2023-12-19 2024-04-09 北京博点智合科技有限公司 一种接口的自动巡检方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
CN111026602A (zh) 一种云平台的健康巡检调度管理方法、装置及电子设备
CN102880503B (zh) 数据分析系统及数据分析方法
CN103201724B (zh) 在高可用性虚拟机环境中提供高可用性应用程序
CN109656782A (zh) 可视化调度监控方法、装置及服务器
CN106406993A (zh) 一种定时任务管理方法和系统
CN111552556B (zh) 一种gpu集群服务管理系统及方法
US8538793B2 (en) System and method for managing real-time batch workflows
CN111274052A (zh) 数据分发方法、服务器及计算机可读存储介质
CN108521339A (zh) 一种基于集群日志的反馈式节点故障处理方法及系统
CN112698952A (zh) 计算资源统一管理方法、装置、计算机设备及存储介质
CN112416581A (zh) 定时任务的分布式调用系统
CN113760677A (zh) 异常链路分析方法、装置、设备及存储介质
CN109902028A (zh) Acl特性的自动化测试方法、装置、设备及存储介质
CN114756328A (zh) 容器云平台巡检方法及装置
Demirbaga et al. Autodiagn: An automated real-time diagnosis framework for big data systems
CN116340110A (zh) 云平台集群监控指标数据的自动化巡检方法及系统
CN112559525B (zh) 数据检查系统、方法、装置和服务器
CN113658351A (zh) 一种产品生产的方法、装置、电子设备及存储介质
CN110929130B (zh) 一种基于分布式调度的公安部级审计数据查询方法
CN112600842A (zh) 集群shell方法、装置、电子设备及计算机可读存储介质
CN109274533B (zh) 一种基于规则引擎的Web服务故障的定位装置和方法
CN108154343B (zh) 一种企业级信息系统的应急处理方法及系统
CN109257256A (zh) 设备监控方法、装置、计算机设备及存储介质
CN112965793B (zh) 一种面向标识解析数据的数据仓库任务调度方法和系统
CN114610413A (zh) 基于Java的同异步任务的执行方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200417

RJ01 Rejection of invention patent application after publication