CN111917599A - 一种云平台主机状态的管理系统与方法 - Google Patents

一种云平台主机状态的管理系统与方法 Download PDF

Info

Publication number
CN111917599A
CN111917599A CN202010495411.8A CN202010495411A CN111917599A CN 111917599 A CN111917599 A CN 111917599A CN 202010495411 A CN202010495411 A CN 202010495411A CN 111917599 A CN111917599 A CN 111917599A
Authority
CN
China
Prior art keywords
host
state
event
task
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010495411.8A
Other languages
English (en)
Other versions
CN111917599B (zh
Inventor
陈秉蔚
蓝海
张书东
李庆林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fiberhome Telecommunication Technologies Co Ltd
Original Assignee
Fiberhome Telecommunication Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fiberhome Telecommunication Technologies Co Ltd filed Critical Fiberhome Telecommunication Technologies Co Ltd
Priority to CN202010495411.8A priority Critical patent/CN111917599B/zh
Publication of CN111917599A publication Critical patent/CN111917599A/zh
Application granted granted Critical
Publication of CN111917599B publication Critical patent/CN111917599B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/12Applying verification of the received information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Abstract

本发明公开了一种云平台主机状态的管理系统,包括:主机状态机用于定义主机状态和主机事件;接口单元用于提供各云平台服务模块对主机的业务请求接口;主机任务处理单元用于根据接口单元收到的业务请求完成主机操作;主机事件单元用于处理主机操作过程中产生的主机事件并更新主机状态机中主机状态的变化;数据库单元用于记录主机状态机中主机状态的变化以及主机事件处理单元接收到的主机事件;巡检单元用于周期性查询各主机的当前实际状态,和主机状态机中的主机状态对比后做相应处理。本发明还提供了相应的云平台主机状态的管理方法。

Description

一种云平台主机状态的管理系统与方法
技术领域
本发明属于云计算技术领域,更具体地,涉及一种云平台主机状态的管理系统与方法。
背景技术
云计算时代,云计算技术正在逐步从互联网领域向各传统产业进行渗透,云计算技术正在进入广泛的应用阶段。随着各种云平台主机规模逐步庞大、承载业务的数量逐渐上升、涉及领域日益广泛,对云平台运维管理的难度也逐渐增大,因此需要有效的方法来对云平台中各资源进行管理。
然而云平台中对于主机状态的管理,现有技术大多采用监控的方式,通过云平台中运维节点上的监控服务周期获取平台中主机以及虚拟机状态,根据结果进行计算、分析、上报或自动化处理,准确度取决于监控采集的周期以及分析算法的准确度,在大规模应用场景下,现有技术存在管理精度低、时延长、运维难度高等问题。
并且,随着依托云计算的5G通信的发展,“低时延、高可靠、高密度”的三大应用场景对云平台的主机管理提出了更高的要求,在主机管理方面,传统的管理方式已无法满足电信云场景需要。
发明内容
本发明的目的是为了克服上述现有技术的不足,提供一种云平台主机状态的管理方案,基于机状态机模块和主机状态管理模块,保持对主机状态监控的同时,在云平台各业务流程中向该管理系统主动更新主机状态的变化,有效降低状态更新时延、提高主机状态准确性、提升运维效率。
按照本发明的一个方面,提供了一种云平台主机状态的管理系统,包括主机状态机和主机状态管理模块,其中:
所述主机状态机用于定义主机状态和主机事件;
所述主机状态管理模块包含接口单元、主机任务处理单元、主机事件处理单元、巡检单元和数据库单元;其中:
所述接口单元用于提供各云平台服务模块对主机的业务请求接口;所述主机任务处理单元用于根据接口单元收到的业务请求完成主机操作;所述主机事件单元用于处理主机操作过程中产生的主机事件并更新主机状态机中主机状态的变化;所述数据库单元用于记录主机状态机中主机状态的变化以及主机事件处理单元接收到的主机事件;所述巡检单元用于周期性查询各主机的当前实际状态,和主机状态机中的主机状态对比后做相应处理;
其中所述主机状态用于描述主机的运行状态,主机事件是用来驱动主机状态往下一个主机状态变化的动作,主机任务是实际可对主机进行的操作。
本发明的一个实施例中,所述巡检单元用于周期性查询各主机的当前实际状态,和主机状态机中的主机状态对比后做相应处理,具体为:
每一个当前主机状态与该主机状态下操作系统和各云平台服务模块的当前实际运行状态存在严格的对应关系,巡检单元周期性查询各主机中操作系统和各云平台服务模块的当前实际状态,将该当前实际状态和主机状态机中记录的当前主机状态对比,若对比结果符合上述对应关系,则主机状态正常,巡检单元会向云平台告警服务模块发送消除告警请求,云平台告警服务模块消除已有的主机状态异常告警,若没有告警则不作处理;若对比结果不符合上述对应关系,则主机状态异常,巡检单元向云平台告警服务模块发送产生告警请求,云平台告警服务模块产生主机状态异常告警。
按照本发明的另一方面,还提供了一种基于上述云平台主机状态的管理系统的云平台主机状态的管理方法,包括:
S201、各云平台服务模块根据自身业务需要,向主机状态管理模块中接口单元发送业务请求,其中所述业务请求为主机状态查询请求或主机操作请求;
S202、接口单元收到业务请求后,若是主机状态查询请求,则读取主机状态机中当前主机状态反馈给相应的云平台服务模块;若是主机操作请求,则进行请求合法性校验,若通过,则转到S203,否则拒绝请求;
S203、主机任务处理单元接受到主机操作请求,执行主机操作请求并生成主机操作请求相对应的主机事件,转到S204;
S204、主机事件处理单元接收到主机任务处理单元生成的主机事件后,把主机事件的产生记录以及主机状态机中的当前主机状态写入数据库单元,并将主机事件传入主机状态机并更新主机状态。
本发明的一个实施例中,自定义一系列主机状态、主机事件、主机任务,其中主机任务和主机操作请求相关联,主机事件根据主机任务的执行过程来产生,主机状态根据主机事件的发生而向下一个主机状态变化。
本发明的一个实施例中,所述主机任务包含:添加主机、删除主机、使能主机、使无效主机和/或巡检主机;所述主机状态包括:初始化、配置、使能中、使能的、使无效中、无效的、故障、删除中和/或已删除;所述主机事件包含:添加、删除、使能、使无效、巡检、任务完成和/或任务失败。
本发明的一个实施例中,添加主机任务在主机状态为“初始化”时执行,主机任务处理单元在任务执行前向主机事件处理单元发出“添加”事件,主机状态将从“初始化”转换为“配置”,待添加主机任务执行完毕后,主机任务处理单元向主机事件处理单元发出“任务完成”事件或“任务失败”事件,发出“任务完成”事件时,主机状态将从“配置”转换为“无效的”;发出“任务失败”事件时,主机状态将从“配置”转换为“故障”。
本发明的一个实施例中,使能主机任务在主机状态为“无效的”时执行,主机任务处理单元在任务执行前向主机事件处理单元发出“使能”事件,主机状态将从“无效的”转换为“使能中”,待使能主机任务执行完毕后,主机任务处理单元向主机事件处理单元发出“任务完成”事件或“任务失败”事件,发出“任务完成”事件时,主机状态将从“使能中”转换为“使能的”;发出“任务失败”事件时,主机状态将从“使能中”转换为“故障”。
本发明的一个实施例中,使无效主机任务只能在主机状态为“使能的”时执行,主机任务处理单元在任务执行前向主机事件处理单元发出“使无效”事件,主机状态将从“使能的”转换为“使无效中”,待使无效主机任务执行完毕后,主机任务处理单元向主机事件处理单元发出“任务完成”事件或“任务失败”事件,发出“任务完成”事件时,主机状态将从“使无效中”转换为“无效的”;发出“任务失败”事件时,主机状态将从“使无效中”转换为“使能的”。
本发明的一个实施例中,删除主机任务在主机状态为“初始化”或“无效的”时执行,主机任务处理单元在任务执行前向主机事件处理单元发出“删除”事件,主机状态将从原本状态转换为“删除中”,待删除主机任务执行完毕后,主机任务处理单元向主机事件处理单元发出“任务完成”事件或“任务失败”事件,发出“任务完成”事件时,主机状态将从“删除中”转换为“删除的”;发出“任务失败”事件时,主机状态将从“删除中”转换为“故障”。
本发明的一个实施例中,巡检主机任务在主机状态为“无效的”,或“使能的”,或“故障”时执行,主机任务处理单元在任务执行前向主机事件处理单元发出“巡检”事件,该事件不会更新主机状态,主机事件处理单元接收到“巡检”事件后,调用主机巡检单元进行周期性巡检任务。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有如下有益效果:
(1)传统云平台中的主机管理方案通过监控服务对云平台中各主机中服务状态、资源使用、配置信息等进行采集和计算,结合相应算法来判断主机状态,对主机状态的变化响应慢、精确度不高,与传统方式中被动地更新主机状态相比,本发明提出的一种云平台主机管理方法与相关管理系统将主机状态的变化和主机操作相关的业务流程绑定,在对主机进行相关操作的同步更新主机状态机,同时保留周期巡检模块去周期获取主机状态,采用主动更新与被动巡检相结合的方式,大幅提高响应速度和精确度,更适用于“高可靠、低时延”的应用场景;
(2)本发明中提出的一种云平台主机状态的管理方法通过维护本发明中提出的主机状态机,可以清晰的获取到主机状态的变化生命周期,提高云平台的可靠性,并且提高运维以及开发场景下对问题定位的准确性;
(3)传统云平台中主机状态管理方法中对主机状态的描述通常局限于状态正常或不正常,与之相比本发明将主机状态的变化和业务流程相结合,主机状态多样化并可描述主机所处的准确业务阶段,提升管理系统的易用性。
附图说明
图1是本发明实施例中云平台主机状态的管理系统的结构框图;
图2是本发明实施例中云平台主机状态的管理系统的工作流程图;
图3是本发明实施例中云平台主机状态机的状态转换流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
参见图1所示,本发明实施例提供一种云平台主机状态的管理系统,包括主机状态机和主机状态管理模块;所述主机状态机定义了主机状态和主机事件;所述主机状态管理模块包含接口单元、主机任务处理单元、主机事件处理单元、巡检单元和数据库单元;主机状态描述了主机的运行状态,主机事件是用来驱动主机状态往下一个主机状态变化的动作,主机任务是实际可对主机进行的操作,在一次主机任务中可能产生多次主机事件;
接口单元提供各云平台服务模块对主机的业务请求接口,其中业务请求包括主机操作请求和对主机状态查询请求;主机任务处理单元是根据接口单元收到的业务请求来完成主机操作的执行单元,执行过程中会产生多个主机事件,主机事件单元用来处理这些主机事件并更新主机状态机中主机状态的变化,数据库单元用来记录主机状态机中主机状态的变化以及主机事件处理单元接收到的主机事件;所述巡检单元用于周期性查询各主机的当前实际状态,和主机状态机中的当前主机状态对比后做相应处理;
在本发明中,数据库单元用来记录主机状态机中主机状态的变化以及主机事件处理单元接收到的主机事件,目的是对主机事件以及其引起的主机状态的变化过程进行记录,以便完整的描述主机状态的变化过程。
需要说明的是,在本发明实施例中涉及到3个主机状态的术语:
主机状态:通用的描述,即指主机的运行状态;
当前主机状态:主机状态机中保存的主机状态;
当前实际状态:指主机当前的实际运行状态;每一个当前主机状态与该主机状态下操作系统和各云平台服务模块的当前实际运行状态存在严格的对应关系,通常情况下,当前实际状态与当前主机状态会保持一致,此时主机状态正常;但可能因为非正常主机事件引起主机状态异常,导致当前实际状态与当前主机状态不一致,此时主机状态异常。
具体地,巡检单元会周期性查询各主机中操作系统和各云平台服务模块的当前实际状态,将该当前实际状态和主机状态机中记录的当前主机状态对比,每一个当前主机状态与该主机状态下操作系统和各云平台服务模块的当前实际运行状态存在严格的对应关系,若对比结果符合该对应关系,则主机状态正常,巡检单元会向云平台告警服务模块(是云平台服务模块的一种)发送消除告警请求,云平台告警服务模块消除已有的主机状态异常告警,若没有告警则不作处理;若对比结果不符合上述对应关系,则主机状态异常,巡检单元会向平台告警服务模块发送产生告警请求,云平台告警服务模块产生主机状态异常告警。
在上述技术方案的基础上,接口单元在处理主机操作请求时会对该请求做合法性校验,依据接口单元接收到主机操作请求时主机状态机中记录的当前主机状态,若该主机操作请求执行时产生的主机事件可以驱动当前主机状态向下一个状态转换,将该主机操作请求视为合法请求,否则视为非法请求,接口单元会拒绝非法请求。
在上述技术方案的基础上,可自定义一系列主机状态、主机事件、主机任务,主机任务和业务请求相关联,主机事件根据主机任务的执行过程来产生,主机状态根据主机事件的发生而向下一个主机状态变化。
在上述技术方案的基础上,如图2所示,各云平台服务模块同主机状态管理模块以及主机状态机的交互流程为:
S201、各云平台服务模块根据自身业务需要,向主机状态管理模块中接口单元发送业务请求,其中所述业务请求为主机状态查询请求或主机操作请求;
S202、主机状态管理模块中接口单元收到业务请求后,若是主机状态查询请求,则读取主机状态机中当前主机状态反馈给相应的云平台服务模块;若是主机操作请求,则进行请求合法性校验,若通过,则转到S203,否则拒绝请求;
S203、主机任务处理单元接受到主机操作请求,执行主机操作请求并生成主机操作请求相对应的主机事件,转到S204;
S204、主机事件处理单元接收到主机任务处理单元生成的主机事件后,把主机事件的产生记录以及主机状态机中的当前主机状态写入数据库单元,并将主机事件传入主机状态机并更新主机状态。
进一步,所述交互流程还包括:
S205、巡检单元周期性查询各主机中操作系统和各云平台服务模块的当前实际状态,将当前实际状态和主机状态机中记录的当前主机状态对比,若对比结果符合主机状态与主机上操作系统以及各云平台服务模块的运行状态的对应关系,则主机状态正常,巡检单元向云平台告警服务模块发送消除告警请求,云平台告警服务模块消除已有的主机状态异常告警,若没有告警则不作处理;若对比结果不符合上述对应关系,则主机状态异常,巡检单元会向云平台告警服务模块发送产生告警请求;云平台告警服务模块根据接收到的请求,产生或消除主机状态异常告警;接着巡检单元进入下一个巡检周期。
在上述技术方案的基础上,定义主机任务包含:添加主机、删除主机、使能主机、使无效主机和/或巡检主机;主机状态包含:初始化、配置、使能中、使能的、使无效中、无效的、故障、删除中和/或已删除;主机事件包含:添加、删除、使能、使无效、巡检、任务完成和/或任务失败。
参考图3所示,上述主机状态随着主机事件的发生的变化关系如下:
1、添加主机任务只能在主机状态为“初始化”时执行,主机任务处理单元在任务执行前会向主机事件处理单元发出“添加”事件,主机状态将从“初始化”转换为“配置”,待添加主机任务执行完毕后,主机任务处理单元会向主机事件处理单元发出“任务完成”事件或“任务失败”事件,发出“任务完成”事件时,主机状态将从“配置”转换为“无效的”;发出“任务失败”事件时,主机状态将从“配置”转换为“故障”;
2、使能主机任务只能在主机状态为“无效的”时执行,主机任务处理单元在任务执行前会向主机事件处理单元发出“使能”事件,主机状态将从“无效的”转换为“使能中”,待使能主机任务执行完毕后,主机任务处理单元会向主机事件处理单元发出“任务完成”事件或“任务失败”事件,发出“任务完成”事件时,主机状态将从“使能中”转换为“使能的”;发出“任务失败”事件时,主机状态将从“使能中”转换为“故障”;
3、使无效主机任务只能在主机状态为“使能的”时执行,主机任务处理单元在任务执行前会向主机事件处理单元发出“使无效”事件,主机状态将从“使能的”转换为“使无效中”,待使无效主机任务执行完毕后,主机任务处理单元会向主机事件处理单元发出“任务完成”事件或“任务失败”事件,发出“任务完成”事件时,主机状态将从“使无效中”转换为“无效的”;发出“任务失败”事件时,主机状态将从“使无效中”转换为“使能的”;
4、删除主机任务可以在主机状态为“初始化”、“无效的”时执行,主机任务处理单元在任务执行前会向主机事件处理单元发出“删除”事件,主机状态将从原本状态转换为“删除中”,待删除主机任务执行完毕后,主机任务处理单元会向主机事件处理单元发出“任务完成”事件或“任务失败”事件,发出“任务完成”事件时,主机状态将从“删除中”转换为“删除的”;发出“任务失败”事件时,主机状态将从“删除中”转换为“故障”;
5、巡检主机任务可以在主机状态为“无效的”、“使能的”、“故障”时执行,主机任务处理单元在任务执行前会向主机事件处理单元发出“巡检”事件,该事件不会更新主机状态,主机事件处理单元接收到“巡检”事件后,会调用主机巡检单元进行周期性巡检任务。
在上述变化关系中,只有在使无效主机任务失败时,主机状态不会转换为“故障”,而是回退到“使能的”,是为了保证云平台中正在运行的业务流程不受干扰,保证云平台的可靠性。
综上所述,本发明提供了一种云平台主机状态的管理方法,保留传统云平台中主机状态管理方法中被动监控的方式,增加主动上报更新主机状态的流程,大幅提高主机状态管理系统的响应速度和精确度,更适用于“高可靠、低时延”的应用场景;并且本发明利用主机状态机精确定义主机状态的变化关系,可以清晰的获取到主机状态的变化生命周期,提高云平台的可靠性,并且提高运维以及开发场景下对问题定位的准确性;而且多样化的主机状态可更精确的描述主机处在准确业务阶段,提升管理系统的易用性。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种云平台主机状态的管理系统,其特征在于,包括主机状态机和主机状态管理模块,其中:
所述主机状态机用于定义主机状态和主机事件;
所述主机状态管理模块包含接口单元、主机任务处理单元、主机事件处理单元、巡检单元和数据库单元;其中:
所述接口单元用于提供各云平台服务模块对主机的业务请求接口;所述主机任务处理单元用于根据接口单元收到的业务请求完成主机操作;所述主机事件单元用于处理主机操作过程中产生的主机事件并更新主机状态机中主机状态的变化;所述数据库单元用于记录主机状态机中主机状态的变化以及主机事件处理单元接收到的主机事件;所述巡检单元用于周期性查询各主机的当前实际状态,和主机状态机中的主机状态对比后做相应处理;
其中所述主机状态用于描述主机的运行状态,主机事件是用来驱动主机状态往下一个主机状态变化的动作,主机任务是实际可对主机进行的操作。
2.如权利要求1所述的云平台主机状态的管理系统,其特征在于,所述巡检单元用于周期性查询各主机的当前实际状态,和主机状态机中的主机状态对比后做相应处理,具体为:
每一个当前主机状态与该主机状态下操作系统和各云平台服务模块的当前实际运行状态存在严格的对应关系,巡检单元周期性查询各主机中操作系统和各云平台服务模块的当前实际状态,将该当前实际状态和主机状态机中记录的当前主机状态对比,若对比结果符合上述对应关系,则主机状态正常,巡检单元会向云平台告警服务模块发送消除告警请求,云平台告警服务模块消除已有的主机状态异常告警,若没有告警则不作处理;若对比结果不符合上述对应关系,则主机状态异常,巡检单元向云平台告警服务模块发送产生告警请求,云平台告警服务模块产生主机状态异常告警。
3.基于权利要求1或2所述云平台主机状态的管理系统的云平台主机状态的管理方法,其特征在于,包括:
S201、各云平台服务模块根据自身业务需要,向主机状态管理模块中接口单元发送业务请求,其中所述业务请求为主机状态查询请求或主机操作请求;
S202、接口单元收到业务请求后,若是主机状态查询请求,则读取主机状态机中当前主机状态反馈给相应的云平台服务模块;若是主机操作请求,则进行请求合法性校验,若通过,则转到S203,否则拒绝请求;
S203、主机任务处理单元接受到主机操作请求,执行主机操作请求并生成主机操作请求相对应的主机事件,转到S204;
S204、主机事件处理单元接收到主机任务处理单元生成的主机事件后,把主机事件的产生记录以及主机状态机中的当前主机状态写入数据库单元,并将主机事件传入主机状态机并更新主机状态。
4.如权利要求3所述的云平台主机状态的管理方法,其特征在于,自定义一系列主机状态、主机事件、主机任务,其中主机任务和主机操作请求相关联,主机事件根据主机任务的执行过程来产生,主机状态根据主机事件的发生而向下一个主机状态变化。
5.如权利要求4所述的云平台主机状态的管理方法,其特征在于,
所述主机任务包含:添加主机、删除主机、使能主机、使无效主机和/或巡检主机;
所述主机状态包括:初始化、配置、使能中、使能的、使无效中、无效的、故障、删除中和/或已删除;
所述主机事件包含:添加、删除、使能、使无效、巡检、任务完成和/或任务失败。
6.如权利要求3至5任一项所述的云平台主机状态的管理方法,其特征在于,添加主机任务在主机状态为“初始化”时执行,主机任务处理单元在任务执行前向主机事件处理单元发出“添加”事件,主机状态将从“初始化”转换为“配置”,待添加主机任务执行完毕后,主机任务处理单元向主机事件处理单元发出“任务完成”事件或“任务失败”事件,发出“任务完成”事件时,主机状态将从“配置”转换为“无效的”;发出“任务失败”事件时,主机状态将从“配置”转换为“故障”。
7.如权利要求3至5任一项所述的云平台主机状态的管理方法,其特征在于,使能主机任务在主机状态为“无效的”时执行,主机任务处理单元在任务执行前向主机事件处理单元发出“使能”事件,主机状态将从“无效的”转换为“使能中”,待使能主机任务执行完毕后,主机任务处理单元向主机事件处理单元发出“任务完成”事件或“任务失败”事件,发出“任务完成”事件时,主机状态将从“使能中”转换为“使能的”;发出“任务失败”事件时,主机状态将从“使能中”转换为“故障”。
8.如权利要求3至5任一项所述的云平台主机状态的管理方法,其特征在于,使无效主机任务只能在主机状态为“使能的”时执行,主机任务处理单元在任务执行前向主机事件处理单元发出“使无效”事件,主机状态将从“使能的”转换为“使无效中”,待使无效主机任务执行完毕后,主机任务处理单元向主机事件处理单元发出“任务完成”事件或“任务失败”事件,发出“任务完成”事件时,主机状态将从“使无效中”转换为“无效的”;发出“任务失败”事件时,主机状态将从“使无效中”转换为“使能的”。
9.如权利要求3至5任一项所述的云平台主机状态的管理方法,其特征在于,删除主机任务在主机状态为“初始化”或“无效的”时执行,主机任务处理单元在任务执行前向主机事件处理单元发出“删除”事件,主机状态将从原本状态转换为“删除中”,待删除主机任务执行完毕后,主机任务处理单元向主机事件处理单元发出“任务完成”事件或“任务失败”事件,发出“任务完成”事件时,主机状态将从“删除中”转换为“删除的”;发出“任务失败”事件时,主机状态将从“删除中”转换为“故障”。
10.如权利要求3至5任一项所述的云平台主机状态的管理方法,其特征在于,巡检主机任务在主机状态为“无效的”,或“使能的”,或“故障”时执行,主机任务处理单元在任务执行前向主机事件处理单元发出“巡检”事件,该事件不会更新主机状态,主机事件处理单元接收到“巡检”事件后,调用主机巡检单元进行周期性巡检任务。
CN202010495411.8A 2020-06-03 2020-06-03 一种云平台主机状态的管理系统与方法 Active CN111917599B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010495411.8A CN111917599B (zh) 2020-06-03 2020-06-03 一种云平台主机状态的管理系统与方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010495411.8A CN111917599B (zh) 2020-06-03 2020-06-03 一种云平台主机状态的管理系统与方法

Publications (2)

Publication Number Publication Date
CN111917599A true CN111917599A (zh) 2020-11-10
CN111917599B CN111917599B (zh) 2021-10-08

Family

ID=73238038

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010495411.8A Active CN111917599B (zh) 2020-06-03 2020-06-03 一种云平台主机状态的管理系统与方法

Country Status (1)

Country Link
CN (1) CN111917599B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090216881A1 (en) * 2001-03-28 2009-08-27 The Shoregroup, Inc. Method and apparatus for maintaining the status of objects in computer networks using virtual state machines
CN102006370A (zh) * 2010-11-19 2011-04-06 中兴通讯股份有限公司 在ngn中对窄带用户进行呼损分析的实现方法及装置
CN108650134A (zh) * 2018-05-14 2018-10-12 周怡颋 网络故障定位的方法、装置及电子设备
US20190097876A1 (en) * 2017-09-26 2019-03-28 Netscout Systems, Inc System and method for managing alerts using a state machine
CN110113201A (zh) * 2019-04-30 2019-08-09 平安科技(深圳)有限公司 监控数据处理方法、装置及监控系统
CN111026602A (zh) * 2019-10-22 2020-04-17 烽火通信科技股份有限公司 一种云平台的健康巡检调度管理方法、装置及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090216881A1 (en) * 2001-03-28 2009-08-27 The Shoregroup, Inc. Method and apparatus for maintaining the status of objects in computer networks using virtual state machines
CN102006370A (zh) * 2010-11-19 2011-04-06 中兴通讯股份有限公司 在ngn中对窄带用户进行呼损分析的实现方法及装置
US20190097876A1 (en) * 2017-09-26 2019-03-28 Netscout Systems, Inc System and method for managing alerts using a state machine
CN108650134A (zh) * 2018-05-14 2018-10-12 周怡颋 网络故障定位的方法、装置及电子设备
CN110113201A (zh) * 2019-04-30 2019-08-09 平安科技(深圳)有限公司 监控数据处理方法、装置及监控系统
CN111026602A (zh) * 2019-10-22 2020-04-17 烽火通信科技股份有限公司 一种云平台的健康巡检调度管理方法、装置及电子设备

Also Published As

Publication number Publication date
CN111917599B (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
US8938421B2 (en) Method and a system for synchronizing data
US9723097B2 (en) Assigning shared catalogs to cache structures in a cluster computing system
CN108076098B (zh) 一种业务处理方法及系统
US8862936B2 (en) Apparatus and method of managing databases of active node and standby node of main memory database management system
TWI738721B (zh) 任務調度方法和裝置
US10630566B1 (en) Tightly-coupled external cluster monitoring
US11263270B1 (en) Heat balancing in a distributed time-series database
CN113657715A (zh) 一种基于核密度估计调用链的根因定位方法及系统
JP2023541298A (ja) トランザクション処理方法、システム、装置、機器、及びプログラム
CN112115012A (zh) 分布式数据库的事务监控方法及装置、系统、存储介质
US11409771B1 (en) Splitting partitions across clusters in a time-series database
CN113364877A (zh) 数据处理方法、装置、电子设备和介质
CN114154035A (zh) 一种动环监控的数据处理系统
US20090100082A1 (en) Replication and mapping mechanism for recreating memory durations
CN117376092A (zh) 故障根因定位方法、装置、设备及存储介质
US11366598B1 (en) Dynamic lease assignments in a time-series database
CN111917599B (zh) 一种云平台主机状态的管理系统与方法
CN109947828B (zh) 一种处理报表数据的方法和装置
CN111752945A (zh) 一种基于容器和层次模型的时序数据库数据交互方法和系统
CN114500289B (zh) 控制平面恢复方法、装置、控制节点及存储介质
CN113052700B (zh) 一种确定微服务调用链的方法及装置
CN112711606A (zh) 数据库访问方法、装置、计算机设备和存储介质
US11580082B2 (en) Object storage system with control entity quota usage mapping
CN115617469A (zh) 一种集群中的数据处理方法、电子设备和存储介质
CN111399753A (zh) 写入图片的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant