CN103746855A - 电信云中异常事件的处理方法及装置 - Google Patents

电信云中异常事件的处理方法及装置 Download PDF

Info

Publication number
CN103746855A
CN103746855A CN201410040568.6A CN201410040568A CN103746855A CN 103746855 A CN103746855 A CN 103746855A CN 201410040568 A CN201410040568 A CN 201410040568A CN 103746855 A CN103746855 A CN 103746855A
Authority
CN
China
Prior art keywords
iaas
application layer
anomalous event
agent process
resource status
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410040568.6A
Other languages
English (en)
Other versions
CN103746855B (zh
Inventor
文晓平
赖剑锋
祁斌
陈选辉
陈太洲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201410040568.6A priority Critical patent/CN103746855B/zh
Publication of CN103746855A publication Critical patent/CN103746855A/zh
Priority to PCT/CN2015/070455 priority patent/WO2015109955A1/zh
Priority to US15/220,116 priority patent/US10187181B2/en
Application granted granted Critical
Publication of CN103746855B publication Critical patent/CN103746855B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/08Arrangements for detecting or preventing errors in the information received by repeating transmission, e.g. Verdan system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • H04L43/065Generation of reports related to network devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Abstract

本发明公开了一种电信云中异常事件的处理方法及装置,以缩短通知路径,增加可靠性。本发明中检测资源状态;将检测到的资源状态异常事件,通过在宿主机Host内部预先建立的基础设施即服务IaaS代理进程与应用层代理进程之间的故障通知通道下发给应用层代理进程,和/或通过在宿主机Host内部预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道下发给应用层管理进程。通过本发明将检测到的资源状态异常事件直接下发给应用层代理进程或者应用层管理进程,无需经过IaaS管理中心节点以及应用层管理中心节点,缩短了通知路径,并增强了可靠性。

Description

电信云中异常事件的处理方法及装置
技术领域
本发明涉及电信云技术领域,尤其涉及一种电信云中异常事件的处理方法及装置。
背景技术
随着电信云概念的推广,业务应用层与IaaS(Infrastructure as a Service,基础设施即服务)层分离、解耦的分层架构被广泛应用到电信系统。电信系统中,硬件设备由IaaS层管理,对业务应用透明,业务应用一般运行在VM(VirtualMachine,虚拟机)中,如图1所示。
电信应用的一个典型特征是高可靠性,电信系统通过进程间主备互助的方式,实现高可靠性。如图2A所示,VM1上运行的是主业务进程,进行业务的处理,VM2上运行的是备业务进程,不进行业务的处理,备业务进程从主业务进程同步状态和数据。运行过程中,由部署在VM3上的管理进程,对系统中运行的进程进行监控,若管理进程监控到VM1上的业务进程出现了异常,则会通知VM2上的备业务进程转换为主业务进程进行业务的处理,而VM1上的主业务进程转变为备业务进程,从而实现业务的恢复,如图2B所示。
在分层架构下,为保证电信应用在云上的可靠性,若IaaS层的资源状态发生变化,例如硬件故障或者运行VM的Host OS(Host Operating System,运行在宿主机的操作系统)崩溃,需要在IaaS层提供相关的通知能力,对异常事件进行处理,由IaaS层一起完成业务迁移和故障隔离等操作,向用户提供高可靠的电信业务。
一般的,进行异常事件通知处理时,如图3所示,当IaaS代理进程检测到VM发生故障时,将该故障上报到IaaS管理中心节点,IaaS管理中心节点再通知应用层管理中心节点,最后由应用层管理中心节点通知到应用层管理进程。
上述进行异常事件通知处理的过程,通道路径比较长,不能及时将异常事件通知到应用层,并且应用层管理中心节点和IaaS管理中心节点都为管理维护节点,管理维护节点作为故障通知通道,可靠性比较低。
发明内容
本发明实施例提供一种电信云中异常事件的处理方法及装置,以缩短通知路径,增加可靠性。
第一方面,提供一种电信云中异常事件的处理方法,包括:
基础设施即服务IaaS代理进程检测资源状态;
所述IaaS代理进程将检测到的资源状态异常事件,通过在宿主机Host内部预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道下发给应用层代理进程,由所述应用层代理进程根据所述资源状态异常事件对实际业务的影响程度,请求应用层管理进程对所述异常事件进行处理;和/或
所述IaaS代理进程将检测到的资源状态异常事件,通过在宿主机Host内部预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道下发给应用层管理进程,由所述应用层管理进程根据所述资源状态异常事件对实际业务的影响程度,对所述异常事件进行处理。
结合第一方面,在第一种实现方式中,在IaaS代理进程检测资源状态之前,该方法还包括:
IaaS代理进程接收应用层管理中心节点发送的异常事件通知服务请求;
IaaS代理进程根据所述异常事件通知服务请求,创建故障通知通道并启动异常事件通知服务;
IaaS代理进程将所述异常事件通知服务的接入地址、接入通道类型和交换协议类型,反馈给所述应用层管理中心节点,指示应用层代理进程或者应用层管理进程根据所述接入地址、所述接入通道类型和所述交换协议类型接入所述异常事件通知服务。
结合第一方面,在第二种实现方式中,所述IaaS代理进程检测资源状态,包括:
IaaS代理进程接收应用层代理进程或应用层管理进程发送的订阅请求;
IaaS代理进程根据所述订阅请求,检测与所述订阅请求相关的资源状态。
结合第一方面,在第三种实现方式中,所述IaaS代理进程检测资源状态,包括:
IaaS代理进程接收应用层管理进程发送的包含有订阅关系的订阅请求,所述订阅关系用于表示所述应用层管理进程欲关注的虚拟机以及欲关注虚拟机的资源状态;
IaaS代理进程查找所述欲关注虚拟机所属的IaaS代理进程,得到欲关注IaaS代理进程;
IaaS代理进程将所述订阅关系发送给所述欲关注IaaS代理进程,并指示所述欲关注IaaS代理进程根据所述订阅关系监测所述欲关注虚拟机的资源状态。
结合第一方面的第三种实现方式,在第四种实现方式中,所述IaaS代理进程接收应用层管理进程发送的包含有订阅关系的订阅请求,具体包括:
所述IaaS代理进程通过所述IaaS代理进程与应用层管理进程之间的故障通知通道接收所述订阅请求;或者
所述IaaS代理进程通过应用层管理进程、应用层管理中心节点和IaaS代理进程之间的故障通知通道接收所述订阅请求。
第二方面,提供一种电信云中异常事件的处理方法,包括:
应用层代理进程接收基础设施即服务IaaS代理进程通过在宿主机Host内部预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道下发的资源状态异常事件;
当所述资源状态异常事件对实际业务的影响程度达到设定级别时,所述应用层代理进程请求应用层管理进程对所述异常事件进行处理。
结合第二方面,在第一种实现方式中,所述应用层代理进程接收IaaS代理进程下发的资源状态异常事件之前,该方法还包括:
所述应用层代理进程接收应用层管理中心节点下发的接入指示,所述接入指示中包括所述IaaS代理进程反馈的异常事件通知服务的接入地址、接入通道类型和交换协议类型;
所述应用层代理进程根据所述接入指示中包括的所述接入地址、所述接入通道类型和所述交换协议类型接入所述异常事件通知服务。
结合第二方面,在第二种实现方式中,所述应用层代理进程接收IaaS代理进程下发的资源状态异常事件之前,该方法还包括:
所述应用层代理进程向所述IaaS代理进程发送订阅请求,请求所述IaaS代理进程下发与所述订阅请求相关的资源状态。
第三方面,提供一种电信云中异常事件的处理方法,包括:
应用层管理进程接收基础设施即服务IaaS代理进程通过在宿主机Host内部预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道下发的资源状态异常事件;
当所述资源状态异常事件对实际业务的影响程度达到设定级别时,所述应用层管理进程对所述异常事件进行处理。
结合第三方面,在第一种实现方式中,所述应用层管理进程接收IaaS代理进程下发的资源状态异常事件之前,该方法还包括:
接收应用层管理中心节点下发的接入指示,所述接入指示包括所述IaaS代理进程反馈的异常事件通知服务的接入地址、接入通道类型和交换协议类型;
所述应用层管理进程根据所述接入指示中包括的所述接入地址、所述接入通道类型和所述交换协议类型接入所述异常事件通知服务。
结合第三方面,在第二种实现方式中所述应用层管理进程接收IaaS代理进程下发的资源状态异常事件之前,该方法还包括:
所述应用层管理进程向所述IaaS代理进程发送订阅请求,请求所述IaaS代理进程下发与所述订阅请求相关的资源状态。
结合第三方面,在第三种实现方式中,所述应用层管理进程通过所述IaaS代理进程与应用层管理进程之间的故障通知通道,向所述IaaS代理进程发送包含有订阅关系的订阅请求,请求所述IaaS代理进程下发所述欲关注虚拟机的资源状态,所述订阅关系用于表示所述应用层管理进程欲关注的虚拟机以及欲关注虚拟机的资源状态;或者
所述应用层管理进程通过应用层管理进程、应用层管理中心节点和IaaS代理进程之间的故障通知通道,向所述IaaS代理进程发送包含有订阅关系的订阅请求,请求所述IaaS代理进程下发所述欲关注虚拟机的资源状态,所述订阅关系用于表示所述应用层管理进程欲关注的虚拟机以及欲关注虚拟机的资源状态
第四方面,提供一种电信云中异常事件的处理装置,包括检测单元和下发单元,其中,
所述检测单元,用于检测资源状态;
所述下发单元,用于将所述检测单元检测到的资源状态异常事件,通过在宿主机Host内部预先建立的基础设施即服务IaaS代理进程与应用层代理进程之间的故障通知通道下发给应用层代理进程,由所述应用层代理进程根据所述资源状态异常事件对实际业务的影响程度,请求应用层管理进程对所述异常事件进行处理;和/或
将所述检测单元检测到的资源状态异常事件,通过在宿主机Host内部预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道下发给应用层管理进程,由所述应用层管理进程根据所述资源状态异常事件对实际业务的影响程度,对所述异常事件进行处理。
结合第四方面,在第一种实现方式中,所述下发单元,还用于:
接收应用层管理中心节点发送的异常事件通知服务请求;
根据所述异常事件通知服务请求,创建故障通知通道并启动异常事件通知服务;
将所述异常事件通知服务的接入地址、接入通道类型和交换协议类型,反馈给所述应用层管理中心节点,指示应用层代理进程或者应用层管理进程根据所述接入地址、所述接入通道类型和所述交换协议类型接入所述异常事件通知服务。
结合第四方面,在第二种实现方式中,所述检测单元,用于:
接收应用层代理进程或应用层管理进程发送的订阅请求;
根据所述订阅请求,检测与所述订阅请求相关的资源状态。
结合第四方面,在第三种实现方式中,所述检测单元,用于:
接收应用层管理进程发送的包含有订阅关系的订阅请求,所述订阅关系用于表示所述应用层管理进程欲关注的虚拟机以及欲关注虚拟机的资源状态;
查找所述欲关注虚拟机所属的IaaS代理进程,得到欲关注IaaS代理进程;
将所述订阅关系发送给所述欲关注IaaS代理进程,并指示所述欲关注IaaS代理进程根据所述订阅关系监测所述欲关注虚拟机的资源状态。
结合第四方面的第三种实现方式,在第四种实现方式中,所述检测单元,具体用于:
通过所述IaaS代理进程与应用层管理进程之间的故障通知通道接收所述订阅请求;或者
通过应用层管理进程、应用层管理中心节点和IaaS代理进程之间的故障通知通道接收所述订阅请求。
第五方面,提供一种电信云中异常事件的处理装置,包括接收单元和请求单元,其中,
所述接收单元,用于接收基础设施即服务IaaS代理进程通过在宿主机Host内部预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道下发的资源状态异常事件;
所述请求单元,用于当所述资源状态异常事件对实际业务的影响程度达到设定级别时,请求应用层管理进程对所述异常事件进行处理。
结合第五方面,在第一种实现方式中,所述接收单元,还用于:
接收应用层管理中心节点下发的接入指示,所述接入指示中包括所述IaaS代理进程反馈的异常事件通知服务的接入地址、接入通道类型和交换协议类型,并根据所述接入指示中包括的所述接入地址、所述接入通道类型和所述交换协议类型接入所述异常事件通知服务。
结合第五方面,在第二种实现方式中,所述请求单元,还用于:
接收IaaS代理进程下发的资源状态异常事件之前,向所述IaaS代理进程发送订阅请求,请求所述IaaS代理进程下发与所述订阅请求相关的资源状态。
第六方面,提供一种电信云中异常事件的处理装置,包括接收单元和处理单元,其中,
所述接收单元,用于接收基础设施即服务IaaS代理进程通过在宿主机Host内部预先建立的基础设施即服务IaaS代理进程与应用层管理进程之间的故障通知通道下发的资源状态异常事件;
所述处理单元,用于当所述资源状态异常事件对实际业务的影响程度达到设定级别时,对所述异常事件进行处理。
结合第六方面,在第一种实现方式中,所述接收单元,还用于:
接收接收应用层管理中心节点下发的接入指示,所述接入指示包括所述IaaS代理进程反馈的异常事件通知服务的接入地址、接入通道类型和交换协议类型,并根据所述接入指示中包括的所述接入地址、所述接入通道类型和所述交换协议类型接入所述异常事件通知服务。
结合第六方面,在第二种实现方式中,该装置还包括请求单元,其中,
所述请求单元,用于接收IaaS代理进程下发的资源状态异常事件之前,向所述IaaS代理进程发送订阅请求,请求所述IaaS代理进程下发与所述订阅请求相关的资源状态。
结合第六方面的第二种实现方式,在第三种实现方式中,所述请求单元,用于:
通过所述IaaS代理进程与应用层管理进程之间的故障通知通道,向所述IaaS代理进程发送包含有订阅关系的订阅请求,请求所述IaaS代理进程下发所述欲关注虚拟机的资源状态,所述订阅关系用于表示所述应用层管理进程欲关注的虚拟机以及欲关注虚拟机的资源状态;或者
通过应用层管理进程、应用层管理中心节点和IaaS代理进程之间的故障通知通道,向所述IaaS代理进程发送包含有订阅关系的订阅请求,请求所述IaaS代理进程下发所述欲关注虚拟机的资源状态,所述订阅关系用于表示所述应用层管理进程欲关注的虚拟机以及欲关注虚拟机的资源状态。
本发明实施例提供的电信云中异常事件的处理方法及装置,通过在Host内部预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道,或IaaS代理进程与应用层管理进程之间的故障通知通道,将检测到的资源状态异常事件直接下发给应用层代理进程或者应用层管理进程,无需经过IaaS管理中心以及应用层管理中心节点,缩短了通知路径,并增强了可靠性。
附图说明
图1为现有技术中电信云分层架构构成示意图;
图2A-图2B为现有技术中实现业务进程迁移过程示意图;
图3为现有技术中异常事件通知处理过程示意图;
图4为本发明实施例提供的Guest和Host之间建立有故障通知通道的系统架构图;
图5为本发明实施例提供的电信云中异常事件通知处理流程图;
图6A-图6B为本发明实施例提供的应用层管理进程故障通知线路示意图;
图7A-图7B为本发明实施例提供的应用层代理进程进行异常事件通知处理流程图;
图8A-图8B为本发明实施例提供的应用层管理进程进行异常事件通知处理流程图;
图9为本发明实施例基于IaaS代理进程提供的电信云中异常事件处理装置构成示意图;
图10为本发明实施例基于应用层代理进程提供的电信云中异常事件处理装置构成示意图;
图11A-图11B为本发明实施例基于应用层管理进程提供的电信云中异常事件处理装置构成示意图;
图12为本发明实施例提供的电信云中异常事件处理装置构成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,并不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例提供的电信云异常事件的处理方法,应用于图4所示的系统架构,包括Host(宿主机)端的IaaS代理进程,Guest(客户机)端的业务进程、代理进程和管理进程,图4中IaaS代理进程运行在Host端,其中一个Guest上的业务进程和管理进程运行在IaaS层创建的虚拟机VM2上,另一个Guest上的业务进程和代理进程运行在IaaS层创建的虚拟机VM1上,本发明实施例在Guest和Host之间建立故障通知通道R,通过该故障通知通道进行异常事件的通知,以缩短通知路径,提高可靠性。
在一个实施例中,以IaaS代理进程执行电信云中异常事件的处理过程进行说明,图5所示为IaaS代理进程进行电信云中异常事件的处理流程图,如图5所示,包括:
S101:IaaS代理进程检测资源状态。
S102:IaaS代理进程将检测到的资源状态异常事件,通过在Host内部预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道下发给应用层代理进程,或通过在Host内部预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道下发给应用层管理进程。
具体的,IaaS代理进程将检测到的资源状态异常事件,通过在宿主机Host内部预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道下发给应用层代理进程,由应用层代理进程根据当前资源状态异常事件对实际业务的影响程度,请求应用层管理进程对异常事件进行例如暂停或者主备倒换等处理。
IaaS代理进程将检测到的资源状态异常事件,通过在宿主机Host内部预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道下发给应用层管理进程,由应用层管理进程根据当前资源状态异常事件对实际业务的影响程度,对异常事件进行暂停或者主备倒换等处理。
进一步的,本发明实施例中在执行S101检测资源状态之前,需要在Host内部预先建立故障通知通道并启动异常事件通知服务,IaaS侧建立故障通知通道的过程可优选如下方式:
IaaS代理进程接收应用层管理中心节点发送的异常事件通知服务请求,并根据异常事件通知服务请求,创建故障通知通道并启动异常事件通知服务。IaaS代理进程将异常事件通知服务的接入地址、接入通道类型和交换协议类型,反馈给应用层管理中心节点,由应用层管理中心节点指示应用层代理进程或者应用层管理进程,根据接入地址、接入通道类型和交换协议类型接入异常事件通知服务。
具体的,本发明实施例中建立的故障通知通道可以使用不同的类型,不同的协议格式,例如可采用如下方式定义故障通知通道的接口:
“directChannelType”:[string]通道类型,该通道类型可以是“Charter device,UDP或TCP”
“directChannelName”:[string]通道地址,该通道地址是IaaS代理进程提供的异常事件通知服务的接入地址。
“directChannelProtocol”:[string]通道消息协议,该通道消息协议可以是“JOSN,XML或TLV”。
例如:Host OS中KVM(Kernel-based Virtual Machine,基于内核的虚拟机)创建虚拟机时,提供virtio-serial(串口通道)给Guest中的业务进程,Guest中的业务进程可以读取字符设备“/dev/virtio-serial/port1”,按照JOSN格式去解析IaaS代理进程下发的资源状态异常事件,采用如下程序实现:
directChannelName=/dev/virtio-serial/port1
directChannelType=charter device
directChannelProtocol=JOSN
当然,本发明实施例可以扩充其他通道,作为故障通知通道,例如通过虚拟网卡走UDP/TCP的通道,也支持其他格式例如XML和TLV,可采用如下方式实现:
directChannelName=172.168.1.6:8990
directChannelType=TCP
directChannelProtocol=TLV。
进一步的,本发明实施例中IaaS代理进程进行资源状态检测的过程,可优选如下方式:
第一种优选的方式:IaaS代理进程接收应用层代理进程或应用层管理进程发送的订阅请求,根据接收到的订阅请求,检测与该订阅请求相关的资源状态。
具体的,本发明实施例中应用层代理进程或应用层管理进程可以订阅相关硬件故障、性能检测和/或可靠性检测的结果事件,并将包含该订阅内容的订阅请求发送给IaaS代理进程,IaaS代理进程根据该订阅请求检测与该订阅请求相关的资源状态,并当检测到的与该订阅请求相关的资源状态异常事件发送给应用层代理进程或应用层管理进程,由应用层代理进程或应用层管理进程根据具体的业务对该异常事件进行处理,例如可以接收应用层管理进程或应用层代理进程发送的对硬件温度过高及多比特的内存错误等虚拟机亚健康状态进行检测的订阅请求,以在发生亚健康状态时完成业务迁移及故障隔离。
具体的,IaaS代理进程接收到应用层代理进程或者应用层管理进程发送的订阅请求后,可通过定义通知接口实现,该通知接口可以包含如下信息:受影响资源标识(可以是多个对象),通知类型,触发事件类型(包含故障,性能下降,可靠性减低),并可采用例如以下的程序方式实现:
Figure BDA0000462954870000121
第二种优选的方式:
A:IaaS代理进程接收应用层管理进程发送的包含有订阅关系的订阅请求,该订阅关系用于表示应用层管理进程欲关注的虚拟机以及该欲关注虚拟机的资源状态。
B:IaaS代理进程接收到包含订阅关系的订阅请求后,查找欲关注虚拟机所属的IaaS代理进程,得到欲关注IaaS代理进程。
C:IaaS代理进程将订阅关系发送给欲关注IaaS代理进程,并指示欲关注IaaS代理进程根据该订阅关系监测欲关注虚拟机的资源状态。
具体的,当欲关注IaaS代理进程检测到欲关注虚拟机的资源状态发生异常时,将资源状态异常事件发送给该发送订阅请求的应用层管理进程所属的IaaS代理进程,并由IaaS代理进程通过在Host内部预先建立的IaaS 代理进程与应用层管理进程之间的故障通知通道下发给应用层管理进程。
优选的,本发明实施例中接收应用层管理进程发送的包含有订阅关系的订阅请求时,可通过在Host内部预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道接收;也可以通过应用层管理进程、应用层管理中心节点和IaaS代理进程之间的故障通知通道接收,如图6A所示,通道M代表IaaS代理进程与应用层管理进程之间的故障通知通道,通道M’代表通过应用层管理进程、应用层管理中心节点和IaaS代理进程之间的故障通知通道接收的通道。
具体的,欲关注IaaS代理进程接收到订阅关系以后,记录订阅关系到本地,当检查到欲关注虚拟机资源状态发生异常时,或者需要对欲关注虚拟机进行故障操作时,根据订阅关系,将资源状态异常事件发送给应用层管理进程所属Host的IaaS代理进程,IaaS代理进程上报给应用层管理进程,由应用层管理进程对该欲关注虚拟机资源状态异常事件进行处理,例如可以通知其他虚拟机中的业务进程接管欲关注虚拟机的业务进程,如图6B所示,L为虚拟机故障时资源状态异常事件通知经过路径。
例如,图6B所示,VM2中的应用层管理进程同时管理4个虚拟机(VM1-VM4),其可订阅这4个虚拟机的故障通知事件,当IaaS代理进程2需要对VM4虚拟机进行重启或关闭操作时,或者IaaS代理进程2直接检测到VM4发生故障时,则IaaS代理进程2可将该资源状态异常事件反馈给IaaS代理进程1,由I aaS代理进程1通过其与VM2中的应用层管理进程之间预先建立的故障通知通道,快速通知VM2中的应用层管理进程,由VM2中的应用层管理进程对虚拟机VM4上的业务进程倒换到正常的虚拟机上面。
本发明实施例中上述异常事件的处理方法,通过预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道,将检测到的资源状态异常事件直接下发给应用层代理进程或者应用层管理进程,无需经过IaaS管理中心以及应用层管理中心节点,缩短了通知路径,并增强了可靠性。
在另一实施例中,以应用层代理进程执行电信云中异常事件的处理方法为例进行说明,如图7A所示,包括:
S201:应用层代理进程接收IaaS代理进程通过在Host内部预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道下发的资源状态异常事件。
S202:当接收到的资源状态异常事件对实际业务的影响程度达到设定级别时,请求应用层管理进程对所述异常事件进行处理。
具体的,本发明实施例中应用层代理进程接收IaaS代理进程下发的资源状态异常事件之前,需要预先接入IaaS代理进程提供的异常事件通知服务,优选如下方式实现:
应用层管理中心节点向IaaS代理进程发送异常事件通知服务请求,并接收IaaS代理进程创建故障通知通道并启动异常事件通知服务后反馈的异常事件通知服务的接入地址、接入通道类型和交换协议类型,当应用层管理中心节点接收到IaaS代理进程反馈的异常事件通知服务的接入地址、接入通道类型和交换协议类型时,向应用层代理进程发送接入指示,该接入指示中包括IaaS代理进程反馈的异常事件通知服务的接入地址、接入通道类型和交换协议类型,应用层代理进程接收到接入指示时,根据接入指示中包括的接入地址、接入通道类型和交换协议类型接入异常事件通知服务。
进一步的,本发明实施例中应用层代理进程还可向IaaS代理进程发送订阅请求,请求IaaS代理进程下发与其发送的订阅请求相关的资源状态。
具体的,本发明实施例中应用层代理进程向IaaS代理进程发送订阅请求时,可通过订阅接口,主要是订阅接口对象类型实现,例如可采用如下程序实现:
Figure BDA0000462954870000141
本发明实施例中应用层代理进程进行异常事件处理的过程,如图7B所示,包括:
S301:应用层代理进程向IaaS代理进程发送接入异常事件通知服务请求,并接入异常事件通知服务。
具体的,本发明实施例中应用层代理进程可在向IaaS代理进程申请虚拟机时,附带申请IaaS代理进程提供的异常事件通知服务,由应用层管理中心节点向IaaS代理进程发起申请请求,在申请成功后,由IaaS代理进程返回异常事件通知服务的接入地址、接入通道类型和交换协议类型,应用层代理进程根据该接入地址、接入通道类型和交换协议类型接入异常事件通知服务。
S302:IaaS代理进程检测到资源状态异常事件时,通过预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道下发资源状态异常事件。
S303:应用层代理进程接收到资源状态异常事件后,根据资源状态异常事件对实际业务影响程度,请求应用层管理进程进行业务倒换。
S304:应用层管理进程指示业务进程,进行倒换业务进程处理。
本发明实施例中应用层代理进程进行异常事件的处理方法,通过在Host内部预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道,将检测到的资源状态异常事件直接下发给应用层代理进程,无需经过IaaS管理中心节点以及应用层管理中心节点,缩短了通知路径,并增强了可靠性。
本发明的再一实施例中,以应用层管理进程执行电信云中异常事件的处理方法为例进行说明,如图8A所示,包括:
S401:应用层管理进程接收IaaS代理进程通过在Host内部预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道。
S402:当资源状态异常事件对实际业务的影响程度达到设定级别时,应用层管理进程对异常事件进行处理。
具体的,本发明实施例中应用层管理进程接收到IaaS代理进程下发的资源状态异常事件后,可根据自身业务对该资源依赖情况决定是否进行处理,当资源状态异常事件对实际业务的影响程度达到设定级别时,对异常事件进行处理。例如,在存储高业务应用时,应用层管理进程在接收到IaaS代理进程下发的RAID降级通知时,在业务进程还没有受损前,触发自动切换进程,将业务进程切换到可靠性更高的虚拟机上,降低RAID降级对业务进程的影响。
进一步的,本发明实施例中应用层管理进程接收IaaS代理进程下发的资源状态异常事件之前,需要预先接入IaaS代理进程提供的异常事件通知服务,优选如下方式实现:
应用层管理中心节点向IaaS代理进程发送异常事件通知服务请求,并接收IaaS代理进程创建故障通知通道并启动异常事件通知服务后反馈的异常事件通知服务的接入地址、接入通道类型和交换协议类型,当应用层管理中心节点接收到IaaS代理进程反馈的异常事件通知服务的接入地址、接入通道类型和交换协议类型时,向应用层管理进程发送接入指示,该接入指示中包括IaaS代理进程反馈的异常事件通知服务的接入地址、接入通道类型和交换协议类型,应用层管理进程接收到接入指示时,根据接入指示中包括的接入地址、接入通道类型和交换协议类型接入异常事件通知服务。
进一步的,应用层管理进程可以向IaaS代理进程发送订阅请求,请求IaaS代理进程下发与订阅请求相关的资源状态。
具体的,本发明实施例中应用层管理进程向IaaS代理进程发送订阅请求时,可采用与应用层代理进程相同的方式,通过订阅接口对象类型实现,具体不再赘述。
更进一步的,本发明实施例中应用层管理进程可通过IaaS代理进程与应用层管理进程之间的故障通知通道或者应用层管理进程、应用层管理中心节点和IaaS代理进程之间的故障通知通道,向IaaS代理进程发送包含有订阅关系的订阅请求,请求IaaS代理进程下发欲关注虚拟机的资源状态,该订阅关系用于表示应用层管理进程欲关注的虚拟机以及欲关注虚拟机的资源状态,可进一步参阅图6A-图6B。
具体的,本发明实施例中应用层管理进程通过发送包含订阅关系的订阅请求给IaaS代理进程,获取资源状态异常事件并进行处理的过程如图8B所示,包括:
S501:应用层管理进程向IaaS代理进程订阅关注虚拟机状态变化的请求。
S502:IaaS代理进程将订阅关系发送给关注虚拟机所在Host的IaaS代理进程,记为欲关注IaaS代理进程。
S503:欲关注IaaS代理进程保存订阅关系。
S504:欲关注IaaS代理进程向IaaS代理进程发布虚拟机故障。
S505:IaaS代理进程通过预先建立的故障通知通道,下发虚拟机故障事件通知。
S506:应用层管理进程指示业务进程,进行倒换业务进程处理。
当然,上述应用层虚拟机故障事件的订阅关系可以使用另外一种通道下发给欲关注IaaS代理进程,即应用层管理中心节点下发订阅关系给IaaS管理中心节点,IaaS管理中心节点保存订阅关系到数据库中,欲关注IaaS代理进程启动时从IaaS管理中心节点获取订阅关系。
本发明实施例中应用层管理进程进行异常事件的处理方法,通过预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道,将检测到的资源状态异常事件直接下发给应用层管理进程,无需经过IaaS管理中心以及应用层管理中心节点,缩短了通知路径,并增强了可靠性。
基于上述IaaS代理进程执行电信云中异常事件的处理方法,本发明实施例提供一种电信云中异常事件的处理装置,如图9所示,该装置包括检测单元901和下发单元902,其中,
检测单元901,用于检测资源状态。
下发单元902,用于将检测单元901检测到的资源状态异常事件,通过在宿主机Host内部预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道下发给应用层代理进程,和/或通过在宿主机Host内部预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道下发给应用层管理进程。
本发明实施例中,下发单元902将检测单元901检测到的资源状态异常事件,通过在宿主机Host内部预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道下发给应用层代理进程,由应用层代理进程根据资源状态异常事件对实际业务的影响程度,请求应用层管理进程对异常事件进行处理。
下发单元902将检测单元901检测到的资源状态异常事件,通过在宿主机Host内部预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道下发给应用层管理进程,由应用层管理进程根据资源状态异常事件对实际业务的影响程度,对异常事件进行处理。
其中,在第一种实现方式中,下发单元902,还用于:
接收应用层管理中心节点发送的异常事件通知服务请求;
根据异常事件通知服务请求,创建故障通知通道并启动异常事件通知服务;
将异常事件通知服务的接入地址、接入通道类型和交换协议类型,反馈给应用层管理中心节点,指示应用层代理进程或者应用层管理进程根据接入地址、接入通道类型和交换协议类型接入异常事件通知服务。
在第二种实现方式中,检测单元901,用于:
接收应用层代理进程或应用层管理进程发送的订阅请求;
根据订阅请求,检测与该订阅请求相关的资源状态。
在第三种实现方式中,检测单元901,用于:
接收应用层管理进程发送的包含有订阅关系的订阅请求,其中,订阅关系用于表示应用层管理进程欲关注的虚拟机以及欲关注虚拟机的资源状态;
查找欲关注虚拟机所属的IaaS代理进程,得到欲关注IaaS代理进程;
将订阅关系发送给欲关注IaaS代理进程,并指示欲关注IaaS代理进程根据订阅关系监测欲关注虚拟机的资源状态。
在第四种实现方式中,检测单元901,具体用于:通过IaaS代理进程与应用层管理进程之间的故障通知通道接收订阅请求;或者
通过应用层管理进程、应用层管理中心节点和IaaS代理进程之间的故障通知通道接收订阅请求。
基于应用层代理进程执行电信云中异常事件的处理方法,本发明实施例提供一种电信云中异常事件的处理装置,如图10所示,包括接收单元1001和请求单元1002,其中,
接收单元1001,用于接收IaaS代理进程通过在宿主机Host内部预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道下发的资源状态异常事件;
请求单元1002,用于当资源状态异常事件对实际业务的影响程度达到设定级别时,请求应用层管理进程对异常事件进行处理。
在第一种实现方式中,接收单元1001,还用于:
接收应用层管理中心节点下发的接入指示,接入指示中包括IaaS代理进程反馈的异常事件通知服务的接入地址、接入通道类型和交换协议类型,并根据接入指示中包括的接入地址、接入通道类型和交换协议类型接入异常事件通知服务。
在第二种实现方式中,请求单元1002,还用于:
接收IaaS代理进程下发的资源状态异常事件之前,向IaaS代理进程发送订阅请求,请求IaaS代理进程下发与订阅请求相关的资源状态。
基于应用层管理进程执行电信云中异常事件的处理方法,本发明实施例还提供一种电信云中异常事件的处理装置,如图11A所示,该装置包括接收单元1101和处理单元1102,其中,
接收单元1101,用于接收IaaS代理进程通过在宿主机Host内部预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道下发的资源状态异常事件;
处理单元1102,用于当资源状态异常事件对实际业务的影响程度达到设定级别时,对异常事件进行处理。
在第一种实现方式中,接收单元1102,还用于:
接收接收应用层管理中心节点下发的接入指示,接入指示包括IaaS代理进程反馈的异常事件通知服务的接入地址、接入通道类型和交换协议类型,并根据接入指示中包括的接入地址、接入通道类型和交换协议类型接入异常事件通知服务。
在第二种实现方式中,该装置还包括请求单元1103,如图11B所示,请求单元1103,用于:
接收IaaS代理进程下发的资源状态异常事件之前,向IaaS代理进程发送订阅请求,请求IaaS代理进程下发与订阅请求相关的资源状态。
在第三种实现方式中,请求单元1103,用于:
通过所述IaaS代理进程与应用层管理进程之间的故障通知通道,向IaaS代理进程发送包含有订阅关系的订阅请求,请求IaaS代理进程下发欲关注虚拟机的资源状态,订阅关系用于表示应用层管理进程欲关注的虚拟机以及欲关注虚拟机的资源状态;或者
通过应用层管理进程、应用层管理中心节点和IaaS代理进程之间的故障通知通道,向IaaS代理进程发送包含有订阅关系的订阅请求,请求IaaS代理进程下发欲关注虚拟机的资源状态,订阅关系用于表示应用层管理进程欲关注的虚拟机以及欲关注虚拟机的资源状态。
基于上述提供的电信云中异常事件的处理装置,本发明实施例还提供一种电信云中异常事件的处理装置,如图12所示,该装置包括:收发器1201,处理器1202,存储器1203和总线1204,其中,收发器1201,处理器1202和存储器1203均与总线1204连接。
处理器1202,用于检测资源状态;通过收发器1201将检测到的资源状态异常事件,通过在宿主机Host内部预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道下发给应用层代理进程,由应用层代理进程根据资源状态异常事件对实际业务的影响程度,请求应用层管理进程对所述异常事件进行处理;和/或,将检测到的资源状态异常事件,通过在宿主机Host内部预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道下发给应用层管理进程,由应用层管理进程根据资源状态异常事件对实际业务的影响程度,对异常事件进行处理。
处理器1202,还用于通过收发器1201接收IaaS代理进程通过在宿主机Host内部预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道下发的资源状态异常事件;当资源状态异常事件对实际业务的影响程度达到设定级别时,请求应用层管理进程对所述异常事件进行处理。
处理器1202,还用于通过收发器1201接收IaaS代理进程通过在宿主机Host内部预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道下发的资源状态异常事件;当资源状态异常事件对实际业务的影响程度达到设定级别时,对异常事件进行处理。
其中,处理器1202执行上述过程通常由一个或多个软件程序控制完成,上述一个或多个软件程序存储于存储器1203中,当处理器1202需要执行上述过程时,将上述一个或多个软件程序调入处理器1202,由处理器1202控制完成上述过程。当然处理器1202执行上述过程也可通过硬件实现,本发明实施例不做限定。
本发明实施例提供的电信云中异常事件的处理装置,可以用来执行图4-图8B所示的电信云中异常事件的处理方法,因此对于图9-图12中涉及的电信云中异常事件的处理装置说明不够详尽的地方,可参阅图4-图8B的说明。
需要说明的是,本发明实施例提供的电信云中异常事件的处理装置可以是独立的部件,也可以是集成在IaaS代理进程、应用层管理进程或应用层代理进程之内,本发明实施例不做限定。
本发明实施例提供的电信云中异常事件的处理装置,通过在Host内部预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道,或IaaS代理进程与应用层管理进程之间的故障通知通道,将检测到的资源状态异常事件直接下发给应用层代理进程或者应用层管理进程,无需经过IaaS管理中心以及应用层管理中心节点,缩短了通知路径,并增强了可靠性。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (24)

1.一种电信云中异常事件的处理方法,其特征在于,包括:
基础设施即服务IaaS代理进程检测资源状态;
所述IaaS代理进程将检测到的资源状态异常事件,通过在宿主机Host内部预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道下发给应用层代理进程,由所述应用层代理进程根据所述资源状态异常事件对实际业务的影响程度,请求应用层管理进程对所述异常事件进行处理;和/或
所述IaaS代理进程将检测到的资源状态异常事件,通过在宿主机Host内部预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道下发给应用层管理进程,由所述应用层管理进程根据所述资源状态异常事件对实际业务的影响程度,对所述异常事件进行处理。
2.如权利要求1所述的方法,其特征在于,在IaaS代理进程检测资源状态之前,该方法还包括:
IaaS代理进程接收应用层管理中心节点发送的异常事件通知服务请求;
IaaS代理进程根据所述异常事件通知服务请求,创建故障通知通道并启动异常事件通知服务;
IaaS代理进程将所述异常事件通知服务的接入地址、接入通道类型和交换协议类型,反馈给所述应用层管理中心节点,指示应用层代理进程或者应用层管理进程根据所述接入地址、所述接入通道类型和所述交换协议类型接入所述异常事件通知服务。
3.如权利要求1所述的方法,其特征在于,所述IaaS代理进程检测资源状态,包括:
IaaS代理进程接收应用层代理进程或应用层管理进程发送的订阅请求;
IaaS代理进程根据所述订阅请求,检测与所述订阅请求相关的资源状态。
4.如权利要求1所述的方法,其特征在于,所述IaaS代理进程检测资源状态,包括:
IaaS代理进程接收应用层管理进程发送的包含有订阅关系的订阅请求,所述订阅关系用于表示所述应用层管理进程欲关注的虚拟机以及欲关注虚拟机的资源状态;
IaaS代理进程查找所述欲关注虚拟机所属的IaaS代理进程,得到欲关注IaaS代理进程;
IaaS代理进程将所述订阅关系发送给所述欲关注IaaS代理进程,并指示所述欲关注IaaS代理进程根据所述订阅关系监测所述欲关注虚拟机的资源状态。
5.如权利要求4所述的方法,其特征在于,所述IaaS代理进程接收应用层管理进程发送的包含有订阅关系的订阅请求,具体包括:
所述IaaS代理进程通过所述IaaS代理进程与应用层管理进程之间的故障通知通道接收所述订阅请求;或者
所述IaaS代理进程通过应用层管理进程、应用层管理中心节点和IaaS代理进程之间的故障通知通道接收所述订阅请求。
6.一种电信云中异常事件的处理方法,其特征在于,包括:
应用层代理进程接收基础设施即服务IaaS代理进程通过在宿主机Host内部预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道下发的资源状态异常事件;
当所述资源状态异常事件对实际业务的影响程度达到设定级别时,所述应用层代理进程请求应用层管理进程对所述异常事件进行处理。
7.如权利要求6所述的方法,其特征在于,所述应用层代理进程接收IaaS代理进程下发的资源状态异常事件之前,该方法还包括:
所述应用层代理进程接收应用层管理中心节点下发的接入指示,所述接入指示中包括所述IaaS代理进程反馈的异常事件通知服务的接入地址、接入通道类型和交换协议类型;
所述应用层代理进程根据所述接入指示中包括的所述接入地址、所述接入通道类型和所述交换协议类型接入所述异常事件通知服务。
8.如权利要求6所述的方法,其特征在于,所述应用层代理进程接收IaaS代理进程下发的资源状态异常事件之前,该方法还包括:
所述应用层代理进程向所述IaaS代理进程发送订阅请求,请求所述IaaS代理进程下发与所述订阅请求相关的资源状态。
9.一种电信云中异常事件的处理方法,其特征在于,包括:
应用层管理进程接收基础设施即服务IaaS代理进程通过在宿主机Host内部预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道下发的资源状态异常事件;
当所述资源状态异常事件对实际业务的影响程度达到设定级别时,所述应用层管理进程对所述异常事件进行处理。
10.如权利要求9所述的方法,其特征在于,所述应用层管理进程接收IaaS代理进程下发的资源状态异常事件之前,该方法还包括:
接收应用层管理中心节点下发的接入指示,所述接入指示包括所述IaaS代理进程反馈的异常事件通知服务的接入地址、接入通道类型和交换协议类型;
所述应用层管理进程根据所述接入指示中包括的所述接入地址、所述接入通道类型和所述交换协议类型接入所述异常事件通知服务。
11.如权利要求9所述的方法,其特征在于,所述应用层管理进程接收IaaS代理进程下发的资源状态异常事件之前,该方法还包括:
所述应用层管理进程向所述IaaS代理进程发送订阅请求,请求所述IaaS代理进程下发与所述订阅请求相关的资源状态。
12.如权利要求11所述的方法,其特征在于,所述应用层管理进程向所述IaaS代理进程发送订阅请求,请求所述IaaS代理进程下发与所述订阅请求相关的资源状态,具体包括:
所述应用层管理进程通过所述IaaS代理进程与应用层管理进程之间的故障通知通道,向所述IaaS代理进程发送包含有订阅关系的订阅请求,请求所述IaaS代理进程下发所述欲关注虚拟机的资源状态,所述订阅关系用于表示所述应用层管理进程欲关注的虚拟机以及欲关注虚拟机的资源状态;或者
所述应用层管理进程通过应用层管理进程、应用层管理中心节点和IaaS代理进程之间的故障通知通道,向所述IaaS代理进程发送包含有订阅关系的订阅请求,请求所述IaaS代理进程下发所述欲关注虚拟机的资源状态,所述订阅关系用于表示所述应用层管理进程欲关注的虚拟机以及欲关注虚拟机的资源状态。
13.一种电信云中异常事件的处理装置,其特征在于,包括检测单元和下发单元,其中,
所述检测单元,用于检测资源状态;
所述下发单元,用于将所述检测单元检测到的资源状态异常事件,通过在宿主机Host内部预先建立的基础设施即服务IaaS代理进程与应用层代理进程之间的故障通知通道下发给应用层代理进程,由所述应用层代理进程根据所述资源状态异常事件对实际业务的影响程度,请求应用层管理进程对所述异常事件进行处理;和/或
将所述检测单元检测到的资源状态异常事件,通过在宿主机Host内部预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道下发给应用层管理进程,由所述应用层管理进程根据所述资源状态异常事件对实际业务的影响程度,对所述异常事件进行处理。
14.如权利要求13所述的装置,其特征在于,所述下发单元,还用于:
接收应用层管理中心节点发送的异常事件通知服务请求;
根据所述异常事件通知服务请求,创建故障通知通道并启动异常事件通知服务;
将所述异常事件通知服务的接入地址、接入通道类型和交换协议类型,反馈给所述应用层管理中心节点,指示应用层代理进程或者应用层管理进程根据所述接入地址、所述接入通道类型和所述交换协议类型接入所述异常事件通知服务。
15.如权利要求13所述的装置,其特征在于,所述检测单元,用于:
接收应用层代理进程或应用层管理进程发送的订阅请求;
根据所述订阅请求,检测与所述订阅请求相关的资源状态。
16.如权利要求15所述的装置,其特征在于,所述检测单元,用于:
接收应用层管理进程发送的包含有订阅关系的订阅请求,所述订阅关系用于表示所述应用层管理进程欲关注的虚拟机以及欲关注虚拟机的资源状态;
查找所述欲关注虚拟机所属的IaaS代理进程,得到欲关注IaaS代理进程;
将所述订阅关系发送给所述欲关注IaaS代理进程,并指示所述欲关注IaaS代理进程根据所述订阅关系监测所述欲关注虚拟机的资源状态。
17.如权利要求16所述的装置,其特征在于,所述检测单元,具体用于:
通过所述IaaS代理进程与应用层管理进程之间的故障通知通道接收所述订阅请求;或者
通过应用层管理进程、应用层管理中心节点和IaaS代理进程之间的故障通知通道接收所述订阅请求。
18.一种电信云中异常事件的处理装置,其特征在于,包括接收单元和请求单元,其中,
所述接收单元,用于接收基础设施即服务IaaS代理进程通过在宿主机Host内部预先建立的IaaS代理进程与应用层代理进程之间的故障通知通道下发的资源状态异常事件;
所述请求单元,用于当所述资源状态异常事件对实际业务的影响程度达到设定级别时,请求应用层管理进程对所述异常事件进行处理。
19.如权利要求18所述的装置,其特征在于,所述接收单元,还用于:
接收应用层管理中心节点下发的接入指示,所述接入指示中包括所述IaaS代理进程反馈的异常事件通知服务的接入地址、接入通道类型和交换协议类型,并根据所述接入指示中包括的所述接入地址、所述接入通道类型和所述交换协议类型接入所述异常事件通知服务。
20.如权利要求18所述的装置,其特征在于,所述请求单元,还用于:
接收IaaS代理进程下发的资源状态异常事件之前,向所述IaaS代理进程发送订阅请求,请求所述IaaS代理进程下发与所述订阅请求相关的资源状态。
21.一种电信云中异常事件的处理装置,其特征在于,包括接收单元和处理单元,其中,
所述接收单元,用于接收基础设施即服务IaaS代理进程通过在宿主机Host内部预先建立的IaaS代理进程与应用层管理进程之间的故障通知通道下发的资源状态异常事件;
所述处理单元,用于当所述资源状态异常事件对实际业务的影响程度达到设定级别时,对所述异常事件进行处理。
22.如权利要求21所述的装置,其特征在于,所述接收单元,还用于:
接收接收应用层管理中心节点下发的接入指示,所述接入指示包括所述IaaS代理进程反馈的异常事件通知服务的接入地址、接入通道类型和交换协议类型,并根据所述接入指示中包括的所述接入地址、所述接入通道类型和所述交换协议类型接入所述异常事件通知服务。
23.如权利要求21所述的装置,其特征在于,该装置还包括请求单元,其中,
所述请求单元,用于接收IaaS代理进程下发的资源状态异常事件之前,向所述IaaS代理进程发送订阅请求,请求所述IaaS代理进程下发与所述订阅请求相关的资源状态。
24.如权利要求23所述的装置,其特征在于,所述请求单元,用于:
通过所述IaaS代理进程与应用层管理进程之间的故障通知通道,向所述IaaS代理进程发送包含有订阅关系的订阅请求,请求所述IaaS代理进程下发所述欲关注虚拟机的资源状态,所述订阅关系用于表示所述应用层管理进程欲关注的虚拟机以及欲关注虚拟机的资源状态;或者
通过应用层管理进程、应用层管理中心节点和IaaS代理进程之间的故障通知通道,向所述IaaS代理进程发送包含有订阅关系的订阅请求,请求所述IaaS代理进程下发所述欲关注虚拟机的资源状态,所述订阅关系用于表示所述应用层管理进程欲关注的虚拟机以及欲关注虚拟机的资源状态。
CN201410040568.6A 2014-01-27 2014-01-27 电信云中异常事件的处理方法及装置 Active CN103746855B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201410040568.6A CN103746855B (zh) 2014-01-27 2014-01-27 电信云中异常事件的处理方法及装置
PCT/CN2015/070455 WO2015109955A1 (zh) 2014-01-27 2015-01-09 电信云中异常事件的处理方法及装置
US15/220,116 US10187181B2 (en) 2014-01-27 2016-07-26 Method and device for handling exception event in telecommunication cloud

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410040568.6A CN103746855B (zh) 2014-01-27 2014-01-27 电信云中异常事件的处理方法及装置

Publications (2)

Publication Number Publication Date
CN103746855A true CN103746855A (zh) 2014-04-23
CN103746855B CN103746855B (zh) 2017-09-12

Family

ID=50503846

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410040568.6A Active CN103746855B (zh) 2014-01-27 2014-01-27 电信云中异常事件的处理方法及装置

Country Status (3)

Country Link
US (1) US10187181B2 (zh)
CN (1) CN103746855B (zh)
WO (1) WO2015109955A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015109955A1 (zh) * 2014-01-27 2015-07-30 华为技术有限公司 电信云中异常事件的处理方法及装置
CN105187482A (zh) * 2015-07-20 2015-12-23 深圳供电局有限公司 一种PaaS平台故障自愈实现的方法及消息服务器
CN106603498A (zh) * 2016-11-15 2017-04-26 华为技术有限公司 事件上报方法及装置
WO2019090564A1 (en) * 2017-11-09 2019-05-16 Nokia Shanghai Bell Co., Ltd. Method, management node and processing node for continuous availability in cloud environment
CN110839011A (zh) * 2018-08-17 2020-02-25 视联动力信息技术股份有限公司 监控资源信息的上报方法和装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10678630B2 (en) * 2017-12-15 2020-06-09 Wipro Limited Method and system for resolving error in open stack operating system
US11609776B1 (en) * 2019-12-23 2023-03-21 Cisco Technology, Inc. Elastic internet protocol (IP) address for hypervisor and virtual router management in a branch environment
CN112769605B (zh) * 2020-12-30 2022-08-09 杭州东方通信软件技术有限公司 一种异构多云的运维管理方法及混合云平台

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102984214A (zh) * 2012-11-08 2013-03-20 华为技术有限公司 一种实现电信云中业务迁移的方法及装置
US20130091282A1 (en) * 2011-10-06 2013-04-11 Channarong Tontiruttananon On-demand integrated capacity and reliability service level agreement licensing
CN103294540A (zh) * 2013-05-17 2013-09-11 北京航空航天大学 一种通过至强融核协处理器提升Erlang虚拟机性能的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014158066A1 (en) * 2013-03-28 2014-10-02 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for fault management in infrastructure as a service clouds
CN103746855B (zh) * 2014-01-27 2017-09-12 华为技术有限公司 电信云中异常事件的处理方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130091282A1 (en) * 2011-10-06 2013-04-11 Channarong Tontiruttananon On-demand integrated capacity and reliability service level agreement licensing
CN102984214A (zh) * 2012-11-08 2013-03-20 华为技术有限公司 一种实现电信云中业务迁移的方法及装置
CN103294540A (zh) * 2013-05-17 2013-09-11 北京航空航天大学 一种通过至强融核协处理器提升Erlang虚拟机性能的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
于佳耕等: "虚拟机确定性执行重放的模型分析和实现方法", 《软件学报》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015109955A1 (zh) * 2014-01-27 2015-07-30 华为技术有限公司 电信云中异常事件的处理方法及装置
US10187181B2 (en) 2014-01-27 2019-01-22 Huawei Technologies Co., Ltd. Method and device for handling exception event in telecommunication cloud
CN105187482A (zh) * 2015-07-20 2015-12-23 深圳供电局有限公司 一种PaaS平台故障自愈实现的方法及消息服务器
CN105187482B (zh) * 2015-07-20 2018-09-28 深圳供电局有限公司 一种PaaS平台故障自愈实现的方法及消息服务器
CN106603498A (zh) * 2016-11-15 2017-04-26 华为技术有限公司 事件上报方法及装置
CN106603498B (zh) * 2016-11-15 2020-01-10 华为技术有限公司 事件上报方法及装置
WO2019090564A1 (en) * 2017-11-09 2019-05-16 Nokia Shanghai Bell Co., Ltd. Method, management node and processing node for continuous availability in cloud environment
CN111316599A (zh) * 2017-11-09 2020-06-19 上海诺基亚贝尔股份有限公司 用于云环境中的持续可用性的方法、管理节点和处理节点
US11456934B2 (en) 2017-11-09 2022-09-27 Nokia Shanghai Bell Co., Ltd Method, management node and processing node for continuous availability in cloud environment
CN110839011A (zh) * 2018-08-17 2020-02-25 视联动力信息技术股份有限公司 监控资源信息的上报方法和装置

Also Published As

Publication number Publication date
US10187181B2 (en) 2019-01-22
US20160337084A1 (en) 2016-11-17
WO2015109955A1 (zh) 2015-07-30
CN103746855B (zh) 2017-09-12

Similar Documents

Publication Publication Date Title
CN103746855A (zh) 电信云中异常事件的处理方法及装置
EP3252608B1 (en) Node system, server device, scaling control method, and program
US11003553B2 (en) Method and apparatus for failover processing
US9600380B2 (en) Failure recovery system and method of creating the failure recovery system
EP3358806B1 (en) Method, device and server for service migration during software upgrade under nfv architecture
EP2430544B1 (en) Altering access to a fibre channel fabric
EP3125122B1 (en) Virtualized resource management node and virtual machine migration method
CN103618627B (zh) 一种管理虚拟机的方法、装置及系统
US9223606B1 (en) Automatically configuring and maintaining cluster level high availability of a virtual machine running an application according to an application level specified service level agreement
EP3188008B1 (en) Virtual machine migration method and device
US8321617B1 (en) Method and apparatus of server I/O migration management
CN110166355B (zh) 一种报文转发方法及装置
US20120005609A1 (en) Management system and management system control method
CN109168328B (zh) 虚拟机迁移的方法、装置和虚拟化系统
US20110209148A1 (en) Information processing device, virtual machine connection method, program, and recording medium
US11093353B2 (en) Virtual network system, VIM, virtual network control method and recording medium
WO2018137520A1 (zh) 一种业务恢复方法及装置
EP3806395A1 (en) Virtual network function (vnf) deployment method and apparatus
US8990608B1 (en) Failover of applications between isolated user space instances on a single instance of an operating system
CN103036701A (zh) 一种跨网段的n+1备用方法及装置
EP2975524B1 (en) Information processing device
US20180176080A1 (en) Systems and methods for dynamically commissioning and decommissioning computer components
US10884878B2 (en) Managing a pool of virtual functions
US11153173B1 (en) Dynamically updating compute node location information in a distributed computing environment
CN107147516B (zh) 服务器、存储系统及相关方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant