CN104685830A - 故障管理的方法、实体和系统 - Google Patents

故障管理的方法、实体和系统 Download PDF

Info

Publication number
CN104685830A
CN104685830A CN201380002104.XA CN201380002104A CN104685830A CN 104685830 A CN104685830 A CN 104685830A CN 201380002104 A CN201380002104 A CN 201380002104A CN 104685830 A CN104685830 A CN 104685830A
Authority
CN
China
Prior art keywords
fault
information
entities
fisrt
nfvi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380002104.XA
Other languages
English (en)
Other versions
CN104685830B (zh
Inventor
刘建宁
朱雷
余芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201810143222.7A priority Critical patent/CN108418711B/zh
Publication of CN104685830A publication Critical patent/CN104685830A/zh
Application granted granted Critical
Publication of CN104685830B publication Critical patent/CN104685830B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0712Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0772Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0775Content or structure details of the error report, e.g. specific table structure, specific error fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • H04L41/0627Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time by acting on the notification or alarm source
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0686Additional information in the notification, e.g. enhancement of specific meta-data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0894Policy-based network configuration management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0895Configuration of virtualised networks or elements, e.g. virtualised network function or OpenFlow elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/40Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using virtualisation of network functions or resources, e.g. SDN or NFV entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0893Assignment of logical groups to network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0896Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities
    • H04L41/0897Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities by horizontal or vertical scaling of resources, or by migrating entities, e.g. virtual resources or entities

Abstract

本发明提供一种故障管理方法,能够实现NFV环境下的故障上报及处理。该方法包括:获取网络功能虚拟化基础设施NFVI实体的包含故障实体标识和故障类型的第一故障信息,第一故障信息用于指示具有故障实体标识的第一NFVI实体发生故障;根据第一故障信息生成第一故障综合信息,第一故障综合信息包含第一故障信息和第一故障信息的关联故障信息;根据第一故障综合信息进行故障修复或上报处理。本发明实施例通过获取硬件和/或软件实体的故障信息,对具有关联关系的故障信息进行综合处理,从而能够实现能够实现NFV环境下的故障上报及处理。

Description

故障管理的方法、 实体和系统 技术领域
本发明涉及通信领域, 并且更具体地, 涉及故障管理的方法、 实体和系 统。 背景技术
网络功能虚拟化(Network Function Virtulization, NFV ) 旨在利用通用 的高性能大容量服务器、 交换机和存储设备来实现一些网络功能的软件化。 NFV端到端 (End to End, E2E ) 架构相对于原有的普通虚拟环境增加了许 多软件实例和管理实体,例如虚拟网络功能( Virtual Network Function , VNF ) 实例 /实体,虚拟化基础设施管理器( Virtualization Management System, VIM ) 实体, VNF管理器实体等等, 使得 NFV环境比普通虚拟环境更加复杂。 普 通虚拟环境下的故障上报及处理方法无法适用于 NFV环境。 因此, 需要考 虑在复杂的 NFV环境下如何进行故障上报及处理。 发明内容
本发明实施例提供一种故障管理方法, 能够实现 NFV环境下的故障上 报及处理。
第一方面, 提供了一种故障管理方法, 包括: 虚拟化基础设施管理器
VIM获取网络功能虚拟化基础设施 NFVI实体的包含故障实体标识和故障类 型的第一故障信息, 所述第一故障信息用于指示具有所述故障实体标识的第 一 NFVI实体发生故障;所述 VIM根据所述第一故障信息生成第一故障综合 信息, 所述第一故障综合信息包含所述第一故障信息和所述第一故障信息的 关联故障信息; 所述 VIM根据所述第一故障综合信息进行故障修复或上报 处理。
结合第一方面,在其第一种实现方式中,所述 VIM获取 NFVI实体的包 含故障实体标识和故障类型的第一故障信息, 包括: 接收所述第一 NFVI实 体发送的所述第一故障信息; 或者确定所述第一 NFVI实体发生故障, 并根 据所述第一 NFVI实体发生的故障生成所述第一故障信息。
结合第一方面及其上述实现方式, 在其第二种实现方式中, 所述第一 NFVI实体为所述 NFVI实体中的任意一个硬件 HW、 主操作系统 Host OS、 虚拟机管理器或虚拟机 VM实体, 所述 VIM根据所述第一故障信息生成第 一故障综合信息, 包括: 确定与所述第一 NFVI实体相关联的 NFVI实体发 送的故障信息为所述第一故障信息的关联故障信息; 生成包含有所述第一故 障信息和所述关联故障信息的第一故障综合信息。
结合第一方面及其上述实现方式, 在其第三种实现方式中, 所述 VIM 根据所述第一故障综合信息进行故障修复或上报处理, 包括: 根据所述第一 故障综合信息中的第一故障信息的故障类型或者所述关联故障信息的故障 类型, 确定所述 VIM是否包含与所述第一故障信息的故障类型或者所述关 联故障信息的故障类型相对应的故障修复策略; 在所述 VIM 包含与所述第 一故障信息的故障类型或者所述关联故障信息的故障类型相对应的故障修 复策略时,根据所述故障修复策略修复所述第一 NFVI实体和 /或与所述第一 NFVI实体相关联的 NFVI实体的故障; 或者在所述 VIM不包含与所述第一 故障信息的故障类型或者所述关联故障信息的故障类型相对应的故障修复 策略时, 向 VNFM发送所述第一故障综合信息或者向编排器发送所述第一 故障综合信息。
结合第一方面及其上述实现方式, 在其第四种实现方式中, 所述根据所 述第一故障综合信息中的第一故障信息的故障类型或者所述关联故障信息 的故障类型, 确定所述 VIM是否包含与所述第一故障信息的故障类型或者 所述关联故障信息的故障类型相对应的故障修复策略, 包括: 在所述第一 NFVI实体和与所述第一 NFVI实体相关联的 NFVI实体中确定优先级最高的 NFVI实体, 其中, HW的优先级高于 Host OS的优先级, Host OS的优先级 高于虚拟机管理器的优先级, 虚拟机管理器的优先级高于 VM的优先级; 根 据所述优先级最高的 NFVI实体的故障类型确定所述 VIM是否包含相对应的 故障修复策略;在所述 VIM包含与所述优先级最高的 NFVI实体的故障类型 相对应的故障修复策略时, 根据所述故障修复策略修复所述优先级最高的 NFVI实体的故障。
结合第一方面及其上述实现方式, 在其第五种实现方式中, 所述根据所 述故障修复策略修复所述第一 NFVI实体和 /或与所述第一 NFVI实体相关联 的 NFVI实体的故障之后, 还包括: 在所述故障修复成功时, 向所述编排器 发送成功指示消息; 在所述故障修复失败时, 向所述 VNFM发送所述第一 故障综合信息或者向所述编排器发送所述第一故障综合信息。
结合第一方面及其上述实现方式, 在其第六种实现方式中, 所述向
VNFM发送所述第一故障综合信息之后, 还包括: 接收所述 VNFM发送的 用于指示所述 VNFM无法处理所述第一故障综合信息的指示消息; 向编排 器发送所述第一故障综合信息。
结合第一方面及其上述实现方式, 在其第七种实现方式中, 所述向编排 器发送所述第一故障综合信息之前,还包括:向 VNFM请求与所述第一 NFVI 实体相关联的 VNF实体的故障信息; 将所述与所述第一 NFVI实体相关联 的 VNF实体的故障信息加入所述第一故障综合信息。
结合第一方面及其上述实现方式, 在其第八种实现方式中, 所述方法还 包括: 接收所述 VNFM发送的请求信息, 所述请求信息用于向所述 VIM请 求与发生故障的 VNF实体相关联的 NFVI实体的故障信息; 向所述 VNFM 发送所述与发生故障的 VNF实体相关联的 NFVI实体的故障信息。
结合第一方面及其上述实现方式, 在其第九种实现方式中, 所述 VIM 根据所述第一故障信息生成第一故障综合信息之后, 还包括: 根据所述第一 故障综合信息检测所述 VIM是否包含与所述第一故障综合信息相同的故障 综合信息; 在所述 VIM 包含与所述第一故障综合信息相同的故障综合信息 时, 删除所述第一故障综合信息。
结合第一方面及其上述实现方式, 在其第十种实现方式中, 所述第一故 障信息还被用于向运营和业务支撑系统 OSS/BSS上报,以便于所述 OSS/BSS 监控并呈现所述第一故障信息。
结合第一方面及其上述实现方式, 在其第十一种实现方式中, 所述第一 故障信息还包括以下至少一项: 运行状态、 故障时间; 所述第一故障综合信 息还包括故障状态信息, 所述故障状态包含未处理, 处理中, 已修复和未修 复中的至少一种。
第二方面,提供了一种故障管理方法,包括:虚拟网络功能管理器 VNFM 获取虚拟网络功能 VNF实体的包含故障实体标识和故障类型的第二故障信 息, 所述第二故障信息用于指示具有所述故障实体标识的第一 VNF实体发 生故障; 所述 VNFM根据所述第二故障信息生成第二故障综合信息; 所述 VNFM根据所述第二故障综合信息进行故障修复或上报处理。
结合第二方面, 在其第一种实现方式中, 所述 VNFM获取 VNF实体的 包含故障实体标识和故障类型的第二故障信息, 包括: 接收所述第一 VNF 实体发送的所述第二故障信息; 或者确定所述第一 VNF实体发生故障, 并 根据所述第一 VNF实体发生的故障生成所述第二故障信息。
结合第二方面及其上述实现方式, 在其第二种实现方式中, 所述 VNFM 根据所述第二故障信息生成第二故障综合信息, 包括: 确定与所述第一 VNF 实体相关联的 VNF实体发送的故障信息为所述第二故障信息的关联故障信 息; 生成包含有所述第二故障信息和所述关联故障信息的第二故障综合信 息。
结合第二方面及其上述实现方式, 在其第三种实现方式中, 所述 VNFM 根据所述第二故障综合信息进行故障修复或上报处理, 包括: 根据所述第二 故障综合信息中的第二故障信息的故障类型或者所述关联故障信息的故障 类型, 确定所述 VNFM是否包含与所述第二故障信息的故障类型或者所述 关联故障信息的故障类型相对应的故障修复策略; 在所述 VNFM 包含与所 述第二故障信息的故障类型或者所述关联故障信息的故障类型相对应的故 障修复策略时, 根据所述故障修复策略修复所述第一 VNF实体和 /或与所述 第一 VNF实体相关联的 VNF实体的故障; 或者在所述 VNFM不包含与所 述第二故障信息的故障类型或者所述关联故障信息的故障类型相对应的故 障修复策略时, 向编排器发送所述第二故障综合信息。
结合第二方面及其上述实现方式, 在其第四种实现方式中, 所述根据所 述故障修复策略修复所述第一 VNF实体和 /或与所述第一 VNF实体相关联的 VNF实体的故障之后, 还包括: 在所述故障修复成功时, 向所述编排器发送 成功指示消息; 在所述故障修复失败时, 向所述编排器发送所述第二故障综 合信息。
结合第二方面及其上述实现方式, 在其第五种实现方式中, 所述向所述 编排器发送所述第二故障综合信息之前, 还包括: 向虚拟化基础设施管理器 VIM请求与所述第一 VNF实体相关联的 NFVI实体的故障信息, 其中所述 NFVI实体为所述 NFVI中的任意一个硬件 HW、 主操作系统 Host OS、 虚拟 机管理器或虚拟机 VM实体; 将所述与所述第一 VNF实体相关联的 NFVI 实体的故障信息加入所述第二故障综合信息。
结合第二方面及其上述实现方式, 在其第六种实现方式中, 所述方法还 包括: 接收 VIM发送的第一故障综合信息, 所述第一故障综合信息包含所 述第一故障信息和所述第一故障信息的关联故障信息, 所述第一故障信息用 于指示第一 NFVI实体发生故障;确定所述 VNFM是否包含与所述第一故障 综合信息中的第一故障信息的故障类型或者所述关联故障信息的故障类型 相对应的故障修复策略; 在所述 VNFM 包含与所述第一故障信息的故障类 型或者所述关联故障信息的故障类型相对应的故障修复策略时,根据所述故 障修复策略修复所述第一 NFVI 实体和 /或与所述第一 NFVI 实体相关联的 NFVI实体的故障; 或者在所述 VNFM不包含与所述第一故障信息的故障类 型或者所述关联故障信息的故障类型相对应的故障修复策略时, 向编排器发 送所述第一故障综合信息, 或者向所述 VIM发送用于指示所述 VNFM无法 处理所述第一故障综合信息的指示消息, 以便于所述 VIM向所述编排器发 送所述第一故障综合信息。
结合第二方面及其上述实现方式, 在其第七种实现方式中, 所述接收 VIM发送的第一故障综合信息之后,还包括: 根据所述第一故障综合信息确 定与所述第一 NFVI实体和 /或与所述第一 NFVI实体相关联的 NFVI实体相 关联的所述第一 VNF实体的故障信息; 将所述第一 VNF实体的故障信息加 入所述第一故障综合信息, 以便于所述所述 VNFM对所述第一故障综合信 息进行修复或上报处理。
结合第二方面及其上述实现方式, 在其第八种实现方式中, 所述 VNFM 根据所述第二故障综合信息进行修复或上报处理之后, 还包括: 根据所述第 二故障综合信息检测所述 VNFM是否包含与所述第二故障综合信息相同的 故障综合信息; 在所述 VNFM 包含与所述第二故障综合信息相同的故障综 合信息时, 删除所述第二故障综合信息。
结合第二方面及其上述实现方式, 在其第九种实现方式中, 所述方法还 包括: 接收所述 VIM发送的请求信息, 所述请求信息用于向所述 VNFM请 求与发生故障的 NFVI实体相关联的 VNF实体的故障信息; 向所述 VIM发 送所述与发生故障的 NFVI实体相关联的 VNF实体的故障信息。
结合第二方面及其上述实现方式, 在其第十种实现方式中, 所述第二故 障信息还被用于向运营和业务支撑系统 OSS/BSS上报,以便于所述 OSS/BSS 监控并呈现所述第二故障信息。
结合第二方面及其上述实现方式, 在其第十一种实现方式中, 所述第二 故障信息还包括以下至少一项: 运行状态、 故障时间; 所述第二故障综合信 息还包括故障状态信息, 所述故障状态包含未处理, 处理中, 已修复和未修 复中的至少一种。
第三方面, 提供了一种故障管理方法, 包括: 编排器接收虚拟化基础设 施管理器 VIM发送的第一故障综合信息, 其中, 所述第一故障综合信息包 括第一故障信息, 所述第一故障信息包含故障实体标识和故障类型, 所述第 一故障信息用于指示具有所述故障实体标识的第一网络功能虚拟化基础设 施 NFVI实体发生故障; 所述编排器根据所述第一故障综合信息进行故障修 复或上 处理。
结合第三方面,在其第一种实现方式中,所述第一故障综合信息还包括: 与所述第一 NFVI 实体相关联的 NFVI 实体的故障信息; 和 /或与所述第一 NFVI实体相关联的虚拟网络功能 VNF实体的故障信息。
结合第三方面及其上述实现方式, 在其第二种实现方式中, 所述编排器 根据所述第一故障综合信息进行故障修复或上报处理, 包括: 根据所述第一 故障综合信息中的故障类型,确定所述编排器是否包含与所述故障类型相对 应的故障修复策略; 在所述编排器包含与所述故障类型相对应的故障修复策 略时, 根据所述故障修复策略修复所述第一 NFVI 实体和 /或与所述第一 NFVI实体相关联的 NFVI实体的故障; 或者在所述编排器不包含与所述故 障类型相对应的故障修复策略时, 向运营和业务支撑系统 OSS/BSS发送所 述第一故障综合信息。
结合第三方面及其上述实现方式, 在其第三种实现方式中, 所述编排器 根据所述第一故障综合信息进行故障修复或上报处理, 包括: 根据所述第一 故障综合信息中的故障类型,确定所述编排器是否包含与所述故障类型相对 应的故障修复策略; 在所述编排器包含与所述故障类型相对应的故障修复策 略时, 根据所述故障修复策略修复所述第一 NFVI实体和与所述第一 NFVI 实体相关联的 NFVI实体的故障和与所述第一 NFVI实体相关联的 VNF实体 的故障; 或者在所述编排器不包含与所述故障类型相对应的故障修复策略 时, 向 OSS/BSS发送所述第一故障综合信息。
结合第三方面及其上述实现方式, 在其第四种实现方式中, 所述编排器 根据所述第一故障综合信息进行故障修复或上报处理之前, 还包括: 根据所 述第一故障综合信息检测所述编排器是否包含与所述第一故障综合信息相 同的故障综合信息; 在所述编排器包含与所述第一故障综合信息相同的故障 综合信息时, 删除所述第一故障综合信息。
结合第三方面及其上述实现方式, 在其第五种实现方式中, 所述第一故 障信息还包括以下至少一项: 运行状态、 故障时间; 所述第一故障综合信息 还包括故障状态信息, 所述故障状态包含未处理, 处理中, 已修复和未修复 中的至少一种。
第四方面, 提供了一种故障管理方法, 包括: 编排器接收虚拟网络功能 管理器 VNFM发送的第二故障综合信息, 其中, 所述第二故障综合信息包 括第二故障信息, 所述第二故障信息包含故障实体标识和故障类型, 所述第 二故障信息用于指示具有所述故障实体标识的第一虚拟网络功能 VNF实体 发生故障; 所述编排器根据所述第二故障综合信息进行故障修复或上报处 理。
结合第四方面,在其第一种实现方式中,所述第二故障综合信息还包括: 与所述第一 VNF实体相关联的 VNF实体的故障信息;和 /或与所述第一 VNF 实体相关联的虚拟化基础设施管理 NFVI实体的故障信息。
结合第四方面及其上述实现方式, 在其第二种实现方式中, 所述编排器 根据所述第二故障综合信息进行故障修复或上报处理, 包括: 根据所述第二 故障综合信息中的故障类型,确定所述编排器是否包含与所述故障类型相对 应的故障修复策略; 在所述编排器包含与所述故障类型相对应的故障修复策 略时,根据所述故障修复策略修复所述第一 VNF实体和 /或与所述第一 VNF 实体相关联的 VNF实体的故障; 或者在所述编排器不包含与所述故障类型 相对应的故障修复策略时, 向运营和业务支撑系统 OSS/BSS发送所述第二 故障综合信息。
结合第四方面及其上述实现方式, 在其第三种实现方式中, 所述编排器 根据所述第二故障综合信息进行故障修复或上报处理, 包括: 根据所述第二 故障综合信息中的故障类型,确定所述编排器是否包含与所述故障类型相对 应的故障修复策略; 在所述编排器包含与所述故障类型相对应的故障修复策 略时,根据所述故障修复策略修复所述第一 VNF实体和与所述第一 VNF实 体相关联的 VNF实体的故障和与所述第一 VNF实体相关联的 NFVI实体的 故障; 或者在所述编排器不包含与所述故障类型相对应的故障修复策略时, 向 OSS/BSS发送所述第二故障综合信息。
结合第四方面及其上述实现方式, 在其第四种实现方式中, 所述编排器 根据所述第二故障综合信息进行故障修复或上报处理之前, 还包括: 根据所 述第二故障综合信息检测所述编排器是否包含与所述第二故障综合信息相 同的故障综合信息; 在所述编排器包含与所述第二故障综合信息相同的故障 综合信息时, 删除所述第二故障综合信息。
结合第四方面及其上述实现方式, 在其第五种实现方式中, 所述第二故 障信息还包括以下至少一项: 运行状态、 故障时间; 所述第二故障综合信息 还包括故障状态信息, 所述故障状态包含未处理, 处理中, 已修复和未修复 中的至少一种。
第五方面, 提供了一种虚拟化基础设施管理器, 包括: 获取单元, 用于 获取网络功能虚拟化基础设施 NFVI实体的包含故障实体标识和故障类型的 第一故障信息, 所述第一故障信息用于指示具有所述故障实体标识的第一 NFVI 实体发生故障; 生成单元, 用于根据所述第一故障信息生成第一故障 综合信息, 所述第一故障综合信息包含所述第一故障信息和所述第一故障信 息的关联故障信息; 处理单元, 用于所述 VIM根据所述第一故障综合信息 进行故障修复或上报处理。
结合第五方面, 在其第一种实现方式中, 所述管理器还包括确定单元和 接收单元, 所述获取单元具体用于: 通过所述接收单元接收所述第一 NFVI 实体发送的所述第一故障信息; 或者通过所述确定单元确定所述第一 NFVI 实体发生故障, 并根据所述第一 NFVI实体发生的故障生成所述第一故障信 息。
结合第五方面及其上述实现方式, 在其第二种实现方式中, 所述第一 NFVI实体为所述 NFVI实体中的任意一个硬件 HW、 主操作系统 Host OS、 虚拟机管理器或虚拟机 VM实体, 所述生成单元具体用于: 通过所述确定单 元确定与所述第一 NFVI实体相关联的 NFVI实体发送的故障信息为所述第 一故障信息的关联故障信息; 生成包含有所述第一故障信息和所述关联故障 信息的第一故障综合信息。
结合第五方面及其上述实现方式, 在其第三种实现方式中, 所述处理单 元包括发送单元, 所述处理单元具体用于: 根据所述第一故障综合信息中的 第一故障信息的故障类型或者所述关联故障信息的故障类型,通过所述确定 单元确定所述 VIM是否包含与所述第一故障信息的故障类型或者所述关联 故障信息的故障类型相对应的故障修复策略; 在所述 VIM 包含与所述第一 故障信息的故障类型或者所述关联故障信息的故障类型相对应的故障修复 策略时, 根据所述故障修复策略修复所述第一 NFVI 实体和 /或与所述第一 NFVI实体相关联的 NFVI实体的故障; 或者在所述 VIM不包含与所述第一 故障信息的故障类型或者所述关联故障信息的故障类型相对应的故障修复 策略时, 通过所述发送单元向 VNFM发送所述第一故障综合信息或者向编 排器发送所述第一故障综合信息。
结合第五方面及其上述实现方式, 在其第四种实现方式中, 所述处理单 元具体用于: 通过所述确定单元在所述第一 NFVI实体和与所述第一 NFVI 实体相关联的 NFVI实体中确定优先级最高的 NFVI实体, 其中, HW的优 先级高于 Host OS的优先级, Host OS的优先级高于虚拟机管理器的优先级, 虚拟机管理器的优先级高于 VM的优先级; 根据所述优先级最高的 NFVI实 体的故障类型, 通过所述确定单元确定所述 VIM是否包含相对应的故障修 复策略;在所述 VIM包含与所述优先级最高的 NFVI实体的故障类型相对应 的故障修复策略时, 根据所述故障修复策略修复所述优先级最高的 NFVI实 体的故障。
结合第五方面及其上述实现方式, 在其第五种实现方式中, 所述发送单 元具体用于: 在所述故障修复成功时, 向所述编排器发送成功指示消息; 在 所述故障修复失败时, 向所述 VNFM发送所述第一故障综合信息或者向所 述编排器发送所述第一故障综合信息。
结合第五方面及其上述实现方式, 在其第六种实现方式中, 所述接收单 元还用于: 接收所述 VNFM发送的用于指示所述 VNFM无法处理所述第一 故障综合信息的指示消息; 所述发送单元还用于: 向编排器发送所述第一故 障综合信息。
结合第五方面及其上述实现方式, 在其第七种实现方式中, 所述处理单 元还用于: 向 VNFM请求与所述第一 NFVI实体相关联的 VNF实体的故障 信息; 将所述与所述第一 NFVI实体相关联的 VNF实体的故障信息加入所 述第一故障综合信息。
结合第五方面及其上述实现方式, 在其第八种实现方式中, 所述接收单 元还用于:接收所述 VNFM发送的请求信息,所述请求信息用于向所述 VIM 请求与发生故障的 VNF实体相关联的 NFVI实体的故障信息; 所述发送单 元还用于向所述 VNFM发送所述与发生故障的 VNF实体相关联的 NFVI实 体的故障信息。
结合第五方面及其上述实现方式, 在其第九种实现方式中, 所述管理器 还包括检测单元和删除单元, 所述检测单元具体用于: 根据所述第一故障综 合信息检测所述 VIM是否包含与所述第一故障综合信息相同的故障综合信 息; 所述删除单元具体用于在所述 VIM 包含与所述第一故障综合信息相同 的故障综合信息时, 删除所述第一故障综合信息。
第六方面, 提供了一种虚拟网络功能管理器, 包括: 获取单元, 用于 获取虚拟网络功能 VNF实体的包含故障实体标识和故障类型的第二故障信 息, 所述第二故障信息用于指示具有所述故障实体标识的第一 VNF实体发 生故障; 生成单元, 用于根据所述第二故障信息生成第二故障综合信息; 处 理单元, 用于根据所述第二故障综合信息进行故障修复或上报处理。
结合第六方面, 在其第一种实现方式中, 所述管理器还包括确定单元和 接收单元, 所述获取单元具体用于: 通过所述接收单元接收所述第一 VNF 实体发送的所述第二故障信息; 或者通过所述确定单元确定所述第一 VNF 实体发生故障, 并根据所述第一 VNF实体发生的故障通过所述生成单元生 成所述第二故障信息。
结合第六方面及其上述实现方式, 在其第二种实现方式中, 所述生成单 元具体用于: 通过所述确定单元确定与所述第一 VNF实体相关联的 VNF实 体发送的故障信息为所述第二故障信息的关联故障信息; 生成包含有所述第 二故障信息和所述关联故障信息的第二故障综合信息。
结合第六方面及其上述实现方式, 在其第三种实现方式中, 所述处理单 元包括发送单元, 所述处理单元具体用于: 根据所述第二故障综合信息中的 第二故障信息的故障类型或者所述关联故障信息的故障类型,通过所述确定 单元确定所述 VNFM是否包含与所述第二故障信息的故障类型或者所述关 联故障信息的故障类型相对应的故障修复策略; 在所述 VNFM 包含与所述 第二故障信息的故障类型或者所述关联故障信息的故障类型相对应的故障 修复策略时, 根据所述故障修复策略修复所述第一 VNF实体和 /或与所述第 一 VNF实体相关联的 VNF实体的故障; 或者在所述 VNFM不包含与所述 第二故障信息的故障类型或者所述关联故障信息的故障类型相对应的故障 修复策略时, 通过所述发送单元向编排器发送所述第二故障综合信息。
结合第六方面及其上述实现方式, 在其第四种实现方式中, 所述发送单 元具体用于: 在所述故障修复成功时, 向所述编排器发送成功指示消息; 在 所述故障修复失败时, 向所述编排器发送所述第二故障综合信息。
结合第六方面及其上述实现方式, 在其第五种实现方式中, 所述处理单 元还用于: 向虚拟化基础设施管理器 VIM请求与所述第一 VNF实体相关联 的 NFVI实体的故障信息, 其中所述 NFVI实体为所述 NFVI中的任意一个 硬件 HW、 主操作系统 Host OS、 虚拟机管理器或虚拟机 VM实体; 将所述 与所述第一 VNF实体相关联的 NFVI实体的故障信息加入所述第二故障综 合信息。
结合第六方面及其上述实现方式, 在其第六种实现方式中, 所述处理单 元还用于: 接收 VIM发送的第一故障综合信息, 所述第一故障综合信息包 含所述第一故障信息和所述第一故障信息的关联故障信息, 所述第一故障信 息用于指示第一 NFVI实体发生故障;确定所述 VNFM是否包含与所述第一 故障综合信息中的第一故障信息的故障类型或者所述关联故障信息的故障 类型相对应的故障修复策略; 在所述 VNFM 包含与所述第一故障信息的故 障类型或者所述关联故障信息的故障类型相对应的故障修复策略时,根据所 述故障修复策略修复所述第一 NFVI实体和 /或与所述第一 NFVI实体相关联 的 NFVI实体的故障;或者在所述 VNFM不包含与所述第一故障信息的故障 类型或者所述关联故障信息的故障类型相对应的故障修复策略时, 向编排器 发送所述第一故障综合信息, 或者向所述 VIM发送用于指示所述 VNFM无 法处理所述第一故障综合信息的指示消息, 以便于所述 VIM向所述编排器 发送所述第一故障综合信息。
结合第六方面及其上述实现方式, 在其第七种实现方式中, 所述处理单 元还具体用于: 根据所述第一故障综合信息确定与所述第一 NFVI 实体和 / 或与所述第一 NFVI实体相关联的 NFVI实体相关联的所述第一 VNF实体的 故障信息; 将所述第一 VNF实体的故障信息加入所述第一故障综合信息, 以便于所述所述 VNFM对所述第一故障综合信息进行修复或上报处理。
结合第六方面及其上述实现方式, 在其第八种实现方式中, 所述管理器 还包括检测单元和删除单元, 所述检测单元具体用于: 根据所述第二故障综 合信息检测所述 VNFM是否包含与所述第二故障综合信息相同的故障综合 信息; 所述删除单元具体用于在所述 VNFM 包含与所述第二故障综合信息 相同的故障综合信息时, 删除所述第二故障综合信息。 结合第六方面及其上述实现方式, 在其第九种实现方式中, 所述接收单 元还用于:接收所述 VIM发送的请求信息,所述请求信息用于向所述 VNFM 请求与发生故障的 NFVI实体相关联的 VNF实体的故障信息; 所述发送单 元还用于: 向所述 VIM发送所述与发生故障的 NFVI实体相关联的 VNF实 体的故障信息。
第七方面, 提供了一种编排器, 包括: 接收单元, 用于接收虚拟化基础 设施管理器 VIM发送的第一故障综合信息, 其中, 所述第一故障综合信息 包括第一故障信息, 所述第一故障信息包含故障实体标识和故障类型, 所述 第一故障信息用于指示具有所述故障实体标识的第一网络功能虚拟化基础 设施 NFVI实体发生故障; 处理单元, 用于根据所述第一故障综合信息进行 故障修复或上报处理。
结合第七方面,在其第一种实现方式中,所述第一故障综合信息还包括: 与所述第一 NFVI 实体相关联的 NFVI 实体的故障信息; 和 /或与所述第一 NFVI实体相关联的虚拟网络功能 VNF实体的故障信息。
结合第七方面及其上述实现方式, 在其第二种实现方式中, 所述处理单 元具体用于: 根据所述第一故障综合信息中的故障类型, 确定所述编排器是 否包含与所述故障类型相对应的故障修复策略; 在所述编排器包含与所述故 障类型相对应的故障修复策略时, 根据所述故障修复策略修复所述第一 NFVI实体和 /或与所述第一 NFVI实体相关联的 NFVI实体的故障; 或者在 所述编排器不包含与所述故障类型相对应的故障修复策略时, 向运营和业务 支撑系统 OSS/BSS发送所述第一故障综合信息。
结合第七方面及其上述实现方式, 在其第三种实现方式中, 所述处理单 元具体用于: 根据所述第一故障综合信息中的故障类型, 确定所述编排器是 否包含与所述故障类型相对应的故障修复策略; 在所述编排器包含与所述故 障类型相对应的故障修复策略时, 根据所述故障修复策略修复所述第一 NFVI实体和与所述第一 NFVI实体相关联的 NFVI实体的故障和与所述第一 NFVI实体相关联的 VNF实体的故障;或者在所述编排器不包含与所述故障 类型相对应的故障修复策略时, 向 OSS/BSS发送所述第一故障综合信息。
结合第七方面及其上述实现方式, 在其第四种实现方式中, 所述编排器 还包括检测单元和删除单元, 所述检测单元用于: 根据所述第一故障综合信 息检测所述编排器是否包含与所述第一故障综合信息相同的故障综合信息; 所述删除单元用于在所述编排器包含与所述第一故障综合信息相同的故障 综合信息时, 删除所述第一故障综合信息。
第八方面, 提供了一种编排器, 包括: 接收单元, 用于接收虚拟网络功 能管理器 VNFM发送的第二故障综合信息, 其中, 所述第二故障综合信息 包括第二故障信息, 所述第二故障信息包含故障实体标识和故障类型, 所述 第二故障信息用于指示具有所述故障实体标识的第一虚拟网络功能 VNF实 体发生故障; 处理单元, 用于根据所述第二故障综合信息进行故障修复或上 报处理。
结合第八方面,在其第一种实现方式中,所述第二故障综合信息还包括: 与所述第一 VNF实体相关联的 VNF实体的故障信息;和 /或与所述第一 VNF 实体相关联的虚拟化基础设施管理 NFVI实体的故障信息。
结合第八方面及其上述实现方式, 在其第二种实现方式中, 所述处理单 元具体用于: 根据所述第二故障综合信息中的故障类型, 确定所述编排器是 否包含与所述故障类型相对应的故障修复策略; 在所述编排器包含与所述故 障类型相对应的故障修复策略时,根据所述故障修复策略修复所述第一 VNF 实体和 /或与所述第一 VNF实体相关联的 VNF实体的故障;或者在所述编排 器不包含与所述故障类型相对应的故障修复策略时, 向运营和业务支撑系统 OSS/BSS发送所述第二故障综合信息。
结合第八方面及其上述实现方式, 在其第三种实现方式中, 所述处理单 元具体用于: 根据所述第二故障综合信息中的故障类型, 确定所述编排器是 否包含与所述故障类型相对应的故障修复策略; 在所述编排器包含与所述故 障类型相对应的故障修复策略时,根据所述故障修复策略修复所述第一 VNF 实体和与所述第一 VNF实体相关联的 VNF实体的故障和与所述第一 VNF 实体相关联的 NFVI实体的故障; 或者在所述编排器不包含与所述故障类型 相对应的故障修复策略时, 向 OSS/BSS发送所述第二故障综合信息。
结合第八方面及其上述实现方式, 在其第四种实现方式中, 所述编排器 还包括检测单元和删除单元, 所述检测单元用于: 根据所述第二故障综合信 息检测所述编排器是否包含与所述第二故障综合信息相同的故障综合信息; 所述删除单元用于在所述编排器包含与所述第二故障综合信息相同的故障 综合信息时, 删除所述第二故障综合信息。
本发明实施例提供了一种故障管理方法, 通过 VIM和 VNFM获取硬件 和 /或软件实体的故障信息,对具有关联关系的故障信息进行综合处理,从而 能够实现能够实现 NFV环境下的故障上报及处理。 附图说明
为了更清楚地说明本发明实施例的技术方案, 下面将对本发明实施例中 所需要使用的附图作筒单地介绍, 显而易见地, 下面所描述的附图仅仅是本 发明的一些实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动的 前提下, 还可以根据这些附图获得其他的附图。
图 1是本发明网络功能虚拟化 NFV的系统架构图。
图 2是本发明一个实施例的故障管理的方法的流程图。
图 3是本发明一个实施例的故障管理的方法的流程图。
图 4是本发明一个实施例的故障管理的方法的流程图。
图 5是本发明一个实施例的故障管理的方法的流程图。
图 6a是本发明一个实施例的故障管理的方法的交互图。
图 6b是本发明一个实施例的实体之间的关联关系的示意图。
图 7是本发明另一实施例的故障管理的方法的交互图。
图 8是本发明另一实施例的故障管理的方法的交互图。
图 9是本发明另一实施例的故障管理的方法的交互图。
图 10是本发明另一实施例的故障管理的方法的交互图。
图 11 是本发明一个实施例的虚拟化基础设施管理 VIM 实体的示意框 图。
图 12是本发明一个实施例的虚拟网络功能管理 VNFM 实体的示意框 图。
图 13是本发明一个实施例的编排器 Orchestrator实体的示意框图。 图 14是本发明另一实施例的 VIM实体的示意框图。
图 15是本发明另一实施例的 VNFM实体的示意框图。
图 16是本发明另一实施例的 Orchestrator实体的示意框图。 具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行 清楚、 完整地描述, 显然, 所描述的实施例是本发明的一部分实施例, 而不 是全部实施例。 基于本发明中的实施例, 本领域普通技术人员在没有做出创 造性劳动的前提下所获得的所有其他实施例, 都应属于本发明保护的范围。
图 1是本发明网络功能虚拟化 NFV的系统架构图。
在网络功能虚拟化 ( Network Function Virtualization, NFV )端到端( End to End , E2E ) 架构中, 网络功能虚拟化基础设施 ( Network Function Virtualization Infrastructure, NFVI ) 包含底层硬件 ( Hardware, HW ) 资源, 具体可分为计算硬件、 存储硬件、 网络硬件等等。 硬件层之上为虚拟化层 ( Virtualization Layer ), 包括主操作系统 ( Host Operating System, Host OS ) 和超级管理程序 /虚拟机管理器( Hypervisor ) ,在虚拟化层之上运行有多个虚 拟机( Virtual Machine, VM )。 其中, HW和 Hypervisor通过网元管理系统 ( Element Management System, EMS )与运营和业务支撑系统 ( Operation and Business Support System, OSS/BSS )相连。 在 NFVI之上有多个网络虚拟功 能 ( Virtual Network Function, VNF ) 实例通过 vEMS与 OSS/BSS相连。
NFVI 通过 Nf- Vi 接口与虚拟化基础设施管理器 ( Virtualization Infrastructure Manager , VIM )相连, VNF通过 Ve-Vnfm接口与 VNF管理器 ( VNFM )相连, VIM与 VNFM之间通过 Vi-Vnfm接口相连。 NFVI通过 Or-Vi与编排器 Orchestrator相连, VNFM通过 Or-Vnfm与 Orchestrator相连, Orchestrator通过 Os-Ma接口与 OSS/BSS相连。
其中, OSS/BSS用于向 Orchestrator发起服务请求, Orchestrator负责根 据 OSS/BSS服务请求, 编排管理资源, 实现 NFV服务, 并实时检测 VNF、 NFVI资源及运行状态信息。 VNFM负责 VNF生命周期管理, 如启动、 生存 时间、 检测收集 VNF的运行状态信息。 VIM负责管理、 分配 NFVI的资源, 检测收集 NFVI运行状态信息。
图 2是本发明一个实施例的故障管理的方法的流程图。 图 2 的方法由 VIM执行。
201 , 虚拟化基础设施管理器 VIM获取网络功能虚拟化基础设施 NFVI 实体的包含故障实体标识和故障类型的第一故障信息, 第一故障信息用于指 示具有故障实体标识的第一 NFVI实体发生故障。
202, VIM根据第一故障信息生成第一故障综合信息, 第一故障综合信 息包含第一故障信息和第一故障信息的关联故障信息。
203, VIM根据第一故障综合信息进行故障修复或上报处理。 本发明实施例提供的故障管理方法, 通过 VIM获取硬件和 /或软件实体 的故障信息, 对具有关联关系的故障信息进行综合处理, 从而能够实现能够 实现 NFV环境下的故障上报及处理。
可选地, 作为一个实施例, 步骤 201包括: 接收第一 NFVI实体发送的 第一故障信息; 或者确定第一 NFVI实体发生故障, 并根据第一 NFVI实体 发生的故障生成第一故障信息。也就是说, VIM可以被动接受发生故障的实 体的故障信息, 也可以在检测到故障后主动生成故障信息。
可选地, 作为一个实施例, 第一 NFVI实体为 NFVI实体中的任意一个 硬件 HW、主操作系统 Host OS、虚拟机管理器或虚拟机 VM实体, 步骤 202 包括: 确定与第一 NFVI实体相关联的 NFVI实体发送的故障信息为第一故 障信息的关联故障信息; 生成包含有第一故障信息和关联故障信息的第一故 障综合信息。 由于某些 HW、 Host OS、 Hypervisor和 VM实体之间具有关联 关系, 因此其中的第一 NFVI实体发生故障时, 可能与第一 NFVI具有关联 关系的其他 NFVI实体也发生故障。 VIM可以收集所有相关的故障信息以便 于进行统一地综合处理。
可选地, 作为一个实施例, 步骤 203, 包括: 根据第一故障综合信息中 的第一故障信息的故障类型或者关联故障信息的故障类型, 确定 VIM是否 包含与第一故障信息的故障类型或者关联故障信息的故障类型相对应的故 障修复策略; 在 VIM 包含与第一故障信息的故障类型或者关联故障信息的 故障类型相对应的故障修复策略时, 根据故障修复策略修复第一 NFVI实体 和 /或与第一 NFVI实体相关联的 NFVI实体的故障; 或者在 VIM不包含与 第一故障信息的故障类型或者关联故障信息的故障类型相对应的故障修复 策略时, 向 VNFM发送第一故障综合信息或者向编排器发送第一故障综合 信息。
具体地, 生成故障综合信息后, VIM首先需要确定 VIM本地是否能够 处理该故障综合信息。 如果能够处理则对故障综合信息所涉及的 NFVI实体 中的一个进行故障修复。 如果无法处理或者修复失败则进行上报处理。
可选地, 作为一个实施例, 根据第一故障综合信息中的第一故障信息的 故障类型或者关联故障信息的故障类型, 确定 VIM是否包含与第一故障信 息的故障类型或者关联故障信息的故障类型相对应的故障修复策略, 包括: 在第一 NFVI实体和与第一 NFVI实体相关联的 NFVI实体中确定优先级最 高的 NFVI实体, 其中, HW的优先级高于 Host OS的优先级, Host OS的 优先级高于虚拟机管理器的优先级,虚拟机管理器的优先级高于 VM的优先 级;根据优先级最高的 NFVI实体的故障类型确定 VIM是否包含相对应的故 障修复策略;在 VIM包含与优先级最高的 NFVI实体的故障类型相对应的故 障修复策略时, 根据故障修复策略修复优先级最高的 NFVI实体的故障。
可选地, 作为一个实施例, 根据故障修复策略修复第一 NFVI 实体和 / 或与第一 NFVI实体相关联的 NFVI实体的故障之后, 还可以包括: 在故障 修复成功时, 向编排器发送成功指示消息; 在故障修复失败时, 向 VNFM 发送第一故障综合信息或者向编排器发送第一故障综合信息。 其中, 成功指 示消息可以是运行状态置为 "正常" 的故障信息, 也可以是其他形式的用于 指示修复成功的消息。 本发明对此不作限定。
可选地, 作为一个实施例, 向 VNFM发送第一故障综合信息之后, 还 包括: 接收 VNFM发送的用于指示 VNFM无法处理第一故障综合信息的指 示消息; 向编排器发送第一故障综合信息。 在 VIM无法处理第一故障综合 信息并上报给 VNFM的情况下, 如果 VNFM也无法处理, 则 VNFM继续将 第一故障综合信息上报给 Orchestrator。
可选地, 作为一个实施例, 向编排器发送第一故障综合信息之前, 还包 括: 向 VNFM请求与第一 NFVI实体相关联的 VNF实体的故障信息; 将与 第一 NFVI实体相关联的 VNF实体的故障信息加入第一故障综合信息。 在 VIM无法处理第一故障综合信息, 或者修复失败时, 可以向 VNFM发起请 求, 以获取与发生故障的 NFVI实体相关联的 VNF实体的故障信息, 综合 上报, 以便于上层管理实体能够进行综合处理。
可选地, 作为一个实施例, 该方法还包括: 接收 VNFM发送的请求信 息, 请求信息用于向 VIM请求与发生故障的 VNF实体相关联的 NFVI实体 的故障信息; 向 VNFM发送与发生故障的 VNF实体相关联的 NFVI实体的 故障信息。 具体地, 在 VNFM无法处理 VNF实体的故障综合信息时同样可 以向 VIM请求相关的 NFVI故障信息, 综合上报, 以便于上层管理实体能够 进行综合处理。
可选地,作为一个实施例, VIM根据第一故障信息生成第一故障综合信 息之后, 还包括: 根据第一故障综合信息检测 VIM是否包含与第一故障综 合信息相同的故障综合信息; 在 VIM 包含与第一故障综合信息相同的故障 综合信息时, 删除第一故障综合信息。
具体地, 由于多个具有关联关系的 NFVI实体发生关联性故障时, VIM 会获取到多个相同的故障综合信息,这里的相同指的是故障综合信息中的故 障信息内容相同, 此时, VIM可以进行重复报警检测。 对于正在进行处理的 故障综合信息继续处理, 对于未处理的相同的故障综合信息做删除处理。
可选地, 作为一个实施例, 第一故障信息还被用于向运营和业务支撑系 统 OSS/BSS上报, 以便于 OSS/BSS监控并呈现第一故障信息。
可选地, 作为一个实施例, 第一故障信息还包括以下至少一项: 运行状 态、 故障时间; 第一故障综合信息还包括故障状态信息, 故障状态包含未处 理, 处理中, 已爹复和未爹复中的至少一种。
本发明实施例提供的故障管理方法, 通过 VIM获取硬件和 /或软件实体 的故障信息, 对具有关联关系的故障信息进行综合处理, 从而能够实现能够 实现 NFV环境下的故障上报及处理。 此外, 由于对相关联的故障信息进行 综合处理, 并且通过重复报警检测对相同的故障综合信息进行删除处理, 从 而提高了故障处理的效率和准确度。
图 3是本发明一个实施例的故障管理的方法的流程图。 图 3 的方法由 VNFM执行。
301 , 虚拟网络功能管理器 VNFM获取虚拟网络功能 VNF实体的包含 故障实体标识和故障类型的第二故障信息, 第二故障信息用于指示具有故障 实体标识的第一 VNF实体发生故障。
302, VNFM根据第二故障信息生成第二故障综合信息。
303, VNFM根据第二故障综合信息进行故障修复或上报处理。
本发明实施例提供的故障管理方法, 通过 VNFM获取硬件和 /或软件实 体的故障信息, 对具有关联关系的故障信息进行综合处理, 从而能够实现能 够实现 NFV环境下的故障上报及处理。
可选地, 作为一个实施例, 步骤 301 包括: 接收第一 VNF实体发送的 第二故障信息; 或者确定第一 VNF实体发生故障, 并根据第一 VNF实体发 生的故障生成第二故障信息。 也就是说, VNFM可以被动接受发生故障的实 体的故障信息, 也可以在检测到故障后主动生成故障信息。
可选地, 作为一个实施例, 步骤 302包括: 确定与第一 VNF实体相关 联的 VNF实体发送的故障信息为第二故障信息的关联故障信息; 生成包含 有第二故障信息和关联故障信息的第二故障综合信息。 由于 VNF实体之间 可能具有关联关系,因此其中的第一 VNF实体发生故障时,可能与第一 VNF 具有关联关系的其他 VNF实体也发生故障。 VNFM可以收集所有相关的故 障信息以便于进行统一地综合处理。
可选地, 作为一个实施例, 步骤 303包括: 根据第二故障综合信息中的 第二故障信息的故障类型或者关联故障信息的故障类型, 确定 VNFM是否 包含与第二故障信息的故障类型或者关联故障信息的故障类型相对应的故 障修复策略; 在 VNFM 包含与第二故障信息的故障类型或者关联故障信息 的故障类型相对应的故障修复策略时, 根据故障修复策略修复第一 VNF实 体和 /或与第一 VNF实体相关联的 VNF实体的故障; 或者在 VNFM不包含 与第二故障信息的故障类型或者关联故障信息的故障类型相对应的故障修 复策略时, 向编排器发送第二故障综合信息。
具体地, 生成故障综合信息后, VNFM首先需要确定 VNFM本地是否 能够处理该故障综合信息。 如果能够处理则对故障综合信息所涉及的 VNF 实体中的一个进行故障修复。 如果无法处理或者修复失败则进行上报处理。
可选地, 作为一个实施例, 根据故障修复策略修复第一 VNF实体和 /或 与第一 VNF实体相关联的 VNF实体的故障之后, 还包括: 在故障修复成功 时, 向编排器发送成功指示消息; 在故障修复失败时, 向编排器发送第二故 障综合信息。 其中, 成功指示消息可以是运行状态置为 "正常"的故障信息, 也可以是其他形式的用于指示修复成功的消息。 本发明对此不作限定。
可选地, 作为一个实施例, 向编排器发送第二故障综合信息之前, 还包 括: 向虚拟化基础设施管理器 VIM请求与第一 VNF实体相关联的 NFVI实 体的故障信息, 其中 NFVI实体为 NFVI中的任意一个硬件 HW、 主操作系 统 Host OS、虚拟机管理器或虚拟机 VM实体;将与第一 VNF实体相关联的 NFVI实体的故障信息加入第二故障综合信息。在 VNFM无法处理第二故障 综合信息, 或者修复失败时, 可以向 VIM发起请求, 以获取与发生故障的 VNF实体相关联的 NFVI实体的故障信息, 综合上报, 以便于上层管理实体 能够进行综合处理。
可选地, 作为一个实施例, 该方法还包括: 接收 VIM发送的第一故障 综合信息, 第一故障综合信息包含第一故障信息和第一故障信息的关联故障 信息, 第一故障信息用于指示第一 NFVI实体发生故障; 确定 VNFM是否包 含与第一故障综合信息中的第一故障信息的故障类型或者关联故障信息的 故障类型相对应的故障修复策略; 在 VNFM 包含与第一故障信息的故障类 型或者关联故障信息的故障类型相对应的故障修复策略时,根据故障修复策 略修复第一 NFVI实体和 /或与第一 NFVI实体相关联的 NFVI实体的故障; 或者在 VNFM 不包含与第一故障信息的故障类型或者关联故障信息的故障 类型相对应的故障修复策略时, 向编排器发送第一故障综合信息, 或者向 VIM发送用于指示 VNFM无法处理第一故障综合信息的指示消息, 以便于 VIM向编排器发送第一故障综合信息。 在 VIM无法处理 NFVI实体的第一 故障综合信息, 或者修复失败时, 向 VNFM上报第一故障综合信息, 如果 VNFM也无法处理或者修复失败时, 则通知 VIM, 以便于 VIM将第一故障 综合信息上报给 Orchestrator。
可选地, 作为一个实施例, 接收 VIM发送的第一故障综合信息之后, 还包括: 根据第一故障综合信息确定与第一 NFVI实体和 /或与第一 NFVI实 体相关联的 NFVI实体相关联的第一 VNF实体的故障信息; 将第一 VNF实 体的故障信息加入第一故障综合信息, 以便于 VNFM对第一故障综合信息 进行修复或上报处理。
可选地, 作为一个实施例, VNFM根据第二故障综合信息进行修复或上 报处理之后, 还包括: 根据第二故障综合信息检测 VNFM是否包含与第二 故障综合信息相同的故障综合信息; 在 VNFM 包含与第二故障综合信息相 同的故障综合信息时, 删除第二故障综合信息。
具体地, 由于多个具有关联关系的 VNF实体发生关联性故障时, VNFM 会获取到多个相同的故障综合信息,这里的相同指的是故障综合信息中的故 障信息内容相同, 此时, VNFM可以进行重复报警检测。 对于正在进行处理 的故障综合信息继续处理, 对于未处理的相同的故障综合信息做删除处理。
可选地, 作为一个实施例, 方法还包括: 接收 VIM发送的请求信息, 请求信息用于向 VNFM请求与发生故障的 NFVI实体相关联的 VNF实体的 故障信息; 向 VIM发送与发生故障的 NFVI实体相关联的 VNF实体的故障 信息。
可选地, 作为一个实施例, 第二故障信息还被用于向运营和业务支撑系 统 OSS/BSS上报, 以便于 OSS/BSS监控并呈现第二故障信息。
可选地, 作为一个实施例, 第二故障信息还包括以下至少一项: 运行状 态、 故障时间; 第二故障综合信息还包括故障状态信息, 故障状态包含未处 理, 处理中, 已爹复和未爹复中的至少一种。
本发明实施例提供的故障管理方法, 通过 VNFM获取硬件和 /或软件实 体的故障信息, 对具有关联关系的故障信息进行综合处理, 从而能够实现能 够实现 NFV环境下的故障上报及处理。 此外, 由于对相关联的故障信息进 行综合处理, 并且通过重复报警检测对相同的故障综合信息进行删除处理, 从而提高了故障处理的效率和准确度。
图 4是本发明一个实施例的故障管理的方法的流程图。 图 4 的方法由 Orchestrator执行。
401 ,编排器接收虚拟化基础设施管理器 VIM发送的第一故障综合信息, 其中, 第一故障综合信息包括第一故障信息, 第一故障信息包含故障实体标 识和故障类型, 第一故障信息用于指示具有故障实体标识的第一网络功能虚 拟化基础设施 NFVI实体发生故障。
402, 编排器根据第一故障综合信息进行故障修复或上报处理。
本发明实施例提供的故障管理方法, 通过 Orchestrator获取硬件和 /或软 件实体的故障信息, 对具有关联关系的故障信息进行综合处理, 从而能够实 现能够实现 NFV环境下的故障上报及处理。
可选地, 作为一个实施例, 第一故障综合信息还包括: 与第一 NFVI实 体相关联的 NFVI实体的故障信息; 和 /或与第一 NFVI实体相关联的虚拟网 络功能 VNF实体的故障信息。也就是说, Orchestrator从 VIM获取的故障综 合信息可以包含 NFVI实体的故障信息, 也可以包含 NFVI实体以及相关的
VNF实体的故障信息。
可选地, 作为一个实施例, 步骤 402包括: 根据第一故障综合信息中的 故障类型, 确定编排器是否包含与故障类型相对应的故障修复策略; 在编排 器包含与故障类型相对应的故障修复策略时, 根据故障修复策略修复第一
NFVI实体和 /或与第一 NFVI实体相关联的 NFVI实体的故障; 或者在编排 器不包含与故障类型相对应的故障修复策略时, 向运营和业务支撑系统
0SS/BSS发送第一故障综合信息。
可选地, 作为一个实施例, 步骤 402包括: 根据第一故障综合信息中的 故障类型, 确定编排器是否包含与故障类型相对应的故障修复策略; 在编排 器包含与故障类型相对应的故障修复策略时, 根据故障修复策略修复第一 NFVI实体和与第一 NFVI实体相关联的 NFVI实体的故障和与第一 NFVI实 体相关联的 VNF实体的故障; 或者在编排器不包含与故障类型相对应的故 障修复策略时, 向 OSS/BSS发送第一故障综合信息。
可选地, 作为一个实施例, 步骤 402之前, 还包括: 根据第一故障综合 信息检测编排器是否包含与第一故障综合信息相同的故障综合信息; 在编排 器包含与第一故障综合信息相同的故障综合信息时, 删除第一故障综合信 息。 具体地, 由于多个具有关联关系的 NFVI实体或 VNF实体发生关联性 故障时, Orchestrator会获取到多个相同的故障综合信息,这里的相同指的是 故障综合信息中的故障信息内容相同,此时, Orchestrator可以进行重复报警 检测。 对于正在进行处理的故障综合信息继续处理, 对于未处理的相同的故 障综合信息做删除处理。
可选地, 作为一个实施例, 第一故障信息还包括以下至少一项: 运行状 态、 故障时间; 第一故障综合信息还包括故障状态信息, 故障状态包含未处 理, 处理中, 已爹复和未爹复中的至少一种。
本发明实施例提供的故障管理方法, 通过 Orchestrator接收 VIM上报的 故障综合信息, 对具有关联关系的故障信息进行综合处理, 从而能够实现能 够实现 NFV环境下的故障上报及处理。 此外, 由于对相关联的故障信息进 行综合处理, 并且通过重复报警检测对相同的故障综合信息进行删除处理, 从而提高了故障处理的效率和准确度。
图 5是本发明一个实施例的故障管理的方法的流程图。 图 5 的方法由
Orchestrator执行。
501 ,编排器接收虚拟网络功能管理器 VNFM发送的第二故障综合信息, 其中, 第二故障综合信息包括第二故障信息, 第二故障信息包含故障实体标 识和故障类型, 第二故障信息用于指示具有故障实体标识的第一虚拟网络功 能 VNF实体发生故障。
502, 编排器根据第二故障综合信息进行故障修复或上报处理。
本发明实施例提供的故障管理方法, 通过 Orchestrator获取硬件和 /或软 件实体的故障信息, 对具有关联关系的故障信息进行综合处理, 从而能够实 现能够实现 NFV环境下的故障上报及处理。
可选地, 作为一个实施例, 第二故障综合信息还包括: 与第一 VNF实 体相关联的 VNF实体的故障信息;和 /或与第一 VNF实体相关联的虚拟化基 础设施管理 NFVI实体的故障信息。 也就是说, Orchestrator从 VNFM获取 的故障综合信息可以包含 NFVI实体的故障信息, 可以包含 VNF实体的故 障信息, 也可以包含 NFVI实体以及相关的 VNF实体的故障信息。
可选地, 作为一个实施例, 步骤 502包括: 根据第二故障综合信息中的 故障类型, 确定编排器是否包含与故障类型相对应的故障修复策略; 在编排 器包含与故障类型相对应的故障修复策略时, 根据故障修复策略修复第一 VNF实体和 /或与第一 VNF实体相关联的 VNF实体的故障; 或者在编排器 不包含与故障类型相对应的故障修复策略时, 向运营和业务支撑系统 OSS/BSS发送第二故障综合信息。
可选地, 作为一个实施例, 步骤 502包括: 根据第二故障综合信息中的 故障类型, 确定编排器是否包含与故障类型相对应的故障修复策略; 在编排 器包含与故障类型相对应的故障修复策略时, 根据故障修复策略修复第一 VNF实体和与第一 VNF实体相关联的 VNF实体的故障和与第一 VNF实体 相关联的 NFVI实体的故障; 或者在编排器不包含与故障类型相对应的故障 修复策略时, 向 0SS/BSS发送第二故障综合信息。
可选地, 作为一个实施例, 步骤 502之前还包括: 根据第二故障综合信 息检测编排器是否包含与第二故障综合信息相同的故障综合信息; 在编排器 包含与第二故障综合信息相同的故障综合信息时, 删除第二故障综合信息。 具体地, 由于多个具有关联关系的 NFVI实体或 VNF实体发生关联性故障 时, Orchestrator会获取到多个相同的故障综合信息,这里的相同指的是故障 综合信息中的故障信息内容相同,此时, Orchestrator可以进行重复报警检测。 对于正在进行处理的故障综合信息继续处理,对于未处理的相同的故障综合 信息做删除处理。
可选地, 作为一个实施例, 第二故障信息还包括以下至少一项: 运行状 态、 故障时间; 第二故障综合信息还包括故障状态信息, 故障状态包含未处 理, 处理中, 已爹复和未爹复中的至少一种。
本发明实施例提供的故障管理方法, 通过 Orchestrator接收 VNFM上报 的故障综合信息, 对具有关联关系的故障信息进行综合处理, 从而能够实现 能够实现 NFV环境下的故障上报及处理。 此外, 由于对相关联的故障信息 进行综合处理, 并且通过重复报警检测对相同的故障综合信息进行删除处 理, 从而提高了故障处理的效率和准确度。 图 6a是本发明一个实施例的故障管理的方法的交互图。 图 6a所示的方 法可以由图 1所示的 NFV系统执行。
601 , VIM获取故障信息。
当 VIM检测到 NFVI中的任意 HW、 Host OS、 Hypervisor和 VM发生 故障时, VIM获取发生故障的 NFVI实体的故障信息。 具体地, 获取故障信 息可以是由发生故障的 NFVI实体生成并上报给 VIM的, 也可以是 VIM根 据检测到的故障在本地生成的。
VIM检测 NFVI实体发生故障的方法可以有以下几种方法:
为了方便描述, 以下以第一 NFVI实体发生故障为例进行描述, 该第一 NFVI实体可以为 NFVI中的任意 HW、 Host OS、 Hypervisor和 VM实体。 其中, 实体可以包括硬件实体或软件实体。
方法一,
第一 NFVI实体发生故障时, 第一 NFVI实体生成故障信息, 该故障信 息至少包含用于唯一标识第一 NFVI实体的故障实体标识, 通过该标识可以 唯一确定发生故障的第一 NFVI实体的实际位置或在拓朴关系中的位置。 该 故障信息还包含有故障标识, 用于唯一标识一个故障信息。 该故障信息还包 含有故障类型, 用于表示该故障发生的原因, 例如过载、 断电、 内存泄漏、 端口错误、 无故障等。 此外, 故障信息还可以包含运行状态和故障时间, 运 行状态用于标记第一 NFVI实体当前是否能够正常运行, 故障时间可以用于 记录故障发生的时间。 作为一个例子, 故障信息的格式可以如表一所示: 故障信息
第一 NFVI 生成上述格式的故障信息后, 可以通过 Nf-Vi接口发送给 VIM,可选地,还可以同时通过 EMS将故障信息发送给 0SS/BSS以供管理、 记录、 呈现。
方法二,
VIM可以周期性地或者在需要的时候向第一 NFVI实体发送指示消息, 指示第一 NFVI实体进行故障检测, 第一 NFVI实体如果检测到故障可以向 VIM返回与上述表一相类似的故障信息, 如果第一 NFVI没有故障, 可以不 返回任何消息, 也可以返回故障类型为 "无故障", 运行状态为 "正常" 的 如表一所示的故障信息。
方法三,
第一 NFVI实体可以周期性地向 VIM发送表示第一 NFVI实体运行正常 的心跳指示消息。 VIM则周期性地接收到第一 NFVI实体的心跳, 感知到第 一 NFVI实体工作正常,当第一 NFVI实体心跳中断,则 VIM判定第一 NFVI 实体发生故障。 VIM可以生成第一 NFVI的故障信息, 具体格式与上述表一 的故障信息相类似, 此处不再赘述。
当 NFVI实体发生断电等突然性事故而无法上报故障信息时, VIM依然 能够在第一时间感知到第一 NFVI实体发生故障。
方法四,
VIM可以周期性地或者在需要的时候对 NFVI进行故障检测,之后 VIM 根据故障检测结果生成第一 NFVI的故障信息, 具体格式与上述表一的故障 信息相类似, 此处不再赘述。
综上所述, VIM检测 NFVI实体的故障可以通过以上任意一种方法进行, 当然可以通过多种方法结合进行检测, 例如, 可以将方法一和方法三结合, NFVI实体周期性向 VIM发送心跳, 在发生故障时向 VIM发送故障信息, 如果 NFVI实体发生灾难性故障无法上报故障信息,则 VIM可以通过心跳停 止感知到 NFVI实体发生故障。
602, VIM生成故障综合信息
在 VIM接收到第一 NFVI 实体发送的故障信息, 或者 VIM根据第一 NFVI实体发生的故障生成故障信息后, VIM需要根据收集与第一 NFVI实 体相关联的其他 NFVI实体的故障信息, 以生成故障综合信息, 以便于进行 综合处理。
具体地, 由于 HW、 Host OS, Hypervisor, VM实体之间存在有关联关 系, 因此当第一 NFVI实体发生故障时, 可能与第一 NFVI实体有关联关系 的某些实体也会发生故障。图 6b示例性地示出了 HW、 Host OS, Hypervisor, VM 实体之间的关联关系。 例如, 与 HW1 有关联关系的包括 Host 0S1、 Hypervisorl , VM1和 VM2。 也就是说, 当 HW1发生故障时, 建立在其上 的虚拟化实体 Host 0S1、 Hypervisorl , VM1和 VM2会发生故障。 此时, VIM可以收集 Host OS 1、 Hypervisorl , VM1和 VM2上报的故障信息, 结 合 HW1的故障信息生成故障综合信息。 具体地, 可以生成如表二所示的故 障综合信息:
故障综合信息
其中 HW、 Host OS , Hypervisor和 VM实体的故障信息格式与上述表一 相类似。 故障综合信息标识用于唯一标识一个故障综合信息。 应理解, 表二 所示的故障综合信息为一个具体的例子,故障综合信息具体包含哪些实体的 故障信息根据关联关系而定。其中故障综合信息刚生成时可以将故障状态置 为 "未处理"。
603 , 报警重复检测
VIM生成故障综合信息后, 可以在 VIM本地检测已生成的故障综合信 息, 确定是否存在相同的信息。 具体地, 由于一个 NFVI实体发生故障后, 与之具有关联关系的发生故障的 NFVI实体都会上报故障信息,因此 VIM很 可能就同一个故障生成多个相同的故障综合信息。 例如, HW1 发生故障, 与 HW1具有关联关系的 Host 0S1、 Hypervisorl、 VM1和 VM2也发生故障 并且与 HW1执行相同的操作, VIM在进行关联故障信息收集后会生成多个 同样的故障综合信息, 此时可以只处理其中的一个故障综合信息, 将其他相 同的故障综合信息丟弃。 应理解, 这里的相同的故障综合信息指的是 HW、 Host OS、 Hypervisor和 VM故障信息部分相同,故障标识和故障状态可以不 同。
具体地, 可以通过故障综合信息的故障状态来保留或丟弃故障综合信 息, 例如, 刚生成的故障综合信息的故障状态为 "未处理", 对该故障综合 信息进行 警重复检测, 如果发现故障状态为 "处理中" 的相同的故障综合 信息, 则对未处理的故障综合信息做丟弃处理。 保留即继续执行对故障状态 为 "处理中" 的故障综合信息中的故障的处理。 604, VIM自愈判断
当 VIM中故障综合信息生成, VIM首先可以判断故障综合信息中的故 障类型是否为 VIM能够处理的故障类型。
具体地, VIM中具有故障修复策略,该故障修复策略包括故障实体标识、 故障类型和故障修复方法的映射关系。可以通过判断故障综合信息中的故障 类型是否存在于故障修复策略中而确定是否能够进行处理。 例如, HW1 的 故障类型为 "低性能", 相对应的故障修复方法为 "重启"。
此外,当故障综合信息中包含多个关联的 NFVI实体的故障信息时, VIM 可以根据 NFVI实体的优先级确定针对哪个 NFVI实体的故障信息中的故障 类型进行自愈判断。优先级为: HW高于 Host OS高于 Hypervisor高于 VM。 例如, 如表二所示, 当故障综合信息包含 HW1、 Host 0S1、 Hypervisorl , VM1和 VM2的故障信息时, VIM可以优先处理 HW1的故障, 也就是说, 根据 HW1的故障信息中的故障类型,例如 "低性能",确定故障修复方法"重 启,,。 启硬件设备、 重新加载软件 ( Host OS、 Hypervisor等)、 迁移 VM、 重新加 载 VNF安装软件、重新实例化 VNF,增力口 VNF实例, 迁移 VNF (即给 VNF 重新分配资源), 重新实例化 VNF转发图 ( VNF Forwarding Graph )。
605aVIM能够进行自愈处理
如果 VIM判断能够处理,则根据故障修复方法对 NFVI实体进行故障修 复。如果故障修复成功,并且具有关联关系的 NFVI实体的故障都得到修复, 则通知 Orchestrator修复成功, 并终结该故障修复处理过程。
如果故障综合信息包含多个 NFVI实体, 被优先处理的 NFVI实体的故 障修复成功, 但是其他关联的 NFVI实体的故障依然存在, 则重复进行 604 的步骤, 对余下的依然存在故障的 NFVI实体中优先级最高的 NFVI实体进 行判断, 并修复, 直到该故障综合信息中的所有 NFVI实体的故障都得到修 复, 则通知 Orchestrator修复成功, 并终结该故障修复处理过程。
具体地, 对于能够处理的故障综合信息, VIM可以将修复状态置为 "处 理中"以防止对后续生成的相同的 "未处理"的故障综合信息进行重复处理。
修复成功的 NFVI实体可以通过上报运行状态为 "正常" 的类似于表一 的故障信息来通知 VIM故障修复成功。 当故障综合信息中具有关联关系的 所有的 NFVI实体的故障都得到修复, VIM可以将故障综合信息的故障状态 置为 "已修复" 并通过 Or-Vi接口上报 Orchestrator。 应理解, 修复成功也可 以通过预定义的信令进行上报, 本发明对此不做限定。
此外, 可以将正在进行修复的 NFVI实体进行隔离, 以避免该故障体与 相邻的其他实体交互而导致进一步的故障传染。
605bVIM不能够进行自愈处理
如果 VIM中的故障修复策略中不包含待修复的 NFVI实体的故障类型, 则 VIM可以将故障综合信息的故障状态置为 "未修复"并通过 Or-Vi接口上 才艮 Orchestrator„
606, Orchestrator自愈判断
当 Orchestrator接收到 VIM发送的故障综合信息, Orchestrator检测是否 能够进行自愈处理, 与 VIM的自愈判断相类似, Orchestrator查询本地故障 修复策略, 如果能够进行处理且修复成功, 则将故障综合信息中的故障状态 置为 "已修复" 并向 0SS/BSS上报。 如果 Orchestrator不能够进行修复处理 或者能进行修复处理但是修复失败, 则将 NFVI的故障综合信息的故障状态 置为 "未修复" 并向 0SS/BSS上报。 应理解, 由于 Orchestrator负责编排管 理资源, 并实现 NFV服务, 因此 Orchestrator具有较高的管理权限以及处理 能力, 能够修复大部分的故障。 只有极少数的无法处理或者修复失败的故障 才会被上报的 0SS/BSS 启硬件设备、 重新加载软件 ( Host 0S、 Hypervisor等)、 迁移 VM、 重新加 载 VNF安装软件、重新实例化 VNF,增力口 VNF实例, 迁移 VNF (即给 VNF 重新分配资源), 重新实例化 VNF转发图 ( VNF Forwarding Graph )。
607 , 0SS/BSS进行故障修复
0SS/BSS将该接收到的故障综合信息的故障状态改为 "处理中"。 然后
0SS/BSS根据故障修复策略中的方法进行故障恢复。 故障恢复后, 0SS/BSS 会收到 NFVI实体发送的故障恢复通知,之后将 0SS/BSS故障综合信息中的 故障状态修改为 "已修复"。 其中 0SS/BSS中的故障修复策略默认包含所有 故障类型的处理方法。
本发明实施例提供的故障管理方法, 通过 VIM获取硬件和 /或软件实体 的故障信息, 对具有关联关系的故障信息进行综合处理, 从而能够实现能够 实现 NFV环境下的故障上报及处理。 此外, 由于对相关联的故障信息进行 综合处理, 并且通过重复报警检测对相同的故障综合信息进行删除处理, 并 且对于正在处理的故障实体进行隔离处理,从而提高了故障处理的效率和准 确度, 且有效的防止了故障传染。
图 7是本发明另一实施例的故障管理的方法的交互图。 图 7所示的方法 可以由图 1所示的 NFV系统执行。
701 , VNFM获取故障信息。
当 VNFM检测到 VNF中的任意 VNF实体发生故障时, VNFM获取发 生故障的 VNF实体的故障信息。 具体地, 获取故障信息可以是由发生故障 的 VNF实体生成并上报给 VNFM的,也可以是 VNFM根据检测到的故障在 VNFM本地生成的。
VNFM检测 VNF实体发生故障的方法可以有以下几种方法:
为了方便描述, 以下以第一 VNF实体发生故障为例进行描述, 该第一 VNF实体可以为 VNF中的任意 VNF实体。其中, 实体可以包括硬件实体或 软件实体或实例。
方法一,
第一 VNF实体发生故障时, 第一 VNF实体生成故障信息, 该故障信息 至少包含用于唯一标识第一 VNF实体的故障实体标识, 通过该标识可以唯 一确定发生故障的第一 VNF实体的实际位置或在拓朴关系中的位置。 故障 标识用于唯一标识一个故障信息。 该故障信息还包含有故障类型, 用于表示 该故障发生的原因, 例如过载、 断电、 内存泄漏、 端口错误或无故障等。 此 夕卜,故障信息还可以包含运行状态和故障时间,运行状态用于标记第一 VNF 实体当前是否能够正常运行, 故障时间可以用于记录故障发生的时间。 作为 一个例子, 故障信息的格式可以如表三所示:
故障信息
表三
第一 VNF生成上述格式的故障信息后, 可以通过 Ve-Vnfm接口发送给 VNFM, 可选地, 还可以同时通过 vEMS将故障信息发送给 OSS/BSS以供 管理、 记录、 呈现。
方法二,
VNFM可以周期性地或者在需要的时候向第一 VNF实体发送指示消息, 指示第一 VNF 实体进行故障检测, 第一 VNF 实体如果检测到故障可以向 VNFM返回与上述表三相类似的故障信息, 如果第一 VNF没有故障, 可以 不返回任何消息, 也可以返回故障类型为 "无故障", 运行状态为 "正常" 的如表三所示的故障信息。
方法三,
第一 VNF实体可以周期性地向 VNFM发送表示第一 VNF实体运行正 常的心跳指示消息。 VNFM则周期性地接收到第一 VNF实体的心跳, 感知 到第一 VNF实体工作正常, 当第一 VNF实体心跳中断, 则 VNFM判定第 一 VNF实体发生故障。 VNFM可以生成第一 VNF的故障信息, 具体格式与 上述表三的故障信息相类似, 此处不再赘述。
当 VNF实体发生突然性故障而无法上报故障信息时, VNFM依然能够 在第一时间感知到第一 VNF实体发生故障。
方法四,
VNFM 可以周期性地或者在需要的时候对 VNF 进行故障检测, 之后 VNFM根据故障检测结果生成第一 VNF的故障信息, 具体格式与上述表三 的故障信息相类似, 此处不再赘述。
综上所述, VNFM检测 VNF实体的故障可以通过以上任意一种方法进 行, 当然可以通过多种方法结合进行检测, 例如, 可以将方法一和方法三结 合, VNF实体周期性向 VNFM发送心跳, 在发生故障时向 VNFM发送故障 信息, 如果 VNF实体发生灾难性故障无法上报故障信息, 则 VNFM可以通 过心跳停止感知到 VNF实体发生故障。
702, VNFM生成故障综合信息
在 VNFM接收到第一 VNF实体发送的故障信息,或者 VNFM根据第一 VNF实体发生的故障生成故障信息后, VNFM可以根据第一 VNF的故障信 息生成故障综合信息。 可选地, VNFM可以收集与第一 VNF实体相关联的 其他 VNF实体的故障信息, 以生成故障综合信息, 以便于进行综合处理。
具体地, 由于 VNF实体之间存在有关联关系, 因此当第一 VNF实体发 生故障时,往往与第一 VNF实体有关联关系的其他 VNF实体也会发生故障。 图 6b示例性地示出了 VNF实体之间的关联关系。 例如, VNF1与 VNF2都 基于 VM1 , 即 VNF1与 VNF2之间具有关联关系。 当 VNF1发生了故障, VNF2有可能也发生了故障。
此时, VNFM可以收集 VNF1上报的故障信息, 结合 VNF2的故障信息 生成故障综合信息。 具体地, 可以生成如表四所示的故障综合信息:
故障综合信息
表四
其中 VNF1 , VNF2实体的故障信息格式与上述表三相类似。 应理解, 表四所示的故障综合信息为一个具体的例子,故障综合信息具体包含哪些实 体的故障信息根据关联关系而定。其中故障综合信息刚生成时可以将故障状 态置为 "未处理"。
703, 报警重复检测
VNFM生成故障综合信息后, 可以在 VNFM本地检测已生成的故障综 合信息, 确定是否存在相同的信息。 具体地, 由于一个 VNF实体发生故障 后, 与之具有关联关系的发生故障的 VNF 实体都会上报故障信息, 因此 VNFM很可能就同一个故障生成多个相同的故障综合信息。 例如, VNF1发 生故障, 与 VNF1具有关联关系的 VNF2也发生故障并且与 VNF1执行相同 的操作, VNFM 在进行关联故障信息收集后会生成多个同样的故障综合信 息, 此时可以只处理其中的一个故障综合信息, 将其他相同的故障综合信息 丟弃。 应理解, 这里的相同的故障综合信息指的是 VNF状态信息部分相同, 故障状态可以不同。
具体地,可以通过故障综合信息的故障状态来保留或丟丟弃故障综合信 息, 例如, 刚生成的故障综合信息的故障状态为 "未处理", 对该故障综合 信息进行 警重复检测, 如果发现故障状态为 "处理中" 的相同的故障综合 信息, 则对未处理的故障综合信息做丟弃处理。
704, VNFM自愈判断
当 VNFM有故障综合信息生成, VNFM首先可以判断故障综合信息中 的故障类型是否为 VNFM能够处理的故障类型。 具体地, VNFM中具有故障修复策略, 该故障修复策略包括故障实体标 识、 故障类型和故障修复方法的映射关系。 可以通过判断故障综合信息中的 故障类型是否存在于故障修复策略中而确定是否能够进行处理。例如, VNF1 的故障类型为 "低性能", 相对应的故障修复方法为 "增加一个 VNF实例"。 启硬件设备、 重新加载软件 ( Host OS、 Hypervisor等)、 迁移 VM、 重新加 载 VNF安装软件、重新实例化 VNF,增力口 VNF实例, 迁移 VNF (即给 VNF 重新分配资源), 重新实例化 VNF转发图 ( VNF Forwarding Graph )。
705aVNFM能够进行自愈处理
如果 VNFM判断能够处理, 则根据故障修复方法对 VNF实体进行故障 修复。 如果故障修复成功, 并且具有关联关系的 VNF实体的故障都得到修 复, 则通知 Orchestrator修复成功, 并终结该故障修复处理过程。
如果故障综合信息包含多个 VNF实体,被优先处理的 VNF实体的故障 修复成功, 但是其他关联的 VNF实体的故障依然存在, 则重复进行 704的 步骤, 对余下的依然存在故障的 VNF实体进行判断, 并修复, 直到该故障 综合信息中的所有 VNF实体的故障都得到修复, 则通知 Orchestrator修复成 功, 并终结该故障修复处理过程。
具体地,对于能够处理的故障综合信息, VNFM可以将修复状态置为 "处 理中"以防止对后续生成的相同的 "未处理"的故障综合信息进行重复处理。
修复成功的 VNF实体可以通过上报运行状态为 "正常" 的类似于表三 的故障信息来通知 VNFM故障修复成功。 当故障综合信息中具有关联关系 的所有的 VNF实体的故障都得到修复, VNFM可以将故障综合信息的故障 状态置为 "已修复" 并通过 Or-Vnfm接口上报 Orchestrator。 应理解, 修复 成功也可以通过预定义的信令进行上报, 本发明对此不做限定。
此外, 可以将正在进行修复的 VNF实体进行隔离, 以避免该故障体与 相邻的其他实体交互而导致进一步的故障传染。
705b VNFM不能够进行自愈处理
如果 VNFM 中的故障修复策略中不包含待修复的 VNF 实体的故障类 型,则 VNFM可以将故障综合信息的故障状态置为"未修复"并通过 Or-Vnfm 接口上才艮 Orchestrator。
706, Orchestrator自愈判断 当 Orchestrator接收到 VNFM发送的故障综合信息, Orchestrator检测是 否能够进行自愈处理, 与 VNFM的自愈判断相类似, Orchestrator查询本地 故障修复策略, 如果能够进行处理且修复成功, 则将故障综合信息中的故障 状态置为 "已修复" 并向 0SS/BSS上报。 如果 Orchestrator不能够进行修复 处理或者能进行修复处理但是修复失败, 则将 VNF的故障综合信息的故障 状态置为 "未修复" 并向 0SS/BSS上报。 应理解, 由于 Orchestrator负责编 排管理资源, 并实现 NFV服务, 因此 Orchestrator具有较高的管理权限以及 处理能力, 能够修复大部分的故障。 只有极少数的无法处理或者修复失败的 故障才会被上报的 0SS/BSS
707 , 0SS/BSS进行故障修复
0SS/BSS将该接收到的故障综合信息的故障状态改为 "处理中"。 然后 0SS/BSS根据故障修复策略中的方法进行故障恢复。 故障恢复后, 0SS/BSS 会收到 VNF实体发送的故障恢复通知, 之后将 0SS/BSS故障综合信息中的 故障状态修改为 "已修复"。 其中 0SS/BSS中的故障修复策略默认包含所有 故障类型的处理方法。 启硬件设备、 重新加载软件 ( Host 0S、 Hypervisor等)、 迁移 VM、 重新加 载 VNF安装软件、重新实例化 VNF,增力口 VNF实例, 迁移 VNF (即给 VNF 重新分配资源), 重新实例化 VNF转发图 ( VNF Forwarding Graph )。
本发明实施例提供的故障管理方法, 通过 VIM获取硬件和 /或软件实体 的故障信息, 对具有关联关系的故障信息进行综合处理, 从而能够实现能够 实现 NFV环境下的故障上报及处理。 此外, 由于对相关联的故障信息进行 综合处理, 并且通过重复报警检测对相同的故障综合信息进行删除处理, 并 且对于正在处理的故障实体进行隔离处理,从而提高了故障处理的效率和准 确度, 且有效的防止了故障传染。
图 8是本发明另一实施例的故障管理的方法的交互图。 图 8所示的方法 可以由图 1所示的 NFV系统执行。
801 , VIM获取故障信息。
当 VIM检测到 NFVI中的任意 HW、 Host 0S、 Hypervisor和 VM实体 发生故障时, VIM获取发生故障的 NFVI实体的故障信息。 具体地, 获取故 障信息可以是由发生故障的 NFVI实体生成并上报给 VIM的,也可以是 VIM 根据检测到的故障在本地生成的。 具体地, VIM检测 NFVI实体发生故障的 方法与上述图 6步骤 601所述的方法相类似, 此处不再赘述。
802, VIM生成故障综合信息
在 VIM接收到第一 NFVI 实体发送的故障信息, 或者 VIM根据第一 NFVI实体发生的故障生成故障信息后, VIM需要根据收集与第一 NFVI实 体相关联的其他 NFVI实体的故障信息, 以生成故障综合信息, 以便于进行 综合处理。具体地,与上述图 6步骤 602所述的方法相类似,此处不再赘述。
803, 报警重复检测
VIM生成故障综合信息后, 可以在 VIM本地检测已生成的故障综合信 息, 确定是否存在相同的信息。 具体检测方法与上述图 6步骤 603所述的方 法相类似, 此处不再赘述。
804, VIM自愈判断
当 VIM有故障综合信息生成, VIM首先可以判断故障综合信息中的故 障类型是否为 VIM能够处理的故障类型。具体判断方法与上述图 6步骤 604 所述的方法相类似, 此处不再赘述。
805aVIM能够进行自愈处理
如果 VIM判断能够处理,则根据故障修复方法对 NFVI实体进行故障修 复。如果故障修复成功,并且具有关联关系的 NFVI实体的故障都得到修复, 则通知 Orchestrator修复成功, 并终结该故障修复处理过程。
如果故障综合信息包含多个 NFVI实体, 被优先处理的 NFVI实体的故 障修复成功, 但是其他关联的 NFVI实体的故障依然存在, 则重复进行 804 的步骤, 对余下的依然存在故障的 NFVI实体中优先级最高的 NFVI实体进 行判断, 并修复, 直到该故障综合信息中的所有 NFVI实体的故障都得到修 复, 则通知 Orchestrator修复成功, 并终结该故障修复处理过程。 具体方法 与上述图 6步骤 605a所述的方法相类似, 此处不再赘述。
此外, 可以将正在进行修复的 NFVI实体进行隔离, 以避免该故障体与 相邻的其他实体交互而导致进一步的故障传染。
805bVIM不能够进行自愈处理则上报 VNFM
如果 VIM中的故障修复策略中不包含待修复的 NFVI实体的故障类型, 则 VIM可以将故障综合信息的故障状态置为 "未修复" 并通过 Vi-Vnfm接 口上报 VNFM。 当 VNFM接收到 VIM发送的故障综合信息, VNFM检测是否能够进行 自愈处理, 与 VIM的自愈判断相类似, VNFM查询本地故障修复策略, 如 果能够进行处理且修复成功,则将故障综合信息中的故障状态置为 "已修复" 并向 Orchestrator上报。 如果 VNFM不能够进行修复处理或者能进行修复处 理但是修复失败, 则将 NFVI的故障综合信息的故障状态置为 "未修复" 并 向 Orchestrator上才艮。
806, Orchestrator自愈判断
当 Orchestrator接收到 VNFM发送的 NFVI的故障综合信息, Orchestrator 检测是否能够进行自愈处理, 与 VIM的自愈判断相类似, Orchestrator查询 本地故障修复策略, 如果能够进行处理且修复成功, 则将故障综合信息中的 故障状态置为 "已修复" 并向 0SS/BSS上报。 如果 Orchestrator不能够进行 修复处理或者能进行修复处理但是修复失败, 则将 NFVI的故障综合信息的 故障状态置为 "未修复" 并向 0SS/BSS上报。 应理解, 由于 Orchestrator负 责编排管理资源, 并实现 NFV服务, 因此 Orchestrator具有较高的管理权限 以及处理能力, 能够修复大部分的故障。 只有极少数的无法处理或者修复失 败的故障才会被上报的 0SS/BSS。
807, OSS/BSS进行故障修复
0SS/BSS将该接收到的故障综合信息的故障状态改为 "处理中"。 然后 OSS/BSS根据故障修复策略中的方法进行故障恢复。 故障恢复后, OSS/BSS 会收到 NFVI实体发送的故障恢复通知,之后将 OSS/BSS故障综合信息中的 故障状态修改为 "已修复"。 其中 OSS/BSS中的故障修复策略默认包含所有 故障类型的处理方法。 启硬件设备、 重新加载软件 ( Host 0S、 Hypervisor等)、 迁移 VM、 重新加 载 VNF安装软件、重新实例化 VNF ,增力口 VNF实例, 迁移 VNF (即给 VNF 重新分配资源), 重新实例化 VNF转发图 ( VNF Forwarding Graph )。
本发明实施例提供的故障管理方法, 通过 VIM获取硬件和 /或软件实体 的故障信息, 对具有关联关系的故障信息进行综合处理, 从而能够实现能够 实现 NFV环境下的故障上报及处理。 此外, 由于对相关联的故障信息进行 综合处理, 并且通过重复报警检测对相同的故障综合信息进行删除处理, 并 且对于正在处理的故障实体进行隔离处理,从而提高了故障处理的效率和准 确度, 且有效的防止了故障传染。
图 9是本发明另一实施例的故障管理的方法的交互图。 图 9所示的方法 可以由图 1所示的 NFV系统执行。
901 , VIM获取故障信息。
当 VIM检测到 NFVI中的任意 HW、 Host OS、 Hypervisor和 VM发生 故障时, VIM获取发生故障的 NFVI实体的故障信息。 具体地, 获取故障信 息可以是由发生故障的 NFVI实体生成并上报给 VIM的, 也可以是 VIM根 据检测到的故障在本地生成的。 具体地, VIM检测 NFVI实体发生故障的方 法与上述图 6步骤 601所述的方法相类似, 此处不再赘述。
902, VIM生成故障综合信息
在 VIM接收到第一 NFVI 实体发送的故障信息, 或者 VIM根据第一 NFVI实体发生的故障生成故障信息后, VIM需要根据收集与第一 NFVI实 体相关联的其他 NFVI实体的故障信息, 以生成故障综合信息, 以便于进行 综合处理。具体地,与上述图 6步骤 602所述的方法相类似,此处不再赘述。
903, 报警重复检测
VIM生成故障综合信息后, 可以在 VIM本地检测已生成的故障综合信 息, 确定是否存在相同的信息。 具体检测方法与上述图 6步骤 603所述的方 法相类似, 此处不再赘述。
904, VIM自愈判断
当 VIM有故障综合信息生成, VIM首先可以判断故障综合信息中的故 障类型是否为 VIM能够处理的故障类型。具体判断方法与上述图 6步骤 604 所述的方法相类似, 此处不再赘述。
905aVIM能够进行自愈处理
如果 VIM判断能够处理,则根据故障修复方法对 NFVI实体进行故障修 复。如果故障修复成功,并且具有关联关系的 NFVI实体的故障都得到修复, 则通知 Orchestrator修复成功, 并终结该故障修复处理过程。
如果故障综合信息包含多个 NFVI实体, 被优先处理的 NFVI实体的故 障修复成功, 但是其他关联的 NFVI实体的故障依然存在, 则重复进行 904 的步骤, 对余下的依然存在故障的 NFVI实体中优先级最高的 NFVI实体进 行判断, 并修复, 直到该故障综合信息中的所有 NFVI实体的故障都得到修 复, 则通知 Orchestrator修复成功, 并终结该故障修复处理过程。 具体方法 与上述图 6步骤 605a所述的方法相类似, 此处不再赘述。
此外, 可以将正在进行修复的 NFVI实体进行隔离, 以避免该故障体与 相邻的其他实体交互而导致进一步的故障传染。
905bVIM不能够进行自愈处理则上报 VNFM
如果 VIM中的故障修复策略中不包含待修复的 NFVI实体的故障类型, 则 VIM可以将故障综合信息的故障状态置为 "未修复" 并通过 Vi-Vnfm接 口上报 VNFM。
当 VNFM接收到 VIM发送的故障综合信息, VNFM检测是否能够进行 自愈处理, 与 VIM的自愈判断相类似, VNFM查询本地故障修复策略, 如 果能够进行处理且修复成功,则将故障综合信息中的故障状态置为 "已修复" 并向 Orchestrator上报。 如果 VNFM不能够进行修复处理或者能进行修复处 理但是修复失败, 则将 NFVI的故障综合信息的故障状态置为 "未修复" 并 将故障综合信息返回给 VIM。
906, Orchestrator自愈判断
之后 VIM将 NFVI的故障综合信息通过 Or-Vi接口上报给 Orchestrator,
Orchestrator检测是否能够进行自愈处理, 与 VIM 的自愈判断相类似, Orchestrator查询本地故障修复策略,如果能够进行处理且修复成功,则将故 障综合信息中的故障状态置为 "已修复 "并向 0SS/BSS上报。如果 Orchestrator 不能够进行修复处理或者能进行修复处理但是修复失败, 则将 NFVI的故障 综合信息的故障状态置为 "未修复" 并向 0SS/BSS 上报。 应理解, 由于 Orchestrator负责编排管理资源,并实现 NFV服务, 因此 Orchestrator具有较 高的管理权限以及处理能力, 能够修复大部分的故障。 只有极少数的无法处 理或者修复失败的故障才会被上报的 0SS/BSS。
907 , 0SS/BSS进行故障修复
0SS/BSS将该接收到的故障综合信息的故障状态改为 "处理中"。 然后
0SS/BSS根据故障修复策略中的方法进行故障恢复。 故障恢复后, 0SS/BSS 会收到 NFVI实体发送的故障恢复通知,之后将 0SS/BSS故障综合信息中的 故障状态修改为 "已修复"。 其中 0SS/BSS中的故障修复策略默认包含所有 故障类型的处理方法。 启硬件设备、 重新加载软件 ( Host 0S、 Hypervisor等)、 迁移 VM、 重新加 载 VNF安装软件、重新实例化 VNF,增力口 VNF实例, 迁移 VNF (即给 VNF 重新分配资源), 重新实例化 VNF转发图 ( VNF Forwarding Graph )。
应理解, 图 6、 图 8和图 9为 VIM对 NFVI实体的故障的修复和管理过 程, 图 7为 VNFM对 VNF实体的故障的修复和管理过程。 VIM对 NFVI实 体、 VNFM对 VNF实体的修复和管理这两个过程可以为相对独立的两个过 程, 也可以为同时进行的两个过程, 本发明对此不做限定。
本发明实施例提供的故障管理方法, 通过 VIM获取硬件和 /或软件实体 的故障信息, 对具有关联关系的故障信息进行综合处理, 从而能够实现能够 实现 NFV环境下的故障上报及处理。 此外, 由于对相关联的故障信息进行 综合处理, 并且通过重复报警检测对相同的故障综合信息进行删除处理, 并 且对于正在处理的故障实体进行隔离处理,从而提高了故障处理的效率和准 确度, 且有效的防止了故障传染。
图 10本发明另一实施例的故障管理的方法的交互图。 图 10所示的方法 可以由图 1所示的 NFV系统执行。
1001a, VIM获取故障信息。
当 VIM检测到 NFVI中的任意 HW、 Host OS、 Hypervisor和 VM发生 故障时, VIM获取发生故障的 NFVI实体的故障信息。 具体地, 获取故障信 息可以是由发生故障的 NFVI实体生成并上报给 VIM的, 也可以是 VIM根 据检测到的故障在本地生成的。
VIM检测 NFVI实体发生故障的方法可以有以下几种方法:
为了方便描述, 以下以第一 NFVI实体发生故障为例进行描述, 该第一 NFVI实体可以为 NFVI中的任意 HW、 Host OS、 Hypervisor和 VM实体。 其中, 实体可以包括硬件实体或软件实体。
方法一,
第一 NFVI实体发生故障时, 第一 NFVI实体生成故障信息, 该故障信 息至少包含用于唯一标识第一 NFVI实体的故障实体标识, 通过该标识可以 唯一确定发生故障的第一 NFVI实体的实际位置或在拓朴关系中的位置。 故 障信息还包含故障标识, 用于唯一标识一个故障信息。 该故障信息还包含有 故障类型, 用于表示该故障发生的原因, 例如断电、 过载、 无故障等。 此外, 故障信息还可以包含运行状态和故障时间, 运行状态用于标记第一 NFVI实 体当前是否能够正常运行, 故障时间可以用于记录故障发生的时间。 作为一 个例子, 故障信息的格式可以如上述表一所示。
第一 NFVI 生成上述格式的故障信息后, 可以通过 Nf-Vi接口发送给 VIM,可选地,还可以同时通过 EMS将故障信息发送给 OSS/BSS以供管理、 记录、 呈现。
方法二,
VIM可以周期性地或者在需要的时候向第一 NFVI实体发送指示消息, 指示第一 NFVI实体进行故障检测, 第一 NFVI实体如果检测到故障可以向 VIM返回与上述表一相类似的故障信息, 如果第一 NFVI没有故障, 可以不 返回任何消息, 也可以返回故障类型为 "无故障", 运行状态为 "正常" 的 如表一所示的故障信息。
方法三,
第一 NFVI实体可以周期性地向 VIM发送表示第一 NFVI实体运行正常 的心跳指示消息。 VIM则周期性地接收到第一 NFVI实体的心跳, 感知到第 一 NFVI实体工作正常,当第一 NFVI实体心跳中断,则 VIM判定第一 NFVI 实体发生故障。 VIM可以生成第一 NFVI的故障信息, 具体格式与上述表一 的故障信息相类似, 此处不再赘述。
当 NFVI实体发生断电等突然性事故而无法上报故障信息时, VIM依然 能够在第一时间感知到第一 NFVI实体发生故障。
方法四,
VIM可以周期性地或者在需要的时候对 NFVI进行故障检测,之后 VIM 根据故障检测结果生成第一 NFVI的故障信息, 具体格式与上述表一的故障 信息相类似, 此处不再赘述。
综上所述, VIM检测 NFVI实体的故障可以通过以上任意一种方法进行, 当然可以通过多种方法结合进行检测, 例如, 可以将方法一和方法三结合, NFVI实体周期性向 VIM发送心跳, 在发生故障时向 VIM发送故障信息, 如果 NFVI实体发生灾难性故障无法上报故障信息,则 VIM可以通过心跳停 止感知到 NFVI实体发生故障。
1001b, VNFM获取故障信息。
当 VNFM检测到 VNF中的任意 VNF实体发生故障时, VNFM获取发 生故障的 VNF实体的故障信息。 具体地, 获取故障信息可以是由发生故障 的 VNF实体生成并上报给 VNFM的,也可以是 VNFM根据检测到的故障在 VNFM本地生成的。
VNFM检测 VNF实体发生故障的方法可以有以下几种方法:
为了方便描述, 以下以第一 VNF实体发生故障为例进行描述, 该第一
VNF实体可以为 VNF中的任意 VNF实体。其中, 实体可以包括硬件实体或 软件实体或实例。
方法一,
第一 VNF实体发生故障时, 第一 VNF实体生成故障信息, 该故障信息 至少包含用于唯一标识第一 VNF实体的故障实体标识, 通过该标识可以唯 一确定发生故障的第一 VNF实体的实际位置或在拓朴关系中的位置。 该故 障信息还包含有故障类型, 用于表示该故障发生的原因或者结果。 此外, 故 障信息还可以包含运行状态和故障时间, 运行状态用于标记第一 VNF实体 当前是否能够正常运行, 故障时间可以用于记录故障发生的时间。 作为一个 例子, 故障信息的格式可以如上述表三所示。
第一 VNF生成上述格式的故障信息后, 可以通过 Ve-Vnfm接口发送给 VNFM, 可选地, 还可以同时通过 vEMS将故障信息发送给 OSS/BSS以供 管理、 记录、 呈现。
方法二,
VNFM可以周期性地或者在需要的时候向第一 VNF实体发送指示消息, 指示第一 VNF 实体进行故障检测, 第一 VNF 实体如果检测到故障可以向 VNFM返回与上述表三相类似的故障信息, 如果第一 VNF没有故障, 可以 不返回任何消息, 也可以返回故障类型为 "无故障", 运行状态为 "正常" 的如表三所示的故障信息。
方法三,
第一 VNF实体可以周期性地向 VNFM发送表示第一 VNF实体运行正 常的心跳指示消息。 VNFM则周期性地接收到第一 VNF实体的心跳, 感知 到第一 VNF实体工作正常, 当第一 VNF实体心跳中断, 则 VNFM判定第 一 VNF实体发生故障。 VNFM可以生成第一 VNF的故障信息, 具体格式与 上述表三的故障信息相类似, 此处不再赘述。
当 VNF实体发生突然性故障而无法上报故障信息时, VNFM依然能够 在第一时间感知到第一 VNF实体发生故障。
方法四, VNFM 可以周期性地或者在需要的时候对 VNF 进行故障检测, 之后 VNFM根据故障检测结果生成第一 VNF的故障信息, 具体格式与上述表三 的故障信息相类似, 此处不再赘述。
综上所述, VNFM检测 VNF实体的故障可以通过以上任意一种方法进 行, 当然可以通过多种方法结合进行检测, 例如, 可以将方法一和方法三结 合, VNF实体周期性向 VNFM发送心跳, 在发生故障时向 VNFM发送故障 信息, 如果 VNF实体发生灾难性故障无法上报故障信息, 则 VNFM可以通 过心跳停止感知到 VNF实体发生故障。
应理解, 步骤 1001a和 1001b可以为两个相对独立的过程, 也可以为两 个相关的过程, 在本发明实施例当中可以理解为基本同时发生的两个过程, 也就是说, 本发明实施例是在 NFVI和 VNF发生关联性故障的情况下进行 故障管理和修复的具体描述。
1002a, VIM生成故障综合信息
在 VIM接收到第一 NFVI 实体发送的故障信息, 或者 VIM根据第一 NFVI实体发生的故障生成故障信息, 即步骤 1001a后, VIM需要根据收集 与第一 NFVI实体相关联的其他 NFVI实体的故障信息, 以生成故障综合信 息, 以便于进行综合处理。
具体地, 由于 HW、 Host OS、 Hypervisor, VM实体之间存在有关联关 系, 因此当第一 NFVI实体发生故障时, 往往与第一 NFVI实体有关联关系 的实体也会发生故障。 图 6b示例性地示出了 HW、 Host OS、 Hypervisor, VM 实体之间的关联关系。 例如, 与 HW1 有关联关系的包括 Host 0S1、 Hypervisorl , VM1和 VM2。 也就是说, 当 HW1发生故障时, 建立在其上 的虚拟化实体 Host 0S1、 Hypervisorl、 VM1和 VM2都会发生故障。
此时, VIM可以收集 Host 0S1、 Hypervisorl , VM1和 VM2上报的故 障信息, 结合 HW1的故障信息生成故障综合信息。 具体地, 可以生成如上 述表二所示的故障综合信息, 其中 HW、 Host OS、 Hypervisor和 VM实体的 故障信息格式与上述表一相类似。 应理解, 表二所示的故障综合信息为一个 具体的例子, 故障综合信息具体包含哪些实体的故障信息根据关联关系而 定。 其中故障综合信息刚生成时可以将故障状态置为 "未处理"。
1002b, VNFM生成故障综合信息
在 VNFM接收到第一 VNF实体发送的故障信息,或者 VNFM根据第一 VNF实体发生的故障生成故障信息后, 即步骤 1001b后, VNFM可以根据 第一 VNF的故障信息生成故障综合信息。 可选地, VNFM可以收集与第一 VNF实体相关联的其他 VNF实体的故障信息, 以生成故障综合信息, 以便 于进行综合处理。
具体地, 由于 VNF实体之间存在有关联关系, 因此当第一 VNF实体发 生故障时,往往与第一 VNF实体有关联关系的其他 VNF实体也会发生故障。 图 7b示例性地示出了 VNF实体之间的关联关系。 例如, VNF1与 VNF2都 基于 VM1 , 即 VNF1与 VNF2之间具有关联关系。 当 VNF1发生了故障, VNF2有可能也发生了故障。
此时, VNFM可以收集 VNF1上报的故障信息, 结合 VNF2的故障信息 生成故障综合信息。 具体地, 可以生成如上述表四所示的故障综合信息。
其中 VNF1 , VNF2实体的故障信息格式与上述表三相类似。 应理解, 表四所示的故障综合信息为一个具体的例子,故障综合信息具体包含哪些实 体的故障信息根据关联关系而定。其中故障综合信息刚生成时可以将故障状 态置为 "未处理"。
同样地, 步骤 1002a和 1002b可以为两个相对独立的过程, 也可以为两 个相关的过程, 在本发明实施例当中可以理解为基本同时发生的两个过程。
1003a, VIM报警重复检测
VIM生成故障综合信息后, 可以在 VIM本地检测已生成的故障综合信 息, 确定是否存在相同的信息。 具体地, 由于一个 NFVI实体发生故障后, 与之具有关联关系的发生故障的 NFVI实体都会上报故障信息,因此 VIM很 可能就同一个故障生成多个相同的故障综合信息。 例如, HW1 发生故障, 与 HW1具有关联关系的 Host 0S1、 Hypervisorl , VM1和 VM2也发生故障 并且与 HW1执行相同的操作, VIM在进行关联故障信息收集后会生成多个 同样的故障综合信息, 此时可以只处理其中的一个故障综合信息, 将其他相 同的故障综合信息丟弃。 应理解, 这里的相同的故障综合信息指的是 HW、 Host OS、 Hypervisor和 VM故障信息部分相同, 故障状态可以不同。
具体地,可以通过故障综合信息的故障状态来保留或丟丟弃故障综合信 息, 例如, 刚生成的故障综合信息的故障状态为 "未处理", 对该故障综合 信息进行 警重复检测, 如果发现故障状态为 "处理中" 的相同的故障综合 信息, 则对未处理的故障综合信息做丟弃处理。 保留即继续执行对故障状态 为 "处理中" 的故障综合信息中的故障的处理。
1003b, VNFM报警重复检测
VNFM生成故障综合信息后, 可以在 VNFM本地检测已生成的故障综 合信息, 确定是否存在相同的信息。 具体地, 由于一个 VNF实体发生故障 后, 与之具有关联关系的发生故障的 VNF 实体都会上报故障信息, 因此 VNFM很可能就同一个故障生成多个相同的故障综合信息。 例如, VNF1发 生故障, 与 VNF1具有关联关系的 VNF2也发生故障并且与 VNF1执行相同 的操作, VNFM 在进行关联故障信息收集后会生成多个同样的故障综合信 息, 此时可以只处理其中的一个故障综合信息, 将其他相同的故障综合信息 丟弃。 应理解, 这里的相同的故障综合信息指的是 VNF状态信息部分相同, 故障状态可以不同。
具体地,可以通过故障综合信息的故障状态来保留或丟丟弃故障综合信 息, 例如, 刚生成的故障综合信息的故障状态为 "未处理", 对该故障综合 信息进行 警重复检测, 如果发现故障状态为 "处理中" 的相同的故障综合 信息, 则对未处理的故障综合信息做丟弃处理。 保留即继续执行对故障状态 为 "处理中" 的故障综合信息中的故障的处理。
1004a, VIM自愈判断
当 VIM有故障综合信息生成, VIM首先可以判断故障综合信息中的故 障类型是否为 VIM能够处理的故障类型。
具体地, VIM中具有故障修复策略,该故障修复策略包括故障实体标识、 故障类型和故障修复方法的映射关系。可以通过判断故障综合信息中的故障 类型是否存在于故障修复策略中而确定是否能够进行处理。 例如, HW1 的 故障类型为 "低性能", 相对应的故障修复方法为 "重启"。
此外,当故障综合信息中包含多个关联的 NFVI实体的故障信息时, VIM 可以根据 NFVI实体的优先级确定针对哪个 NFVI实体的故障信息中的故障 类型进行自愈判断。优先级为: HW高于 Host OS高于 Hypervisor高于 VM。 例如, 如表二所示, 当故障综合信息包含 HW1、 Host 0S1、 Hypervisorl , VM1和 VM2的故障信息时, VIM可以优先处理 HW1的故障, 也就是说, 根据 HW1的故障信息中的故障类型,例如 "低性能",确定故障修复方法"重 启,,。
1004b, VNFM自愈判断 当 VNFM有故障综合信息生成, VNFM首先可以判断故障综合信息中 的故障类型是否为 VNFM能够处理的故障类型。
具体地, VNFM中具有故障修复策略, 该故障修复策略包括故障实体标 识、 故障类型和故障修复方法的映射关系。 可以通过判断故障综合信息中的 故障类型是否存在于故障修复策略中而确定是否能够进行处理。例如, VNF1 的故障类型为 "低性能", 相对应的故障修复方法为 "增加一个 VNF实例"。 启硬件设备、 重新加载软件 ( Host OS、 Hypervisor等)、 迁移 VM、 重新加 载 VNF安装软件、重新实例化 VNF,增力口 VNF实例, 迁移 VNF (即给 VNF 重新分配资源), 重新实例化 VNF转发图 (VNF Forwarding Graph )。
1005aVIM能够进行自愈处理
如果 VIM判断能够处理,则根据故障修复方法对 NFVI实体进行故障修 复。如果故障修复成功,并且具有关联关系的 NFVI实体的故障都得到修复, 则通知 Orchestrator修复成功, 并终结该故障修复处理过程。
如果故障综合信息包含多个 NFVI实体, 被优先处理的 NFVI实体的故 障修复成功,但是其他关联的 NFVI实体的故障依然存在,则重复进行 1004a 的步骤, 对余下的依然存在故障的 NFVI实体中优先级最高的 NFVI实体进 行判断, 并修复, 直到该故障综合信息中的所有 NFVI实体的故障都得到修 复, 则通知 Orchestrator修复成功, 并终结该故障修复处理过程。
具体地, 对于能够处理的故障综合信息, VIM可以将修复状态置为 "处 理中"以防止对后续生成的相同的 "未处理"的故障综合信息进行重复处理。
修复成功的 NFVI实体可以通过上报运行状态为 "正常" 的类似于表一 的故障信息来通知 VIM故障修复成功。 当故障综合信息中具有关联关系的 所有的 NFVI实体的故障都得到修复, VIM可以将故障综合信息的故障状态 置为 "已修复" 并通过 Or-Vi接口上 ·fe OrchestratoL 应理解, 修复成功也可 以通过预定义的信令进行上报, 本发明对此不做限定。
此外, 可以将正在进行修复的 NFVI实体进行隔离, 以避免该故障体与 相邻的其他实体交互而导致进一步的故障传染。
1005bVNFM能够进行自愈处理
如果 VNFM判断能够处理, 则根据故障修复方法对 VNF实体进行故障 修复。 如果故障修复成功, 并且具有关联关系的 VNF实体的故障都得到修 复, 则通知 Orchestrator修复成功, 并终结该故障修复处理过程。 如果故障综合信息包含多个 VNF实体,被优先处理的 VNF实体的故障 修复成功, 但是其他关联的 VNF实体的故障依然存在, 则重复进行 1004b 的步骤, 对余下的依然存在故障的 VNF实体进行判断, 并修复, 直到该故 障综合信息中的所有 VNF实体的故障都得到修复, 则通知 Orchestrator修复 成功, 并终结该故障修复处理过程。
具体地,对于能够处理的故障综合信息, VNFM可以将修复状态置为 "处 理中"以防止对后续生成的相同的 "未处理"的故障综合信息进行重复处理。
修复成功的 VNF实体可以通过上报运行状态为 "正常" 的类似于表三 的故障信息来通知 VNFM故障修复成功。 当故障综合信息中具有关联关系 的所有的 VNF实体的故障都得到修复, VNFM可以将故障综合信息的故障 状态置为 "已修复" 并通过 Or-Vnfm接口上报 Orchestrator。 应理解, 修复 成功也可以通过预定义的信令进行上报, 本发明对此不做限定。
此外, 可以将正在进行修复的 VNF实体进行隔离, 以避免该故障体与 相邻的其他实体交互而导致进一步的故障传染。
1005c VIM不能够进行自愈处理
经过步骤 1005a中的判断, 如果 VIM中的故障修复策略中不包含待修 复的 NFVI实体的故障类型, VIM向 VNFM请求与第一 VNFI实体相关联的 VNF实体的故障信息。 之后 VIM接收 VNFM发送的与第一 VNFI实体相关 联的 VNF实体的故障信息, 并将接收的故障信息加入原有 NFVI的故障综 合信息, 然后通过 Or- Vi接口向 Orchestrator上报综合后的故障综合信息。 例如,如上述图 6a所示的关联关系,与 HW1相关联的 NFVI实体有 Host 0S1、 Hypervisorl , VM1和 VM2, 进一步向 VNF关联, VNFI和 VNF2也与 HW1 具有关联关系, 如果其中的 VNF1也发生了故障, 即 VNFM处有 VNF1的 故障信息, 则 VNFM将 VNF1的故障信息通过 Vi- Vnfm接口发送给 VIM , 以便 VIM进行综合处理上报。
1005d VNFM不能够进行自愈处理
经过步骤 1005b中的判断, 如果 VNFM中的故障修复策略中不包含待 修复的 VNF实体的故障类型, VNFM向 VIM请求与第一 VNF实体相关联 的 NFVI实体的故障信息。之后 VNFM接收 VIM发送的与第一 VNF实体相 关联的 NFVI实体的故障信息, 并将接收的故障信息加入原有 VNF的故障 综合信息, 然后通过 Or-Vnfm接口向 Orchestrator上报综合后的故障综合信 息。 例如, 如上述图 6a所示的关联关系, 与 VNF1相关联的 NFVI实体有 VM1、 Host OSl、 Hypervisorl , HWl和 HW2, 如果其中的 VM1、 Host OSl、 Hypervisorl , HWl也发生了故障则 VIM将 VM1、 Host 0S1、 Hypervisorl 和 HWl的故障信息通过 Vi-Vnfm接口发送给 VNFM ,以便 VNFM进行综合 处理上报。
1006, Orchestrator自愈判断
Orchestrator接收到 VNFM或 VIM上报的经过综合处理的故障综合信息 ( 1005c或 1005d ), Orchestrator检测是否能够对该故障综合信息进行自愈处 理, 与 VIM的自愈判断相类似, Orchestrator查询本地故障修复策略, 如果 能够进行处理且修复成功, 则将故障综合信息中的故障状态置为 "已修复" 并向 OSS/BSS上报。 如果 Orchestrator不能够进行修复处理或者能进行修复 处理但是修复失败, 则将 NFVI的故障综合信息的故障状态置为 "未修复" 并向 0SS/BSS上报。 应理解, 由于 Orchestrator负责编排管理资源, 并实现 NFV服务, 因此 Orchestrator具有较高的管理权限以及处理能力, 能够修复 大部分的故障。 只有极少数的无法处理或者修复失败的故障才会被上报的 0SS/BSS。
1007, OSS/BSS进行故障修复
0SS/BSS将该接收到的故障综合信息的故障状态改为 "处理中"。 然后 OSS/BSS根据故障修复策略中的方法进行故障恢复。 故障恢复后, OSS/BSS 会收到 NFVI实体发送的故障恢复通知,之后将 OSS/BSS故障综合信息中的 故障状态修改为 "已修复"。 其中 OSS/BSS中的故障修复策略默认包含所有 故障类型的处理方法。
本发明实施例提供的故障管理方法, 通过 VIM获取硬件和 /或软件实体 的故障信息, 对具有关联关系的故障信息进行综合处理, 从而能够实现能够 实现 NFV环境下的故障上报及处理。 此外, 由于对相关联的故障信息进行 综合处理, 并且通过重复报警检测对相同的故障综合信息进行删除处理, 并 且对于正在处理的故障实体进行隔离处理,从而提高了故障处理的效率和准 确度, 且有效的防止了故障传染。
图 11 是本发明一个实施例的虚拟化基础设施管理 VIM 实体的示意框 图。 图 11所示的 VIM实体 1100包括获取单元 1101、 生成单元 1102和处理 单元 1103。
获取单元 1101获取网络功能虚拟化基础设施 NFVI实体的包含故障实体 标识和故障类型的第一故障信息, 第一故障信息用于指示具有故障实体标识 的第一 NFVI实体发生故障。
生成单元 1102根据获取单元 1101获取的第一故障信息生成第一故障综 合信息, 第一故障综合信息包含第一故障信息和第一故障信息的关联故障信 息;
处理单元 1103根据生成单元 1102生成的第一故障综合信息进行故障修 复或上 处理。
本发明实施例提供的 VIM实体 1100获取硬件和 /或软件实体的故障信 息,对具有关联关系的故障信息进行综合处理,从而能够实现能够实现 NFV 环境下的故障上4艮及处理。
可选地,作为一个实施例, VIM实体 1100还包括确定单元和接收单元, 获取单元具体用于:通过接收单元接收第一 NFVI实体发送的第一故障信息; 或者通过确定单元确定第一 NFVI实体发生故障, 并根据第一 NFVI实体发 生的故障生成第一故障信息。
可选地, 作为一个实施例, 第一 NFVI实体为 NFVI实体中的任意一个 硬件 HW、 主操作系统 Host OS、 虚拟机管理器或虚拟机 VM实体, 生成单 元 1102具体用于:通过确定单元确定与第一 NFVI实体相关联的 NFVI实体 发送的故障信息为第一故障信息的关联故障信息; 生成包含有第一故障信息 和关联故障信息的第一故障综合信息。
可选地,作为一个实施例,处理单元 1103包括发送单元,处理单元 1103 具体用于: 根据第一故障综合信息中的第一故障信息的故障类型或者关联故 障信息的故障类型, 通过确定单元确定 VIM实体 1100是否包含与第一故障 信息的故障类型或者关联故障信息的故障类型相对应的故障修复策略; 在 VIM实体 1100包含与第一故障信息的故障类型或者关联故障信息的故障类 型相对应的故障修复策略时,根据故障修复策略修复第一 NFVI实体和 /或与 第一 NFVI实体相关联的 NFVI实体的故障; 或者在 VIM实体 1100不包含 与第一故障信息的故障类型或者关联故障信息的故障类型相对应的故障修 复策略时, 通过发送单元向 VNFM发送第一故障综合信息或者向编排器发 送第一故障综合信息。 可选地, 作为一个实施例, 处理单元 1103具体用于: 通过确定单元在 第一 NFVI实体和与第一 NFVI实体相关联的 NFVI实体中确定优先级最高 的 NFVI实体, 其中, HW的优先级高于 Host OS的优先级, Host OS的优 先级高于虚拟机管理器的优先级, 虚拟机管理器的优先级高于 VM 的优先 级;根据优先级最高的 NFVI实体的故障类型,通过确定单元确定 VIM实体 1100是否包含相对应的故障修复策略;在 VIM实体 1100包含与优先级最高 的 NFVI实体的故障类型相对应的故障修复策略时, 根据故障修复策略修复 优先级最高的 NFVI实体的故障。
可选地, 作为一个实施例, 发送单元具体用于: 在故障修复成功时, 向 编排器发送成功指示消息; 在故障修复失败时, 向 VNFM发送第一故障综 合信息或者向编排器发送第一故障综合信息。
可选地, 作为一个实施例, 接收单元还用于: 接收 VNFM发送的用于 指示 VNFM无法处理第一故障综合信息的指示消息; 发送单元还用于: 向 编排器发送第一故障综合信息。
可选地, 作为一个实施例, 处理单元 1103还用于: 向 VNFM请求与第 一 NFVI实体相关联的 VNF实体的故障信息;将与第一 NFVI实体相关联的 VNF实体的故障信息加入第一故障综合信息。
可选地, 作为一个实施例, 接收单元还用于: 接收 VNFM发送的请求 信息, 请求信息用于向 VIM实体 1100请求与发生故障的 VNF实体相关联 的 NFVI实体的故障信息;发送单元还用于向 VNFM发送与发生故障的 VNF 实体相关联的 NFVI实体的故障信息。
可选地,作为一个实施例, VIM实体 1100还包括检测单元和删除单元, 检测单元具体用于: 根据第一故障综合信息检测 VIM实体 1100是否包含与 第一故障综合信息相同的故障综合信息;删除单元具体用于在 VIM实体 1100 包含与第一故障综合信息相同的故障综合信息时, 删除第一故障综合信息。
本发明实施例提供的 VIM实体 1100硬件和 /或软件实体的故障信息,对 具有关联关系的故障信息进行综合处理, 从而能够实现能够实现 NFV环境 下的故障上报及处理。 此外, 由于对相关联的故障信息进行综合处理, 并且 通过重复报警检测对相同的故障综合信息进行删除处理,从而提高了故障处 理的效率和准确度。
图 12是本发明一个实施例的虚拟网络功能管理 VNFM 实体的示意框 图。 图 12所示的 VNFM实体 1200包括获取单元 1201、 生成单元 1202和处 理单元 1203。
获取单元 1201获取虚拟网络功能 VNF实体的包含故障实体标识和故障 类型的第二故障信息,第二故障信息用于指示具有故障实体标识的第一 VNF 实体发生故障。 生成单元 1202根据第二故障信息生成第二故障综合信息。 处理单元 1203根据第二故障综合信息进行故障修复或上报处理。 息,对具有关联关系的故障信息进行综合处理,从而能够实现能够实现 NFV 环境下的故障上4艮及处理。
可选地, 作为一个实施例, VNFM实体 1200还包括确定单元和接收单 元, 获取单元具体用于: 通过接收单元接收第一 VNF实体发送的第二故障 信息; 或者通过确定单元确定第一 VNF实体发生故障, 并根据第一 VNF实 体发生的故障通过生成单元生成第二故障信息。
可选地, 作为一个实施例, 生成单元 1202具体用于: 通过确定单元确 定与第一 VNF实体相关联的 VNF实体发送的故障信息为第二故障信息的关 联故障信息; 生成包含有第二故障信息和关联故障信息的第二故障综合信 息。
可选地, 作为一个实施例, 处理单元 1203 包括发送单元, 处理单元具 体用于: 根据第二故障综合信息中的第二故障信息的故障类型或者关联故障 信息的故障类型, 通过确定单元确定 VNFM实体 1200是否包含与第二故障 信息的故障类型或者关联故障信息的故障类型相对应的故障修复策略; 在 VNFM实体 1200包含与第二故障信息的故障类型或者关联故障信息的故障 类型相对应的故障修复策略时, 根据故障修复策略修复第一 VNF实体和 /或 与第一 VNF实体相关联的 VNF实体的故障; 或者在 VNFM实体 1200不包 含与第二故障信息的故障类型或者关联故障信息的故障类型相对应的故障 修复策略时, 通过发送单元向编排器发送第二故障综合信息。
可选地, 作为一个实施例, 发送单元具体用于: 在故障修复成功时, 向 编排器发送成功指示消息; 在故障修复失败时, 向编排器发送第二故障综合 信息。
可选地, 作为一个实施例, 处理单元 1203还用于: 向虚拟化基础设施 管理器 VIM请求与第一 VNF实体相关联的 NFVI实体的故障信息, 其中 NFVI实体为 NFVI中的任意一个硬件 HW、 主操作系统 Host OS、 虚拟机管 理器或虚拟机 VM实体; 将与第一 VNF实体相关联的 NFVI实体的故障信 息加入第二故障综合信息。
可选地, 作为一个实施例, 处理单元 1203还用于: 接收 VIM发送的第 一故障综合信息, 第一故障综合信息包含第一故障信息和第一故障信息的关 联故障信息, 第一故障信息用于指示第一 NFVI实体发生故障; 确定 VNFM 实体 1200是否包含与第一故障综合信息中的第一故障信息的故障类型或者 关联故障信息的故障类型相对应的故障修复策略; 在 VNFM实体 1200包含 与第一故障信息的故障类型或者关联故障信息的故障类型相对应的故障修 复策略时, 根据故障修复策略修复第一 NFVI实体和 /或与第一 NFVI实体相 关联的 NFVI实体的故障; 或者在 VNFM实体 1200不包含与第一故障信息 的故障类型或者关联故障信息的故障类型相对应的故障修复策略时, 向编排 器发送第一故障综合信息, 或者向 VIM发送用于指示 VNFM实体 1200无 法处理第一故障综合信息的指示消息, 以便于 VIM向编排器发送第一故障 综合信息。
可选地, 作为一个实施例, 处理单元 1203还具体用于: 根据第一故障 综合信息确定与第一 NFVI实体和 /或与第一 NFVI实体相关联的 NFVI实体 相关联的第一 VNF实体的故障信息; 将第一 VNF实体的故障信息加入第一 故障综合信息, 以便于 VNFM实体 1200对第一故障综合信息进行修复或上 处理。
可选地, 作为一个实施例, VNFM实体 1200还包括检测单元和删除单 元, 检测单元具体用于: 根据第二故障综合信息检测 VNFM实体 1200是否 包含与第二故障综合信息相同的故障综合信息;删除单元具体用于在 VNFM 实体 1200 包含与第二故障综合信息相同的故障综合信息时, 删除第二故障 综合信息。
可选地, 作为一个实施例, 接收单元还用于: 接收 VIM发送的请求信 息, 请求信息用于向 VNFM实体 1200请求与发生故障的 NFVI实体相关联 的 VNF实体的故障信息;发送单元还用于:向 VIM发送与发生故障的 NFVI 实体相关联的 VNF实体的故障信息。
本发明实施例提供的 VNFM实体 1200硬件和 /或软件实体的故障信息, 对具有关联关系的故障信息进行综合处理, 从而能够实现能够实现 NFV环 境下的故障上报及处理。 此外, 由于对相关联的故障信息进行综合处理, 并 且通过重复报警检测对相同的故障综合信息进行删除处理,从而提高了故障 处理的效率和准确度。
图 13是本发明一个实施例的编排器 Orchestrator实体的示意框图。图 12 所示的 Orchestrator实体 1300包括接收单元 1301和处理单元 1302。
接收单元 1301接收虚拟化基础设施管理器 VIM发送的第一故障综合信 息, 其中, 第一故障综合信息包括第一故障信息, 第一故障信息包含故障实 体标识和故障类型, 第一故障信息用于指示具有故障实体标识的第一网络功 能虚拟化基础设施 NFVI实体发生故障。 处理单元 1302根据第一故障综合 信息进行故障修复或上报处理。
或者
接收单元 1301接收虚拟网络功能管理器 VNFM发送的第二故障综合信 息, 其中, 第二故障综合信息包括第二故障信息, 第二故障信息包含故障实 体标识和故障类型, 第二故障信息用于指示具有故障实体标识的第一虚拟网 络功能 VNF实体发生故障。处理单元 1302根据第二故障综合信息进行故障 修复或上报处理。
本发明实施例提供的 Orchestrator实体 1300从 VNFM或 VIM获取硬件 和 /或软件实体的故障信息,对具有关联关系的故障信息进行综合处理,从而 能够实现能够实现 NFV环境下的故障上报及处理。
可选地, 作为一个实施例, 第一故障综合信息还包括: 与第一 NFVI实 体相关联的 NFVI实体的故障信息; 和 /或与第一 NFVI实体相关联的虚拟网 络功能 VNF实体的故障信息。
可选地, 作为一个实施例, 第二故障综合信息还包括: 与第一 VNF实 体相关联的 VNF实体的故障信息;和 /或与第一 VNF实体相关联的虚拟化基 础设施管理 NFVI实体的故障信息。
可选地, 作为一个实施例, 处理单元 1302具体用于: 根据第一故障综 合信息中的故障类型, 确定 Orchestrator实体 1300是否包含与故障类型相对 应的故障修复策略; 在 Orchestrator实体 1300包含与故障类型相对应的故障 修复策略时, 根据故障修复策略修复第一 NFVI实体和 /或与第一 NFVI实体 相关联的 NFVI实体的故障; 或者在 Orchestrator实体 1300不包含与故障类 型相对应的故障修复策略时, 向运营和业务支撑系统 0SS/BSS发送第一故 障综合信息。
可选地, 作为一个实施例, 处理单元 1302具体用于: 根据第二故障综 合信息中的故障类型, 确定 Orchestrator实体 1300是否包含与故障类型相对 应的故障修复策略; 在 Orchestrator实体 1300包含与故障类型相对应的故障 修复策略时,根据故障修复策略修复第一 VNF实体和 /或与第一 VNF实体相 关联的 VNF实体的故障; 或者在 Orchestrator实体 1300不包含与故障类型 相对应的故障修复策略时, 向运营和业务支撑系统 0SS/BSS发送第二故障 综合信息。
可选地, 作为一个实施例, 处理单元 1302具体用于: 根据第一故障综 合信息中的故障类型, 确定 Orchestrator实体 1300是否包含与故障类型相对 应的故障修复策略; 在 Orchestrator实体 1300包含与故障类型相对应的故障 修复策略时, 根据故障修复策略修复第一 NFVI实体和与第一 NFVI实体相 关联的 NFVI实体的故障和与第一 NFVI实体相关联的 VNF实体的故障;或 者在 Orchestrator实体 1300不包含与故障类型相对应的故障修复策略时, 向 0SS/BSS发送第一故障综合信息。
可选地, 作为一个实施例, 处理单元 1302具体用于: 根据第二故障综 合信息中的故障类型, 确定 Orchestrator实体 1300是否包含与故障类型相对 应的故障修复策略; 在 Orchestrator实体 1300包含与故障类型相对应的故障 修复策略时,根据故障修复策略修复第一 VNF实体和与第一 VNF实体相关 联的 VNF实体的故障和与第一 VNF实体相关联的 NFVI实体的故障; 或者 在 Orchestrator实体 1300不包含与故障类型相对应的故障修复策略时, 向 0SS/BSS发送第二故障综合信息。
可选地, 作为一个实施例, Orchestrator实体 1300还包括检测单元和删 除单元, 检测单元用于: 根据第一 /第二故障综合信息检测 Orchestrator实体 1300 是否包含与第一 /第二故障综合信息相同的故障综合信息; 删除单元用 于在 Orchestrator实体 1300包含与第一 /第二故障综合信息相同的故障综合信 息时, 删除第一 /第二故障综合信息。
本发明实施例提供的 Orchestrator实体 1300从 VIM或 VNFM获取硬件 和 /或软件实体的故障信息,对具有关联关系的故障信息进行综合处理,从而 能够实现能够实现 NFV环境下的故障上报及处理。 此外, 由于对相关联的 故障信息进行综合处理, 并且通过重复报警检测对相同的故障综合信息进行 删除处理, 从而提高了故障处理的效率和准确度。
图 14是本发明另一实施例的 VIM实体的示意框图。 图 14的 VIM实体 1400包括处理器 1401和存储器 1402。处理器 1401和存储器 1402通过总线 系统 1403相连。 实体的包含故障实体标识和故障类型的第一故障信息, 第一故障信息用于指 示具有故障实体标识的第一 NFVI实体发生故障; 根据第一故障信息生成第 一故障综合信息, 第一故障综合信息包含第一故障信息和第一故障信息的关 联故障信息; 根据第一故障综合信息进行故障修复或上报处理。
本发明实施例提供的 VIM实体 1400获取硬件和 /或软件实体的故障信 息,对具有关联关系的故障信息进行综合处理,从而能够实现能够实现 NFV 环境下的故障上4艮及处理。
此外, VIM实体 1400还可以包括发射电路 1404、接收电路 1405。 处理 器 1401控制 VIM实体 1400的操作, 处理器 1401还可以称为 CPU ( Central Processing Unit, 中央处理单元)。 存储器 1402可以包括只读存储器和随机 存取存储器, 并向处理器 1401提供指令和数据。 存储器 1402的一部分还可 以包括非易失性随机存取存储器( NVRAM )。 VIM实体 1400的各个组件通 过总线系统 1403耦合在一起, 其中总线系统 1403除包括数据总线之外, 还 可以包括电源总线、 控制总线和状态信号总线等。 但是为了清楚说明起见, 在图中将各种总线都标为总线系统 1403。
上述本发明实施例揭示的方法可以应用于处理器 1401 中, 或者由处理 器 1401实现。处理器 1401可能是一种集成电路芯片,具有信号的处理能力。 在实现过程中, 上述方法的各步骤可以通过处理器 1401 中的硬件的集成逻 辑电路或者软件形式的指令完成。 上述的处理器 1401可以是通用处理器、 数字信号处理器( DSP )、专用集成电路( ASIC )、现成可编程门阵列( FPGA ) 或者其他可编程逻辑器件、 分立门或者晶体管逻辑器件、 分立硬件组件。 可 以实现或者执行本发明实施例中的公开的各方法、 步骤及逻辑框图。 通用处 理器可以是微处理器或者该处理器也可以是任何常规的处理器等。 结合本发 明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成, 或 者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机 存储器, 闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、 寄存器等本领域成熟的存储介质中。 该存储介质位于存储器 1402, 处理器 1401读取存储器 1402中的信息, 结合其硬件完成上述方法的步骤。
本发明实施例提供的 VIM实体 1400硬件和 /或软件实体的故障信息,对 具有关联关系的故障信息进行综合处理, 从而能够实现能够实现 NFV环境 下的故障上报及处理。 此外, 由于对相关联的故障信息进行综合处理, 并且 通过重复报警检测对相同的故障综合信息进行删除处理,从而提高了故障处 理的效率和准确度。
图 15是本发明另一实施例的 VNFM实体的示意框图。 图 15的 VNFM 实体 1500包括处理器 1501和存储器 1502。处理器 1501和存储器 1502通过 总线系统 1503相连。
存储器 1502用于存储使得处理器 1501执行以下操作的指令: 获取虚拟 网络功能 VNF实体的包含故障实体标识和故障类型的第二故障信息, 第二 故障信息用于指示具有故障实体标识的第一 VNF实体发生故障。 根据第二 故障信息生成第二故障综合信息。根据第二故障综合信息进行故障修复或上 处理。 息,对具有关联关系的故障信息进行综合处理,从而能够实现能够实现 NFV 环境下的故障上4艮及处理。
此外, VNFM实体 1500还可以包括发射电路 1504、接收电路 1505。 处 理器 1501控制 VNFM 实体 1500的操作, 处理器 1501还可以称为 CPU ( Central Processing Unit, 中央处理单元)。 存储器 1502可以包括只读存储 器和随机存取存储器, 并向处理器 1501提供指令和数据。 存储器 1502的一 部分还可以包括非易失性随机存取存储器( NVRAM )。 VNFM实体 1500的 各个组件通过总线系统 1503耦合在一起, 其中总线系统 1503除包括数据总 线之外, 还可以包括电源总线、 控制总线和状态信号总线等。 但是为了清楚 说明起见, 在图中将各种总线都标为总线系统 1503。
上述本发明实施例揭示的方法可以应用于处理器 1501 中, 或者由处理 器 1501实现。处理器 1501可能是一种集成电路芯片,具有信号的处理能力。 在实现过程中, 上述方法的各步骤可以通过处理器 1501 中的硬件的集成逻 辑电路或者软件形式的指令完成。 上述的处理器 1501可以是通用处理器、 数字信号处理器(DSP )、专用集成电路(ASIC )、现成可编程门阵列(FPGA ) 或者其他可编程逻辑器件、 分立门或者晶体管逻辑器件、 分立硬件组件。 可 以实现或者执行本发明实施例中的公开的各方法、 步骤及逻辑框图。 通用处 理器可以是微处理器或者该处理器也可以是任何常规的处理器等。 结合本发 明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成, 或 者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机 存储器, 闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、 寄存器等本领域成熟的存储介质中。 该存储介质位于存储器 1502, 处理器 1501读取存储器 1502中的信息, 结合其硬件完成上述方法的步骤。
本发明实施例提供的 VNFM实体 1500硬件和 /或软件实体的故障信息, 对具有关联关系的故障信息进行综合处理, 从而能够实现能够实现 NFV环 境下的故障上报及处理。 此外, 由于对相关联的故障信息进行综合处理, 并 且通过重复报警检测对相同的故障综合信息进行删除处理,从而提高了故障 处理的效率和准确度。
图 16是本发明另一实施例的 Orchestrator 实体的示意框图。 图 16 的 Orchestrator实体 1600包括处理器 1601和存储器 1602。处理器 1601和存储 器 1602通过总线系统 1603相连。
存储器 1602用于存储使得处理器 1601执行以下操作的指令: 接收虚拟 化基础设施管理器 VIM发送的第一故障综合信息, 其中, 第一故障综合信 息包括第一故障信息, 第一故障信息包含故障实体标识和故障类型, 第一故 障信息用于指示具有故障实体标识的第一网络功能虚拟化基础设施 NFVI实 体发生故障。 根据第一故障综合信息进行故障修复或上报处理。
或者接收虚拟网络功能管理器 VNFM发送的第二故障综合信息, 其中, 第二故障综合信息包括第二故障信息, 第二故障信息包含故障实体标识和故 障类型,第二故障信息用于指示具有故障实体标识的第一虚拟网络功能 VNF 实体发生故障; 根据第二故障综合信息进行故障修复或上报处理。
本发明实施例提供的 Orchestrator实体 1600获取硬件和 /或软件实体的故 障信息, 对具有关联关系的故障信息进行综合处理, 从而能够实现能够实现 NFV环境下的故障上报及处理。
此夕卜, Orchestrator实体 1600还可以包括发射电路 1604、接收电路 1605。 处理器 1601控制 Orchestrator实体 1600的操作, 处理器 1601还可以称为 CPU ( Central Processing Unit, 中央处理单元)。 存储器 1602可以包括只读 存储器和随机存取存储器, 并向处理器 1601提供指令和数据。 存储器 1602 的一部分还可以包括非易失性随机存取存储器(NVRAM )。 Orchestrator 实 体 1600的各个组件通过总线系统 1603耦合在一起, 其中总线系统 1603除 包括数据总线之外, 还可以包括电源总线、 控制总线和状态信号总线等。 但 是为了清楚说明起见, 在图中将各种总线都标为总线系统 1603。
上述本发明实施例揭示的方法可以应用于处理器 1601 中, 或者由处理 器 1601实现。处理器 1601可能是一种集成电路芯片,具有信号的处理能力。 在实现过程中, 上述方法的各步骤可以通过处理器 1601 中的硬件的集成逻 辑电路或者软件形式的指令完成。 上述的处理器 1601可以是通用处理器、 数字信号处理器(DSP )、专用集成电路(ASIC )、现成可编程门阵列(FPGA ) 或者其他可编程逻辑器件、 分立门或者晶体管逻辑器件、 分立硬件组件。 可 以实现或者执行本发明实施例中的公开的各方法、 步骤及逻辑框图。 通用处 理器可以是微处理器或者该处理器也可以是任何常规的处理器等。 结合本发 明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成, 或 者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机 存储器, 闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、 寄存器等本领域成熟的存储介质中。 该存储介质位于存储器 1602, 处理器 1601读取存储器 1602中的信息, 结合其硬件完成上述方法的步骤。
本发明实施例提供的 Orchestrator实体 1600硬件和 /或软件实体的故障信 息,对具有关联关系的故障信息进行综合处理,从而能够实现能够实现 NFV 环境下的故障上报及处理。 此外, 由于对相关联的故障信息进行综合处理, 并且通过重复报警检测对相同的故障综合信息进行删除处理,从而提高了故 障处理的效率和准确度。
本领域普通技术人员可以意识到, 结合本文中所公开的实施例中描述的 各方法步骤和单元, 能够以电子硬件、 计算机软件或者二者的结合来实现, 为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性 地描述了各实施例的步骤及组成。 这些功能究竟以硬件还是软件方式来执 行, 取决于技术方案的特定应用和设计约束条件。 本领域普通技术人员可以 对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应 认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或步骤可以用硬件、处理器执行 的软件程序,或者二者的结合来实施。软件程序可以置于随机存储器( RAM )、 内存、 只读存储器(ROM )、 电可编程 ROM、 电可擦除可编程 ROM、 寄存 器、 硬盘、 可移动磁盘、 CD-ROM, 或技术领域内所公知的任意其它形式的 存储介质中。 但本发明并不限于此。 在不脱离本发明的精神和实质的前提下, 本领域普通 技术人员可以对本发明的实施例进行各种等效的修改或替换, 而这些修改或 替换都应在本发明的涵盖范围内。

Claims (62)

  1. 权利要求
    1. 一种故障管理方法, 其特征在于, 包括:
    虚拟化基础设施管理器 VIM获取网络功能虚拟化基础设施 NFVI实体的 包含故障实体标识和故障类型的第一故障信息, 所述第一故障信息用于指示 具有所述故障实体标识的第一 NFVI实体发生故障;
    所述 VIM根据所述第一故障信息生成第一故障综合信息, 所述第一故 障综合信息包含所述第一故障信息和所述第一故障信息的关联故障信息; 所述 VIM根据所述第一故障综合信息进行故障修复或上报处理。
  2. 2. 根据权利要求 1所述的方法, 其特征在于, 所述 VIM获取 NFVI实 体的包含故障实体标识和故障类型的第一故障信息, 包括:
    接收所述第一 NFVI实体发送的所述第一故障信息; 或者
    确定所述第一 NFVI实体发生故障, 并根据所述第一 NFVI实体发生的 故障生成所述第一故障信息。
  3. 3.根据权利要求 1或 2所述的方法, 其特征在于, 所述第一 NFVI实体 为所述 NFVI实体中的任意一个硬件 HW、 主操作系统 Host OS、 虚拟机管 理器或虚拟机 VM实体, 所述 VIM根据所述第一故障信息生成第一故障综 合信息, 包括:
    确定与所述第一 NFVI实体相关联的 NFVI实体发送的故障信息为所述 第一故障信息的关联故障信息;
    生成包含有所述第一故障信息和所述关联故障信息的第一故障综合信 息。
  4. 4.根据权利要求 1或 2所述的方法, 其特征在于, 所述 VIM根据所述 第一故障综合信息进行故障修复或上报处理, 包括:
    根据所述第一故障综合信息中的第一故障信息的故障类型或者所述关 联故障信息的故障类型, 确定所述 VIM是否包含与所述第一故障信息的故 障类型或者所述关联故障信息的故障类型相对应的故障修复策略;
    在所述 VIM 包含与所述第一故障信息的故障类型或者所述关联故障信 息的故障类型相对应的故障修复策略时,根据所述故障修复策略修复所述第 一 NFVI实体和 /或与所述第一 NFVI实体相关联的 NFVI实体的故障; 或者 在所述 VIM不包含与所述第一故障信息的故障类型或者所述关联故障 信息的故障类型相对应的故障修复策略时, 向 VNFM发送所述第一故障综 合信息或者向编排器发送所述第一故障综合信息。
  5. 5.根据权利要求 4所述的方法, 其特征在于,
    所述根据所述第一故障综合信息中的第一故障信息的故障类型或者所 述关联故障信息的故障类型, 确定所述 VIM是否包含与所述第一故障信息 的故障类型或者所述关联故障信息的故障类型相对应的故障修复策略, 包 括:
    在所述第一 NFVI实体和与所述第一 NFVI实体相关联的 NFVI实体中 确定优先级最高的 NFVI实体, 其中, HW的优先级高于 Host OS的优先级, Host OS的优先级高于虚拟机管理器的优先级, 虚拟机管理器的优先级高于 VM的优先级;
    根据所述优先级最高的 NFVI实体的故障类型确定所述 VIM是否包含相 对应的故障修复策略;
    在所述 VIM包含与所述优先级最高的 NFVI实体的故障类型相对应的故 障修复策略时, 根据所述故障修复策略修复所述优先级最高的 NFVI实体的 故障。
  6. 6.根据权利要求 4所述的方法,其特征在于,所述根据所述故障修复策 略修复所述第一 NFVI实体和 /或与所述第一 NFVI实体相关联的 NFVI实体 的故障之后, 还包括:
    在所述故障修复成功时, 向所述编排器发送成功指示消息;
    在所述故障修复失败时, 向所述 VNFM发送所述第一故障综合信息或 者向所述编排器发送所述第一故障综合信息。
  7. 7.根据权利要求 6所述的方法, 其特征在于, 所述向 VNFM发送所述 第一故障综合信息之后, 还包括:
    接收所述 VNFM发送的用于指示所述 VNFM无法处理所述第一故障综 合信息的指示消息;
    向编排器发送所述第一故障综合信息。
  8. 8.根据权利要求 6所述的方法,其特征在于,所述向编排器发送所述第 一故障综合信息之前, 还包括:
    向 VNFM请求与所述第一 NFVI实体相关联的 VNF实体的故障信息; 将所述与所述第一 NFVI实体相关联的 VNF实体的故障信息加入所述 第一故障综合信息。
  9. 9.根据权利要求 1至 8中任意一项所述的方法,其特征在于,所述方法 还包括:
    接收所述 VNFM发送的请求信息, 所述请求信息用于向所述 VIM请求 与发生故障的 VNF实体相关联的 NFVI实体的故障信息;
    向所述 VNFM发送所述与发生故障的 VNF实体相关联的 NFVI实体的 故障信息。
  10. 10. 根据权利要求 1至 8中任意一项所述的方法,其特征在于,所述 VIM 根据所述第一故障信息生成第一故障综合信息之后, 还包括:
    根据所述第一故障综合信息检测所述 VIM是否包含与所述第一故障综 合信息相同的故障综合信息;
    在所述 VIM 包含与所述第一故障综合信息相同的故障综合信息时, 删 除所述第一故障综合信息。
  11. 11.根据权利要求 1至 8中任意一项所述的方法, 其特征在于, 所述第 一故障信息还被用于向运营和业务支撑系统 OSS/BSS 上报, 以便于所述 OSS/BSS监控并呈现所述第一故障信息。
  12. 12. 根据权利要求 1至 11中任意一项所述的方法, 其特征在于, 所述第一故障信息还包括以下至少一项: 运行状态、 故障时间; 所述第一故障综合信息还包括故障状态信息, 所述故障状态包含未处 理, 处理中, 已爹复和未爹复中的至少一种。
  13. 13. 一种故障管理方法, 其特征在于, 包括:
    虚拟网络功能管理器 VNFM获取虚拟网络功能 VNF实体的包含故障实 体标识和故障类型的第二故障信息,所述第二故障信息用于指示具有所述故 障实体标识的第一 VNF实体发生故障;
    所述 VNFM根据所述第二故障信息生成第二故障综合信息;
    所述 VNFM根据所述第二故障综合信息进行故障修复或上报处理。
  14. 14. 根据权利要求 13所述的方法, 其特征在于, 所述 VNFM获取 VNF 实体的包含故障实体标识和故障类型的第二故障信息, 包括:
    接收所述第一 VNF实体发送的所述第二故障信息; 或者
    确定所述第一 VNF实体发生故障, 并根据所述第一 VNF实体发生的故 障生成所述第二故障信息。
  15. 15. 根据权利要求 13或 14所述的方法, 其特征在于, 所述 VNFM根据 所述第二故障信息生成第二故障综合信息, 包括:
    确定与所述第一 VNF实体相关联的 VNF实体发送的故障信息为所述第 二故障信息的关联故障信息;
    生成包含有所述第二故障信息和所述关联故障信息的第二故障综合信 息。
  16. 16.根据权利要求 13或 14所述的方法, 其特征在于, 所述 VNFM根据 所述第二故障综合信息进行故障修复或上报处理, 包括:
    根据所述第二故障综合信息中的第二故障信息的故障类型或者所述关 联故障信息的故障类型, 确定所述 VNFM是否包含与所述第二故障信息的 故障类型或者所述关联故障信息的故障类型相对应的故障修复策略;
    在所述 VNFM 包含与所述第二故障信息的故障类型或者所述关联故障 信息的故障类型相对应的故障修复策略时,根据所述故障修复策略修复所述 第一 VNF实体和 /或与所述第一 VNF实体相关联的 VNF实体的故障; 或者 在所述 VNFM不包含与所述第二故障信息的故障类型或者所述关联故 障信息的故障类型相对应的故障修复策略时, 向编排器发送所述第二故障综 合信息。
  17. 17.根据权利要求 16所述的方法,其特征在于,所述根据所述故障修复 策略修复所述第一 VNF实体和 /或与所述第一 VNF实体相关联的 VNF实体 的故障之后, 还包括:
    在所述故障修复成功时, 向所述编排器发送成功指示消息;
    在所述故障修复失败时, 向所述编排器发送所述第二故障综合信息。
  18. 18.根据权利要求 17所述的方法,其特征在于,所述向所述编排器发送 所述第二故障综合信息之前, 还包括:
    向虚拟化基础设施管理器 VIM 请求与所述第一 VNF 实体相关联的 NFVI实体的故障信息,其中所述 NFVI实体为所述 NFVI中的任意一个硬件 HW、 主操作系统 Host OS、 虚拟机管理器或虚拟机 VM实体;
    将所述与所述第一 VNF实体相关联的 NFVI实体的故障信息加入所述 第二故障综合信息。
  19. 19. 根据权利要求 13所述的方法, 其特征在于, 所述方法还包括: 接收 VIM发送的第一故障综合信息, 所述第一故障综合信息包含所述 第一故障信息和所述第一故障信息的关联故障信息, 所述第一故障信息用于 指示第一 NFVI实体发生故障;
    确定所述 VNFM是否包含与所述第一故障综合信息中的第一故障信息 的故障类型或者所述关联故障信息的故障类型相对应的故障修复策略;
    在所述 VNFM 包含与所述第一故障信息的故障类型或者所述关联故障 信息的故障类型相对应的故障修复策略时,根据所述故障修复策略修复所述 第一 NFVI实体和 /或与所述第一 NFVI实体相关联的 NFVI实体的故障; 或 者
    在所述 VNFM不包含与所述第一故障信息的故障类型或者所述关联故 障信息的故障类型相对应的故障修复策略时, 向编排器发送所述第一故障综 合信息, 或者向所述 VIM发送用于指示所述 VNFM无法处理所述第一故障 综合信息的指示消息, 以便于所述 VIM向所述编排器发送所述第一故障综 合信息。
  20. 20.根据权利要求 19所述的方法, 其特征在于, 所述接收 VIM发送的 第一故障综合信息之后, 还包括:
    根据所述第一故障综合信息确定与所述第一 NFVI 实体和 /或与所述第 一 NFVI实体相关联的 NFVI实体相关联的所述第一 VNF实体的故障信息; 将所述第一 VNF实体的故障信息加入所述第一故障综合信息, 以便于 所述所述 VNFM对所述第一故障综合信息进行修复或上报处理。
  21. 21.根据权利要求 13至 20中任意一项所述的方法, 其特征在于, 所述 VNFM根据所述第二故障综合信息进行修复或上报处理之后, 还包括: 根据所述第二故障综合信息检测所述 VNFM是否包含与所述第二故障 综合信息相同的故障综合信息;
    在所述 VNFM 包含与所述第二故障综合信息相同的故障综合信息时, 删除所述第二故障综合信息。
  22. 22.根据权利要求 13至 20中任意一项所述的方法, 其特征在于, 所述 方法还包括:
    接收所述 VIM发送的请求信息, 所述请求信息用于向所述 VNFM请求 与发生故障的 NFVI实体相关联的 VNF实体的故障信息;
    向所述 VIM发送所述与发生故障的 NFVI实体相关联的 VNF实体的故 障信息。
  23. 23.根据权利要求 13至 20中任意一项所述的方法, 其特征在于, 所述 第二故障信息还被用于向运营和业务支撑系统 OSS/BSS上报, 以便于所述 OSS/BSS监控并呈现所述第二故障信息。
  24. 24. 根据权利要求 13至 23中任意一项所述的方法, 其特征在于, 所述第二故障信息还包括以下至少一项: 运行状态、 故障时间; 所述第二故障综合信息还包括故障状态信息, 所述故障状态包含未处 理, 处理中, 已爹复和未爹复中的至少一种。
  25. 25. 一种故障管理方法, 其特征在于, 包括:
    编排器接收虚拟化基础设施管理器 VIM发送的第一故障综合信息, 其 中, 所述第一故障综合信息包括第一故障信息, 所述第一故障信息包含故障 实体标识和故障类型,所述第一故障信息用于指示具有所述故障实体标识的 第一网络功能虚拟化基础设施 NFVI实体发生故障;
    所述编排器根据所述第一故障综合信息进行故障修复或上报处理。
  26. 26. 根据权利要求 25所述的方法,其特征在于,所述第一故障综合信息 还包括:
    与所述第一 NFVI实体相关联的 NFVI实体的故障信息; 和 /或 与所述第一 NFVI实体相关联的虚拟网络功能 VNF实体的故障信息。
  27. 27. 根据权利要求 25或 26所述的方法, 其特征在于, 所述编排器根据 所述第一故障综合信息进行故障修复或上报处理, 包括:
    根据所述第一故障综合信息中的故障类型,确定所述编排器是否包含与 所述故障类型相对应的故障修复策略;
    在所述编排器包含与所述故障类型相对应的故障修复策略时,根据所述 故障修复策略修复所述第一 NFVI实体和 /或与所述第一 NFVI实体相关联的 NFVI实体的故障; 或者
    在所述编排器不包含与所述故障类型相对应的故障修复策略时, 向运营 和业务支撑系统 OSS/BSS发送所述第一故障综合信息。
  28. 28. 根据权利要求 25或 26所述的方法, 其特征在于, 所述编排器根据 所述第一故障综合信息进行故障修复或上报处理, 包括:
    根据所述第一故障综合信息中的故障类型,确定所述编排器是否包含与 所述故障类型相对应的故障修复策略;
    在所述编排器包含与所述故障类型相对应的故障修复策略时,根据所述 故障修复策略修复所述第一 NFVI 实体和与所述第一 NFVI 实体相关联的 NFVI实体的故障和与所述第一 NFVI实体相关联的 VNF实体的故障; 或者 在所述编排器不包含与所述故障类型相对应的故障修复策略时, 向 OSS/BSS发送所述第一故障综合信息。
  29. 29. 根据权利要求 25至 28中任意一项所述的方法, 其特征在于, 所述 编排器根据所述第一故障综合信息进行故障修复或上报处理之前, 还包括: 根据所述第一故障综合信息检测所述编排器是否包含与所述第一故障 综合信息相同的故障综合信息;
    在所述编排器包含与所述第一故障综合信息相同的故障综合信息时,删 除所述第一故障综合信息。
  30. 30. 根据权利要求 25至 29中任意一项所述的方法, 其特征在于, 所述第一故障信息还包括以下至少一项: 运行状态、 故障时间; 所述第一故障综合信息还包括故障状态信息, 所述故障状态包含未处 理, 处理中, 已爹复和未爹复中的至少一种。
  31. 31. 一种故障管理方法, 其特征在于, 包括:
    编排器接收虚拟网络功能管理器 VNFM发送的第二故障综合信息, 其 中, 所述第二故障综合信息包括第二故障信息, 所述第二故障信息包含故障 实体标识和故障类型,所述第二故障信息用于指示具有所述故障实体标识的 第一虚拟网络功能 VNF实体发生故障;
    所述编排器根据所述第二故障综合信息进行故障修复或上报处理。 32. 根据权利要求 31所述的方法,其特征在于,所述第二故障综合信息 还包括:
    与所述第一 VNF实体相关联的 VNF实体的故障信息; 和 /或
    与所述第一 VNF实体相关联的虚拟化基础设施管理 NFVI实体的故障 信息。
  32. 33. 根据权利要求 31或 32所述的方法, 其特征在于, 所述编排器根据 所述第二故障综合信息进行故障修复或上报处理, 包括:
    根据所述第二故障综合信息中的故障类型,确定所述编排器是否包含与 所述故障类型相对应的故障修复策略;
    在所述编排器包含与所述故障类型相对应的故障修复策略时,根据所述 故障修复策略修复所述第一 VNF实体和 /或与所述第一 VNF实体相关联的 VNF实体的故障; 或者 在所述编排器不包含与所述故障类型相对应的故障修复策略时, 向运营 和业务支撑系统 OSS/BSS发送所述第二故障综合信息。
  33. 34. 根据权利要求 31或 32所述的方法, 其特征在于, 所述编排器根据 所述第二故障综合信息进行故障修复或上报处理, 包括:
    根据所述第二故障综合信息中的故障类型,确定所述编排器是否包含与 所述故障类型相对应的故障修复策略;
    在所述编排器包含与所述故障类型相对应的故障修复策略时,根据所述 故障修复策略修复所述第一 VNF实体和与所述第一 VNF实体相关联的 VNF 实体的故障和与所述第一 VNF实体相关联的 NFVI实体的故障; 或者
    在所述编排器不包含与所述故障类型相对应的故障修复策略时, 向
    OSS/BSS发送所述第二故障综合信息。
  34. 35. 根据权利要求 31至 34中任意一项所述的方法, 其特征在于, 所述 编排器根据所述第二故障综合信息进行故障修复或上报处理之前, 还包括: 根据所述第二故障综合信息检测所述编排器是否包含与所述第二故障 综合信息相同的故障综合信息;
    在所述编排器包含与所述第二故障综合信息相同的故障综合信息时,删 除所述第二故障综合信息。
  35. 36. 根据权利要求 31至 35中任意一项所述的方法, 其特征在于, 所述第二故障信息还包括以下至少一项: 运行状态、 故障时间; 所述第二故障综合信息还包括故障状态信息, 所述故障状态包含未处 理, 处理中, 已爹复和未爹复中的至少一种。
  36. 37. 一种虚拟化基础设施管理器, 其特征在于, 包括:
    获取单元, 用于获取网络功能虚拟化基础设施 NFVI实体的包含故障实 体标识和故障类型的第一故障信息,所述第一故障信息用于指示具有所述故 障实体标识的第一 NFVI实体发生故障;
    生成单元, 用于根据所述第一故障信息生成第一故障综合信息, 所述第 一故障综合信息包含所述第一故障信息和所述第一故障信息的关联故障信 息;
    处理单元, 用于根据所述第一故障综合信息进行故障修复或上报处理。 38. 根据权利要求 37所述的管理器, 其特征在于, 所述管理器还包括 确定单元和接收单元, 所述获取单元具体用于: 通过所述接收单元接收所述第一 NFVI实体发送的所述第一故障信息; 或者
    通过所述确定单元确定所述第一 NFVI实体发生故障, 并根据所述第一 NFVI实体发生的故障生成所述第一故障信息。
  37. 39.根据权利要求 37或 38所述的管理器,其特征在于,所述第一 NFVI 实体为所述 NFVI实体中的任意一个硬件 HW、 主操作系统 Host 0S、 虚拟 机管理器或虚拟机 VM实体, 所述生成单元具体用于:
    通过所述确定单元确定与所述第一 NFVI实体相关联的 NFVI实体发送 的故障信息为所述第一故障信息的关联故障信息;
    生成包含有所述第一故障信息和所述关联故障信息的第一故障综合信 息。
  38. 40.根据权利要求 37或 38所述的管理器, 其特征在于, 所述处理单元 包括发送单元, 所述处理单元具体用于:
    根据所述第一故障综合信息中的第一故障信息的故障类型或者所述关 联故障信息的故障类型, 通过所述确定单元确定所述 VIM是否包含与所述 第一故障信息的故障类型或者所述关联故障信息的故障类型相对应的故障 修复策略;
    在所述 VIM 包含与所述第一故障信息的故障类型或者所述关联故障信 息的故障类型相对应的故障修复策略时,根据所述故障修复策略修复所述第 一 NFVI实体和 /或与所述第一 NFVI实体相关联的 NFVI实体的故障; 或者 在所述 VIM不包含与所述第一故障信息的故障类型或者所述关联故障 信息的故障类型相对应的故障修复策略时, 通过所述发送单元向 VNFM发 送所述第一故障综合信息或者向编排器发送所述第一故障综合信息。
  39. 41.根据权利要求 40所述的管理器,其特征在于,所述处理单元具体用 于:
    通过所述确定单元在所述第一 NFVI实体和与所述第一 NFVI实体相关 联的 NFVI实体中确定优先级最高的 NFVI实体, 其中, HW的优先级高于 Host OS的优先级, Host OS的优先级高于虚拟机管理器的优先级, 虚拟机 管理器的优先级高于 VM的优先级;
    根据所述优先级最高的 NFVI实体的故障类型, 通过所述确定单元确定 所述 VIM是否包含相对应的故障修复策略; 在所述 VIM包含与所述优先级最高的 NFVI实体的故障类型相对应的故 障修复策略时, 根据所述故障修复策略修复所述优先级最高的 NFVI实体的 故障。
  40. 42. 根据权利要求 40所述的管理器,其特征在于,所述发送单元具体用 于:
    在所述故障修复成功时, 向所述编排器发送成功指示消息;
    在所述故障修复失败时, 向所述 VNFM发送所述第一故障综合信息或 者向所述编排器发送所述第一故障综合信息。
  41. 43. 根据权利要求 42所述的管理器,其特征在于,所述接收单元还用于: 接收所述 VNFM发送的用于指示所述 VNFM无法处理所述第一故障综 合信息的指示消息;
    所述发送单元还用于: 向编排器发送所述第一故障综合信息。
  42. 44. 根据权利要求 42所述的管理器,其特征在于,所述处理单元还用于: 向 VNFM请求与所述第一 NFVI实体相关联的 VNF实体的故障信息; 将所述与所述第一 NFVI实体相关联的 VNF实体的故障信息加入所述 第一故障综合信息。
  43. 45. 根据权利要求 37至 44中任意一项所述的管理器, 所述接收单元还 用于:
    接收所述 VNFM发送的请求信息, 所述请求信息用于向所述 VIM请求 与发生故障的 VNF实体相关联的 NFVI实体的故障信息; 关联的 NFVI实体的故障信息。
  44. 46. 根据权利要求 37至 44中任意一项所述的管理器, 其特征在于, 所 述管理器还包括检测单元和删除单元, 所述检测单元具体用于:
    根据所述第一故障综合信息检测所述 VIM是否包含与所述第一故障综 合信息相同的故障综合信息;
    所述删除单元具体用于在所述 VIM 包含与所述第一故障综合信息相同 的故障综合信息时, 删除所述第一故障综合信息。
  45. 47. —种虚拟网络功能管理器, 其特征在于, 包括:
    获取单元, 用于获取虚拟网络功能 VNF实体的包含故障实体标识和故 障类型的第二故障信息, 所述第二故障信息用于指示具有所述故障实体标识 的第一 VNF实体发生故障;
    生成单元, 用于根据所述第二故障信息生成第二故障综合信息; 处理单元, 用于根据所述第二故障综合信息进行故障修复或上报处理。 48. 根据权利要求 47所述的管理器, 其特征在于, 所述管理器还包括 确定单元和接收单元, 所述获取单元具体用于:
    通过所述接收单元接收所述第一 VNF实体发送的所述第二故障信息; 或者
    通过所述确定单元确定所述第一 VNF实体发生故障, 并根据所述第一 VNF实体发生的故障通过所述生成单元生成所述第二故障信息。
  46. 49. 根据权利要求 47或 48所述的管理器, 其特征在于, 所述生成单元 具体用于:
    通过所述确定单元确定与所述第一 VNF实体相关联的 VNF实体发送的 故障信息为所述第二故障信息的关联故障信息;
    生成包含有所述第二故障信息和所述关联故障信息的第二故障综合信 息。
  47. 50. 根据权利要求 47或 48所述的管理器, 其特征在于, 所述处理单元 包括发送单元, 所述处理单元具体用于:
    根据所述第二故障综合信息中的第二故障信息的故障类型或者所述关 联故障信息的故障类型, 通过所述确定单元确定所述 VNFM是否包含与所 述第二故障信息的故障类型或者所述关联故障信息的故障类型相对应的故 障修复策略;
    在所述 VNFM 包含与所述第二故障信息的故障类型或者所述关联故障 信息的故障类型相对应的故障修复策略时,根据所述故障修复策略修复所述 第一 VNF实体和 /或与所述第一 VNF实体相关联的 VNF实体的故障; 或者 在所述 VNFM不包含与所述第二故障信息的故障类型或者所述关联故 障信息的故障类型相对应的故障修复策略时,通过所述发送单元向编排器发 送所述第二故障综合信息。
  48. 51.根据权利要求 50所述的管理器,其特征在于,所述发送单元具体用 于:
    在所述故障修复成功时, 向所述编排器发送成功指示消息;
    在所述故障修复失败时, 向所述编排器发送所述第二故障综合信息。
  49. 52. 根据权利要求 51所述的管理器,其特征在于,所述处理单元还用于: 向虚拟化基础设施管理器 VIM 请求与所述第一 VNF 实体相关联的
    NFVI实体的故障信息,其中所述 NFVI实体为所述 NFVI中的任意一个硬件 HW、 主操作系统 Host OS、 虚拟机管理器或虚拟机 VM实体;
    将所述与所述第一 VNF实体相关联的 NFVI实体的故障信息加入所述 第二故障综合信息。
  50. 53. 根据权利要求 47所述的管理器,其特征在于,所述处理单元还用于: 接收 VIM发送的第一故障综合信息, 所述第一故障综合信息包含所述 第一故障信息和所述第一故障信息的关联故障信息, 所述第一故障信息用于 指示第一 NFVI实体发生故障;
    确定所述 VNFM是否包含与所述第一故障综合信息中的第一故障信息 的故障类型或者所述关联故障信息的故障类型相对应的故障修复策略;
    在所述 VNFM 包含与所述第一故障信息的故障类型或者所述关联故障 信息的故障类型相对应的故障修复策略时,根据所述故障修复策略修复所述 第一 NFVI实体和 /或与所述第一 NFVI实体相关联的 NFVI实体的故障; 或 者
    在所述 VNFM不包含与所述第一故障信息的故障类型或者所述关联故 障信息的故障类型相对应的故障修复策略时, 向编排器发送所述第一故障综 合信息, 或者向所述 VIM发送用于指示所述 VNFM无法处理所述第一故障 综合信息的指示消息, 以便于所述 VIM向所述编排器发送所述第一故障综 合信息。
  51. 54. 根据权利要求 53所述的管理器,其特征在于,所述处理单元还具体 用于:
    根据所述第一故障综合信息确定与所述第一 NFVI 实体和 /或与所述第 一 NFVI实体相关联的 NFVI实体相关联的所述第一 VNF实体的故障信息; 将所述第一 VNF实体的故障信息加入所述第一故障综合信息, 以便于 所述所述 VNFM对所述第一故障综合信息进行修复或上报处理。
  52. 55.根据权利要求 47至 54中任意一项所述的管理器, 其特征在于, 所 述管理器还包括检测单元和删除单元, 所述检测单元具体用于:
    根据所述第二故障综合信息检测所述 VNFM是否包含与所述第二故障 综合信息相同的故障综合信息; 所述删除单元具体用于在所述 VNFM 包含与所述第二故障综合信息相 同的故障综合信息时, 删除所述第二故障综合信息。
  53. 56.根据权利要求 47至 54中任意一项所述的管理器, 其特征在于, 所 述接收单元还用于:
    接收所述 VIM发送的请求信息, 所述请求信息用于向所述 VNFM请求 与发生故障的 NFVI实体相关联的 VNF实体的故障信息;
    所述发送单元还用于:向所述 VIM发送所述与发生故障的 NFVI实体相 关联的 VNF实体的故障信息。
  54. 57. 一种编排器, 其特征在于, 包括:
    接收单元, 用于接收虚拟化基础设施管理器 VIM发送的第一故障综合 信息, 其中, 所述第一故障综合信息包括第一故障信息, 所述第一故障信息 包含故障实体标识和故障类型, 所述第一故障信息用于指示具有所述故障实 体标识的第一网络功能虚拟化基础设施 NFVI实体发生故障;
    处理单元, 用于根据所述第一故障综合信息进行故障修复或上报处理。 58.根据权利要求 57所述的编排器,其特征在于,所述第一故障综合信 息还包括:
    与所述第一 NFVI实体相关联的 NFVI实体的故障信息; 和 /或
    与所述第一 NFVI实体相关联的虚拟网络功能 VNF实体的故障信息。
  55. 59. 根据权利要求 57或 58所述的编排器, 其特征在于, 所述处理单元 具体用于:
    根据所述第一故障综合信息中的故障类型,确定所述编排器是否包含与 所述故障类型相对应的故障修复策略;
    在所述编排器包含与所述故障类型相对应的故障修复策略时,根据所述 故障修复策略修复所述第一 NFVI实体和 /或与所述第一 NFVI实体相关联的 NFVI实体的故障; 或者
    在所述编排器不包含与所述故障类型相对应的故障修复策略时, 向运营 和业务支撑系统 OSS/BSS发送所述第一故障综合信息。
  56. 60. 根据权利要求 57或 58所述的编排器, 其特征在于, 所述处理单元 具体用于:
    根据所述第一故障综合信息中的故障类型,确定所述编排器是否包含与 所述故障类型相对应的故障修复策略; 在所述编排器包含与所述故障类型相对应的故障修复策略时,根据所述 故障修复策略修复所述第一 NFVI 实体和与所述第一 NFVI 实体相关联的 NFVI实体的故障和与所述第一 NFVI实体相关联的 VNF实体的故障; 或者 在所述编排器不包含与所述故障类型相对应的故障修复策略时, 向 OSS/BSS发送所述第一故障综合信息。
  57. 61.根据权利要求 57至 60中任意一项所述的编排器, 其特征在于, 所 述编排器还包括检测单元和删除单元, 所述检测单元用于:
    根据所述第一故障综合信息检测所述编排器是否包含与所述第一故障 综合信息相同的故障综合信息;
    所述删除单元用于在所述编排器包含与所述第一故障综合信息相同的 故障综合信息时, 删除所述第一故障综合信息。
  58. 62. 一种编排器, 其特征在于, 包括:
    接收单元, 用于接收虚拟网络功能管理器 VNFM发送的第二故障综合 信息, 其中, 所述第二故障综合信息包括第二故障信息, 所述第二故障信息 包含故障实体标识和故障类型, 所述第二故障信息用于指示具有所述故障实 体标识的第一虚拟网络功能 VNF实体发生故障;
    处理单元, 用于根据所述第二故障综合信息进行故障修复或上报处理。
  59. 63. 根据权利要求 62所述的编排器,其特征在于,所述第二故障综合信 息还包括:
    与所述第一 VNF实体相关联的 VNF实体的故障信息; 和 /或
    与所述第一 VNF实体相关联的虚拟化基础设施管理 NFVI实体的故障 信息。
  60. 64. 根据权利要求 62或 63所述的编排器, 其特征在于, 所述处理单元 具体用于:
    根据所述第二故障综合信息中的故障类型,确定所述编排器是否包含与 所述故障类型相对应的故障修复策略;
    在所述编排器包含与所述故障类型相对应的故障修复策略时,根据所述 故障修复策略修复所述第一 VNF实体和 /或与所述第一 VNF实体相关联的
    VNF实体的故障; 或者
    在所述编排器不包含与所述故障类型相对应的故障修复策略时, 向运营 和业务支撑系统 OSS/BSS发送所述第二故障综合信息。
  61. 65. 根据权利要求 62或 63所述的编排器, 其特征在于, 所述处理单元 具体用于:
    根据所述第二故障综合信息中的故障类型,确定所述编排器是否包含与 所述故障类型相对应的故障修复策略;
    在所述编排器包含与所述故障类型相对应的故障修复策略时,根据所述 故障修复策略修复所述第一 VNF实体和与所述第一 VNF实体相关联的 VNF 实体的故障和与所述第一 VNF实体相关联的 NFVI实体的故障; 或者
    在所述编排器不包含与所述故障类型相对应的故障修复策略时, 向 OSS/BSS发送所述第二故障综合信息。
  62. 66. 根据权利要求 62至 65中任意一项所述的编排器, 其特征在于, 所 述编排器还包括检测单元和删除单元, 所述检测单元用于:
    根据所述第二故障综合信息检测所述编排器是否包含与所述第二故障 综合信息相同的故障综合信息;
    所述删除单元用于在所述编排器包含与所述第二故障综合信息相同的 故障综合信息时, 删除所述第二故障综合信息。
CN201380002104.XA 2013-09-30 2013-09-30 故障管理的方法、实体和系统 Active CN104685830B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810143222.7A CN108418711B (zh) 2013-09-30 2013-09-30 故障管理的存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2013/084686 WO2015042937A1 (zh) 2013-09-30 2013-09-30 故障管理的方法、实体和系统

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201810143222.7A Division CN108418711B (zh) 2013-09-30 2013-09-30 故障管理的存储介质

Publications (2)

Publication Number Publication Date
CN104685830A true CN104685830A (zh) 2015-06-03
CN104685830B CN104685830B (zh) 2018-03-06

Family

ID=52741866

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201810143222.7A Active CN108418711B (zh) 2013-09-30 2013-09-30 故障管理的存储介质
CN201380002104.XA Active CN104685830B (zh) 2013-09-30 2013-09-30 故障管理的方法、实体和系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201810143222.7A Active CN108418711B (zh) 2013-09-30 2013-09-30 故障管理的存储介质

Country Status (8)

Country Link
US (1) US10073729B2 (zh)
EP (2) EP3322125B1 (zh)
JP (1) JP6212207B2 (zh)
KR (1) KR101908465B1 (zh)
CN (2) CN108418711B (zh)
BR (1) BR112016006902B1 (zh)
RU (1) RU2644146C2 (zh)
WO (1) WO2015042937A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105049293A (zh) * 2015-08-21 2015-11-11 中国联合网络通信集团有限公司 监控的方法及装置
CN105847237A (zh) * 2016-03-15 2016-08-10 中国联合网络通信集团有限公司 一种基于nfv的安全管理方法和装置
CN106878096A (zh) * 2015-12-10 2017-06-20 中国电信股份有限公司 Vnf状态检测通告方法、装置以及系统
CN107409063A (zh) * 2015-08-25 2017-11-28 华为技术有限公司 一种获取vnf信息的方法、装置及系统
CN107534575A (zh) * 2015-10-21 2018-01-02 华为技术有限公司 一种网络虚拟化环境下的监控方法、监控装置和网络节点
WO2018137520A1 (zh) * 2017-01-24 2018-08-02 华为技术有限公司 一种业务恢复方法及装置
CN109565448A (zh) * 2016-06-16 2019-04-02 瑞典爱立信有限公司 用于解决链路故障的技术
WO2022063032A1 (zh) * 2020-09-28 2022-03-31 华为技术有限公司 一种面向分布式系统的故障信息关联上报方法及相关设备

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9806979B1 (en) * 2013-12-19 2017-10-31 Amdocs Software Systems Limited System, method, and computer program for optimizing a chain of virtual network functions in a network based on network function virtualization (NFV)
US10606718B1 (en) * 2013-12-19 2020-03-31 Amdocs Development Limited System, method, and computer program for managing fault recovery in network function virtualization (Nfv) based networks
WO2015099035A1 (ja) * 2013-12-27 2015-07-02 株式会社Nttドコモ 管理システム、仮想通信機能管理ノード及び管理方法
WO2015099036A1 (ja) * 2013-12-27 2015-07-02 株式会社Nttドコモ 管理システム、全体管理ノード及び管理方法
BR112016016656A2 (pt) * 2014-01-21 2017-08-08 Huawei Tech Co Ltd Método de manuseio de falha de serviço de rede, sistema de gerenciamento de serviço e módulo de gerenciamento de sistema
CN105591784A (zh) * 2014-10-24 2016-05-18 中兴通讯股份有限公司 告警处理方法及装置
US9946614B2 (en) * 2014-12-16 2018-04-17 At&T Intellectual Property I, L.P. Methods, systems, and computer readable storage devices for managing faults in a virtual machine network
CN105873114B (zh) * 2015-01-21 2020-12-11 中兴通讯股份有限公司 一种虚拟网络功能性能监控的方法及相应的系统
WO2016161605A1 (zh) * 2015-04-09 2016-10-13 华为技术有限公司 基于网络功能虚拟化的故障处理方法和装置
CN106301828A (zh) * 2015-05-21 2017-01-04 中兴通讯股份有限公司 一种虚拟化网络功能业务故障的处理方法及装置
CN106330501A (zh) * 2015-06-26 2017-01-11 中兴通讯股份有限公司 一种故障关联方法和装置
JP6466003B2 (ja) 2015-06-30 2019-02-06 ホアウェイ・テクノロジーズ・カンパニー・リミテッド Vnfフェイルオーバの方法及び装置
CN106375101B (zh) * 2015-07-20 2019-08-27 华为技术有限公司 一种生命周期管理方法及装置
JP2018517345A (ja) * 2015-07-30 2018-06-28 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 可用性カウント装置および方法
WO2017025126A1 (en) * 2015-08-10 2017-02-16 Nokia Solutions And Networks Oy Automatic symptom data collection in cloud deployment
CN106533714A (zh) * 2015-09-09 2017-03-22 中兴通讯股份有限公司 重新实例化虚拟网络功能的方法和装置
CN105187249B (zh) * 2015-09-22 2018-12-07 华为技术有限公司 一种故障恢复方法及装置
WO2017078790A1 (en) * 2015-11-02 2017-05-11 Intel IP Corporation Restoring virtual network function (vnf) performance via vnf reset of lifecycle management
CN105681077B (zh) 2015-12-31 2019-04-05 华为技术有限公司 故障处理方法、装置及系统
WO2017157903A1 (en) * 2016-03-14 2017-09-21 Nokia Solutions And Networks Oy End-to-end virtualized network function healing
EP3439249B1 (en) * 2016-03-31 2022-07-20 Nec Corporation Network system, management method and device for same, and server
US10547511B2 (en) * 2016-05-04 2020-01-28 Alcatel Lucent Infrastructure resource states
US10083098B1 (en) 2016-06-07 2018-09-25 Sprint Communications Company L.P. Network function virtualization (NFV) virtual network function (VNF) crash recovery
JP6607572B2 (ja) * 2016-08-10 2019-11-20 日本電信電話株式会社 復旧制御システム及び方法
EP3493469B1 (en) * 2016-08-31 2020-03-25 Huawei Technologies Co., Ltd. Alarm information reporting method and device
IL248285B (en) * 2016-10-10 2018-01-31 Adva Optical Networking Israel Ltd A method and system for the secure operation of a virtual network
US11012883B2 (en) * 2017-01-06 2021-05-18 Apple Inc. Measurement job suspension and resumption in network function virtualization
JP6778151B2 (ja) * 2017-06-20 2020-10-28 日本電信電話株式会社 ネットワーク管理装置およびネットワーク管理方法
CN107623596A (zh) * 2017-09-15 2018-01-23 郑州云海信息技术有限公司 一种nfv平台中启动测试网元定位排查故障的方法
EP3503614B1 (en) * 2017-12-22 2022-06-08 Deutsche Telekom AG Devices and methods for monitoring and handling faults in a network slice of a communication network
CN109995569B (zh) * 2018-01-02 2022-06-03 中国移动通信有限公司研究院 故障联动处理方法、网元及存储介质
CN109995568B (zh) * 2018-01-02 2022-03-29 中国移动通信有限公司研究院 故障联动处理方法、网元及存储介质
KR102019927B1 (ko) * 2018-09-12 2019-11-04 숭실대학교산학협력단 네트워크 기능 가상화 운영 장치 및 방법
CN112840609A (zh) * 2018-11-01 2021-05-25 慧与发展有限责任合伙企业 虚拟网络功能对服务中断的响应
US10979321B2 (en) * 2018-12-10 2021-04-13 Nec Corporation Method and system for low-latency management and orchestration of virtualized resources
US10887156B2 (en) * 2019-01-18 2021-01-05 Vmware, Inc. Self-healing Telco network function virtualization cloud
CN110601905A (zh) * 2019-09-29 2019-12-20 苏州浪潮智能科技有限公司 一种故障检测方法和装置
CN112860496A (zh) 2019-11-27 2021-05-28 华为技术有限公司 故障修复操作推荐方法、装置及存储介质
CN113541988B (zh) * 2020-04-17 2022-10-11 华为技术有限公司 一种网络故障的处理方法及装置
WO2022264289A1 (ja) * 2021-06-15 2022-12-22 楽天モバイル株式会社 ネットワーク管理装置、ネットワーク管理方法およびプログラム
WO2023228233A1 (ja) * 2022-05-23 2023-11-30 楽天モバイル株式会社 障害発生時における自動復旧のためのネットワーク管理

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006057588A1 (en) * 2004-11-29 2006-06-01 Telefonaktiebolaget Lm Ericsson (Publ) Service alarm correlation
US20090303884A1 (en) * 2008-06-06 2009-12-10 Fujitsu Limited Monitoring system, monitoring device, monitored device, and monitoring method
US20100332889A1 (en) * 2009-06-25 2010-12-30 Vmware, Inc. Management of information technology risk using virtual infrastructures
CN102394774A (zh) * 2011-10-31 2012-03-28 广东电子工业研究院有限公司 云计算操作系统的控制器服务状态监控和故障恢复方法
CN102523257A (zh) * 2011-11-30 2012-06-27 广东电子工业研究院有限公司 一种基于iaas云平台的虚拟机容错方法
CN103037019A (zh) * 2013-01-07 2013-04-10 北京华胜天成科技股份有限公司 一种基于云计算的分布式数据采集系统及方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002359925B2 (en) * 2002-12-26 2008-10-23 Fujitsu Limited Operation managing method and operation managing server
KR100805820B1 (ko) * 2006-09-29 2008-02-21 한국전자통신연구원 센서 네트워크의 노드 장애 관리 방법 및 이를 위한 장애 발생 보고 장치
US7877760B2 (en) * 2006-09-29 2011-01-25 Microsoft Corporation Distributed hardware state management in virtual machines
EP1976185B1 (en) * 2007-03-27 2019-05-01 Nokia Solutions and Networks GmbH & Co. KG Operating network entities in a communication system comprising a management network with agent and management levels
JP5140633B2 (ja) * 2008-09-04 2013-02-06 株式会社日立製作所 仮想化環境において生じる障害の解析方法、管理サーバ、及びプログラム
JP5287402B2 (ja) * 2009-03-19 2013-09-11 富士通株式会社 ネットワーク監視制御装置
US8055933B2 (en) * 2009-07-21 2011-11-08 International Business Machines Corporation Dynamic updating of failover policies for increased application availability
US8122290B2 (en) * 2009-12-17 2012-02-21 Hewlett-Packard Development Company, L.P. Error log consolidation
JP5494298B2 (ja) * 2010-07-06 2014-05-14 富士通株式会社 計算機装置,障害復旧制御プログラムおよび障害復旧制御方法
US8887006B2 (en) * 2011-04-04 2014-11-11 Microsoft Corporation Proactive failure handling in database services
US9262253B2 (en) * 2012-06-28 2016-02-16 Microsoft Technology Licensing, Llc Middlebox reliability
US9292376B2 (en) * 2012-08-24 2016-03-22 Vmware, Inc. Proactive resource reservation for protecting virtual machines
US9847915B2 (en) * 2013-01-11 2017-12-19 Huawei Technologies Co., Ltd. Network function virtualization for a network device
US9973375B2 (en) * 2013-04-22 2018-05-15 Cisco Technology, Inc. App store portal providing point-and-click deployment of third-party virtualized network functions
US9350632B2 (en) * 2013-09-23 2016-05-24 Intel Corporation Detection and handling of virtual network appliance failures

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006057588A1 (en) * 2004-11-29 2006-06-01 Telefonaktiebolaget Lm Ericsson (Publ) Service alarm correlation
US20090303884A1 (en) * 2008-06-06 2009-12-10 Fujitsu Limited Monitoring system, monitoring device, monitored device, and monitoring method
US20100332889A1 (en) * 2009-06-25 2010-12-30 Vmware, Inc. Management of information technology risk using virtual infrastructures
CN102394774A (zh) * 2011-10-31 2012-03-28 广东电子工业研究院有限公司 云计算操作系统的控制器服务状态监控和故障恢复方法
CN102523257A (zh) * 2011-11-30 2012-06-27 广东电子工业研究院有限公司 一种基于iaas云平台的虚拟机容错方法
CN103037019A (zh) * 2013-01-07 2013-04-10 北京华胜天成科技股份有限公司 一种基于云计算的分布式数据采集系统及方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHIOSI, MARGARET ET AL.: "Network Function Virtualisation- An Introduction, Benefits Enablers, Challenge Network Function Virtualisation- Introductory White Paper", 《NETWORK FUNCTION VIRTUALISATION- AN INTRODUCTION, BENEFITS ENABLERS, CHALLENGE NETWORK FUNCTION VIRTUALISATION- INTRODUCTORY WHITE PAPER》 *
ETSI: "Network Function Virtualization(NFV) Management and Orchestration;NFV-MAN001v005_marked_changes", 《ETSI DRAFT》 *
ETSI: "Network Function Virtualization(NFV);Management and Orchestration", 《ETSI DRAFT》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105049293A (zh) * 2015-08-21 2015-11-11 中国联合网络通信集团有限公司 监控的方法及装置
CN107409063B (zh) * 2015-08-25 2019-12-24 华为技术有限公司 一种获取vnf信息的方法、装置及系统
CN107409063A (zh) * 2015-08-25 2017-11-28 华为技术有限公司 一种获取vnf信息的方法、装置及系统
US10756999B2 (en) 2015-08-25 2020-08-25 Huawei Technologies Co., Ltd. Virtualized network function information obtaining method, apparatus, and system
CN107534575A (zh) * 2015-10-21 2018-01-02 华为技术有限公司 一种网络虚拟化环境下的监控方法、监控装置和网络节点
CN107534575B (zh) * 2015-10-21 2020-07-10 北京航天天盾信息有限公司 一种网络虚拟化环境下的监控方法、监控装置和网络节点
CN106878096A (zh) * 2015-12-10 2017-06-20 中国电信股份有限公司 Vnf状态检测通告方法、装置以及系统
CN106878096B (zh) * 2015-12-10 2019-12-06 中国电信股份有限公司 Vnf状态检测通告方法、装置以及系统
CN105847237B (zh) * 2016-03-15 2019-01-15 中国联合网络通信集团有限公司 一种基于nfv的安全管理方法和装置
CN105847237A (zh) * 2016-03-15 2016-08-10 中国联合网络通信集团有限公司 一种基于nfv的安全管理方法和装置
CN109565448A (zh) * 2016-06-16 2019-04-02 瑞典爱立信有限公司 用于解决链路故障的技术
WO2018137520A1 (zh) * 2017-01-24 2018-08-02 华为技术有限公司 一种业务恢复方法及装置
CN108347339B (zh) * 2017-01-24 2020-06-16 华为技术有限公司 一种业务恢复方法及装置
WO2022063032A1 (zh) * 2020-09-28 2022-03-31 华为技术有限公司 一种面向分布式系统的故障信息关联上报方法及相关设备

Also Published As

Publication number Publication date
BR112016006902A2 (zh) 2017-09-19
KR20160060741A (ko) 2016-05-30
EP3024174A1 (en) 2016-05-25
KR101908465B1 (ko) 2018-12-10
JP6212207B2 (ja) 2017-10-11
EP3024174A4 (en) 2016-08-17
WO2015042937A1 (zh) 2015-04-02
RU2016117218A (ru) 2017-11-14
JP2016533655A (ja) 2016-10-27
EP3322125A1 (en) 2018-05-16
BR112016006902B1 (pt) 2022-10-04
RU2644146C2 (ru) 2018-02-07
EP3322125B1 (en) 2019-11-13
US20160224409A1 (en) 2016-08-04
US10073729B2 (en) 2018-09-11
EP3024174B1 (en) 2017-11-22
CN108418711A (zh) 2018-08-17
CN108418711B (zh) 2021-05-18
CN104685830B (zh) 2018-03-06

Similar Documents

Publication Publication Date Title
CN104685830A (zh) 故障管理的方法、实体和系统
US8910172B2 (en) Application resource switchover systems and methods
CN109815043B (zh) 故障处理方法、相关设备及计算机存储介质
US9547605B2 (en) Method for data backup, device and system
US9652326B1 (en) Instance migration for rapid recovery from correlated failures
JP6443895B2 (ja) 障害管理方法、仮想化ネットワーク機能マネージャ(vnfm)、及びプログラム
WO2018054081A1 (zh) 故障处理方法、虚拟架构管理系统和业务管理系统
US20120246517A1 (en) Providing first field data capture in a virtual input/output server (vios) cluster environment with cluster-aware vioses
EP2975515A1 (en) System and method for managing excessive distribution of memory
US11706080B2 (en) Providing dynamic serviceability for software-defined data centers
CN108347339B (zh) 一种业务恢复方法及装置
US20210105179A1 (en) Fault management method and related apparatus
US10353786B2 (en) Virtualization substrate management device, virtualization substrate management system, virtualization substrate management method, and recording medium for recording virtualization substrate management program
CA2686384A1 (en) Dynamic cli mapping for clustered software entities
JP5425720B2 (ja) 仮想化環境監視装置とその監視方法およびプログラム
CN111181780A (zh) 基于ha集群的主机池切换方法、系统、终端及存储介质
CN110737503B (zh) 容器服务快照的管理方法和装置
WO2017107014A1 (zh) 一种网络亚健康诊断方法及装置
CN115391106A (zh) 一种备端资源池化的方法、系统及装置
CN110287066B (zh) 一种服务器分区迁移方法及相关装置
CN114064217B (zh) 一种基于OpenStack的节点虚拟机迁移方法及装置
CN116578446B (zh) 虚拟机备份方法、装置、系统、电子设备及存储介质
CN111901415B (zh) 数据处理方法和系统、计算机可读存储介质及处理器
RU2672184C1 (ru) Способ, устройство и система управления обработкой отказов
CN116566804A (zh) 一种云环境下智能网卡硬件卸载的单点故障避免方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant